NVIDIA ja Stanfordi üheminutilised AI multikad

Ülevaade:
NVIDIA ja Stanfordi teadlased tutvustasid uut tehisintellekti meetodit nimega "Test-Time Training", mis suudab luua varasemast pikemaid videoklippe. Näiteks loodi minutipikkused joonisfilme.
Detailid:
- Süsteem loob minutipikkuseid animatsioone, kus stseenid on kvaliteetsemad ja tulemused on paremad kui senistel lahendustel.
- TTT kihid töötavad neurovõrkudena mäluna, mis aitab mudelil meeles pidada, mis videol varem juhtus ja hoida lugu loogilisena ka pikemates klippides.
- Lahendus töötab olemasolevate videomudelite peal, kui lisada neile TTT kihid, mis võimaldab seeläbi palju pikemate videote loomist kui seni võimalik oli.
Miks see on oluline: AI videod on viimase aasta jooksul kiiresti arenenud, aga siiani on olnud suur probleem, et klipid on lühikesed ja ei suudeta järjepidevust hoida. Uus lähenemine võib tulevikus aidata luua pikemaid ja ühtlasema loogikaga videosid, ilma et peaks sadade väikeste lõikude kaupa videot kokku panema.
Amazoni uus hääletehnoloogia ja parem video kvaliteet

Ülevaade: Amazon tuli välja uue Nova Sonic häälemudeliga, mis teeb vestlused masinaga loomulikumaks. Samal ajal uuendati ka Nova Reels 1.1 videomudelit, mis suudab nüüd luua parema kvaliteediga ja pikemaid videoklippe
Detailid:
- Nova Sonic suudab töödelda häälelist sisendit ja vastata loomuliku kõnega vaid 1,09 sekundilise latentsusega, mis on palju kiirem kui OpenAI mudelid.
- See mudel on täpne ka mitmes keeles ja suudab hästi hakkama saada ka mürarikkas keskkonnas, kus räägivad mitu inimest korraga.
- Nova Reels 1.1 võimaldab luua kuni 2 minuti pikkuseid videoid.
- Mõlemad tööriistad on saadaval Amazon Bedrocki platvormil ning Nova Sonic on umbes 80% odavam kui OpenAI samaväärne lahendus.
Miks see on oluline: Amazon on hakanud tõsiselt tehisintellekti arendamisega tegelema, eriti hääle- ja videotehnoloogia valdkonnas. Koos oma uue Alexa+ AI, agendibrauseri ja teiste tööriistadega annab Amazon arendajatele hea põhjuse eelistada just nende lahendusi konkurentide asemel.
Murati Thinking Machines palkas endised OpenAI töötajad oma tiimi

Ülevaade: Tehisintellekti idufirma Thinking Machines Lab, mille lõi endine OpenAI tehnoloogiajuht Mira Murati, lisas oma advisorite hulka ka endise OpenAI müügijuhi Bob McGrew ja GPT looja Alec Radfordi. Nüüd on umbes pool nende tiimist OpenAI taustaga.
Detailid:
- 38-st algtiimi liikmest 19 on varem töötanud OpenAI-s, sealhulgas üks kaasasutajatest John Schulman, kes on praegu teaduste juht.
- Bob McGrew lahkus OpenAI-st pärast kaheksat aastat ja liitus Muratiga mõned kuud hiljem, kuigi oli algselt plaaninud töötamisest pausi teha.
- Alec Radford, kes mängis suurt rolli GPT tehnoloogia arendamisel, lahkus eelmisel aastal, et keskenduda personaalsele uurimistööle.
- Startup üritas hiljuti kaasata kuni 1 miljard dollarit, hinnates ettevõtte väärtuseks 9 miljardit, kuid nende toote täpsemad detailid on veel ebaselged.
Miks see on oluline: Murati värbab endiselt oma vanu kolleege enda tiimi, kuhu kuuluvad ka inimesed, kes aitasid luua ChatGPT, DALL-E ja teisi suuri AI lahendusi. Kuigi AI maailmas on konkurents tihe, tegutsevad Murati ja Ilya Sutskeveri praegu pigem vaikselt kulisside taga.