Multikate aeg - Nvidia ja Stanford toovad teieni minutilised joonisfilmid

aprill 9, 2025

Multikate aeg – Nvidia ja Stanford toovad teieni minutilised joonisfilmid

NVIDIA ja Stanfordi üheminutilised AI multikad

Ajakava järgi jaotatud koomiksipaneelid, mis kujutavad Tomi ja Jerryt erinevates olukordades. Paneelidel on kujutatud Tomi kontoris, kus arvuti lakkab töötamast, sest Jerryl, pruunil hiirel, on kaabel läbi närinud. Järgneb tagaajamine, mille käigus jõuab Tom kohtumisse, mida juhib buldog. Jerry on oma urgus, naerdes segaduse üle. Järgmistel paneelidel sööb Jerry juustu, kuni Tom selle temalt kavalalt ära võtab. Nördinud Jerry pakib oma asjad ja lahkub. Lõpuks pakub Tom talle juustu leppimise märgiks ja nad lepivad ära. — *Pildi allikas: NVIDIA ja Stanford Ülikool*

Ülevaade:

NVIDIA ja Stanfordi teadlased tutvustasid uut tehisintellekti meetodit nimega “Test-Time Training”, mis suudab luua varasemast pikemaid videoklippe. Näiteks loodi minutipikkused joonisfilme.

Detailid:

Süsteem loob minutipikkuseid animatsioone, kus stseenid on kvaliteetsemad ja tulemused on paremad kui senistel lahendustel.
TTT kihid töötavad neurovõrkudena mäluna, mis aitab mudelil meeles pidada, mis videol varem juhtus ja hoida lugu loogilisena ka pikemates klippides.
Lahendus töötab olemasolevate videomudelite peal, kui lisada neile TTT kihid, mis võimaldab seeläbi palju pikemate videote loomist kui seni võimalik oli.

Miks see on oluline: AI videod on viimase aasta jooksul kiiresti arenenud, aga siiani on olnud suur probleem, et klipid on lühikesed ja ei suudeta järjepidevust hoida. Uus lähenemine võib tulevikus aidata luua pikemaid ja ühtlasema loogikaga videosid, ilma et peaks sadade väikeste lõikude kaupa videot kokku panema.

Amazoni uus hääletehnoloogia ja parem video kvaliteet

Kuvand näitab kasutajaliidest nimega 'Image / Video Playground' Amazon Bedrockis. Vasakul on seadistuste sektsioon, kus on valitud 'Nova Reel v1.1 On-demand'. Toimingukastis on valik 'Generate video'. Video kestus on määratud 120 sekundit. Paremal on tööajaloo sektsioon, kus on kuvatud tööde olek, viimane töökäik on märgitud kui 'Success'. Keskel on lilla ala, kus kuvatakse video genereerimise teade ja nupp 'Run new job'. — *Pildi allikas: AWS*

Ülevaade: Amazon tuli välja uue Nova Sonic häälemudeliga, mis teeb vestlused masinaga loomulikumaks. Samal ajal uuendati ka Nova Reels 1.1 videomudelit, mis suudab nüüd luua parema kvaliteediga ja pikemaid videoklippe

Detailid:

Nova Sonic suudab töödelda häälelist sisendit ja vastata loomuliku kõnega vaid 1,09 sekundilise latentsusega, mis on palju kiirem kui OpenAI mudelid.
See mudel on täpne ka mitmes keeles ja suudab hästi hakkama saada ka mürarikkas keskkonnas, kus räägivad mitu inimest korraga.
Nova Reels 1.1 võimaldab luua kuni 2 minuti pikkuseid videoid.
Mõlemad tööriistad on saadaval Amazon Bedrocki platvormil ning Nova Sonic on umbes 80% odavam kui OpenAI samaväärne lahendus.

Miks see on oluline: Amazon on hakanud tõsiselt tehisintellekti arendamisega tegelema, eriti hääle- ja videotehnoloogia valdkonnas. Koos oma uue Alexa+ AI, agendibrauseri ja teiste tööriistadega annab Amazon arendajatele hea põhjuse eelistada just nende lahendusi konkurentide asemel.

Murati Thinking Machines palkas endised OpenAI töötajad oma tiimi

Pildi keskel on tekst 'THINKING MACHINES', mis on kirjutatud hallide suurte trükitähtedega valgel taustal. — *Pildi allikas: Thinking Machines*

Ülevaade: Tehisintellekti idufirma Thinking Machines Lab, mille lõi endine OpenAI tehnoloogiajuht Mira Murati, lisas oma advisorite hulka ka endise OpenAI müügijuhi Bob McGrew ja GPT looja Alec Radfordi. Nüüd on umbes pool nende tiimist OpenAI taustaga.

Detailid:

38-st algtiimi liikmest 19 on varem töötanud OpenAI-s, sealhulgas üks kaasasutajatest John Schulman, kes on praegu teaduste juht.
Bob McGrew lahkus OpenAI-st pärast kaheksat aastat ja liitus Muratiga mõned kuud hiljem, kuigi oli algselt plaaninud töötamisest pausi teha.
Alec Radford, kes mängis suurt rolli GPT tehnoloogia arendamisel, lahkus eelmisel aastal, et keskenduda personaalsele uurimistööle.
Startup üritas hiljuti kaasata kuni 1 miljard dollarit, hinnates ettevõtte väärtuseks 9 miljardit, kuid nende toote täpsemad detailid on veel ebaselged.

Miks see on oluline: Murati värbab endiselt oma vanu kolleege enda tiimi, kuhu kuuluvad ka inimesed, kes aitasid luua ChatGPT, DALL-E ja teisi suuri AI lahendusi. Kuigi AI maailmas on konkurents tihe, tegutsevad Murati ja Ilya Sutskeveri praegu pigem vaikselt kulisside taga.