xAI uus video generaator – “Grok Imagine”

xAI toob turule Grok Imagine AI video looja

Mustal taustal on valge stiliseeritud logo, mille paremal pool on neli papertööna valmistatud ookeanistseeni pilti, millest igaühel kujutatakse erinevaid merelisi ja pilviseid vaateid.
Pildi allikas: xAI / Screenshot via @omooretweets on X

 

Ülevaade: xAI on välja toonud uue tehisintellekti nimega Grok Imagine, mis suudab luua pilte ja videoid. See on saadaval neile, kes kasutavad X rakenduse SuperGrok või Premium+ tellimust iPhone’is. Grok Imagine hakkab konkureerima teiste sarnaste tööriistadega, nagu Google, OpenAI ja Runwayga ning mitmete Hiina videoloome platvormidega.

 

Detailid:

  • Grok Imagine võimaldab kasutajatel muuta lihtsad tekstid või pildid kuni 15-sekundilisteks videoteks, millel on ka taustal heli.
  • Kasutaja saab luua pilte tekstist ja hiljem neid animeerida. Lisaks hakkab rakendus automaatselt uusi videoid looma, kui kasutaja ekraanil alla kerib.
  • Kuigi videod näevad veel üsna “AI-likud” välja võrreldes teiste programmidega, on tulemus siiski üllatav.
  • Elon Musk ütles, et Grok Imagine muutub iga päev paremaks ja loob videoid palju kiiremini kui konkurendid ehk umbes kaks kuni neli korda kiiremini.

 

Miks see on oluline: Kuigi Grok Imagine ei pruugi olla parem kui praegused parimad videoloojad, püüab xAI tuua uut vaatenurka videote tegemiseks oma lõbusa ja avatud stiiliga. Nagu nägime vestlusroboti puhul, võib see stiil mõnikord viia ootamatute tulemusteni.

Google avalikustas Gemini 2.5 Deep Thinki

Tabel, mis võrdleb erinevate tehisintellekti mudelite suutlikkust neljas kategoorias: põhjendamine ja teadmised (Humanity's Last Exam), matemaatika (IMO 2025, AIME 2025) ja koodi genereerimine (LiveCodeBench v6). Iga kategooria all on toodud protsendid erinevate mudelite jaoks: Gemini 2.5 Pro, Gemini 2.5 Deep Think, OpenAI o3, Grok 4. Näiteks Humanity's Last Exam kategoorias sai Gemini 2.5 Deep Think 34.8% ja IMO 2025 kategoorias 60.7% (pronksmedali tase).
Pildi allikas: Google

 

Ülevaade: Google tutvustas Gemini 2.5 Deep Thinki, oma esimest mitmeagendi mudelit, mis on nüüd avalikkusele kättesaadav.

 

Detailid:

  • Gemini 2.5 Deep Think kuulutati välja esmakordselt I/O 2025 üritusel ja see mudel saavutas sel aastal matemaatikaolümpiaadil kuldmedali.
  • Raskete küsimuste lahendamiseks loob mudel korraga mitu agenti, kes uurivad erinevaid lahendusi ja valivad neist parima.
  • Mudel sai Humanity’s Last Exam-il tulemuseks 34,8%, mis oli parem kui Grok 4 ja OpenAI o3 tulemused. See näitas head taset ka programmeerimise ja veebiarenduse ülesannetes.
  • Gemini 2.5 Deep Think on saadaval neile, kes kasutavad Google’i Gemini rakendust kõige kallimas, 250-dollarilises kuupaketis (Ultra). Selle eriversiooni (IMO) saavad kasutada vaid mõned valitud teadlased.

 

Miks see on oluline:Meta tahab luua tehisintellekti, mis oleks justkui inimese isiklik abiline. Google seevastu keskendub teistsugusele lahendusele. Nende AI aitab teadlastel ja uurijatel probleeme lahendada nii, et see ei anna kohe vastust, vaid mõtleb nagu ekspertide meeskond, vaatleb olukorda mitmest küljest ja jõuab alles siis parima lahenduseni.

Uuring: Anthropic uurib tehisintellekti isiksuse muutusi

Infograafik kujutab isiksuse vektorite rakendusi, keskendudes omadussõnale 'kurjus'. Seal on torujuhtme sisend ja väljund ning automaatne protsess nende vahel. Alafunktsioonid hõlmavad isiksuste jälgimist, peenhäälestamisest põhjustatud muutuste leevendamist või vältimist roolimise kaudu ning isiksuse nihkumise põhjustavate andmete tähistamist enne peenhäälestamist. Iga osa on illustreeritud skeemide ja ikoonidega.
Pildi allikas: Anthropic

 

Ülevaade: Anthropic teadlased avastasid kontseptsiooni “Isiksuse Vektorid,” mis on seotud tehisintellekti modelleerimise muutustega. Need aitavad mõista, miks tehisintellekti süsteemid vahel ootamatuid ja ebameeldivaid käitumismustreid kuvavad.

 

Detailid:

  • Tehisintellekti mudeleid õpetatakse olema abivalmid ja ausad, kuid mõnikord võivad nad käituda ootamatult. Näiteks võivad muutuda pahatahtlikuks või näidata eelarvamusi.
  • Kui selline käitumine ilmneb, tekivad AI närvivõrgus kindlad mustrid, mida nimetatakse isiksuse vektoriteks. Need meenutavad inimaju tööviisi.
  • Teadlased tuvastasid need vektorid, analüüsides erinevaid aktiveerimismustreid olukordades, kus tehisintellekt käitus hästi või halvasti.
  • Uuringus keskenduti kolmele probleemile: halb käitumine, pahatahtlikkus ja valede andmine (hallutsinatsioonid). Isiksuse vektorite abil püüti neid probleeme paremini mõista ja vähendada.

 

Miks see on oluline: Tööriistad nagu ChatGPT ja Grok on mõnikord käitunud halvasti, näiteks olnud pahatahtlikud või teinud antisemiitlikke avaldusi. See näitab, et ükski tehisintellekt pole täielikult kaitstud ootamatute käitumismuutuste eest. Anthropic’i uurimus aitab paremini aru saada, miks need muutused tekivad, ja otsida viise nende vältimiseks.