Fei-Fei Li: järgmine suur läbimurre tehisintellektis tuleb ruumilisest mõtlemisest

Tehisintellekti eksperdi üleskutse keskenduda ruumilisele intelligentsusele

Naisjuhendaja räägib konverentsil, seistes mikrofoni ees kõnepuldil. Taustal on häguselt nähtavad istuvad inimesed ja suur ekraan, mis näitab sinakasvalget sisu.
Pildi allikas: Reve

 

Ülevaade: Dr Fei-Fei Li, tuntud tehisintellekti ekspert, avaldas essee, milles selgitab, miks tehisintellekti järgmine suur läbimurre saab olema ruumiline intelligentsus. See tähendab, et süsteemid suudavad mõista ja luua 3D maailmu, mis on kooskõlas füüsikaseadustega.

 

Detailid:

  • Dr Li väidab, et kuigi suured keelemudelid (LLM-id) teavad palju abstraktseid asju, ei oska nad ruumi hästi tajuda või tegutseda, näiteks hinnata kaugust ja liikumist.
  • Ta rõhutab, et ruumiline mõistmine on inimaju kognitiivse võimekuse keskmes ning on vajalik, et tehisintellekt saaks keelelisest mõistmisest edasi liikuda reaalsesse tajumisse ja tegutsemisse.
  • Dr Li ütleb, et superintelligentse AI arendamiseks on vaja maailmamudeleid, mis oskavad luua realistseid 3D keskkondi, mõista sisendeid nagu pildid ja ette näha, kuidas need keskkonnad muutuvad.
  • Ta lisab, et sellised mudelid aitavad tulevikus saavutada uusi edusamme robootikas, teaduses, tervishoius ja disainis, sest need võimaldavad AI-l paremini mõista ja selgitada päris maailma.

 

Miks see on oluline: Maailmamudelid, mis saavad aru, kuidas objektid liiguvad ja üksteisega toimivad, võiksid tulevikus ennustada näiteks molekulide reaktsioone, modelleerida kliimat või testida uusi materjale. Suur väljakutse on õpetada tehisintellektile, kuidas füüsika päriselt töötab, kuid dr Li töö ning Google’i ja Tencenti kiire areng aitavad ruumiliselt nutikad süsteemid samm-sammult reaalsusele lähemale.

Anthropicul on rahalised eelised võrreldes OpenAI-ga

Kahel mehel on karikatuursetes proportsioonides kehad ja nad seisavad tahvli ees, millel on tekst 'The AI Race: Efficiency vs. Scale'. Ühel mehel on seljas must särk kirjaga 'API First' ning ta hoiab käes rahatähti. Tema kõrval on serverikapp sildiga 'Smart Spend'. Teisel mehel on seljas sinine ülikond ning tema kõrval on põlev rahahunnik.
Pildi allikas: Reve

 

Ülevaade: The Informationi andmetel eeldab Anthropic, et nad kulutavad OpenAI-st vähem oma tehisintellekti süsteemide arendamiseks ja hooldamiseks järgmiste aastate jooksul.

 

Detailid:

  • Anthropic ennustab, et nende kulud jõuavad 2025. aastaks 6 miljardi dollarini, samal ajal kui OpenAI kulud ulatuvad umbes 15 miljardi dollarini. Aastaks 2028 kasvavad need numbrid veelgi: Anthropic 27 miljardini ja OpenAI 111 miljardini.
  • Anthropic kulud on väiksemad, sest nad kasutavad odavamaid Amazoni, Nvidia ja Google’i kiipe. OpenAI toetub peamiselt Nvidia kallimatele kiipidele.
  • Anthropic tõstis ka oma tuluootusi. Nad usuvad, et 2027. aastal jõuavad nad positiivse rahavooni ja 2028. aastaks teenivad juba 70 miljardit dollarit.
  • OpenAI loodab teenida 2028. aastaks umbes 100 miljardit dollarit, kuid võib jääda positiivse rahavoota kuni 2030. aastani.

Miks see on oluline: Anthropic püüab luua AI-d võimalikult säästlikult ja väiksemate kuludega. OpenAI tahab samal ajal laiendada oma tegevust paljudele toodetele, näiteks ChatGPT-le ja teadusprojektidele. Nende erinevad lähenemised mõjutavad seda, milliseks AI tulevik kujuneb.

GPT-5 lahendas 9×9 Sudoku mõistatuse

Tabel pealkirjaga "Sudoku-Bench Leaderboard", mis loetleb erinevaid mudeleid ja nende tulemusi. Tabelis on veerud: mudeli nimi, mitme sammu lahendus (4x4, 6x6, 9x9) ASR ja ACP, kõigi mõistatuste keskmine lahendamise määr ning ühel vaatlemisel lahendamise määr (4x4, 6x6, 9x9). Tulemused on esitatud protsentides ja numbrilistes väärtustes. Tabel on värvikoodiga, kus erinevad värvid tähistavad erinevaid lahendamise määrasid.
Pildi allikas: Sakana AI

 

Ülevaade: GPT-5 on esimene tehisintellekt, kes suutis lahendada 9×9 Sudoku mõistatuse, kasutades Sakana AI loodud Sudoku-Bench’i teste, mis kontrollivad põhjalikku mõtlemist ja ruumilist loogikat.

 

Detailid:

  • Mai alguses loodud Sudoku-Bench kontrollib, kui hästi keelemudelid suudavad lahendada erinevaid ja keerulisi Sudoku variante.
  • Varem ei olnud ükski mudel suutnud täielikult lahendada 9×9 Sudokut, kuid GPT-5 sai sellega paremini hakkama kui varasemad mudelid.
  • GPT-5 lahendas umbes 33% mõistatustest, mis on peaaegu kaks korda rohkem kui eelmine parim mudel.
  • Siiski jääb 67% mõistatustest lahendamata, sest mudelitel on raske õppida uusi reegleid ja kasutada loovat mõtlemist, mida inimesed hästi oskavad.

 

Miks see on oluline: GPT-5 oskus Sudokut lahendada näitab, et AI on arenenud ja suudab järjest paremini struktureeritult mõelda, kuid samas on selge, et ta jääb veel inimestest maha. Et seda vahet vähendada, on vaja mudeleid, mis oskavad korraga kasutada matemaatikat, ruumitaju ja loovust. Samu oskusi, mida inimesed kasutavad igapäevaste probleemide lahendamisel.