Uus Gemini 2.0 Flash Thinking mudel

January 23, 2025

Uus Gemini 2.0 Flash Thinking mudel

Google DeepMind esitleb Gemini 2.0 Flash Thinking’ut

Kaks graafikut mustal taustal, millel kummalgi on lineaarne tõus. Vasakul graafikul pealkirjaga 'AIME2024 (Math)' on vertikaalteljel vahemik 35% kuni 75% ja horisontaaltelg on märgistatud 'Inference Compute (log scale)'. See näitab andmepunkte '2.0 Flash' ja '2.0 Flash Thinking (Exp 1219)' ning andmepunkt '2.0 Flash Thinking (Exp 01-21)' on kõrgeim punkt. Paremal graafikul pealkirjaga 'GPQA Diamond (Science)' on vertikaalteljel vahemik 58% kuni 74% ja sama horisontaaltelg, samuti andmepunktid '2.0 Flash', '2.0 Flash Thinking (Exp 1219)' ja kõrgeim punkt '2.0 Flash Thinking (Exp 01-21)'. — *Pildi allikas: Google DeepMind*

Ülevaade: Google DeepMind tutvustas just Gemini 2.0 Flash Thinking’ut, uut tasuta katse tehisintellekti mudelit, mis saavutab uusi kõrgeid tulemusi matemaatikas, teaduslikus mõtlemises ja multimodaalsete standardites ning on tõusnud ka LM Arena edetabelis esikohale.

Detailid:

Mudel saavutas AIME’s (matemaatika) 73,3% ja GPQA Diamond’is (teadus) 74,2% õigeid vastuseid, näidates märkimisväärset arengut varasemate tulemustega.
1 miljoni tokeni kontekstiaken võimaldab töödelda viis korda rohkem tekste kui OpenAI praegused mudelid.
Süsteemis on ka sisseehitatud koodi käivitamine, mis näitab selgelt, kuidas mudeli mõtlemisprotsess välja näeb.
Mudel on beta-testimise ajal tasuta, kuid kasutuspiirangutega.

Miks see on oluline: Google jätkab üllatamisega – uus Flash Thinking mudel ületab oma varasema mudeli võimekust ja võtab LLM edetabelis esimese koha. Lisaks, tugevad mõtlemisvõimed ja 1 miljoni tokeni suurune kontekstiaken tähendavad, et kasutajad saavad peagi kogeda võimsat tehisintellekti ja selle võimalusi tasuta.

Musk ja Altman kaklevad 500 miljardi dollari suuruse Stargate projekti üle

Kaks bokserit karikatuurina poksiringis, mõlemal sinised boksekindad, nende ümber lendab dollari kupüüre. — *Pildi allikas: Grok*

Ülevaade: Elon Musk vaidlustas avalikult OpenAI hiljuti kuulutatud 500 miljardi dollari suuruse Stargate projekti rahastamise, mis algatas kuuma vaidluse OpenAI tegevjuhi Sam Altmaniga sotsiaalmeedia platvormil X.

Detailid:

OpenAI kuulutas Stargate projekti välja teisipäeval, plaanides luua laiahaardelist tehisintellekti infrastruktuuri Ameerika Ühendriikides, mida rahastavad Oracle, SoftBank ja teised.
Microsofti tegevjuht Satya Nadella kinnitas projekti toetust avalikus intervjuus CNBC-le, kinnitades ettevõtte 80 miljardi dollari suurust investeeringut.

Miks see on oluline: Pärast Valge Maja Stargate avalikustamist hakkasid paljud küsima, kuidas Musk reageerib, arvestades tema tõusu Trumpi mõjusfääri ja OpenAI vastasseisu. Tundub, et nüüd liigub konflikt poliitilisse sfääri, kus Eloni roll nii konkurendi kui ka valitsuse nõustajana teeb olukorra veelgi keerulisemaks.

ByteDance lansseeris uue põhjendamisagendi (reasoning agent)

Tabel, mis võrdleb erinevaid tehisintellekti mudeleid eri kategooriates, nagu teadmised, matemaatika, kood, põhjendamine, juhiste järgimine ja hiina keel. Kategooriate all on alamtestid, mille tulemused on esitatud protsendina iga mudeli kohta. Tabelis on seitse mudelit, sealhulgas Doubao-1.5-pro ja DeepseekV3. Iga mudeli tulemus on esitatud vastava testi all. — *Pildi allikas: ByteDance*

Ülevaade: ByteDance tõi just turule Doubao 1.5 Pro, mis saavutab paremat jõudlust, kasutades oluliselt vähem ressursse kui konkurendid, ning uue avatud lähtekoodiga põhjendamisagendi mudeli.

Detailid:

Uus mudel ületab konkurente nagu GPT-4o, Claude 3.5 Sonnet ja Deepseek V3 teaduslikes küsimustes, programmeerimises, põhjendamises ja hiina keele üldtestides.
Doubao hind on samuti oluliselt madalam kui OpenAI mudelitel, sest ta kasutab palju vähem arvutusressurssi kui teised mudelid.
ByteDance lansseeris ka UI-TARS, avatud lähtekoodiga GUI tehisintellekti agendi mudeli, mis suudab põhjendada ja teostada arvutiga interaktsioone, tuginedes ekraanipiltide sisendile.

Miks see on oluline: Kuigi ByteDance’il on olnud viimased kuud seoses TikToki keelustamisega väga palju probleeme, ei ole see pidurdanud ByteDance’il tehisintellekti arendust. Tundub, et Hiinal pole mingit probleemi püsida konkurentsis teiste AI ettevõtetega.