Mis on Google'i Gemma 3?

märts 13, 2025

Mis on Google’i Gemma 3?

Google Gemma 3 mudel

Diagrammil on 'Chatbot Arena Elo Score' baaride graafik. Seitse valikut järjestatud skooride järgi. Skoorid vasakult paremale: DeepSeek R1 (1363), Gemma 3 27B (1338), Deepseek v3 (1318), o3-mini (1304), Llama3-405B (1269), Mistral Large (1251), Gemma 2 27B (1220). All noteerib ka vajalikke NVIDIA H100 GPU-sid. — *Pildi allikas: Google*

Ülevaade: Google tutvustas uusimat Gemma 3 tehisintellekti mudelit, mis põhineb Gemini 2.0 tehnoloogial. See pakub suurt jõudlust, võrreldes suuremate mudelitega, ning töötab efektiivselt vaid ühe GPU (graafikaprotsessori) või TPU (spetsiaalne kiip, mida Google on arendanud tehisintellekti ja masinõppe rakenduste jaoks) abil.

Detailid:

Mudelid on saadaval neljas suuruses (1B, 4B, 12B ja 27B parameetrit), mis on optimeeritud erinevatele seadmetele alates telefonidest kuni sülearvutiteni.
Inimeste eelistus uuringutes ületab 27B mudel suuremaid konkurente nagu Llama-405B, DeepSeek-V3 ja o3-mini LMArena edetabelis.
Uute funktsionaalsuste hulka kuulub 128 000 märksõna konteksti aken, toetatakse 140 erinevat keelt ning võimalus analüüsida pilte, teksti ja lühivideoid.

Miks see on oluline: Gemma 3 jõudlus on vaimustav, ületades süsteemid, mis on nii suuruses kui arvutusvõimsuses märksa suuremad. Töötades ainult ühel GPU-l, saavutavad need mudelid nüüd varem kujutamatuks peetud tasakaalu – olles avatud lähtekoodiga, võimsad, kiired, multimoodsed ja piisavalt väikesed, et neid saaks rakendada üle erinevate seadmete – tõesti tohutult suur saavutus.

Gemma 3 jõudlus on muljetavaldav, kuna see ületab süsteeme, mis on nii suuruses kui arvutusvõimsuses märksa võimsamad. Need mudelid töötavad nüüd ainult ühel GPU abil, ehk mis varem tundus võimatu, on nüüd võimalik. See on tõeliselt suur saavutus.

Gemini Flash uued pilditöötlusfunktsioonid

Kahel pildil on söögilaud ja toolid heledas ruumis. Ülemisel pildil on laud tühi, alumisel pildil on laual lillevaas värviliste lilledega. Tekst küsib, kas lauale saab lilli lisada. — *Pildi allikas: Google*

Ülevaade: Google tutvustas Gemini 2.0 Flash mudeli uusi pilditöötlus funktsioone, mis võimaldavad kasutajatel pilte üles laadida, luua ja muuta otse keelemudelis, ilma eraldi pildi generatsiooni rakendust kasutamata.

Detailid:

2.0-flash-exp mudel on saadaval API ja Google AI Studios kaudu ning toetab nii piltide kui ka tekstide loomist ja redigeerimist vestluse kaudu.
Gemini kasutab arutlemisvõimet, et säilitada karakteride identiteeti ja mõista reaal-elulisi kontseptsioone kogu vestluse vältel.
Näiteks saab seda kasutada piltide loomiseks looga ja suunata neid vestluste kaudu täiuslikkuse poole.
Google väidab, et Flash 2.0 on tekstide loomisel konkurentidest parem, aidates luua reklaame, sotsiaalmeedia postitusi ja muid kujundusi.

Miks see on oluline: Uus täiendus on suur samm tehisintellekti arengus visuaalse sisu loomisele. Mis tähendab liikumist spetsiaalsetelt pildimudelidelt keelemudelitele, mis mõistavad nii teksti kui pilte. Nii nagu loomulik keel on vallutanud mitmed valdkonnad, on pildi redigeerimine ilmselt järgmine samm.

Sakana avaldas tehisintellekti kirjutatud artikli, mis läbis eelretsenseerimise

Pildil on teadusliku artikli tekst, mis on jaotatud kuuele leheküljele. Igal leheküljel on tihedas formaadis trükitud tekst ning mitmed graafikud ja diagrammid. Artikli pealkiri ja alapealkirjad on erinevates sektsioonides. Graafikud sisaldavad mitmevärvilisi jooni ja graafikute pealdisi, lisades visuaalset sisu. Leheküljenumbrid asuvad lehtede allosas. — *Pildi allikas: Sakana AI*

Ülevaade: Jaapani tehisintellekti startup Sakana teatas, et nende tehisintellekti süsteem on loonud teadusartikli, mis läbis eelretsenseerimise. Firma väidab, et see on esimene täielikult tehisintellekti poolt kirjutatud artikkel, vastab teaduslikele standarditele.

Detailid:

AI Scientist-v2 genereeris kolm artiklit, lõi hüpoteesid, koodi, andmeanalüüsi, visualiseeringud ja teksti ilma inimese abita.
Üks artiklitest võeti vastu ICLR 2025 töötoas ja saavutas keskmise 6.33 tulemuse, mis ületas paljude inimeste kirjutatud artiklite tulemusi.
Sakana märkis ka mõningaid kitsaskohti, nagu tehisintellekti viitamis vead.
Ettevõte järeldas, et artikkel ei vastanud nende sisemistele ICLR standarditele.

Miks see on oluline: Kuigi see verstapost sisaldab mõningaid mööndusi, tähistab see olulist sammu tehisintellekti suurenevas rollis akadeemilises uurimistöös. Sakana ja Google AI teadlaste mudelid näitavad, et teadusmaailma muutus on aina lähemal.