Anthropicu uus hübriidmudel pakub nii kiirust kui võimekust

veebruar 14, 2025

Anthropicu uus hübriidmudel pakub nii kiirust kui võimekust

Anthropic valmistub järgmiseks Claude mudeliks

Illustratsioon oranžil taustal, millel on stiliseeritud inimese pea profiil, koos peast lähtuva valge kiirtega struktuuriga, mille otstes on ringid. — *Pildi allikas: Anthropic*

Ülevaade: Anthropic plaanib lähiajal välja anda uue tehisintellekti mudeli, mis ühendab traditsioonilised keelelised võimed täiustatud mõtlemisvõimekusega. Mudel oskab hästi programmeerida ning pakub arendajatele suuremat kiirust ja rohkem arvutusvõimsust.

Detailid:

Hübriidlähenemine võimaldab mudelil töötada kas tavalise keelemudelina või sügava mõtlemisvõimekusega, kohanedes erinevate kasutusjuhtudega vastavalt vajadusele.
Süsteem näitab tähtsamat infot skaalal, mis lubab arendajatel täpselt kontrollida iga päringu jaoks kuluvat jõudlust.
Maksimaalsel mõtlemisvõimsusel näitab mudel erilist tugevust reaalsetes programmeerimisülesannetes ning suudab käsitleda suuri koodibaase.
Hiljutised jutud väitsid, et Anthropic’ul on juba sisemiselt mudel, mis on parem OpenAI o3-st. Veel pole seda ohutuskaalutlustel veel välja lastud.

Miks see on oluline: Kuigi OpenAI, Google ja teised on järjepidevalt mudeleid välja lasknud, on Anthropic olnud vaikne pärast Sonnet 3.5. Oluline täiendus võiks ettevõtte tähelepanu keskmesse tuua — ning kuna ka ChatGPT liigub hübriidmudelite suunas, võib Anthropic olla tugevaks konkurendiks neile.

YouTube toob Shortsi AI videolooja

Viis nutitelefoni ekraani, mis näitavad protsessi video loomiseks rakenduses. Esimesel ekraanil on fotode galerii, teisel ekraanil sisestatakse tekst 'Bulldog wearing a helmet and knee pads skateboarding in an empty skate park,' kolmandal ekraanil on tekkinud videod, kus bulldog rulaga sõidab, neljas ekraan näitab valitud videot koos nuppudega ja viies ekraan näitab videot redigeerimise vaates. — *Pildi allikas: YouTube*

Ülevaade: YouTube teatas, et toob Google DeepMindi uusima videoloome mudeli Veo 2 oma Shortsi platvormile – võimaldades loojatel luua kohandatud videoklippe ja taustasid otse tekstikirjelduste põhjal.

Detailid:

Loojad saavad genereerida videoklippe ja dünaamilisi taustasid teksti abil, määrates kindlaks stiilid, kaameraefektid ja filmilaadsed väljanägemised.
Uuendus täiustab olemasolevat Dream Screen’i funktsiooni kiirematel genereerimisaegadel ja täpsemal liikumisel.
Kogu AI-genereeritud sisu sisaldab Google SynthID vesimärke ja selgeid märgiseid, tagamaks läbipaistvust AI sisu osas.
Funktsioon käivitub esmalt USA-s, Kanadas, Austraalias ja Uus-Meremaal Shortsi kaamera liidese kaudu.

Miks see on oluline:

See uuendus toob tipptasemel AI-video otse YouTube’i sisuloojate töövoogu. Enam ei piirdu see vaid lihtsate taustadega – nüüd saab luua terveid klippe ja stseene. See avab uusi loomevõimalusi, aga muudab veelgi keerulisemaks vahet teha, mis on päris ja mis on tehisintellekti loodud.

Gemini Flash 2.0 juhib uut tehisintellekti agentide edetabelit

Tabeli pilt, mis loetleb erinevaid mudeleid nende järjestuse, tüübi, müüja, hinna ja keskmise kategooria skoori järgi. Järjestus on tähistatud vasakul olevas veerus ja algab 'gemini-2.0-flash-001' mudeliga. Tüübid on märgitud kas 'Private' või 'Open source'. Pakkujad on Google, OpenAI, Mistral, Alibaba, Anthropic ja Meta. Hinnad on antud I / O formaadis. Keskmine kategooria skoor (TSQ) on iga mudeli jaoks esitatud ribagraafikuna ja numbriliselt. Kõrgeim skoor on 0.938 ja madalaim on 0.750. — *Pildi allikas: Galileo*

Ülevaade: Galileo Labs lanseeris äsja uue tehisintellekti agentide edetabeli, et hinnata mudelite võimekust käsitleda reaalseid tööriistade interaktsioone, kus Google’i Gemini 2.0 ja OpenAI GPT-4o asuvad kohe hindamise tippudes.

Detailid:

Edetabel hindas 17 juhtivat keelemudelit 14 kategoorias, sealhulgas tööriistade kasutamine, valikuvõimalused, pikaajaline kontekst ja keerukad interaktsioonid.
Flash 2.0 saavutas kõrgeima tulemuse – 0,938 punkti –, edestades isegi kallimaid konkurente ja näidates tugevaid tulemusi kõigis kategooriates.
Avatud lähtekoodiga mudelid vähendavad tasemevahet – näiteks Mistrali uusim Small versioon suudab konkureerida mõne premium-mudeliga, olles samas taskukohasem.
DeepSeeki V3 ja R1 mudelid jäid testimisest välja, kuna neil puudus vajalik funktsionaalsus, kuid need lisatakse hiljem, kui vastavad võimalused tekivad.

Miks see on oluline: Agendid on alles arengujärgus, kuid 2025. aastal saavad neist üks peamisi fookusteemasid. Nende võimekuse mõõtmine muutub tõenäoliselt oluliseks hindamiskriteeriumiks. Kuna agendid on erinevate tugevuste ja spetsialiseerumistega, sõltub valik pigem konkreetsetest vajadustest kui lihtsalt brändist või hinnast.