Google Gemini sõidab konkurentidest üle

Google’i Gemini 2.5 Pro liigub edetabelites järjest kõrgemale

Rohelisel taustal on sõnajalg. Selle kõrval on valgel taustal stiliseeritud, koodi meenutava struktuuriga joonis sõnajalast. Vasakul sõnajalale on lisatud tekst: 'Transform this image into a code-based representation of its natural behavior.'
Pildi allikas: Google

 

Ülevaade: Google näitas enne I/O konverentsi Gemini 2.5 Pro uut versiooni, mis teeb koodi kirjutamise ja veebiarenduse palju paremaks ning viib mudeli tehisintellekti edetabelite tippu.

 

Detailid:

  • Uuendus saavutas WebDev Arena edetabelis esikoha, ületades märkimisväärselt eelmise liidri Claude 3.7 Sonnet’i.
  • Mudel töötab nüüd paremini kasutajaliideste loomisel, koodi muutmisel ja keerukate protsesside arendamisel.

  • 2.5 Pro suudab ka videoid paremini mõista, mis võimaldab näiteks teisendada videosisu interaktiivseteks õpirakendusteks.
  • Lisaks on mudel LM Arena edetabelis esikohal igas kategoorias, edestades ka OpenAI o3 mudelit.

 

Miks see on oluline: Google’i suur I/O üritus on küll alles ees, aga ettevõte ei suutnud oodata ja näitas juba oma uusimat tehnoloogiat. Nagu ka detsembris, toob Google taas välja võimsa mudeli ilma suure kärata. Esimesed testid ja demod viitavad, et programmeerimine on saanud suure arenguhüppe.

HeyGen lisab animatsioonidele rohkem emotsionaalsust

Collaaž neljast fotost naise erinevatest vaatenurkadest. Naine kannab siniseid huulepulka ja kübarat, mis on kaunistatud siniste ja valgete detailidega. Esimesel ja kolmandal fotol on külgprofiil, teisel otsevaade ning neljandal on vaade ülalt. Naise riietus on siniste ja valgete mustritega.
Pildi allikas: HeyGen

 

Ülevaade: HeyGen esitles uut Avatar IV mudelit, mis suudab vaid ühe foto põhjal luua elutruid ja väljendusrikkaid animatsioone, tabades hääletooni, loomulikke žeste ja näoilmeid.

 

Detailid:

  • HeyGeni uus mudel kasutab hääle analüüsi, et luua loomulikke näoilmeid.
  • See vajab vaid ühte pilti ja helifaili ning töötab ka külgvaadete, loomade ja anime-tegelaste puhul.
  • Avatar IV toetab nii portree-, pool- kui täiskehaversioone, võimaldades teha elavamaid ja tavapärasest erinevaid videoid.
  • HeyGen ütleb, et see sobib hästi näiteks sisuloojate videote, laulvate avataride, mängutegelaste ja visuaalsete podcast’ide jaoks.

 

Miks see on oluline: HeyGen loob jätkuvalt AI avatare, mis näevad realistlikud välja. Uued kaadrinurgad ja formaadid võimaldavad palju mitmekesisemat videoloomet.

Lightricksi uus avatud lähtekoodiga videomudel

Vanem mees pika valge habemega ja musta laia äärega mütsiga, hoiab käes keppi. Taustal on hägune maastik.
Pildi allikas: Lighttricks

 

Ülevaade: Lightricks tutvustas LTXV-13B nimelist avatud tehisintellekti mudelit, mis teeb kvaliteetset videot 30 korda kiiremini kui senised lahendused ja töötab ka tavalises arvutis.

 

Detailid:

  • Mudel kasutab uut lähenemist, kus video luuakse kihtidena, mis tagab sujuvama ja ühtlasema tulemuse.
  • See töötab ka tavalises arvutis, ilma et oleks vaja kalleid masinad, säilitades samal ajal kiiruse ja kvaliteedi.
  • Lisatud on ka funktsioonid nagu täpne kaameraliikumine ja mitme stseeni ühendamine, et saavutada profitasemel tulemus.
  • LTXV on avatud lähtekoodiga ja tasuta kasutamiseks ettevõtetele, kelle käive on alla 10 miljoni dollari. Mudel kasutab treenimiseks andmeid koostöös Getty ja Shutterstockiga.

 

Miks see on oluline: AI-videomudeleid on nüüd palju rohkem kui aasta tagasi, ja tehnoloogia on selle ajaga täielikult muutunud. Liikumine, sujuvus, kiirus ja efektiivsus arenevad kiiresti ning uute kvaliteetsete avatud lähtekoodiga tööriistadega on videotegemine lihtsam ja parem kui kunagi varem.