Google haarab kinni ebaõnnestunud OpenAI tehingust

Google astub mängu, samal ajal kui OpenAI ja Windsurf tehing ebaõnnestub

Kaks animeeritud tegelast sõidavad lainetes surfilaudadel. Ühel neist on pruunid lühikesed püksid ja sinine särk ning tema laud on kaunistatud Google'i logoga. Teine kannab musta särki ja siniseid teksaseid. Esiplaanil olev tegelane naeratab ja on enesekindel, taustal olev tegelane paistab olevat tasakaalu kaotamas. Taustal on sinine taevas ja mõned valged pilved.
Pildi allikas: Ideogram

 

Ülevaade: Google palkab Windsurf’i tegevjuhi Varun Mohani ning mitmed teadlased 2,4 miljardi dollari suuruse litsentsilepingu raames. See toimus pärast seda, kui OpenAI ja Windsurf’i 3 miljardi dollarine tehing ebaõnnestus Microsoftiga seotud probleemide tõttu.

 

Detailid:

  • Mohan ja kaasasutaja Douglas Chen liituvad Google’iga, et töötada Gemini kallal, samal ajal kui Windsurf jääb iseseisvaks uue ajutise tegevjuhi juhtimisel.
  • OpenAI tehing ebaõnnestus, kuna Windsurf’il olid mured oma tehnoloogia jagamise pärast Microsoftiga, kellega neil olid juba koostöölepped.
  • 3 miljardi dollari tehingu eksklusiivsus lõppes, kuna Microsoft keeldus andmast OpenAI-le erandit, mis oleks võimaldanud Windsurf’il vältida oma tehnoloogia jagamist.
  • Uus leping sisaldab mitmeaastaseid tasuta pakette ja mitte-eksklusiivset litsentsi, mis võimaldab Windsurf’il edasi teenindada oma kliente.

 

Miks see on oluline: Windsurfi tehingust pidi saama OpenAI suurim ost, aga nüüd on see järjekordne probleem keerulisel ajal, mida nimetatakse AI suveks. Tagasilöök Microsoftiga suurendab pingeid kahe ettevõtte vahel, kelle suhted on juba niigi kehvad.

Moonshot AI K2 juhib avatud lähtekoodi valdkonda

Graafik erinevate tarkvaraarenduse ja STEM-i võrdlusuuringute tulemustega. Ülemises osas on 'Agentic and Competitive Coding' kategooria, mis sisaldab SWE-bench Verified, SWE-bench Multilingual, LiveCodeBench v6 ja OJBench tulemusi. Alumises osas on 'Tool Use' ja 'Math & STEM' kategooriad, mis sisaldavad Tau2-bench, AceBench(en), AIME 2025 ja GPQA-Diamond tulemusi. Erinevad jooned esindavad erinevaid tööriistu või meetodeid.
Pildi allikas: Moonshot AI

 

Ülevaade: Hiina idufirma Moonshot AI tutvustas Kimi-K2 nimelist mudelit, millel on lausa 1 triljon parameetrit. See mudel suudab mitmes valdkonnas konkureerida parimate tehisintellektidega ja isegi neist paremini hakkama saada, eriti programmeerimise ja agendilikes ülesannetes.

 

Detailid:

  • K2 on saanud paremaid tulemusi kui GPT-4.1 ja Claude 4 Opus, eriti programmeerimise testides. Samuti saavutas see häid tulemusi matemaatikas ja loodusteadustes, kuigi tal puudub veel võime argumenteerida.
  • Mudel on väga tugev agendilikes töövoogudes, suutes edukalt lahendada keerulisi ülesandeid, nagu andmeanalüüs ja reiside broneerimine, kasutades erinevaid tööriistu.
  • Moonshot lõi spetsiaalse tööriista nimega MuonClip, mis aitas K2 treenida sujuvalt ja ilma suuremate probleemideta.
  • Kuigi K2 ei oska veel käidelda erinevaid sisendeid korraga ega arutleda, plaanib Moonshot need oskused tulevikus lisada.

 

Miks see on oluline: Kuigi Moonshoti uue mudeli tutvustus ei tekitanud nii palju tähelepanu kui „DeepSeek hetk”, on K2 tulemused väga muljetavaldavad, eriti avatud lähtekoodiga mudeli kohta. Kui K2-le lisandub võimekus argumenteerida, võiks see mudel jõuda täiesti uuele tasemele.

Tehisintellekti tööriistad aeglustavad kogenud arendajaid

Graafik pealkirjaga "Asjatundjad ja uuringus osalejad hindavad valesti AI kiirendust". Y-teljel on näidatud aja muutus AI kasutamise korral. Majanduse eksperthinnangud, masinõppe ekspertide hinnangud, arendajate hinnangud uuringu ajal ja pärast uuringut on kõik esitatud roheliste punktidega allpool nulljoont, näidates ajasäästmist. Punane punkt näitab jälgitavat tulemust, mis on nulljoonest kõrgemal.
Pildi allikas: METR

 

Ülevaade: METR instituudi uuringust selgub, et kogenud arendajad vajavad AI tööriistadega töötades rohkem aega, kuigi tunnevad, et on produktiivsemad.

 

Detailid:

  • Uuriti 16 kogenud arendajat, kes lahendasid 246 ülesannet suurtes koodibaasides, kus oli keskmiselt üle 22 000 märgi ja üle 1 miljoni koodirea.
  • Arendajad arvasid, et AI-tööriistad, nagu Cursor Pro, säästavad neile 24% ajast, kuid tegelikkuses võttis see 19% rohkem aega.
  • Arendajad veetsid vähem aega koodi kirjutamisel ning rohkem aega AI tööriistade juhendamisel ja nende vastuste ootamisel.
  • Kuigi arendajad arvasid, et AI tegi nad 20% efektiivsemaks, ütlesid tulemused vastupidist.

 

Miks see on oluline: Need tulemused on üllatavad, sest paljudes suurtes firmades kirjutab AI juba suure osa koodist. Kiiruse asemel peaks vaatama, kas AI muudab kodeerimise lihtsamaks, isegi kui see võtab rohkem aega.