xAI esitles maailma targimat tehisintellekti Grok-3

Elon Musk ja xAI uue põlvkonna Grok-3

Neli meest istuvad pimedas ruumis, taustal on graafik, mille pealkiri on 'Chatbot Arena (LMSYS)'. Graafikul on erinevate süsteemide tulemuslikkus vertikaalse telje kõrval väärtustega 1300 kuni 1400.
Pildi allikas: xAI

Ülevaade: Elon Musk ja xAI tutvustasid Grok-3 mudelit kui maailma kõige targemat tehisintellekti, saavutab kõrgeid tulemusi matemaatikas, teaduses ja programmeerimises ning edestab Gemini-2 Pro, Claude 3.5 Sonnet'i ja GPT-4o mudelit põhilistes võrdlustestides.

Detailid:

  • Peamine Grok-3 mudel võetakse kasutusele järk-järgult Grok rakenduse kaudu, väiksem Grok-3 mini versioon võimaldab kiiremaid vastuseid.
  • Mõlemad mudelid said esikoha AIME'24, GPQA ja LiveCodeBench võrdlustestides, varajane Grok-3 versioon saavutas esikoha Chatbot Areenal.
  • Mudelitel on ka arutlusvõimelised variandid, kus nad justkui "mõtlevad probleemid läbi" sarnaselt OpenAI o3-mini ja DeepSeek R1-le. Nad toetavad ka põhjalikku uurimistööd.
  • Mudelid on treenitud 10x suuremas mahus arvutustel kui Grok-2 ja kasutab xAI Colossus superarvutit koos 200 000 H100 GPU-ga.

Miks see on oluline: Grok-3 positsioneerib ennast kahe aasta vanuse xAI ettevõtte tehisintellekti võidusõidu tippu. Huvitav on jälgida, kui kaua see juhtimine kestab, kuna OpenAI valmistub lansseerima GPT-4.5 ja hiljem GPT-5. Ka Anthropic, DeepMind ning Hiina tegijad nagu Alibaba ja DeepSeek teevad märkimisväärseid edusamme.

Mistrali esimene regioonipõhine tehisintellekt

Diagramm näitab mitme mudeli täpsust viies kategoorias: Arabic MMLU, Arabic TyDiQAGoldP, Arabic Alghafa, Arabic Hellaswag ja English MMLU. Mudelid on tähistatud värviliste tulpadega: oranž (Mistral Saba 24B), kollane (Mistral Small 3 24B), sinine (Qwen 2.5 32B), heleroheline (Jais 70B) ja türkiissinine (LLama 3.1 70B). Täpsust mõõdetakse protsentides vertikaalsel teljel, ulatudes 55%-st 90%-ni. Kõrgeim täpsus on English MMLU kategoorias. Mõnel tulbal on väike kroon.
Pildi allikas: Mistral

Ülevaade: Prantsuse tehisintellekti startup Mistral lanseeris Mistral Saba keelemudeli, mis on loodud Lähis-Ida ja valitud Lõuna-Aasia piirkondadele, mis märgib ettevõtte esimest sammu lokaliseeritud tehisintellekti suunas, mis on kohandatud kindlatele kultuuridele ja keelelistele nüanssidele.

Detailid:

  • Saba on 24B mudel, mis on treenitud Lähis-Ida ja Lõuna-Aasia andmestikul, pakkudes kiiremat ja kulutõhusamat võimet võrreldes suuremate mudelitega.
  • Mudel toetab nii araabia kui ka lõuna india keeli nagu tamili ja malajalam ning käsitleb piirkondade vahelisi keelelisi ja kultuurilisi vajadusi.
  • Saba on disainitud vestlusrobotiks ja kultuuriliselt relevantseks sisu loomiseks, võimaldades loomulikumat suhtlust araabiakeelse auditooriumi liikmetega.
  • See on kättesaadav API kaudu ja lokaalse juurutamise teel, kusjuures Mistral avaldas ka infot kohandatud mudelite kohta ettevõtte strateegilistele klientidele.

Miks see on oluline: Võidujooks suurima ja parima üldmudeli loomise nimel on juba ammu alanud ja täidab uudiste esikaane, kuid väiksemad ning spetsialiseeritumad mudelid läbivad samuti suuri täiustusi, mis pakuvad väärtust piirkondadele, mille keeled ja nüansid ei ole alati põhjalikult kaetud üldistes andmekogudes.

The New York Times'i tehisintellekt uudistes

Roboti peaga tegelane, kes kannab ülikonda ja hoiab kohvrit, kõnnib kontoris, millel on 'New York Times' logo. Taustal on arvutid ja toalilled.
Pildi allikas: Ideogram

Ülevaade: The New York Times viib läbi olulise muudatuse enda organisatsioonis, lubades oma uudistes kasutada nii väliseid kui sisemisi tehisintellekti tööriistu, et efektiivistada töö ülesandeid nagu SEO pealkirjad, redigeerimine, kokkuvõtted ja tootearendus.

Detailid:

  • Tehisintellekti võib nüüd kasutada SEO-s, ajurünnakutes, uurimistöös ja sotsiaalmeedias, kuid endiselt on keelatud artiklite koostamine, pildi genereerimine ja muud redigeerimine.
  • Tööriistad nagu GitHub Copilot, Google'i Vertex AI, NotebookLM ja OpenAI on NYT kinnitusega kasutatavad.
  • Ajaleht tutvustas ka Echo't, sisemist tehisintellekti kokkuvõtete töövahendit, mis on loodud artiklite, teadaannete ja interaktiivse sisu lühendamiseks.
  • Üleminek toimub olukorras, kus NYT on endiselt autoriõiguste kohtuprotsessis OpenAI vastu, väites, et ettevõte on ebaausalt treenitud Times'i sisule.

Miks see on oluline: Suhted suurte väljaandjate ja tehisintellekti vahel on olnud keerulised, kuid paratamatu on, et peaaegu kõik väljaanded kohandavad oma protsesse, et ära kasutada tehnoloogia poolt pakutavat tootlikkuse tõusu. Teised märkimisväärsed väljaandjad, kes kasutavad tehisintellekti, on Financial Times, Vox Media, Axel Springer ja Associated Press.

Jätka lugemist

Uus Facebook? OpenAI hakkas konkurenti ehitama

GPT-4.1 on kohal – odavam, targem ja absurdse kontekstimäluga

32 miljardi unistus: OpenAI kaasasutaja ehitab “turvalist superintellekti”