OpenAI mini arendajate päeva uuendused

detsember 18, 2024

OpenAI mini arendajate päeva uuendused

OpenAI uued tööriistad arendajatele

Ülevaade: OpenAI esitles uusi tööriistu ja uuendusi arendajatele. Nende hulgas on juurdepääs uuele o1 mudelile ja parendused Realtime API-s.

Detailid:

o1 mudel on nüüd saadaval, pakkudes uusi võimalusi, nagu funktsioonide kutsumine ja struktureeritud väljundid.
o1 API hind on 15 dollarit 750 000 analüüsitud sõna kohta ja 60 dollarit 750 000 genereeritud sõna kohta.
Realtime API hinnad on langenud 60%, lisaks on saadaval odavam mini versioon.
Samuti tutvustati beetaversioone Go ja Java keeles arendamiseks.

Miks see on oluline: Need uuendused pakuvad arendajatele võimalusi luua uusi ja keerukaid rakendusi. o1 mudel ja uued funktsioonid aitavad toota innovaatilisi lahendusi ja arendada edasisi ideid AI valdkonnas.

Nvidiaga taskukohane AI superarvuti

Ülevaade: Nvidia tutvustas Jetson Orin Nano Super Developer Kit’i, mis maksab 249 dollarit ja on kompaktne AI superarvuti, mis on poole odavam kui eelmine mudel, kuid pakub paremat jõudlust.

Detailid:

Seade on peopesa suurune ja pakub 1,7 korda rohkem jõudlust, 70% rohkem töötlemisvõimsust ja 50% rohkem mälu võrreldes eelmise mudeliga.
Nano suudab samal ajal teha mitmeid AI ülesandeid, nagu näiteks visuaalsete andmete töötlemine ja robotite juhtimine.
Platvorm toetab populaarseid AI tööriistu, sealhulgas robootika ja visuaalse jälgimise jaoks.
Juba olemasolevad Jetson Orin Nano kasutajad saavad tasuta tarkvarauuenduse, et saavutada sarnane jõudluse tõus.

Miks see on oluline: Nvidia odav AI superarvuti võib innustada uusi arendajaid looma nutikaid roboteid ja loomingulisi AI tööriistu oma kodus. AI tööriistade kasutamine on nüüd lihtsam kui kunagi varem.

Uued DeepMind’i testid LLM-i täpsuse osas

Ülevaade: Google DeepMind tutvustas uut FACTS testimis tulemusi, et hinnata, kuidas LLM-id suudavad anda täpseid ja põhjalikke vastuseid, vältides hallutsinatsioone.

Detailid:

FACTS koosneb 1719 näitest, mis koosneb dokumendist, juhisest ja küsimusest, et testida vastuste andmise oskust.
Kolm tehisintellekti mudelit (Gemini 1.5 Pro, GPT-4o ja Claude 3.5 Sonnet) hindavad vastuseid nende täpsuse ja päringute käsitlemise järgi.
Tulemused koondatakse ja avaldatakse Kaggle’i edetabelis, mis uuendatakse uute mudelitega.
Google’i Gemini mudelid on hetkel parimad, Gemini 2.0 Flash Experimental saavutas 83,6% täpsuse.

Miks see on oluline: Valeinfo on suur probleem, mis mõjutab isegi parimaid LLM-e, vähendades nende usaldusväärsust. FACTS Groundingu tulemuste järgi saame jälgida LLM-ide edusamme vastuste andmises.