OpenAI uued tööriistad arendajatele
Ülevaade: OpenAI esitles uusi tööriistu ja uuendusi arendajatele. Nende hulgas on juurdepääs uuele o1 mudelile ja parendused Realtime API-s.
Detailid:
- o1 mudel on nüüd saadaval, pakkudes uusi võimalusi, nagu funktsioonide kutsumine ja struktureeritud väljundid.
- o1 API hind on 15 dollarit 750 000 analüüsitud sõna kohta ja 60 dollarit 750 000 genereeritud sõna kohta.
- Realtime API hinnad on langenud 60%, lisaks on saadaval odavam mini versioon.
- Samuti tutvustati beetaversioone Go ja Java keeles arendamiseks.
Miks see on oluline: Need uuendused pakuvad arendajatele võimalusi luua uusi ja keerukaid rakendusi. o1 mudel ja uued funktsioonid aitavad toota innovaatilisi lahendusi ja arendada edasisi ideid AI valdkonnas.
Nvidiaga taskukohane AI superarvuti
Ülevaade: Nvidia tutvustas Jetson Orin Nano Super Developer Kit'i, mis maksab 249 dollarit ja on kompaktne AI superarvuti, mis on poole odavam kui eelmine mudel, kuid pakub paremat jõudlust.
Detailid:
- Seade on peopesa suurune ja pakub 1,7 korda rohkem jõudlust, 70% rohkem töötlemisvõimsust ja 50% rohkem mälu võrreldes eelmise mudeliga.
- Nano suudab samal ajal teha mitmeid AI ülesandeid, nagu näiteks visuaalsete andmete töötlemine ja robotite juhtimine.
- Platvorm toetab populaarseid AI tööriistu, sealhulgas robootika ja visuaalse jälgimise jaoks.
- Juba olemasolevad Jetson Orin Nano kasutajad saavad tasuta tarkvarauuenduse, et saavutada sarnane jõudluse tõus.
Miks see on oluline: Nvidia odav AI superarvuti võib innustada uusi arendajaid looma nutikaid roboteid ja loomingulisi AI tööriistu oma kodus. AI tööriistade kasutamine on nüüd lihtsam kui kunagi varem.
Uued DeepMind'i testid LLM-i täpsuse osas
Ülevaade: Google DeepMind tutvustas uut FACTS testimis tulemusi, et hinnata, kuidas LLM-id suudavad anda täpseid ja põhjalikke vastuseid, vältides hallutsinatsioone.
Detailid:
- FACTS koosneb 1719 näitest, mis koosneb dokumendist, juhisest ja küsimusest, et testida vastuste andmise oskust.
- Kolm tehisintellekti mudelit (Gemini 1.5 Pro, GPT-4o ja Claude 3.5 Sonnet) hindavad vastuseid nende täpsuse ja päringute käsitlemise järgi.
- Tulemused koondatakse ja avaldatakse Kaggle'i edetabelis, mis uuendatakse uute mudelitega.
- Google'i Gemini mudelid on hetkel parimad, Gemini 2.0 Flash Experimental saavutas 83,6% täpsuse.
Miks see on oluline: Valeinfo on suur probleem, mis mõjutab isegi parimaid LLM-e, vähendades nende usaldusväärsust. FACTS Groundingu tulemuste järgi saame jälgida LLM-ide edusamme vastuste andmises.