ChatGPT “Deep Research” – teeb teadustöid koos viidetega!

February 3, 2025

ChatGPT “Deep Research” – teeb teadustöid koos viidetega!

OpenAI tutvustab tehisintellekti uurimis assistenti

Vaade ekraanile, kus on kuvatud lumelaudade uurimine kesktaseme freestyle sõitjatele. Vasakul on sõitja spetsifikatsioonid: kogemus: kesktase, tüübi: freestyle, pikkus: 180 cm, kaal: 89 kg, kinganumber: 11, eelarve: $500-$700. Keskosas on tekst, mis lubab otsida sobivaid lumelaudu, mis tasakaalustavad jõudlust ja vastupidavust, ning uuendatakse parimate valikutega. Paremal on allikate loend, sealhulgas Evo, Snowboard Review Hub ja Burton. — *Pildi allikas: OpenAI*

Ülevaade: OpenAI just lansseeris Deep Research’i, uue ChatGPT funktsiooni, mis teeb põhjalikke veebiotsinguid keerulistel teemadel ning koostab üksikasjalikke aruandeid viidete ja allikatega alla 30 minuti.

Detailid:

Süsteem kasutab o3 mudelit, et analüüsida teksti, pilte ja PDF-e erinevatest allikatest, et luua põhjalikke teaduslikke kokkuvõtteid.
Algne ligipääs on piiratud Pro tellijatele (200$/kuu) kuni 100 päringut kuus, kuid kui ohutuse näitajad püsivad stabiilsed, laiendatakse seda Plus ja Team kasutajatele mõne nädala jooksul.
Uurimis ülesanded võtavad 5-30 minutit, kasutajad saavad alguses täpsustavatele küsimustele vastata ning hiljem teatise tulemustest.
Deep Research saavutas 26,6% tulemuse Inimkonna Viimasel Eksamil (Humanity’s Last Exam), ületades märgatavalt teisi tehisintellekti mudeleid nagu Gemini Thinking (6,2%) ja GPT-4o (3,3%).

Miks see on oluline: ChatGPT on seni tulnud hästi toime kiirete vastustega, kuid Deep Research tähistab esimest suurt katset lahendada keerukaid ülesandeid, mis tavaliselt võtavad inimestel päevi. Koos Operatori lansseerimisega ja muude uuendustega muutub tehisintellekti maastik järjest autonoomsemaks ja läbimõeldumaks.

OpenAI tutvustab o3-mini mõtlemisvõimelist mudelit

Kaks graafikut mustal taustal. Vasakpoolsel graafikul on toodud täpsusprotsendid (võistlusmatemaatika AIME 2024) erinevate OpenAI mudelite jaoks: 'o1-preview' 56,7, 'o1' 83,3, 'o1-mini' 63,6, 'o3-mini (low)' 60,0, 'o3-mini (medium)' 79,6, 'o3-mini (high)' 87,3. Parempoolsel graafikul on toodud ELO punktid (võistluskood Codeforces) samade mudelite jaoks: 'o1-preview' 1258, 'o1' 1891, 'o1-mini' 1650, 'o3-mini (low)' 1831, 'o3-mini (medium)' 2036, 'o3-mini (high)' 2130. — *Pildi allikas: OpenAI*

Ülevaade: Reedel avaldas OpenAI o3-mini, uue kulutõhusa mõtlemisvõimelise mudeli, mis toob kõrgenenud STEM võimekused nii tasuta kui ka tasuliste kasutajate jaoks, märkimisväärselt vähendades kulusid ja vastamisaegu võrreldes eelnevate versioonidega.

Detailid:

Tasuta kasutajad saavad esmakordselt ligipääsu mõtlemisvõimele o3-mini kaudu, tasulised kasutajad saavad laiendatud limiidid kuni 150 sõnumini päevas.
o3-mini näitab erilist oskust tehnilistes valdkondades nagu matemaatika ja kodeerimine, ületades o1 jõudlust ning reageerides 24% kiiremini.
Arendajad saavad reguleerida “mõtlemispingutust” kolme erineva seadega – madal, keskmine ja kõrge – tasakaalustades kiirust ja täpsust erinevates kasutusstsenaariumides.
Süsteemi käitamiskulud on 63% madalamad võrreldes eelkäijaga, langetades hinna 1,10 dollarini miljoni sisendtokeni kohta, säilitades samal ajal konkurentsivõimelise jõudluse.

Miks see on oluline: DeepSeek on viimase nädala jooksul olnud küll kõikide artiklite esikaanel, kuid OpenAI-l tundub alati olevat veel üks vägev trump varrukas peidus. o3-mini toob tasuta kasutajatele esimese mõtlemis mudeli ning juba täiendatud o3 mudel on tulemas mõne kuu jooksul.

Sam Altmani seisukoht avatud lähtekoodist

Kuvatõmmis näitab teadaannet OpenAI AMAst (Ask Me Anything) Redditis. Osalejad on Sam Altman, Mark Chen, Kevin Weil, Srinivas Narayanan, Michelle Pokrass ja Hongyu Ren, keda tutvustatakse koos nende ametinimetuste ja Redditi kasutajanimedega. Küsimustele vastatakse ajavahemikus 14:00 kuni 15:00 PST. Postituse lõpus on link Twitteri postitusele. — *Pildi allikas: Reddit*

Ülevaade: OpenAI korraldas Redditis AMA-sessiooni pärast o3-mini mudeli lanseerimist, kus tegevjuht Sam Altman, tooteüksuse juht Kevin Weil ja teised vastasid küsimustele alates avatud lähtekoodist kuni tulevaste funktsioonide ja mudelite ajakavadeni.

Detailid:

Altman tunnistas, et tema arvates on nad “ajaloos valel poolel” seoses avatud lähtekoodiga ning OpenAI-l on vaja välja töötada strateegia.
Tegevjuht ütles, et tema hinnangul võetakse täielik o3 mudel kasutusele mitte päris nädalate, aga mitte ka mitmete kuude pärast.
Altman kommenteeris ka DeepSeek mudelit, nimetades seda “väga heaks mudeliks” ning lisas, et OpenAI “toodab paremaid mudeleid, kuid säilitab väikse edu”.
Weil andis mõned detailid tulevaste väljalasete kohta, öeldes, et varsti saavad kättesaadavaks uued agendid ja uus pildigeneraator.

Miks see on oluline: Peamine uudis on avatud lähtekoodi kommentaar, mis on OpenAI suurim kriitikapunkt. Kuigi muutusi ei pruugi kohe näha, võib iga väike muudatus muuta kogu valdkonna suunda.