DeepSeek endiselt esikaanel - uus pildiloomise mudel

January 28, 2025

DeepSeek endiselt esikaanel – uus pildiloomise mudel

DeepSeek lanseerib uue tehisintellekti pildi mudeli

Kollaaž kuuest pildist, võrreldakse Janust ja Janus-Pro-7B. Ülemine rida: kaks portreefotot tüdrukutest, aurav kohvitass puidust laual, punase veiniga klaas peegelduval pinnal. Alumine rida: kaks fotot apelsinist punasel kangal, tahvli pilt, millel on kriidiga kirjutatud 'Hello', lähivõte päevalillest mesilasega õiele ning sellel on valgussära. — *Pildi allikas: DeepSeek*

Ülevaade: DeepSeek tekitab USA tehnoloogiaettevõtetes tõsist peavalu, sundides investoreid kahtlema, kas kallid tehnoloogiad on üldse õigustatud, kui Hiina pakub sama kvaliteeti kordades odavamalt. Täna rapuvad nad turgu järgmiste uuendustega – värskeim neist on Janus-Pro, avatud lähtekoodiga multimodaalne tehisintellekti mudel, mis edestab konkurente nagu DALL-E 3 ja Stable Diffusion.

Detailid:

Uus Janus-Pro mudel loob teksti kirjeldustest kõrgkvaliteetseid pilte, saadaval on 1B ja 7B parameetriga mudelid.
Janus-Pro edestas DALL-E 3 ja Stable Diffusionit benchmark testides pildi kvaliteedi ja täpsuse osas.
Mudelid avaldati MIT litsentsiga, mis võimaldab arendajatel mudelit vabalt kasutada ja kohandada äriprojektides.
Lansseerimine järgneb DeepSeek R1 väljatulekule, mis saavutas o1-taseme mõtlemisvõime märkimisväärselt madalama hinnaga – üllatades USA turgu ja kogu tööstust.

Miks see on oluline: DeepSeek on viimasel ajal palju kõneainet pakkunud, sundides maailma ümber hindama arenduskulude ja tehnoloogia võimaluste tasakaalu. Kuigi praegune paanika võib olla liialdatud, on Hiina labor seadnud küsimärgi alla USA senise liidrirolli selles valdkonnas.

Qwen toob turule tehisintellekti, mis juhib seadmeid

Ekraanipilt arvutis töötavast pilditöötlusprogrammist. Paremal pool kuvatakse naise foto, kes istub õues pingil, taustal on rohelised taimed. Vasakul pool on ekraani menüüde ja tööriistade riba, mille kohal on tekst inglise ja hiina keeles, küsides abi foto värvide elavdamiseks. Ekraani paremas ülanurgas on tekst 'NEXT.' — *Pildi allikas: Alibaba*

Ülevaade: Alibaba Qwen-i meeskond tõi just välja Qwen2.5-VL, uue visiooni-keele mudeli, mis suudab suhelda arvutite ja telefonidega ning pakub täiustatud võimekusi dokumentide ja videote analüüsimiseks.

Detailid:

Juhtiv 72B mudel ületab GPT-4o ja Claude 3.5 Sonnet-i peamistes dokumentide töötlemise ja videote mõistmise võrdlustestides.
Süsteem suudab analüüsida tunniajaseid videoid, leida spetsiifilisi momente ning töödelda keerukaid dokumente nagu arved ja vormid.
Uus funktsioon annab tehisintellektile agendiõigused nutitelefoni rakendusteks ja arvutiteks, näidates demo lennupiletite broneerimisest pilditöötluseni ja koodi paigaldamiseni.
Väiksemad 3B ja 7B versioonid on tasuta kättesaadavad, 72B mudel nõuab aga luba ulatuslikeks ärikasutuseteks.

Miks see on oluline: Qwen-i arvutikasutamise visioonimudel ilmus vaid nädal pärast OpenAI sensatsioonilist väljalaset. Qwen-i ja DeepSeek-i viimase nädala väljalasked näitavad, et vahe Hiina ja USA mudelite vahel on kuidagi märkamatult kitsenenud.

Meta tehisintellekt saab personaliseerimise täiustuse

Kolm mobiiliekraani, millel on näha Meta AI vestlused. Esimesel ekraanil pakub tehisintellekt hommikusöögi retsepti munade, paprikate, sibulate ja seentega. Kasutaja vastab: — *Pildi allikas: Meta*

Ülevaade: Meta teatas just uutest tehisintellekti personaliseerimise funktsioonidest, mis võimaldavad abistajal meeles pidada vestlusi ja kasutada andmeid Facebookist, Instagramist ja WhatsAppist.

Detailid:

Meta tehisintellekt suudab nüüd meelde jätta olulisi üksikasju ühele-ühele vestlustest, nagu toitumiseelistused ja huvid, et pakkuda täpsemat vastust.
Abistaja pääseb ligi kasutajate Facebook’i asukohtadele, Instagram’i vaatamisajaloole ja muudele profiili andmetele personaalsete soovituste tegemiseks.
Funktsioonid käivituvad Ameerika Ühendriikides ja Kanadas Meta platvormidel ilma välja astumise võimaluseta, kuigi kindlaid vestluste mälestusi saab kustutada.
ChatGPT ja Gemini on samuti lisanud ‘mälu’ oma abilistele, kuid see on piiratud ainult vestluse sees olevatele andmetele ning ei kasuta sotsiaalseid andmeid.

Miks see on oluline: Metal on käsutuses rikkalik sotsiaalmeedia andmestik ning selle kasutamine võib anda ainulaadse eelise kasutajakogemuses. Siiski tundub suur risk olevat andmete kasutamine ja usalduse tekitamine kasutajates, Meta ajalugu näitab, et sellega on ennegi probleeme olnud.