Mākslīgā intelekta asistents no Ķīnas startapa DeepSeek pirmo reizi pārspēja ChatGPT un kļuva par populārāko bezmaksas aplikāciju App Store ASV, saskaņā ar Sensor Tower datiem (Reuters).
DeepSeek V3 ir atvērtā koda modelis, kas veiksmīgi norādīja savu potenciālu galvenajos testos un pierādīja spēju konkurēt ar vadošajiem nozares modeļiem, vienlaikus uzrādot "uzlabojumus" loģiskās domāšanas uzdevumos. V3 izmanto Mixture-of-Experts (MoE) arhitektūru ar kopējo parametru skaitu 671 miljardi, kur 37 miljardi tiek aktivizēti katram tokenam (salīdzinājumam, V2 priekšgājējai bija 236 miljardi parametru ar 21 miljardu parametru aktivāciju katram tokenam).
Interesanti, ka DeepSeek V3 izmantoja "klasteri, kas sastāv no vairāk nekā 2000 Nvidia čipiem" — salīdzinājumam, līdzīga izmēra modeļu apmācībai amerikāņu uzņēmumi tērē miljonus dolāru uz desmitiem tūkstošu čipu.
Šis ir arī tas pats modelis, kurš uzskatīja sevi par ChatGPT — šeit tiek skaidrots, kāpēc tas notiek.
Pēdējos gados Ķīnas tehnoloģiju giganti un startapi izlaida veselu virkni MI modeli, tomēr tieši DeepSeek izdevās iekarot globālu uzmanību un izraisīt paniku Silīcija ielejas birojos. Nesen uzņēmums atklātā pieejamībā izlaida loģikas modeļa R1, kas mudināja OpenAI pārvietot savu o3-mini modeli uz bezmaksas versiju ChatGPT.
Arī R1 ir savi rekordi — tas kļuva par populārāko modeli, kuru ielādē HuggingFace platformā (vairāk nekā 100 tūkstoši ielādes uz 25. janvāri). Turklāt pirms dažām dienām neatkarīgi analītiķi no Chatbot Arena (platformas, ko organizē Kalifornijas universitātes Bērklijā pētnieki) pievienoja V3 un R1 modeļus labāko pieejamo čatbotu top 10 pēc veiktspējas.
Komentāri (0)
Šobrīd nav neviena komentāra