Meta atklāja pirmos divus modeļus no multimodālās saimes Llama 4: Llama 4 Scout un Llama 4 Maverick. Kopumā saimei būs četri modeļi. Divi no tiem jau ir palaisti, bet pārējie parādīsies vēlāk. Pēc Meta teiktā, visi tie apmācījās, izmantojot lielu daudzumu neanotēta teksta, attēlus un video, lai iegūtu plašas vizuālās izpratnes iespējas.
Jauno modeļu paātrinātās palaišanas iemesls bija veiksmīga Ķīnas laboratorijas DeepSeek atvērtā modeļa izstrāde, kas strādā līdzīgā līmenī kā vai pat labāk nekā iepriekšējie Meta modeļi. Saskaņā ar ziņojumiem, Meta steidzami organizēja "kara istabas", lai saprastu, kā DeepSeek izdevās samazināt R1 un V3 modeļu palaišanas un izmantošanas izmaksas.
Pēc uzņēmuma domām, Llama 4 Maverick ir "darba zirgs", kas vislabāk tiek galā ar attēlu un teksta izpratni, palīdzot "tipiskos palīga un tērzēšanas uzdevumos". Savukārt Llama 4 Scout ir piemērots uzdevumiem, piemēram, vairāku dokumentu apkopojumam, liela skaita lietotāju darbību analīzei personalizētiem uzdevumiem un apjomīgu kodu bāzu loģiskai apstrādei.
Meta arī paziņoja par Llama 4 Behemoth — nākotnes modeli, kuru uzņēmums sauc par "vienu no gudrākajiem AI modeļiem pasaulē". Izpilddirektors Marks Cukerbergs piebilda, ka ceturtais modelis — Llama 4 Reasoning — tiks izvērsts nākošajā mēnesī.
Llama 4 Maverick un Scout jau ir pieejami lejupielādei vietnē Llama un Hugging Face, kā arī jau integrēti Meta AI — īpaši WhatsApp, Messenger un Instagram (ziņās).
Llama 4 tehniskās specifikācijas
Llama 4 Scout ir ar 17 miljardiem aktīvajiem parametriem un 16 ekspertiem. Pēc Cukerberga teiktā, šis modelis ir "ārkārtīgi ātrs" un vietējā līmenī multimodāls. Tas var ietvert gandrīz bezgalīgu kontekstu līdz 10 miljoniem tokenu. Tomēr tas ir izstrādāts tā, lai darbotos uz viena grafiskā procesora.
Llama 4 Maverick arī ir ar 17 miljardiem aktīvajiem parametriem, bet tam ir 128 eksperti. Meta apgalvo, ka Maverick:
- Pārspēj GPT-4o, Gemini 2.0 kodēšanas, loģikas, daudzvalodu uzdevumos, darba ar garu kontekstu un attēliem;
- Konkure par loģiskās spriešanas un kodēšanas kvalitāti ar DeepSeek v3.1.
Llama 4 Behemoth
Šis modelis joprojām ir apmācības fāzē, bet Meta jau apgalvo, ka tas būs "visjaudīgākais pamata modelis pasaulē", ar 288 miljardiem aktīvajiem parametriem. Lai arī tas vēl nav prezentēts, drīz būtu jāgaida vairāk informācijas ne tikai par to.
Var sagaidīt arī detaļas par modeli Llama 4 Reasoning. Jo jau pēc dažām nedēļām notiks liela Meta AI izstrādātāju konference — LlamaCon.
2025. gada janvārī tiesas procesā atklājās, ka Meta Marka Cukerberga vadībā nelikumīgi izmantoja miljoniem grāmatu AI Llama apmācībā.
Avots: techcrunch, engadget
Komentāri (0)
Šobrīd nav neviena komentāra