Google piešķir Gemini 1.5 Pro "ausis" un uzsāk mākslīgā intelekta botu veidotāja Vertex darbību

Saskaņā ar paziņojumu no Google Next pasākuma, turpmāk Gemini 1.5 Pro klausīsies savus lietotājus — praksē modelis spēs reaģēt uz augšupielādētiem audio failiem vai sniegt informāciju, balstoties uz zvaniem un video, nevis nepieciešamību lejupielādēt stenogrammu.

Pats Gemini 1.5 Pro tika ieviests pirmo reizi februārī un tagad ir Google spēcīgākais automātiskās valodas modelis (pārspēj Gemini Ultra veiktspējā). Bez šaubām, tā galvenā īpatnība ir konteksta apjoms, ko modelis var apstrādāt: no 128 000 līdz 1 miljonam žetonu. Miljons žetonu ir aptuveni 700 000 vārdi vai aptuveni 30 000 rindas koda — tas ir aptuveni četrkārt vairāk datu nekā flagmaņa modelis Anthropic, Claude 3 un aptuveni astoņas reizes vairāk nekā GPT-4 Turbo max no OpenAI.

Gemini 1.5 Pro būs pieejama priekšskatā uz Vertex AI — jaunā konstruktoru platformā, kur Google biznesa klienti varēs izveidot savus čatbotus.

Teksta ģenerēšanas modelis Imagen 2 arī ir saņēmis atjauninājumu — tagad tas piedāvā "inpainting" un "outpainting" funkcijas, kas ļaus pievienot vai noņemt elementus no attēliem. Visiem ar neironu tīklu ģenerētajiem attēliem arī var tikt pievienota SynthID atzīme — neredzams ūdenszīme, kas norāda attēla izcelsmi.

Avots: The Verge, Techcrunch