2025. gada janvārī, tiesas prāvas laikā, atklājās, ka Meta, kuru vada Marks Cukerbergs, nelikumīgi izmantoja miljoniem grāmatu, lai apmācītu Llama mākslīgo intelektu. Tagad ir iespējams noskaidrot, kuras konkrēti grāmatas tika izmantotas.
Lielas valodas modeļiem nepieciešami milzīgi tekstu datu kopumi, lai apmācītu un precīzi atspoguļotu valodu. Patiesībā legāli oriģināli materiāli mākslīgajam intelektam kļūst arvien grūtāk pieejami.
«Mēs burtiski beidzamies ar tekstu Visumā, uz kura var apmācīt šīs sistēmas», - teica datorzinātnieks Stjuarts Rasels jau 2023. gadā.
Meta, Facebook un Instagram mātes uzņēmums, bija spiests daļēji atklāt, kā tas tiešām tiek darīts. Tiesas lieta atklāja, ka Meta nelikumīgi lejupielādēja plaši zināmu pirātisko bibliotēku LibGen, lai iegūtu miljoniem aizsargātu tekstu. Pēc tam, kad programmētāji ieguva personīgu atļauju no Cukerberga, grāmatas nelikumīgi tika nodotas LLM apmācīšanai. Tā viena no lielākajām pasaules kompānijām nemaksāja ne par vienu šo grāmatu eksemplāru.
Vietne The Atlantic izveidoja meklēšanas sistēmu, kas ļauj atklāt, kuras konkrēti grāmatas no LibGen datu kopas tika izmantotas Meta. Runa ir par ārkārtēji lielu datu apjomu, kas aptver vairāk nekā 7,5 miljonus grāmatu, apmēram 81 miljonu zinātnisko darbu, kā arī citus darbus.
Prasību vadīja autori Ta-Nehisi Coates un Sara Silverman, kuri aizdomājās par datu pirātismu Meta sakarā ar iepriekšējo prasību 2023. gadā. Jaunais meklēšanas rīks ļauj rakstniekiem un zinātniekiem noskaidrot, kurš darbs tika «uzpirāts» korporācijas mērķim apmācīt komerciālo mākslīgo intelektu.
«Mana grāmata ir šeit - un tas ir labi! LibGen padara tekstus pieejamus cilvēkiem, kuriem citādi šāda piekļuve nebūtu. Problēma ir nevis tā, ka LibGen padara saturu pieejamu bez maksas, bet gan tā, ka Meta zog šo materiālu peļņas gūšanai,» - saka Wired autors Džastins Lings.
Galīgais lēmums notiekošajā procesā tiek gaidīts ne ātrāk kā vasarā. Pa to laiku Llama darbojas un ir pieejams tādās platformās kā Facebook, Instagram un WhatsApp. Šis nav vienīgais līdzīgais process pret lielo kompāniju: pirms gada autori uzsāka tiesvedību pret NVIDIA.
Avots: Futurism
Komentāri (0)
Šobrīd nav neviena komentāra