MegaBits.lv - ir tiešsaites žurnāls, kur tu vari atrast jaunumus un ziņas par mūsdienīgam tehnoloģijam


Atpakaļ
Zinātne un Kosmoss

Valodas modeļi un cilvēka runa darbojas līdzīgi - mākslīgais intelekts ir palīdzējis zinātniekiem pētīt smadzenes

vakar 15:22Komentāri (0)Apskati (3)5 min. lasīt
Valodas modeļi un cilvēka runa darbojas līdzīgi - mākslīgais intelekts ir palīdzējis zinātniekiem pētīt smadzenes
0 0 3 0

Pētnieki no Ebreju universitātes Jeruzalemē, izmantojot mākslīgā intelekta valodas modeli, salīdzināja mākslīgā intelekta un cilvēka smadzeņu mehānismus runas informācijas apstrādē.

Mākslīgā intelekta modeļu un cilvēka smadzeņu izmantoto mehānismu līdzība runas informācijas apstrādē nākotnē var palīdzēt izstrādāt ierīces, kas cilvēkiem palīdzēs saziņas laikā.

Balstoties uz to, kā valodas modelis Whisper pārvērš reālu cilvēku sarunu audioierakstus tekstā, pētnieki spēja precīzāk atspoguļot smadzeņu aktivāciju ikdienas sarunu laikā, nekā tradicionālie mākslīgā intelekta valodas modeļi, kas kodē noteiktas valodas struktūras iezīmes, īpaši fonētiskās skaņas, no kurām sastāv vārdi un runas daļas.

Whisper vietā tika apmācīts, izmantojot sarunu audioierakstus un teksta transkripcijas. Izmantojot iegūtos statistiskos datus, valodas modelis, veicot atbilstību, iemācījās radīt tekstu no audioierakstiem, kurus tas iepriekš nebija dzirdējis. Tādējādi šis modelis izmanto tikai iegūtos statistiskos datus, nevis valodas struktūras iezīmes, kas kodētas sākotnējos iestatījumos. Tomēr pētījumu rezultāti parādīja, ka Whisper pēc apmācības joprojām izmantoja runas struktūras iezīmes.

Pētījums arī demonstrēja lielu mākslīgā intelekta valodas modeļu darbu principu. Tomēr pētniekus vairāk interesēja izpratne par to, kā šādi modeļi izgaismo procesus, kas saistīti ar runu cilvēka smadzenēs.

„Faktiski tas attiecas uz to, kā mēs domājam par izziņu. Mums jādomā par izziņu caur šī modeļa prizmu,” skaidro Ebreju universitātes docents un pētījuma autors Ariels Goldšteins.

Pētījumā piedalījās 4 brīvprātīgie ar epilepsiju, kuriem jau veiktas operācijas elektrodu implantēšanai smadzeņu monitoringa nolūkos. Ar viņu piekrišanu pētnieki ierakstīja šo pacientu sarunas uzturēšanās laikā slimnīcā. Kopumā tika ierakstītas vairāk nekā 100 stundas audio.

Katrā dalībniekā tika implantēti no 104 līdz 255 elektrodi smadzeņu aktivitātes izsekošanai. Kā norāda Ariels Goldšteins, lielākā daļa līdzīgu pētījumu veikti laboratorijās, kontrolētos apstākļos, tomēr viņa kolēģi izteica vēlmi pētīt smadzeņu aktivitāti reālās dzīves apstākļos.

Zinātnieks uzsvēra, ka vēl joprojām notiek debates par to, vai atsevišķas smadzeņu daļas tiek aktivizētas runas un vārdu atpazīšanas laikā, vai arī smadzenes reaģē kolektīvāk. Zinātnieki pieņem, ka viena smadzeņu daļa var būt atbildīga par fonētisko skaņu atpazīšanu, kamēr cita interpretē vārdu nozīmes. Tajā pašā laikā trešā smadzeņu daļa apstrādā kustības un sejas izteiksmes, kas pavada runu.

Goldšteins uzskata, ka dažādas smadzeņu jomas darbojas saskaņoti, sadalot savā starpā dažādus uzdevumus. Piemēram, jomas, par kurām zināms, ka tās piedalās skaņas apstrādē, kā augšējā temporālā gyrus, parādīja lielāku aktivitāti dzirdes informācijas apstrādē, bet jomas, kas saistītas ar augstāka līmeņa domāšanu, kā apakšējā frontālā gyrus, bija aktīvākas runas izpratnē.

Pētnieki arī fiksēja, ka dažādas smadzeņu daļas aktivizējās secīgi. Jo īpaši, joma, kas ir atbildīga par vārdu uztveri, aktivizējās agrāk nekā joma, kas atbild par vārdu interpretāciju. Tomēr pētnieki arī skaidri redzēja, ka smadzeņu jomas reaģēja arī uz aktivitātēm, kuru apstrādei, kā uzskatīja zinātnieki, tās nebija paredzētas.

Kā mākslīgā intelekta valodas modelis pārsteidza pētniekus

Zinātnieki izmantoja 80% ierakstīto audio sarunu un saistīto transkripciju Whisper valodas modeļa apmācībai, pēc kura tā bija jāiemācās patstāvīgi radīt teksta formu atlikušajiem 20% audioierakstu.

Pētnieki analizēja, kā tieši Whisper apstrādā audio materiālus un tekstu transkripcijas, un salīdzināja šos mehānismus ar smadzeņu aktivitāti, kas fiksēta ar elektrodiem. Pamatojoties uz šo analīzi, zinātnieki spēja izmantot valodas modeli, lai prognozētu, kuras smadzeņu daļas būs aktīvas laikā, kad notika sarunas, kas nebija iekļautas apmācības procesā. Modeļa precizitāte pārsniedza citu modeļu precizitāti, kas balstās uz valodas struktūras iezīmēm

Un lai gan pētnieki neprogrammēja priekš Whisper fonēmu vai vārdu izpratni, viņi atklāja, ka šīs valodu struktūras joprojām atspoguļojas tajā, kā modelis veido savus transkriptus. Tādējādi tā izvilka šīs iezīmes bez konkrētas norādes to darīt.

„Smadzeņu salīdzināšana ar mākslīgajiem neironu tīkliem ir svarīgs darbs Ja mēs izpratīsim mākslīgo un bioloģisko neironu iekšējo darbību un to līdzības, mēs varēsim veikt eksperimentus un modelēšanu, ko nevar realizēt mūsu bioloģiskajās smadzenēs,” norāda Kalifornijas Universitātes Berklijas lingvistikas departamenta docents Gašpers Bīgus, kurš nepiedalījās pētījumā.

Pētījums publicēts žurnālā Nature

Avots: LiveScience

Paldies, tavs viedoklis pieņemts.

Komentāri (0)

Šobrīd nav neviena komentāra

Atstāj Komentāru:

Lai būtu iespējams atstāt komentāru - tēv jāautorizējas mūsu vietnē

Saistītie Raksti