Google nejauši publicēja 2500 lapaspuses no savas meklētājprogrammas tehniskās dokumentācijas

Izrādījās, ka algoritms ņem vērā cilvēku klikšķus Chrome un ierobežo jaunas vietnes

Maija beigās tīklā parādījās Google iekšējie dokumenti, kas atklāj dažus uzņēmuma meklēšanas algoritma darbības principus. Piemēram, tika noskaidrots, ka tas izmanto Chrome datus vietņu klasifikācijai un veido "baltos sarakstus" avotiem saistībā ar noteiktiem jaunumu notikumiem. Pēc nedēļas žurnālisti uzzināja par iespējamiem vairāku gadu drošības un konfidencialitātes pārkāpumiem, kas notikuši Google. Uzņēmums bija spiests atzīt, ka visi tīklā nokļuvušie dati ir patiesi.

Google izveidoja "baltos sarakstus" COVID-19 pieprasījumiem un meloja par vietņu klasifikācijas parametriem

Par pirmo noplūdi 27. maijā ziņoja Rands Fiškins, SparkToro vadītājs un SEO optimizācijas eksperts. Viņš stāstīja, ka mēneša sākumā saņēma e-pastu no anonīma avota, kas apgalvoja, ka viņam ir piekļuve liela apjoma Google iekšējiem dokumentiem. Nosūtītājs piebilda, ka dokumentu autentiskumu apstiprinājuši bijušie uzņēmuma darbinieki, kuri dalījās ar papildinformāciju, kas saistīta ar meklēšanu.

Fiškins sarunājās ar avotu videozvanā, saņēma nepieciešamos apstiprinājumus par informācijas autentiskumu un piekrita to publiskot. Viņš arī vērsās pie cita SEO eksperta, iPullRank dibinātāja Maika Kinga, lai kopīgi analizētu dokumentus. Nākamajā dienā pēc publikācijas anonīmais informators nolēma atklāt savu identitāti un publicēja video YouTube. Viņš izrādījās SEO speciālists un EA Eagle Digital dibinātājs Erfans Azimi.

Erfana Azimi publiskais paziņojums

Erfan Azimi (EA Eagle Digital)

Randa Fiškina un Maika Kinga rīcībā nonāca 2500 lappušu iekšējās API dokumentācijas, kas kļūdas dēļ tika augšupielādēta GitHub'ā. Šķiet, ka tā tur atradās no 27. marta līdz 7. maijam, un šajā periodā to atrada Azimi. Šajā dokumentā pieejamā informācija ir tehniska — lielākā tās daļa ir interesanta galvenokārt SEO optimizācijas ekspertiem. Tomēr tā arī ļauj uzzināt vairāk par meklētāja darbības principiem.

Piemēram, var secināt, ka Google regulāri veido tā sauktos "baltos sarakstus" vietnēm, kuras meklēšanas rezultātos saņem augstāku vērtējumu. Resursi, kas tajos neiekļūst, tiek pazemināti, un lietotājiem ir grūtāk tos atrast noteikta pieprasījuma gadījumā. Fishkin norāda, ka šādus sarakstus izmantoja vismaz divas reizes: pandēmijas un ASV vēlēšanu laikā.

Kopumā kļuva skaidrāki parametri, kas patiešām ietekmē meklēšanu. Piemēram, Google noliedza, ka vietņu klasifikācijai izmanto Chrome datus. Spriežot pēc noplūdes, tas nav taisnība: pārlūkprogramma tomēr tiek pieminēta meklēšanas rezultātu sadaļās. Tāpat uzņēmums noliedza, ka atsevišķi faktori, piemēram, satura autorība, varētu ietekmēt rezultātus. Maiks Kings savā analīzē atzīmē, ka E-E-A-T rādītājs, kas ietver autora ekspertīzes līmeni, tomēr ietekmē vietņu klasifikāciju.

Eksperti izceļ vēl vairākus parametrus, kas ietekmē meklēšanas rezultātus. Piemēram, tiek pieminēta NavBoost sistēma, kas analizē klikšķus, ņemot vērā ģeolokāciju, un sadala tos vairākās kategorijās, tostarp "labie", "sliktie" un "garie". Domēna nosaukums, kā arī zīmola atpazīstamība tīklā, spēlē nozīmīgu lomu un var ietekmēt rezultātus. Tāpat ir atsevišķa "smilškaste" jaunām vietnēm — tās tiek ierobežotas meklēšanas rezultātos, lai gan iepriekš Google to arī noliedza.

Almost every API call in the Google leaks has a geographic modifier - if you are doing SEO in places where the algo is less advanced than the U.S. (they may have less data, smaller/fewer brands, etc.)

The things that work for SEO in the U.S. don’t always work in those countries,… pic.twitter.com/R9m8mZivU2
— Lily Ray 😏 (@lilyraynyc) June 4, 2024

«Gandrīz katram API pieprasījumam Google noplūdēs ir ģeogrāfiskais modifikators — ja jūs nodarbojaties ar SEO vietās, kur algoritms ir mazāk attīstīts nekā ASV (viņiem var būt mazāk datu, mazāk zīmolu, tie nav tik atpazīstami utt.), tas, kas darbojas SEO ASV, ne vienmēr darbojas šajās valstīs, un tas, kas darbojas šajās valstīs, ne vienmēr darbojas šeit»

Nevar teikt, ka publicētā informācija ir pilnīgi negaidīta SEO ekspertiem. Par dažiem jautājumiem viņi jau agrāk aizdomājās. Bet, kā norāda Rands Fishkins, daudzi no noplūdē iekļautajiem faktiem ir pretrunā ar Google oficiālajiem paziņojumiem, kas veikti daudzu gadu garumā. Tas grauj uzticību uzņēmumam. Eksperts cer, ka nākotnē Google publiskie komentāri tiks vērtēti kritiskāk.

Google vairākas dienas atteicās komentēt noplūdi, bet 30. maijā uzņēmuma pārstāvis Deivis Tompsons apstiprināja izdevumam The Verge, ka noplūdušie dokumenti ir īsti. Viņš arī atzīmēja, ka nevajadzētu izdarīt nepareizus pieņēmumus par meklēšanas algoritmu darbību, pamatojoties uz "izkontekstētiem, novecojušiem vai nepilnīgiem datiem".

Google pakalpojumu traucējumi noveda pie nejaušas personas datu vākšanas — ieskaitot bērnu sarunas

Nedēļu pēc pirmās publikācijas kļuva zināms par jaunu noplūdi. 3. jūnijā izdevuma 404 Media žurnālists Džozefs Koks ziņoja, ka no anonīma avota saņēma lielu datu kopumu, kurā atrada pierādījumus par daudziem informācijas drošības un konfidencialitātes pārkāpumiem.

Noplūdē bija informācija par tūkstošiem pārkāpumu, kas tika reģistrēti kā iekšējie ziņojumi no 2013. līdz 2018. gadam. Tie ietvēra problēmas ar datu vākšanu un apstrādi, darbinieku kļūdas, kā arī ievainojamības trešo pušu partneros, kuru pakalpojumus izmantoja uzņēmums. Katram šādam incidentam ziņojumos tika piešķirts prioritātes reitings, kas noteica, cik steidzami nepieciešams novērst konkrēto problēmu.

Žurnālists noskaidroja, ka 2016. gadā kāds uzņēmuma darbinieks ziņoja, ka Google Street View sistēmas atšifrē un glabā automašīnu numurus, kas parādās fotoattēlos. Parasti šī informācija, tāpat kā cilvēku sejas, tiek izpludināta konfidencialitātes nodrošināšanai. Ziņojumā tika norādīts, ka tas noticis nejauši — algoritms tekstu noteikšanai fotoattēlos kādā brīdī sāka nolasīt arī automašīnu numurus. Lai gan sākotnēji sistēma bija iestatīta tā, lai tos noteiktu un ignorētu. Kļūdas rezultātā uzņēmuma rīcībā bija vesela bāze ar ģeolocētajiem numuriem vai to fragmentiem.

Cits incidents bija saistīts ar izglītības platformu Socratic, ko Google iegādājās 2018. gadā. Izrādījās, ka uzņēmuma vietnes sākotnējā kodā vairāk nekā gadu tika glabāti vairāk nekā miljons e-pasta adrešu (ziņojumā tika norādīts, ka varēja būt pieejamas arī IP adreses un ģeolokācija), tostarp piederīgas bērniem. Minēts vēl viens gadījums, kas skāra nepilngadīgos lietotājus. Nezināmā laika periodā Google radās datubāze ar apmēram tūkstoša bērnu runas ierakstiem — kaut kāda iemesla dēļ filtrs nedarbojās pareizi, un sistēma stundas laikā ierakstīja un saglabāja šos ierakstus. Šie dati tika dzēsti.

Kopumā Koks pieminēja vairāk nekā desmit dažādus pārkāpumus. Piemēram, reiz Google mākoņpakalpojuma lietotāju, kas bija paredzēts valdības klientiem, pārveda uz produktu, kas bija paredzēts parastiem patērētājiem. Tas apdraudēja mākoņā glabāto datu konfidencialitāti. Vēl tiek minēts gadījums, kad kopbraukšanas funkcijas kļūmes dēļ navigācijas lietotnē Waze (kas pieder Google kopš 2013. gada) noplūda dati par lietotāju adresēm un maršrutiem. Cita kļūme bija saistīta ar YouTube — serviss deva ieteikumus, ņemot vērā videoklipus, kas tika izdzēsti no skatīšanās vēstures, kas pretrunā ar servisa politiku.

Guessing some birds stop chirping after this. https://t.co/vr9p5J54BM
— Baldy (@TheBaldEmperor) June 3, 2024

«Domāju, ka pēc tam daži putniņi pārstās čivināt»

Atsevišķā tekstā Džozefs Koks stāstīja, ka 2017. gadā viens no darbiniekiem, kas strādāja Google pēc līguma, izmantoja administratora tiesības, lai piekļūtu Nintendo oficiālajam kontam. Viņš atrada vēl nepublicētu jaunas neizsludinātas spēles videoklipu un dalījās tajā ar draugu, kas noveda pie noplūdes. Runa ir par spēli Yoshi's Crafted World, kas iznāca 2019. gadā. Iekšējā uzņēmuma ziņojumā tika teikts, ka noplūde varēja būt «neapzināta».

Google pārstāvji apstiprināja žurnālistam publicētās informācijas patiesumu. Viņi arī norādīja, ka katru iekšējo ziņojumu izskatīja un pieņēma atbilstošus lēmumus. Dažos gadījumos pārkāpumi vispār neprasīja iejaukšanos vai tika atklāti trešo pušu servisos.

Džozefs Koks piebilda, ka lielāko daļu no šiem incidentiem tiešām ātri novērsa, un katrs no tiem atsevišķi varēja skart tikai nelielu cilvēku skaitu. Tomēr viņš uzsvēra, ka viņa publicētā informācija ir labs piemērs tam, cik vieglprātīgi pasaules lielākie uzņēmumi izturas pret lietotāju konfidenciālajiem datiem.

Nesen Publicētas Ziņas

Spānijā ir radīta pasaulē pirmā 3D hologramma ar interaktivitāti ...

MELANIA komanda klusi pārdod žetonus 30 miljonu dolāru vērtībā.

RTX 5060 Ti būs lētāka nekā RTX 4060 Ti: no 379 $

Aprīļa PS Plus katalogs - Hogvarts Legacy, neatkarīgais hits Blue...

Google nejauši publicēja 2500 lapaspuses no savas meklētājprogrammas tehniskās dokumentācijas

Izrādījās, ka algoritms ņem vērā cilvēku klikšķus Chrome un ierobežo jaunas vietnes

Google izveidoja "baltos sarakstus" COVID-19 pieprasījumiem un meloja par vietņu klasifikācijas parametriem

Google pakalpojumu traucējumi noveda pie nejaušas personas datu vākšanas — ieskaitot bērnu sarunas

Saistītie Tagi:

Ko gaidīt no WWDC 2024: iOS 18, Siri atjauninājumi un jaunas iPadOS funkcijas

Apple mākslīgā intelekta revolūcija? Viss, kas jums jāzina par jaunāko WWDC-2024 prezentāciju

Kā tev patīk raksts?

Komentāri (0)

Šobrīd nav neviena komentāra

Atstāj Komentāru:

Lai būtu iespējams atstāt komentāru - tēv jāautorizējas mūsu vietnē

Nesen Publicētas Ziņas

Pieraksties

Google nejauši publicēja 2500 lapaspuses no savas meklētājprogrammas tehniskās dokumentācijas

Izrādījās, ka algoritms ņem vērā cilvēku klikšķus Chrome un ierobežo jaunas vietnes

Google izveidoja "baltos sarakstus" COVID-19 pieprasījumiem un meloja par vietņu klasifikācijas parametriem

Google pakalpojumu traucējumi noveda pie nejaušas personas datu vākšanas — ieskaitot bērnu sarunas

Saistītie Tagi:

Kā tev patīk raksts?

Komentāri (0)

Šobrīd nav neviena komentāra

Atstāj Komentāru:

Lai būtu iespējams atstāt komentāru - tēv jāautorizējas mūsu vietnē

Saistītie Raksti