Un ghid pentru sistemele de clasificare Google Search
Google utilizează sisteme automate de clasificare care
analizează mulți factori și semnale
despre sute de miliarde de pagini web și alt conținut din indexul nostru de Căutare pentru a prezenta cele mai relevante și utile rezultate, toate într-o fracțiune de secundă.
Această pagină este un ghid pentru a înțelege unele dintre cele mai notabile sisteme de clasificare ale noastre. Acoperă unele sisteme care fac parte din sistemele noastre de clasificare de bază, care sunt tehnologiile fundamentale ce produc rezultate de căutare ca răspuns la interogări. De asemenea, acoperă unele sisteme implicate în nevoi specifice de clasificare.
Sistemele noastre de clasificare sunt concepute să funcționeze la nivel de pagină, folosind o varietate de semnale și sisteme pentru a înțelege cum să clasifice paginile individuale. Semnalele și clasificatorii la nivel de site sunt de asemenea folosiți și contribuie la înțelegerea paginilor. A avea câteva semnale bune la nivel de site nu înseamnă că tot conținutul de pe un site va fi întotdeauna clasificat sus, la fel cum a avea câteva semnale slabe la nivel de site nu înseamnă că tot conținutul de pe un site va fi clasificat slab.
Google îmbunătățește regulat sistemele de clasificare prin
testare și evaluare riguroasă
și oferă notificări despre
actualizările sistemelor de clasificare
atunci când acestea ar putea fi utile creatorilor de conținut și altora.
De asemenea, poți vizita site-ul nostru Cum funcționează Căutarea
pentru a înțelege cum sistemele de clasificare,
combinate cu alte procese, lucrează împreună astfel încât Căutarea Google să își îndeplinească misiunea de a organiza informațiile lumii și de a le face universal accesibile și utile.
BERT
Bidirectional Encoder Representations from Transformers (BERT)
este un sistem AI pe care Google îl folosește pentru a înțelege cum combinațiile de cuvinte exprimă diferite semnificații și intenții.
Sisteme de informații de criză
Google a dezvoltat sisteme pentru a oferi informații utile și la timp în perioade de criză, fie că acestea implică situații de criză personală, dezastre naturale sau alte situații de criză extinsă:
- Criză personală: Sistemele noastre lucrează pentru a înțelege când oamenii caută informații despre situații de criză personală pentru a afișa linii de asistență și conținut de la organizații de încredere pentru anumite interogări legate de suicid, agresiune sexuală, ingerare de otrăvuri, violență de gen sau dependență de droguri. Află mai multe despre cum
informațiile de criză personală sunt afișate în Căutarea Google. - Alerta SOS: În perioade de dezastre naturale sau situații de criză extinsă, sistemul nostru de Alerta SOS lucrează pentru a afișa actualizări de la autorități locale, naționale sau internaționale. Aceste actualizări pot include numere de telefon de urgență și site-uri web, hărți, traduceri ale unor fraze utile, oportunități de donații și altele. Află mai multe despre
cum funcționează Alerta SOS și cum fac parte din
alertele de criză
ale Google care ajută în perioade de inundații, incendii de vegetație, cutremure, uragane și alte dezastre.
Sisteme de deduplicare
Căutările pe Google pot găsi mii sau chiar milioane de pagini web care se potrivesc. Unele dintre acestea pot fi foarte similare între ele. În astfel de cazuri, sistemele noastre afișează doar cele mai relevante rezultate pentru a evita duplicarea inutilă. Află mai multe despre
cum funcționează deduplicarea și cum să vezi rezultatele omise
dacă dorești, atunci când are loc deduplicarea.
Deduplicarea se întâmplă și cu fragmentele prezentate.
Dacă o listare de pagini web este ridicată pentru a deveni un fragment prezentat, nu repetăm listarea mai târziu pe prima pagină de rezultate. Acest lucru decongestionează rezultatele și ajută oamenii să localizeze informațiile relevante mai ușor.
Sistemul de domenii cu potrivire exactă
Sistemele noastre de clasificare iau în considerare cuvintele din numele de domenii ca unul dintre mulți factori pentru a determina dacă conținutul este relevant pentru o căutare. Totuși, sistemul nostru de domenii cu potrivire exactă lucrează pentru a ne asigura că nu acordăm prea mult credit pentru conținutul găzduit sub domenii concepute să se potrivească exact cu anumite interogări. De exemplu, cineva ar putea crea un nume de domeniu care conține cuvintele “cele-mai-bune-locuri-pentru-prânz” în speranța că toate acele cuvinte din numele de domeniu ar propulsa conținutul sus în clasamente. Sistemul nostru ajustează acest lucru.
Sisteme de prospețime
Avem diverse sisteme “interogarea merită prospețime” concepute să afișeze conținut mai proaspăt pentru interogări unde ar fi de așteptat. De exemplu, dacă cineva caută despre un film care tocmai a fost lansat, probabil că dorește recenzii recente mai degrabă decât articole mai vechi de când a început producția. Pentru un alt exemplu, în mod obișnuit o căutare pentru “cutremur” ar putea aduce materiale despre pregătire și resurse. Totuși, dacă un cutremur a avut loc recent, atunci articolele de știri și conținutul mai proaspăt ar putea apărea.
Sisteme de analiză a legăturilor și PageRank
Avem diverse sisteme care înțeleg cum paginile se leagă între ele ca o modalitate de a determina despre ce sunt paginile și care ar putea fi cele mai utile ca răspuns la o interogare. Printre acestea se numără PageRank, unul dintre sistemele noastre de clasificare de bază folosite când Google a fost lansat pentru prima dată. Cei curioși pot afla mai multe citind lucrarea de cercetare originală PageRank
și brevetul.
Modul în care funcționează PageRank a evoluat mult de atunci și continuă să facă parte din sistemele noastre de clasificare de bază.
Sisteme de știri locale
Avem sisteme care lucrează pentru a identifica și a aduce în prim-plan surse locale de știri ori de câte ori este relevant,
cum ar fi prin
funcțiile noastre “Top stories” și “Local news”.
MUM
Multitask Unified Model (MUM)
este un sistem AI capabil atât să înțeleagă, cât și să genereze limbaj. Nu este folosit în prezent pentru clasificarea generală în Căutare, ci mai degrabă pentru unele aplicații specifice, cum ar fi
îmbunătățirea căutărilor pentru informații despre vaccinurile COVID-19
și pentru a îmbunătăți fragmentele prezentate pe care le afișăm.
Potrivire neurală
Potrivirea neurală
este un sistem AI pe care Google îl folosește pentru a înțelege reprezentările conceptelor în interogări și pagini și a le potrivi între ele.
Sisteme de conținut original
Avem sisteme care ajută la asigurarea că afișăm conținut original proeminent în rezultatele de căutare,
inclusiv raportări originale,
înaintea celor care doar îl citează. Acest lucru include suportul pentru un
marcaj canonic
special pe care creatorii îl pot folosi pentru a ne ajuta să înțelegem mai bine care este pagina principală dacă o pagină a fost duplicată în mai multe locuri.
Sisteme de demotare bazate pe eliminări
Google are politici care permit eliminarea anumitor tipuri de conținut. Dacă procesăm un volum semnificativ de astfel de eliminări care implică un anumit site, folosim acest lucru ca un semnal pentru a îmbunătăți rezultatele noastre. În special:
-
Eliminări legale:
Când primim un volum semnificativ de
cereri valide de eliminare a drepturilor de autor
care implică un anumit site,
putem folosi acest lucru
pentru a demota alt conținut de pe site în rezultatele noastre. În acest fel, dacă există alt conținut care încalcă drepturile, oamenii sunt mai puțin probabil să îl întâlnească în locul conținutului original. Aplicăm semnale similare de demotare pentru plângeri care implică defăimare, bunuri contrafăcute și eliminări ordonate de instanță. În cazul materialelor de abuz sexual asupra copiilor (CSAM), eliminăm întotdeauna astfel de conținuturi când sunt identificate și demotăm tot conținutul de pe site-urile cu o proporție semnificativă de conținut CSAM. -
Eliminări de informații personale:
Dacă procesăm un volum semnificativ de eliminări de informații personale care implică un site cu
practici de eliminare exploatative,
demotăm alt conținut de pe site în rezultatele noastre.
De asemenea, verificăm
dacă același tipar de comportament se întâmplă cu alte site-uri și, dacă da, aplicăm demotări pentru conținutul de pe acele site-uri. Putem aplica practici similare de demotare pentru site-urile care primesc un volum semnificativ de eliminări de conținut care implică
conținut de doxxing,
imagini personale explicite create sau distribuite fără consimțământ, sau
conținut fals explicit non-consensual.
Sistem de clasificare a pasajelor
Clasificarea pasajelor
este un sistem AI pe care îl folosim pentru a identifica secțiuni individuale sau “pasaje” ale unei pagini web pentru a înțelege mai bine cât de relevantă este o pagină pentru o căutare.
RankBrain
RankBrain
este un sistem AI care ne ajută să înțelegem cum cuvintele sunt legate de concepte. Acest lucru înseamnă că putem returna mai bine conținut relevant chiar dacă nu conține toate cuvintele exacte folosite într-o căutare, prin înțelegerea faptului că conținutul este legat de alte cuvinte și concepte.
Sisteme de informații fiabile
Multiple sisteme lucrează în diverse moduri pentru a afișa cele mai fiabile informații posibile, cum ar fi
pentru a aduce în prim-plan pagini mai autoritare și a demota conținut de calitate scăzută
și pentru a ridica jurnalismul de calitate.
În cazurile în care informațiile fiabile ar putea lipsi, sistemele noastre afișează automat
avertismente de conținut
despre subiecte care se schimbă rapid sau când sistemele noastre nu au încredere mare în calitatea generală a rezultatelor disponibile pentru căutare. Acestea oferă sfaturi despre cum să cauți în moduri care ar putea duce la rezultate mai utile. Află mai multe despre
abordarea noastră de a livra informații de înaltă calitate în Căutare.
Sistem de recenzii
Sistemul de recenzii are ca scop să recompenseze mai bine recenziile de înaltă calitate, conținutul care oferă analize perspicace și cercetări originale, și este scris de experți sau entuziaști care cunosc bine subiectul.
Sistem de diversitate a site-urilor
Sistemul nostru de diversitate a site-urilor funcționează astfel încât, în general, să nu afișăm mai mult de două listări de pagini web de la același site în rezultatele noastre de top, astfel încât niciun site să nu tindă să domine toate rezultatele de top. Totuși, putem afișa mai mult de două listări în cazurile în care sistemele noastre determină că este deosebit de relevant să facem acest lucru pentru o căutare particulară. Diversitatea site-urilor tratează în general subdomeniile ca parte a unui domeniu rădăcină. De exemplu: listările de la un subdomeniu (subdomeniu.exemplu.com) și domeniul rădăcină (exemplu.com) vor fi considerate toate ca provenind de la același site unic. Totuși, uneori subdomeniile sunt tratate ca site-uri separate pentru scopuri de diversitate atunci când este considerat relevant să facem acest lucru.
Sisteme de detectare a spamului
Nimeni nu își dorește ca inbox-ul să fie plin de spam, motiv pentru care filtrele de spam sunt atât de utile. Căutarea se confruntă cu o provocare similară, deoarece internetul include cantități uriașe de spam care, dacă nu ar fi gestionate, ne-ar împiedica să afișăm cele mai utile și relevante rezultate. Folosim o gamă de
sisteme de detectare a spamului,
inclusiv SpamBrain, pentru a gestiona
conținutul și comportamentele care încalcă
politicile de spam.
Aceste sisteme sunt constant actualizate pentru a ține pasul
cu cele mai recente moduri în care amenințarea spamului evoluează.
Sisteme retrase
Următoarele sisteme sunt menționate în scopuri istorice. Ele au fost fie încorporate în sisteme succesoare, fie au devenit parte din sistemele noastre de clasificare de bază.
Sistem de conținut util
Anunțat în 2022 ca
“Actualizarea de Conținut Util”, acesta a fost un sistem conceput pentru a asigura mai bine că oamenii văd conținut original, util, scris de oameni, pentru oameni, în rezultatele de căutare, mai degrabă decât conținut creat în principal pentru a obține trafic din motoarele de căutare. În martie 2024, a evoluat și
a devenit parte din
sistemele noastre de clasificare de bază, deoarece sistemele noastre folosesc o varietate de semnale și sisteme pentru a prezenta rezultate utile utilizatorilor.
Hummingbird
Acesta a fost o îmbunătățire majoră a sistemelor noastre generale de clasificare realizată în august 2013. Sistemele noastre de clasificare au continuat să evolueze de atunci, la fel cum evoluaseră și înainte.
Sistemul Panda
Acesta a fost un sistem conceput pentru a asigura mai bine că conținutul de înaltă calitate și original apare în rezultatele noastre de căutare.
Anunțat în 2011
și poreclit “Panda”, a evoluat și a devenit parte din sistemele noastre de clasificare de bază în 2015.
Sistemul Penguin
Acesta a fost un sistem conceput pentru a combate spamul de legături.
Anunțat în 2012
și poreclit “Actualizarea Penguin”, a fost
integrat
în sistemele noastre de clasificare de bază în 2016.
Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.

Leave a Reply