Ghiduri - Advanced Systems Headless CMS

Scrie recenzii de înaltă calitate

Importanța recenziilor de calitate

Publicarea de recenzii de înaltă calitate poate ajuta oamenii să afle mai multe despre lucrurile pe care le iau în considerare, cum ar fi produse, servicii, destinații, jocuri, filme sau alte subiecte. De exemplu, poți scrie o recenzie ca:

Un membru al personalului expert sau un comerciant care ghidează oamenii între produse concurente.
Un blogger care oferă opinii independente.
Un membru al personalului editorial la un site de știri sau alt site de publicare.

Practici recomandate pentru recenzii

Pentru a ajuta oamenii să descopere paginile tale de recenzii în Căutarea Google și pe alte suprafețe Google, urmează aceste practici recomandate:

Evaluează din perspectiva utilizatorului.
Demonstrează că ești bine informat despre ceea ce recenzezi—arată că ești un expert.
Oferă dovezi, cum ar fi imagini, audio sau alte linkuri ale propriei tale experiențe cu ceea ce recenzezi, pentru a-ți susține expertiza și a întări autenticitatea recenziei tale.
Împărtășește măsurători cantitative despre cum se comportă ceva în diverse categorii de performanță.
Explică ce diferențiază ceva de concurenții săi.
Acoperă lucruri comparabile de luat în considerare sau explică ce ar putea fi cel mai bun pentru anumite utilizări sau circumstanțe.
Discută avantajele și dezavantajele unui lucru, bazându-te pe propria ta cercetare originală.
Descrie cum un produs a evoluat de la modelele sau versiunile anterioare pentru a aduce îmbunătățiri, a rezolva probleme sau a ajuta utilizatorii în luarea unei decizii de cumpărare.
Concentrează-te pe cei mai importanți factori de decizie, bazându-te pe experiența sau expertiza ta (de exemplu, o recenzie auto ar putea determina că economia de combustibil și siguranța sunt factori cheie de decizie și să evalueze performanța în acele domenii).
Descrie alegerile cheie în modul în care un produs a fost proiectat și efectul lor asupra utilizatorilor dincolo de ceea ce spune producătorul.
Include linkuri către alte resurse utile (ale tale sau de pe alte site-uri) pentru a ajuta un cititor să ia o decizie.
Ia în considerare includerea de linkuri către mai mulți vânzători pentru a oferi cititorului opțiunea de a cumpăra de la comerciantul ales.
Când recomanzi ceva ca fiind cel mai bun în general sau cel mai bun pentru un anumit scop, include de ce îl consideri cel mai bun, cu dovezi de primă mână care să susțină afirmația.
Asigură-te că există suficient conținut util în listele tale clasificate pentru a putea sta pe cont propriu, chiar dacă alegi să scrii recenzii individuale detaliate.

Recenziile folosesc adesea linkuri de afiliere, astfel încât dacă cineva găsește o recenzie utilă și urmează linkul furnizat pentru a cumpăra, creatorul recenziei este recompensat de vânzător. Dacă faci acest lucru, vezi și
poziția Google privind programele de afiliere.

Recenziile pot fi o resursă excelentă pentru oameni atunci când iau decizii. Când scrii recenzii, concentrează-te pe calitatea și originalitatea recenziilor tale, nu pe lungime, urmând cât mai multe dintre practicile recomandate de mai sus. Acest lucru va oferi cea mai mare valoare celor care citesc recenziile tale.

Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.

April 12, 2026

Înțelegerea experienței paginii în rezultatele căutării Google

Auto-evaluează experiența paginii conținutului tău

Răspunsul afirmativ la următoarele întrebări înseamnă că probabil ești pe drumul cel bun în a oferi o experiență bună a paginii:

Paginile tale au valori bune pentru Core Web Vitals?
Sunt paginile tale servite într-un mod securizat?
Conținutul tău se afișează bine pe dispozitive mobile?
Conținutul tău evită utilizarea excesivă a reclamelor care distrag sau interferează cu conținutul principal?
Paginile tale evită utilizarea interstițialelor intruzive?
Pagina ta este proiectată astfel încât vizitatorii să poată distinge ușor conținutul principal de alte conținuturi de pe pagină?

Aceste întrebări nu cuprind toate aspectele experienței paginii care trebuie luate în considerare.
Totuși, întrebări ca acestea și consultarea resurselor următoare te pot ajuta să te aliniezi cu oferirea unei experiențe generale bune a paginii.

Resurse pentru experiența paginii

Iată câteva resurse care te pot ajuta să măsori, să monitorizezi și să optimizezi experiența paginii:

Înțelegerea Core Web Vitals și a rezultatelor căutării Google:
Află mai multe despre Core Web Vitals și cum funcționează în rezultatele căutării Google.
Raportul HTTPS din Search Console:
Verifică dacă servești pagini HTTPS securizate și ce trebuie să corectezi, dacă nu.
Verifică dacă conexiunea unui site este securizată: Află cum să
verifici dacă conexiunea site-ului tău este securizată, așa cum este raportată de Chrome.
Dacă pagina nu este servită prin HTTPS, află cum să
securizezi site-ul cu HTTPS.
Evită interstițialele și dialogurile intruzive: Află cum să eviți interstițialele care pot face conținutul mai puțin accesibil.
Chrome Lighthouse:
Acest set de instrumente de la Chrome te poate ajuta să identifici o gamă de îmbunătățiri legate de experiența paginii, inclusiv utilizabilitatea pe mobil.

FAQ

Există un singur “semnal de experiență a paginii” pe care Google Search îl folosește pentru clasare?

Nu există un singur semnal. Sistemele noastre de clasare de bază analizează o varietate de semnale care se aliniază cu experiența generală a paginii.

Ce aspecte ale experienței paginii sunt utilizate în clasare?

Core Web Vitals sunt utilizate de sistemele noastre de clasare.
Google recomandă proprietarilor de site-uri să obțină valori bune pentru Core Web Vitals pentru succesul în Căutare și pentru a asigura o experiență excelentă a utilizatorului în general.
Ține cont că obținerea unor rezultate bune în rapoarte precum raportul Core Web Vitals din Search Console
sau în instrumente terțe nu garantează că paginile tale vor fi clasate în topul rezultatelor căutării Google;
există mai mult pentru o experiență excelentă a paginii decât scorurile Core Web Vitals.
Aceste scoruri sunt menite să te ajute să îmbunătățești site-ul pentru utilizatorii tăi în general,
iar încercarea de a obține un scor perfect doar din motive SEO poate să nu fie cea mai bună utilizare a timpului tău.

Dincolo de Core Web Vitals, alte aspecte ale experienței paginii nu ajută direct site-ul tău să se claseze mai sus în rezultatele căutării.
Totuși, ele pot face ca site-ul tău să fie mai satisfăcător de utilizat, ceea ce este în general aliniat cu ceea ce sistemele noastre de clasare caută să recompenseze.
Prin urmare, merită totuși să lucrezi pentru a îmbunătăți experiența paginii în general.

Este evaluată experiența paginii la nivel de site sau la nivel de pagină?

Sistemele noastre de clasare de bază evaluează în general conținutul la nivel de pagină, inclusiv atunci când înțeleg aspectele legate de experiența paginii. Totuși, avem și unele evaluări la nivel de site.

Cât de importantă este experiența paginii pentru succesul în clasare?

Google Search caută întotdeauna să afișeze cel mai relevant conținut, chiar dacă experiența paginii este sub standard. Dar pentru multe interogări, există mult conținut util disponibil. O experiență excelentă a paginii poate contribui la succesul în Căutare, în astfel de cazuri.

Actualizări recente pe blogul nostru

Iată tot ce am anunțat despre experiența paginii pe blogul Google Search Central:

Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.

April 11, 2026

Blocarea indexării în căutare cu noindex

Blocarea indexării în căutare cu `noindex`

noindex este o regulă setată fie printr-un tag <meta>, fie printr-un header de răspuns HTTP și este utilizată pentru a preveni indexarea conținutului de către motoarele de căutare care suportă regula noindex, cum ar fi Google. Când Googlebot accesează acea pagină și extrage tagul sau headerul, Google va elimina complet acea pagină din rezultatele Căutării Google, indiferent dacă alte site-uri fac legătura către ea.

Important: Pentru ca regula noindex să fie eficientă, pagina sau resursa nu trebuie să fie blocată de un fișier robots.txt și trebuie să fie accesibilă crawlerului. Dacă pagina este blocată de un fișier robots.txt sau crawlerul nu poate accesa pagina, crawlerul nu va vedea niciodată regula noindex, iar pagina poate apărea în continuare în rezultatele căutării, de exemplu, dacă alte pagini fac legătura către ea.

Utilizarea noindex este utilă dacă nu aveți acces root la serverul dvs., deoarece vă permite să controlați accesul la site-ul dvs. pe baza fiecărei pagini.

Implementarea `noindex`

Există două modalități de a implementa noindex: ca un tag <meta> și ca un header de răspuns HTTP. Ambele au același efect; alegeți metoda care este mai convenabilă pentru site-ul dvs. și potrivită pentru tipul de conținut. Specificarea regulii noindex în fișierul robots.txt nu este suportată de Google.

Puteți combina, de asemenea, regula noindex cu alte reguli care controlează indexarea. De exemplu, puteți combina un indiciu nofollow cu o regulă noindex: <meta name="robots" content="noindex, nofollow" />.

`<meta>` tag

Pentru a preveni toate motoarele de căutare care suportă regula noindex să indexeze o pagină de pe site-ul dvs., plasați următorul tag <meta> în secțiunea <head> a paginii dvs.:

<meta name="robots" content="noindex">

Pentru a preveni doar crawlerii web Google să indexeze o pagină:

<meta name="googlebot" content="noindex">

Fiți conștienți că unele motoare de căutare ar putea interpreta regula noindex diferit. Ca rezultat, este posibil ca pagina dvs. să apară în continuare în rezultatele altor motoare de căutare.

Citiți mai multe despre tagul noindex <meta>.

Header de răspuns HTTP

În loc de un tag <meta>, puteți returna un header HTTP X-Robots-Tag cu o valoare de noindex sau none în răspunsul dvs. Un header de răspuns poate fi utilizat pentru resurse non-, cum ar fi fișiere PDF, fișiere video și fișiere imagine. Iată un exemplu de răspuns HTTP cu un header X-Robots-Tag care instruiește motoarele de căutare să nu indexeze o pagină:

HTTP/1.1 200 OK
(...)
X-Robots-Tag: noindex
(...)

Citiți mai multe despre headerul de răspuns noindex.

Depanarea problemelor `noindex`

Trebuie să accesăm pagina dvs. pentru a vedea tagurile <meta> și headerele HTTP. Dacă o pagină apare în continuare în rezultate, probabil că nu am accesat pagina de când ați adăugat regula noindex. În funcție de importanța paginii pe internet, poate dura luni pentru ca Googlebot să reviziteze o pagină. Puteți solicita ca Google să recrawleze o pagină folosind instrumentul de inspectare a URL-urilor.

Dacă trebuie să eliminați rapid o pagină de pe site-ul dvs. din rezultatele căutării Google, consultați documentația despre eliminări.

Un alt motiv ar putea fi că fișierul robots.txt blochează URL-ul de la crawlerii web Google, astfel încât aceștia nu pot vedea tagul. Pentru a debloca pagina dvs. de la Google, trebuie să editați fișierul robots.txt.

În cele din urmă, asigurați-vă că regula noindex este vizibilă pentru Googlebot. Pentru a testa dacă implementarea dvs. noindex este corectă, utilizați instrumentul de inspectare a URL-urilor pentru a vedea -ul pe care Googlebot l-a primit în timp ce accesa pagina. De asemenea, puteți utiliza raportul de indexare a paginilor din Search Console pentru a monitoriza paginile de pe site-ul dvs. din care Googlebot a extras o regulă noindex.

Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.

April 11, 2026

Introducere în robots.txt

Un fișier robots.txt indică crawler-elor motoarelor de căutare care URL-uri pot fi accesate pe site-ul tău. Acesta este utilizat în principal pentru a evita supraîncărcarea site-ului cu cereri; nu este un mecanism pentru a împiedica o pagină web să fie indexată de Google. Pentru a împiedica o pagină web să fie indexată de Google, blochează indexarea cu noindex sau protejează pagina cu parolă.

Pentru ce este folosit un fișier robots.txt?

Un fișier robots.txt este folosit în principal pentru a gestiona traficul crawler-elor către site-ul tău și de obicei pentru a împiedica un fișier să fie indexat de Google, în funcție de tipul fișierului:

Efectul robots.txt asupra diferitelor tipuri de fișiere

Pagină web

Efectul robots.txt asupra diferitelor tipuri de fișiere
Pagină web	Poți folosi un fișier robots.txt pentru pagini web (, PDF sau alte formate non-media pe care Google le poate citi), pentru a gestiona traficul de crawling dacă crezi că serverul tău va fi copleșit de cererile de la crawler-ul Google sau pentru a evita accesarea paginilor neimportante sau similare de pe site-ul tău. Avertisment: Nu folosi un fișier robots.txt ca mijloc de a ascunde paginile tale web (inclusiv PDF-uri și alte formate textuale suportate de Google) din rezultatele Căutării Google. Dacă alte pagini indică către pagina ta cu text descriptiv, Google ar putea totuși să indexeze URL-ul fără a vizita pagina. Dacă dorești să blochezi pagina din rezultatele căutării, folosește o altă metodă, cum ar fi protecția cu parolă sau `noindex`. Dacă pagina ta web este blocată cu un fișier robots.txt, URL-ul său poate apărea în continuare în rezultatele căutării, dar rezultatul căutării nu va avea o descriere. Fișierele de imagine, video, PDF și alte fișiere non- încorporate în pagina blocată vor fi excluse de la crawling, de asemenea, cu excepția cazului în care sunt referite de alte pagini care sunt permise pentru crawling. Dacă vezi acest rezultat al căutării pentru pagina ta și dorești să-l corectezi, elimină intrarea din robots.txt care blochează pagina. Dacă dorești să ascunzi complet pagina din Căutare, folosește o altă metodă.
Fișier media	Folosește un fișier robots.txt pentru a gestiona traficul de crawling și, de asemenea, pentru a preveni afișarea fișierelor de imagine, video și audio în rezultatele Căutării Google. Acest lucru nu va împiedica alte pagini sau utilizatori să facă legături către fișierul tău de imagine, video sau audio. Citește mai multe despre prevenirea afișării imaginilor pe Google. Citește mai multe despre cum să elimini sau să restricționezi fișierele tale video de la afișarea pe Google.
Fișier resursă	Poți folosi un fișier robots.txt pentru a bloca fișiere de resurse, cum ar fi imagini neimportante, scripturi, sau fișiere de stil, dacă crezi că paginile încărcate fără aceste resurse nu vor fi afectate semnificativ de lipsa lor. Totuși, dacă absența acestor resurse face ca pagina să fie mai greu de înțeles pentru crawler-ul Google, nu le bloca, altfel Google nu va face o treabă bună în analizarea paginilor care depind de acele resurse.

Poți folosi un fișier robots.txt pentru pagini web (, PDF sau alte
formate non-media pe care Google le poate citi),
pentru a gestiona traficul de crawling dacă crezi că serverul tău va fi copleșit de cererile
de la crawler-ul Google sau pentru a evita accesarea paginilor neimportante sau similare de pe site-ul tău.

Dacă pagina ta web este blocată cu un fișier robots.txt, URL-ul său poate apărea în continuare în rezultatele căutării, dar rezultatul căutării
nu va avea o descriere.
Fișierele de imagine, video, PDF și alte fișiere non- încorporate în pagina blocată vor
fi excluse de la crawling, de asemenea, cu excepția cazului în care sunt referite de alte pagini care sunt permise
pentru crawling. Dacă vezi acest rezultat al căutării pentru pagina ta și dorești să-l corectezi, elimină
intrarea din robots.txt care blochează pagina. Dacă dorești să ascunzi complet pagina din Căutare,
folosește
o altă metodă.

Fișier media

Folosește un fișier robots.txt pentru a gestiona traficul de crawling și, de asemenea, pentru a preveni afișarea fișierelor de imagine, video și
audio în rezultatele Căutării Google. Acest lucru nu va împiedica alte pagini sau
utilizatori să facă legături către fișierul tău de imagine, video sau audio.

Fișier resursă Poți folosi un fișier robots.txt pentru a bloca fișiere de resurse, cum ar fi imagini neimportante, scripturi,
sau fișiere de stil, dacă crezi că paginile încărcate fără aceste resurse nu vor
fi afectate semnificativ de lipsa lor. Totuși, dacă absența acestor
resurse face ca pagina să fie mai greu de înțeles pentru crawler-ul Google, nu le bloca,
altfel Google nu va face o treabă bună în analizarea paginilor care depind de
acele resurse.

Înțelege limitările unui fișier robots.txt

Înainte de a crea sau edita un fișier robots.txt, ar trebui să cunoști limitele acestei metode de blocare a URL-urilor. În funcție de obiectivele și situația ta, s-ar putea să dorești să iei în considerare alte mecanisme pentru a te asigura că URL-urile tale nu sunt găsite pe web.

Regulile robots.txt pot să nu fie suportate de toate motoarele de căutare.
Instrucțiunile din fișierele robots.txt nu pot impune comportamentul crawler-elor pe site-ul tău; depinde de crawler să le respecte. În timp ce Googlebot și alte crawler-e web respectabile respectă
instrucțiunile dintr-un fișier robots.txt, alte crawler-e s-ar putea să nu o facă. Prin urmare, dacă dorești să păstrezi informațiile în siguranță față de crawler-ele web, este mai bine să folosești alte metode de blocare, cum ar fi
protejarea cu parolă a fișierelor private pe serverul tău.
Diferite crawler-e interpretează sintaxa diferit.
Deși crawler-ele web respectabile urmează regulile dintr-un fișier robots.txt, fiecare crawler
ar putea interpreta regulile diferit. Ar trebui să cunoști
sintaxa corectă pentru a te adresa
diferitelor crawler-e web, deoarece unele s-ar putea să nu înțeleagă anumite instrucțiuni.
O pagină care este interzisă în robots.txt poate
fi totuși indexată dacă este legată de alte site-uri.
În timp ce Google nu va accesa sau indexa conținutul blocat de un fișier robots.txt, este posibil să găsim și să indexăm un URL interzis dacă este legat de alte locuri de pe web. Ca rezultat,
adresa URL și, potențial, alte informații disponibile public, cum ar fi textul ancoră
în legăturile către pagină, pot apărea în rezultatele Căutării Google. Pentru a preveni corect apariția URL-ului tău
în rezultatele Căutării Google,
protejează cu parolă fișierele pe serverul tău,
folosește eticheta noindex meta sau antetul de răspuns,
sau elimină complet pagina.

Creează sau actualizează un fișier robots.txt

Dacă ai decis că ai nevoie de unul, învață cum să
creezi un fișier robots.txt. Sau dacă
ai deja unul, învață cum să
îl actualizezi.

Vrei să afli mai multe? Verifică următoarele resurse:

Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.

April 10, 2026

Înțelegeți elementele de bază ale SEO pentru JavaScript

JavaScript este o parte importantă a platformei web, deoarece oferă multe funcționalități care transformă web-ul într-o platformă puternică pentru aplicații.
Asigurarea că aplicațiile web alimentate de JavaScript sunt descoperibile prin Căutarea Google vă poate ajuta să găsiți noi utilizatori și să reangajați utilizatorii existenți în timp ce aceștia caută conținutul pe care aplicația dvs. web îl oferă.
În timp ce Căutarea Google rulează JavaScript cu o versiune evergreen a Chromium, există câteva lucruri pe care le puteți optimiza.

Acest ghid descrie cum procesează Căutarea Google JavaScript și cele mai bune practici pentru îmbunătățirea aplicațiilor web JavaScript pentru Căutarea Google.

Cum procesează Google JavaScript

Google procesează aplicațiile web JavaScript în trei faze principale:

Răsfoire
Redare
Indexare

Googlebot pune în coadă paginile atât pentru răsfoire, cât și pentru redare. Nu este imediat evident când o pagină așteaptă să fie răsfoită și când așteaptă să fie redată.
Când Googlebot preia o adresă URL din coada de răsfoire prin efectuarea unei cereri HTTP, verifică mai întâi dacă permiteți răsfoirea. Googlebot citește fișierul robots.txt.
Dacă marchează adresa URL ca nepermisă, atunci Googlebot omite efectuarea unei cereri HTTP către această adresă URL și o omite. Căutarea Google nu va reda JavaScript din fișierele blocate sau pe paginile blocate.

Googlebot apoi analizează răspunsul pentru alte adrese URL în atributul href al linkurilor și adaugă adresele URL în coada de răsfoire. Pentru a preveni descoperirea linkurilor, utilizați mecanismul nofollow.

Răsfoirea unei adrese URL și analizarea răspunsului funcționează bine pentru site-urile clasice sau paginile redare pe server unde -ul din răspunsul HTTP conține tot conținutul.
Unele site-uri JavaScript pot utiliza modelul app shell unde -ul inițial nu conține conținutul real și Google trebuie să execute JavaScript înainte de a putea vedea conținutul real al paginii pe care JavaScript-ul îl generează.

Googlebot pune în coadă toate paginile cu un cod de stare HTTP 200 pentru redare, cu excepția cazului în care un meta tag sau antet robots spune Google să nu indexeze pagina.
Pagina poate rămâne în această coadă pentru câteva secunde, dar poate dura mai mult de atât. Odată ce resursele Google permit, un Chromium fără cap redă pagina și execută JavaScript-ul.
Googlebot analizează din nou -ul redat pentru linkuri și pune în coadă adresele URL pe care le găsește pentru răsfoire. Google folosește, de asemenea, -ul redat pentru a indexa pagina.

Toate paginile cu un cod de stare HTTP 200 sunt trimise în coada de redare, indiferent dacă JavaScript-ul este prezent pe pagină.
Dacă codul de stare HTTP este non-200 (de exemplu, pe paginile de eroare cu cod de stare 404), redarea poate fi omisă.

Rețineți că redarea pe server sau pre-redarea este încă o idee excelentă, deoarece face site-ul dvs. mai rapid pentru utilizatori și crawlere, și nu toate boturile pot rula JavaScript.

Descrieți pagina dvs. cu titluri și fragmente unice

<title> elemente unice și descriptive și meta descrieri ajută utilizatorii să identifice rapid cel mai bun rezultat pentru obiectivul lor.
Puteți utiliza JavaScript pentru a seta sau schimba meta descrierea, precum și elementul <title>.

Setați URL-ul canonic

rel="canonical" tag-ul de link ajută Google să găsească versiunea canonică a unei pagini.
Puteți utiliza JavaScript pentru a seta URL-ul canonic, dar rețineți că nu ar trebui să utilizați JavaScript pentru a schimba URL-ul canonic în altceva decât URL-ul pe care l-ați specificat ca URL canonic în -ul original.
Cel mai bun mod de a seta URL-ul canonic este să utilizați , dar dacă trebuie să utilizați JavaScript, asigurați-vă că setați întotdeauna URL-ul canonic la aceeași valoare ca -ul original.
Dacă nu puteți seta URL-ul canonic în , atunci puteți utiliza JavaScript pentru a seta URL-ul canonic și să-l lăsați în afara -ului original.

Scrieți cod compatibil

Browserele oferă multe API-uri și JavaScript este un limbaj care evoluează rapid. Google are unele limitări în ceea ce privește care API-uri și caracteristici JavaScript le suportă. Pentru a vă asigura că codul dvs. este
compatibil cu Google, urmați ghidurile noastre pentru depanarea problemelor JavaScript.

Google recomandă utilizarea servirii diferențiale și a polyfill-urilor dacă detectați lipsa unui API de browser de care aveți nevoie.
Deoarece unele caracteristici ale browserului nu pot fi polyfill-ate, Google recomandă să verificați documentația polyfill pentru eventualele limitări.

Utilizați coduri de stare HTTP semnificative

Googlebot folosește coduri de stare HTTP pentru a afla dacă ceva a mers prost atunci când răsfoiește pagina.

Pentru a spune Googlebot dacă o pagină nu poate fi răsfoită sau indexată, utilizați un cod de stare semnificativ, cum ar fi un 404 pentru o pagină care nu a putut fi găsită sau un cod 401 pentru paginile din spatele unui login.
Puteți utiliza coduri de stare HTTP pentru a spune Googlebot dacă o pagină a fost mutată la o nouă adresă URL, astfel încât indexul să poată fi actualizat corespunzător.

Iată o listă de coduri de stare HTTP și cum afectează acestea Căutarea Google.

Evitați erorile `soft 404` în aplicațiile cu o singură pagină

În aplicațiile cu o singură pagină redare pe partea clientului, rutarea este adesea implementată ca rutare pe partea clientului.
În acest caz, utilizarea codurilor de stare HTTP semnificative poate fi imposibilă sau nepractică.
Pentru a evita erorile soft 404 atunci când utilizați redarea și rutarea pe partea clientului, utilizați una dintre următoarele strategii:

Utilizați un redirect JavaScript către o adresă URL pentru care serverul răspunde cu un cod de stare HTTP 404 (de exemplu /not-found).
Adăugați un <meta name="robots" content="noindex"> la paginile de eroare folosind JavaScript.

Iată un exemplu de cod pentru abordarea cu redirect:

fetch(`/api/products/${productId}`)
.then(response => response.json())
.then(product => {
  if(product.exists) {
    showProductDetails(product); // afișează informațiile despre produs pe pagină
  } else {
    // acest produs nu există, deci aceasta este o pagină de eroare.
    window.location.href = '/not-found'; // redirecționează către pagina 404 pe server.
  }
})

Iată un exemplu de cod pentru abordarea cu tagul noindex:

fetch(`/api/products/${productId}`)
.then(response => response.json())
.then(product => {
  if(product.exists) {
    showProductDetails(product); // afișează informațiile despre produs pe pagină
  } else {
    // acest produs nu există, deci aceasta este o pagină de eroare.
    // Notă: Acest exemplu presupune că nu există alt tag meta robots prezent în .
    const metaRobots = document.createElement('meta');
    metaRobots.name = 'robots';
    metaRobots.content = 'noindex';
    document.head.appendChild(metaRobots);
  }
})

Utilizați API-ul History în loc de fragmente

Google poate descoperi linkurile dvs. doar dacă sunt <a> elemente cu un atribut href.

Pentru aplicațiile cu o singură pagină cu rutare pe partea clientului, utilizați API-ul History pentru a implementa rutarea între diferitele vizualizări ale aplicației dvs. web.
Pentru a vă asigura că Googlebot poate analiza și extrage adresele URL, nu utilizați fragmente pentru a încărca conținut diferit al paginii.
Următorul exemplu este o practică proastă, deoarece Googlebot nu poate rezolva în mod fiabil adresele URL:

<nav>
  <ul>
    <li><a href="#/products">Produsele noastre</a></li>
    <li><a href="#/services">Serviciile noastre</a></li>
  </ul>
</nav>

<h1>Bine ați venit la example.com!</h1>
<div id="placeholder">
  <p>Aflați mai multe despre <a href="#/products">produsele noastre</a> și <a href="#/services">serviciile noastre</a></p>
</div>
<script>
window.addEventListener('hashchange', function goToPage() {
  // această funcție încarcă conținut diferit pe baza fragmentului URL curent
  const pageToLoad = window.location.hash.slice(1); // fragment URL
  document.getElementById('placeholder').inner = load(pageToLoad);
});
</script>

În schimb, puteți să vă asigurați că adresele URL sunt accesibile pentru Googlebot implementând API-ul History:

<nav>
  <ul>
    <li><a href="/products">Produsele noastre</a></li>
    <li><a href="/services">Serviciile noastre</a></li>
  </ul>
</nav>

<h1>Bine ați venit la example.com!</h1>
<div id="placeholder">
  <p>Aflați mai multe despre <a href="/products">produsele noastre</a> și <a href="/services">serviciile noastre</a></p>
</div>
<script>
function goToPage(event) {
  event.preventDefault(); // oprește browserul să navigheze la adresa URL de destinație.
  const hrefUrl = event.target.getAttribute('href');
  const pageToLoad = hrefUrl.slice(1); // elimină bara de început
  document.getElementById('placeholder').inner = load(pageToLoad);
  window.history.pushState({}, window.title, hrefUrl) // Actualizează URL-ul și istoricul browserului.
}

// Activează rutarea pe partea clientului pentru toate linkurile de pe pagină
document.querySelectorAll('a').forEach(link => link.addEventListener('click', goToPage));

</script>

Injectați corect tagul de link `rel="canonical"`

Deși nu se recomandă utilizarea JavaScript pentru aceasta, este posibil să injectați un rel="canonical" tag de link cu JavaScript.
Căutarea Google va prelua URL-ul canonic injectat atunci când redă pagina. Iată un exemplu pentru a injecta un tag de link rel="canonical" cu JavaScript:

fetch('/api/cats/' + id)
  .then(function (response) { return response.json(); })
  .then(function (cat) {
    // creează un tag de link canonic și construiește dinamic URL-ul
    // de exemplu, https://example.com/cats/simba
    const linkTag = document.createElement('link');
    linkTag.setAttribute('rel', 'canonical');
    linkTag.href = 'https://example.com/cats/' + cat.urlFriendlyName;
    document.head.appendChild(linkTag);
  });

Când utilizați JavaScript pentru a injecta tagul de link rel="canonical", asigurați-vă că acesta este singurul tag de link rel="canonical" de pe pagină.
Implementările incorecte pot crea multiple taguri de link rel="canonical" sau pot schimba un tag de link rel="canonical" existent.
Tagurile de link rel="canonical" conflictuale sau multiple pot duce la rezultate neașteptate.

Utilizați cu atenție tagurile robots `meta`

Puteți împiedica Google să indexeze o pagină sau să urmeze linkuri prin intermediul tagului robots meta.
De exemplu, adăugarea următorului tag meta în partea de sus a paginii dvs. blochează Google să indexeze pagina:

<!-- Google nu va indexa această pagină sau nu va urma linkurile de pe această pagină -->
<meta name="robots" content="noindex, nofollow">

Puteți utiliza JavaScript pentru a adăuga un tag robots meta la o pagină sau pentru a-i schimba conținutul.
Următorul exemplu de cod arată cum să schimbați tagul robots meta cu JavaScript pentru a preveni indexarea paginii curente dacă un apel API nu returnează conținut.

fetch('/api/products/' + productId)
  .then(function (response) { return response.json(); })
  .then(function (apiResponse) {
    if (apiResponse.isError) {
      // obțineți tagul robots meta
      var metaRobots = document.querySelector('meta[name="robots"]');
      // dacă nu a existat niciun tag robots meta, adăugați unul
      if (!metaRobots) {
        metaRobots = document.createElement('meta');
        metaRobots.setAttribute('name', 'robots');
        document.head.appendChild(metaRobots);
      }
      // spuneți Google să excludă această pagină din index
      metaRobots.setAttribute('content', 'noindex');
      // afișați un mesaj de eroare utilizatorului
      errorMsg.textContent = 'Acest produs nu mai este disponibil';
      return;
    }
    // afișați informațiile despre produs
    // ...
  });

Când Google întâlnește tagul noindex, poate sări peste redare și execuția JavaScript,
ceea ce înseamnă că utilizarea JavaScript pentru a schimba sau elimina tagul robots
meta din noindex poate să nu funcționeze așa cum vă așteptați. Dacă doriți ca pagina să fie indexată, nu utilizați un
tag noindex în codul original al paginii.

Utilizați cache-ul pe termen lung

Googlebot cachează agresiv pentru a reduce cererile de rețea și utilizarea resurselor. WRS poate ignora anteturile de cache. Acest lucru poate duce la utilizarea de către WRS a resurselor JavaScript sau CSS învechite.
Amprentarea conținutului evită această problemă prin includerea unei amprente a conținutului în numele fișierului, cum ar fi main.2bb85551.js.
Amprenta depinde de conținutul fișierului, astfel încât actualizările generează un nume de fișier diferit de fiecare dată.
Consultați ghidul web.dev despre strategiile de cache pe termen lung pentru a afla mai multe.

Utilizați date structurate

Când utilizați date structurate pe paginile dvs., puteți utiliza JavaScript pentru a genera JSON-LD-ul necesar și a-l injecta în pagină. Asigurați-vă că testați implementarea pentru a evita problemele.

Urmați cele mai bune practici pentru componente web

Google suportă componentele web.
Când Google redă o pagină, aplatizează conținutul shadow DOM și light DOM.
Acest lucru înseamnă că Google poate vedea doar conținutul care este vizibil în -ul redat. Pentru a vă asigura că Google poate vedea în continuare conținutul dvs. după ce este redat, utilizați Testul pentru rezultate bogate sau Instrumentul de inspecție a URL-urilor și verificați -ul redat.

Dacă conținutul nu este vizibil în -ul redat, Google nu va putea să-l indexeze.

Următorul exemplu creează o componentă web care afișează conținutul său light DOM în interiorul shadow DOM.
Un mod de a vă asigura că atât conținutul light DOM, cât și shadow DOM sunt afișate în -ul redat este să utilizați un element Slot.

<script>
  class MyComponent extends Element {
    constructor() {
      super();
      this.attachShadow({ mode: 'open' });
    }

    connectedCallback() {
      let p = document.createElement('p');
      p.inner = 'Hello World, this is shadow DOM content. Here comes the light DOM: <slot></slot>';
      this.shadowRoot.appendChild(p);
    }
  }

  window.customElements.define('my-component', MyComponent);
</script>

<my-component>
  <p>Acesta este conținutul light DOM. Este proiectat în shadow DOM.</p>
  <p>WRS redă acest conținut, precum și conținutul shadow DOM.</p>
</my-component>

După redare, Google poate indexa acest conținut:

<my-component>
  Hello World, this is shadow DOM content. Here comes the light DOM:
  <p>Acesta este conținutul light DOM. Este proiectat în shadow DOM<p>
  <p>WRS redă acest conținut, precum și conținutul shadow DOM.</p>
</my-component>

Remediați imaginile și conținutul încărcat la cerere

Imaginile pot fi destul de costisitoare în ceea ce privește lățimea de bandă și performanța. O strategie bună este să utilizați încărcarea la cerere pentru a încărca imagini doar atunci când utilizatorul este pe cale să le vadă.
Pentru a vă asigura că implementați încărcarea la cerere într-un mod prietenos cu căutarea, urmați ghidurile noastre de încărcare la cerere.

Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.

April 10, 2026

Cum interpretează Google specificațiile robots.txt

Roboții automatizați ai Google, cunoscuți sub numele de
crawlers, suportă
Protocolul de Excludere a Roboților (REP).
Acest lucru înseamnă că, înainte de a accesa un site, roboții Google descarcă și analizează fișierul robots.txt al site-ului pentru a extrage informații despre care părți ale site-ului pot fi accesate. REP nu se aplică roboților Google care sunt controlați de utilizatori (de exemplu, abonamente la fluxuri) sau roboților care sunt utilizați pentru a crește siguranța utilizatorilor (de exemplu, analiza malware).

Această pagină descrie interpretarea REP de către Google. Pentru standardul original, consultați
RFC 9309.

Ce este un fișier robots.txt

Dacă nu doriți ca roboții să acceseze secțiuni ale site-ului dvs., puteți crea un fișier robots.txt cu reguli corespunzătoare. Un fișier robots.txt este un fișier text care conține reguli despre care roboți pot accesa care părți ale unui site. De exemplu, fișierul robots.txt pentru example.com poate arăta astfel:

# Acest fișier robots.txt controlează accesarea URL-urilor sub https://example.com.
# Toți roboții nu au permisiunea de a accesa fișierele din directorul "includes", cum ar fi .css, .js, dar Google are nevoie de ele pentru redare, așa că Googlebot are permisiunea de a le accesa.
User-agent: *
Disallow: /includes/

User-agent: Googlebot
Allow: /includes/

Sitemap: https://example.com/sitemap.xml

Dacă sunteți nou în utilizarea robots.txt, începeți cu
introducerea în robots.txt. De asemenea, puteți găsi
sfaturi pentru crearea unui fișier robots.txt.

Locația fișierului și domeniul de valabilitate

Trebuie să plasați fișierul robots.txt în directorul de nivel superior al unui site, pe un protocol suportat. URL-ul pentru fișierul robots.txt este (ca și alte URL-uri) sensibil la majuscule și minuscule. În cazul Google Search, protocoalele suportate sunt HTTP, HTTPS și FTP. Pe HTTP și HTTPS, roboții accesează fișierul robots.txt cu o cerere HTTP non-condițională GET; pe FTP, roboții folosesc o comandă standard RETR (RETRIEVE), folosind autentificare anonimă.

Regulile listate în fișierul robots.txt se aplică doar gazdei, protocolului și numărului de port unde este găzduit fișierul robots.txt.

Exemple de URL-uri robots.txt valide

Tabelul următor conține exemple de URL-uri robots.txt și pentru ce căi URL sunt valabile. Prima coloană conține URL-ul unui fișier robots.txt, iar a doua coloană conține domeniile pentru care acel fișier robots.txt ar fi și nu ar fi valabil.

Exemple de URL-uri robots.txt
`https://example.com/robots.txt`	Acesta este cazul general. Nu este valabil pentru alte subdomenii, protocoale sau numere de port. Este valabil pentru toate fișierele din toate subdirectoarele de pe aceeași gazdă, protocol și număr de port. Valabil pentru: `https://example.com/` `https://example.com/folder/file` Nu este valabil pentru: `https://other.example.com/` `http://example.com/` `https://example.com:8181/`
`https://www.example.com/robots.txt`	Un fișier robots.txt pe un subdomeniu este valabil doar pentru acel subdomeniu. Valabil pentru: `https://www.example.com/` Nu este valabil pentru: `https://example.com/` `https://shop.www.example.com/` `https://www.shop.example.com/`
`https://example.com/folder/robots.txt`	Nu este un fișier robots.txt valabil. Roboții nu verifică fișierele robots.txt în subdirectoare.
`https://www.exämple.com/robots.txt`	IDN-urile sunt echivalente cu versiunile lor punycode. Vezi și RFC 3492. Valabil pentru: `https://www.exämple.com/` `https://xn--exmple-cua.com/` Nu este valabil pentru: `https://www.example.com/`
`ftp://example.com/robots.txt`	Valabil pentru: `ftp://example.com/` Nu este valabil pentru: `https://example.com/`
`https://212.96.82.21/robots.txt`	Un fișier robots.txt cu o adresă IP ca nume de gazdă este valabil doar pentru accesarea acelei adrese IP ca nume de gazdă. Nu este automat valabil pentru toate site-urile găzduite pe acea adresă IP (deși este posibil ca fișierul robots.txt să fie partajat, caz în care ar fi disponibil și sub numele de gazdă partajat). Valabil pentru: `https://212.96.82.21/` Nu este valabil pentru: `https://example.com/` (chiar dacă este găzduit pe `212.96.82.21`)
`https://example.com:443/robots.txt`	Numerele de port standard (`80` pentru HTTP, `443` pentru HTTPS, `21` pentru FTP) sunt echivalente cu numele de gazdă implicite. Valabil pentru: `https://example.com:443/` `https://example.com/` Nu este valabil pentru: `https://example.com:444/`
`https://example.com:8181/robots.txt`	Fișierele robots.txt pe numere de port non-standard sunt valabile doar pentru conținutul disponibil prin acele numere de port. Valabil pentru: `https://example.com:8181/` Nu este valabil pentru: `https://example.com/`

Gestionarea erorilor și codurilor de stare HTTP

Când se solicită un fișier robots.txt, codul de stare HTTP al răspunsului serverului afectează modul în care fișierul robots.txt va fi utilizat de roboții Google. Tabelul următor rezumă modul în care Googlebot tratează fișierele robots.txt pentru diferite coduri de stare HTTP.

Gestionarea erorilor și codurilor de stare HTTP
`2xx (succes)`	Codurile de stare HTTP care semnalează succesul determină roboții Google să proceseze fișierul robots.txt așa cum este furnizat de server.
`3xx (redirecționare)`	Google urmează cel puțin cinci salturi de redirecționare, așa cum este definit de RFC 1945, și apoi se oprește și tratează ca un `404` pentru fișierul robots.txt. Acest lucru se aplică și oricăror URL-uri interzise în lanțul de redirecționare, deoarece robotul nu a putut prelua regulile din cauza redirecționărilor. Google nu urmează redirecționările logice în fișierele robots.txt (cadre, JavaScript sau redirecționări de tip meta refresh).
`4xx (erori client)`	Roboții Google tratează toate erorile `4xx`, cu excepția `429`, ca și cum un fișier robots.txt valabil nu ar exista. Acest lucru înseamnă că Google presupune că nu există restricții de accesare. Nu utilizați codurile de stare `401` și `403` pentru a limita rata de accesare. Codurile de stare `4xx`, cu excepția `429`, nu au efect asupra ratei de accesare. Aflați cum să limitați rata de accesare.
`5xx (erori server)`	Dacă Google găsește un fișier robots.txt, dar nu poate să-l preia, Google urmează acest comportament: Pentru primele 12 ore, Google oprește accesarea site-ului, dar continuă să încerce să preia fișierul robots.txt. Dacă Google nu poate prelua o versiune nouă, pentru următoarele 30 de zile Google va folosi ultima versiune bună, continuând să încerce să preia o versiune nouă. O eroare `503 (serviciu indisponibil)` duce la încercări frecvente de reîncercare. Dacă nu există o versiune în cache disponibilă, Google presupune că nu există restricții de accesare. Dacă erorile nu sunt remediate după 30 de zile: Dacă site-ul este în general disponibil pentru Google, Google va acționa ca și cum nu ar exista un fișier robots.txt (dar va continua să verifice pentru o versiune nouă). Dacă site-ul are probleme generale de disponibilitate, Google va opri accesarea site-ului, continuând să solicite periodic un fișier robots.txt.
Alte erori	Un fișier robots.txt care nu poate fi preluat din cauza problemelor DNS sau de rețea, cum ar fi expirări de timp, răspunsuri invalide, conexiuni resetate sau întrerupte și erori de fragmentare HTTP, este tratat ca o eroare de server.

Caching

Google în general cachează conținutul fișierului robots.txt pentru până la 24 de ore, dar poate să-l cacheze mai mult în situații în care reîmprospătarea versiunii cache nu este posibilă (de exemplu, din cauza expirărilor de timp sau a erorilor 5xx). Răspunsul cache poate fi partajat de diferiți roboți. Google poate crește sau reduce durata de viață a cache-ului pe baza
max-age Cache-Control
din anteturile HTTP.

Formatul fișierului

Fișierul robots.txt trebuie să fie un fișier text simplu codificat
UTF-8 și liniile trebuie să fie separate prin CR, CR/LF sau LF.

Google ignoră liniile invalide din fișierele robots.txt, inclusiv
Marca de Ordine a Bytelor Unicode (BOM) la începutul fișierului robots.txt, și folosește doar liniile valide. De exemplu, dacă conținutul descărcat este în loc de reguli robots.txt, Google va încerca să parseze conținutul și să extragă regulile, ignorând tot restul.

În mod similar, dacă codificarea caracterelor fișierului robots.txt nu este UTF-8, Google poate ignora caracterele care nu fac parte din gama UTF-8, ceea ce poate face ca regulile robots.txt să fie invalide.

Google impune o limită de dimensiune a fișierului robots.txt de 500
kibibytes (KiB). Conținutul care depășește dimensiunea maximă a fișierului este ignorat. Puteți reduce dimensiunea fișierului robots.txt prin consolidarea regulilor care ar duce la un fișier robots.txt supradimensionat. De exemplu, plasați materialul exclus într-un director separat.

Sintaxa

Liniile valide din fișierul robots.txt constau dintr-un câmp, un colon și o valoare. Spațiile sunt opționale, dar recomandate pentru a îmbunătăți lizibilitatea. Spațiul de la începutul și sfârșitul liniei este ignorat. Pentru a include comentarii, precedați comentariul cu caracterul #. Rețineți că tot ce urmează după caracterul # va fi ignorat. Formatul general este <field>:<value><#optional-comment>.

Google suportă următoarele câmpuri (alte câmpuri, cum ar fi crawl-delay, nu sunt suportate):

user-agent: identifică pentru care robot se aplică regulile.
allow: o cale URL care poate fi accesată.
disallow: o cale URL care nu poate fi accesată.
sitemap: URL-ul complet al unui sitemap.

Câmpurile allow și disallow sunt, de asemenea, numite reguli (cunoscute și sub numele de directive). Aceste reguli sunt întotdeauna specificate sub forma rule: [path], unde [path] este opțional. În mod implicit, nu există restricții pentru accesarea de către roboții desemnați. Roboții ignoră regulile fără un [path].

Valoarea [path], dacă este specificată, este relativă la rădăcina site-ului de unde a fost preluat fișierul robots.txt (folosind același protocol, număr de port, gazdă și nume de domeniu). Valoarea căii trebuie să înceapă cu / pentru a desemna rădăcina, iar valoarea este sensibilă la majuscule și minuscule. Aflați mai multe despre
potrivirea URL-urilor pe baza valorilor căii.

`user-agent`

Linia user-agent identifică pentru care robot se aplică regulile. Consultați
roboții Google și șirurile de user-agent
pentru o listă cuprinzătoare de șiruri de user-agent pe care le puteți utiliza în fișierul dvs. robots.txt.

Valoarea liniei user-agent nu este sensibilă la majuscule și minuscule.

`disallow`

Regula disallow specifică căile care nu trebuie accesate de roboții identificați de linia user-agent cu care este grupată regula disallow. Roboții ignoră regula fără o cale.

Google nu poate indexa conținutul paginilor care sunt interzise pentru accesare, dar poate totuși să indexeze URL-ul și să-l afișeze în rezultatele căutării fără un fragment. Aflați cum să
blocați indexarea.

Valoarea regulii disallow este sensibilă la majuscule și minuscule.

Utilizare:

disallow: [path]

`allow`

Regula allow specifică căile care pot fi accesate de roboții desemnați. Când nu este specificată nicio cale, regula este ignorată.

Valoarea regulii allow este sensibilă la majuscule și minuscule.

Utilizare:

allow: [path]

`sitemap`

Google, Bing și alte motoare de căutare majore suportă câmpul sitemap în robots.txt, așa cum este definit de
sitemaps.org.

Valoarea câmpului sitemap este sensibilă la majuscule și minuscule.

Utilizare:

sitemap: [absoluteURL]

Linia [absoluteURL] indică locația unui fișier sitemap sau a unui index de sitemap. Trebuie să fie un URL complet calificat, incluzând protocolul și gazda, și nu trebuie să fie codificat URL. URL-ul nu trebuie să fie pe aceeași gazdă ca fișierul robots.txt. Puteți specifica mai multe câmpuri sitemap. Câmpul sitemap nu este legat de niciun agent utilizator specific și poate fi urmat de toți roboții, cu condiția să nu fie interzis pentru accesare.

De exemplu:

user-agent: otherbot
disallow: /kale

sitemap: https://example.com/sitemap.xml
sitemap: https://cdn.example.org/other-sitemap.xml
sitemap: https://ja.example.org/テスト-サイトマップ.xml

Gruparea liniilor și regulilor

Puteți grupa împreună regulile care se aplică mai multor agenți utilizatori prin repetarea liniilor user-agent pentru fiecare robot.

De exemplu:

user-agent: a
disallow: /c

user-agent: b
disallow: /d

user-agent: e
user-agent: f
disallow: /g

user-agent: h

În acest exemplu există patru grupuri distincte de reguli:

Un grup pentru agentul utilizator “a”.
Un grup pentru agentul utilizator “b”.
Un grup pentru ambii agenți utilizatori “e” și “f”.
Un grup pentru agentul utilizator “h”.

Pentru descrierea tehnică a unui grup, consultați
secțiunea 2.1 din REP.

Ordinea de precedență pentru agenți utilizatori

Doar un singur grup este valabil pentru un anumit robot. Roboții Google determină grupul corect de reguli găsind în fișierul robots.txt grupul cu cel mai specific agent utilizator care se potrivește cu agentul utilizator al robotului. Alte grupuri sunt ignorate. Tot textul care nu se potrivește este ignorat (de exemplu, atât googlebot/1.2 cât și googlebot* sunt echivalente cu googlebot). Ordinea grupurilor în fișierul robots.txt este irelevantă.

Dacă există mai mult de un grup specific declarat pentru un agent utilizator, toate regulile din grupurile aplicabile agentului utilizator specific sunt combinate intern într-un singur grup. Grupurile specifice agentului utilizator și grupurile globale (*) nu sunt combinate.

Exemple

user-agent” tabindex=”-1″>Potrivirea câmpurilor `user-agent`

user-agent: googlebot-news
(group 1)

user-agent: *
(group 2)

user-agent: googlebot
(group 3)

Așa ar alege roboții grupul relevant:

Grup urmat de fiecare robot
Googlebot News	`googlebot-news` urmează grupul 1, deoarece grupul 1 este cel mai specific grup.
Googlebot (web)	`googlebot` urmează grupul 3.
Googlebot Storebot	`Storebot-Google` urmează grupul 2, deoarece nu există un grup specific `Storebot-Google`.
Googlebot News (când accesează imagini)	Când accesează imagini, `googlebot-news` urmează grupul 1. `googlebot-news` nu accesează imaginile pentru Google Images, așa că urmează doar grupul 1.
Otherbot (web)	Alți roboți Google urmează grupul 2.
Otherbot (știri)	Alți roboți Google care accesează conținut de știri, dar nu se identifică ca `googlebot-news` urmează grupul 2. Chiar dacă există o intrare pentru un robot similar, este valabilă doar dacă se potrivește specific.

Gruparea regulilor

Dacă există mai multe grupuri într-un fișier robots.txt care sunt relevante pentru un agent utilizator specific, roboții Google combină intern grupurile. De exemplu:

user-agent: googlebot-news
disallow: /fish

user-agent: *
disallow: /carrots

user-agent: googlebot-news
disallow: /shrimp

Roboții grupează intern regulile pe baza agentului utilizator, de exemplu:

user-agent: googlebot-news
disallow: /fish
disallow: /shrimp

user-agent: *
disallow: /carrots

Regulile altele decât allow, disallow și user-agent sunt ignorate de parserul robots.txt. Acest lucru înseamnă că următorul fragment de robots.txt este tratat ca un singur grup, și astfel atât user-agent a cât și b sunt afectați de regula disallow: /:

user-agent: a
sitemap: https://example.com/sitemap.xml

user-agent: b
disallow: /

Când roboții procesează regulile robots.txt, ei ignoră linia sitemap. De exemplu, așa ar înțelege roboții fragmentul anterior de robots.txt:

user-agent: a
user-agent: b
disallow: /

Potrivirea URL-urilor pe baza valorilor căilor

Google folosește valoarea căii în regulile allow și disallow ca bază pentru a determina dacă o regulă se aplică unui URL specific pe un site. Acest lucru funcționează prin compararea regulii cu componenta căii URL-ului pe care robotul încearcă să-l acceseze. Caracterele non-ASCII de 7 biți dintr-o cale pot fi incluse ca caractere UTF-8 sau ca caractere codificate UTF-8 cu procent, conform
RFC 3986.

Google, Bing și alte motoare de căutare majore suportă o formă limitată de caractere wildcard pentru valorile căilor. Aceste caractere wildcard sunt:

* desemnează 0 sau mai multe instanțe ale oricărui caracter valid.
$ desemnează sfârșitul URL-ului.

Tabelul următor arată cum afectează caracterele wildcard diferite parsarea:

Exemple de potrivire a căilor
`/`	Se potrivește cu rădăcina și orice URL de nivel inferior.
`/*`	Echivalent cu `/`. Wildcard-ul final este ignorat.
`/$`	Se potrivește doar cu rădăcina. Orice URL de nivel inferior este permis pentru accesare.
`/fish`	Se potrivește cu orice cale care începe cu `/fish`. Rețineți că potrivirea este sensibilă la majuscule și minuscule. Se potrivește: `/fish` `/fish.` `/fish/salmon.` `/fishheads` `/fishheads/yummy.` `/fish.php?id=anything` Nu se potrivește: `/Fish.asp` `/catfish` `/?id=fish` `/desert/fish`
`/fish*`	Echivalent cu `/fish`. Wildcard-ul final este ignorat. Se potrivește: `/fish` `/fish.` `/fish/salmon.` `/fishheads` `/fishheads/yummy.` `/fish.php?id=anything` Nu se potrivește: `/Fish.asp` `/catfish` `/?id=fish` `/desert/fish`
`/fish/`	Se potrivește cu orice în folderul `/fish/`. Se potrivește: `/fish/` `/fish/?id=anything` `/fish/salmon.htm` Nu se potrivește: `/fish` `/fish.` `/animals/fish/` `/Fish/Salmon.asp`
`/*.php`	Se potrivește cu orice cale care conține `.php`. Se potrivește: `/index.php` `/filename.php` `/folder/filename.php` `/folder/filename.php?parameters` `/folder/any.php.file.` `/filename.php/` Nu se potrivește: `/` (chiar dacă se mapează la /index.php) `/windows.PHP`
`/*.php$`	Se potrivește cu orice cale care se termină cu `.php`. Se potrivește: `/filename.php` `/folder/filename.php` Nu se potrivește: `/filename.php?parameters` `/filename.php/` `/filename.php5` `/windows.PHP`
`/fish*.php`	Se potrivește cu orice cale care conține `/fish` și `.php`, în această ordine. Se potrivește: `/fish.php` `/fishheads/catfish.php?parameters` Nu se potrivește: `/Fish.PHP`

Ordinea de precedență pentru reguli

Când se potrivesc regulile robots.txt cu URL-urile, roboții folosesc cea mai specifică regulă pe baza lungimii căii regulii. În cazul regulilor conflictuale, inclusiv cele cu wildcard-uri, Google folosește regula cea mai puțin restrictivă.

Următoarele exemple demonstrează ce regulă vor aplica roboții Google pe un URL dat.

Situații exemplu
`https://example.com/page`	allow: /p disallow: / Regula aplicabilă: `allow: /p`, deoarece este mai specifică.
`https://example.com/folder/page`	allow: /folder disallow: /folder Regula aplicabilă: `allow: /folder`, deoarece în cazul regulilor conflictuale, Google folosește regula cea mai puțin restrictivă.
`https://example.com/page.htm`	allow: /page disallow: /.htm Regula aplicabilă: `disallow: /.htm`, deoarece calea regulii este mai lungă și se potrivește cu mai multe caractere din URL, deci este mai specifică.
`https://example.com/page.php5`	allow: /page disallow: /.ph Regula aplicabilă*: `allow: /page`, deoarece în cazul regulilor conflictuale, Google folosește regula cea mai puțin restrictivă.
`https://example.com/`	allow: /$ disallow: / Regula aplicabilă: `allow: /$`, deoarece este mai specifică.
`https://example.com/page.htm`	allow: /$ disallow: / Regula aplicabilă: `disallow: /`, deoarece regula `allow` se aplică doar pe URL-ul rădăcină.

Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.

April 9, 2026

Cum afectează codurile de stare HTTP crawler-ele Google

Coduri de stare HTTP

Codurile de stare HTTP sunt generate de serverul care găzduiește site-ul atunci când răspunde la o cerere făcută de un client, de exemplu un browser sau un crawler. Fiecare cod de stare HTTP are o semnificație diferită, dar adesea rezultatul cererii este același. De exemplu, există mai multe coduri de stare care semnalează redirecționarea, dar rezultatul lor este același.

Search Console generează mesaje de eroare pentru codurile de stare din intervalul 4xx—5xx, și pentru redirecționările eșuate (3xx). Dacă serverul a răspuns cu un cod de stare 2xx, conținutul primit în răspuns poate fi luat în considerare pentru indexare.

Pentru Google Search, un cod de stare HTTP 2xx (success) nu garantează indexarea.

Tabelul următor conține cele mai întâlnite coduri de stare HTTP de către Google și o explicație despre cum gestionează Google fiecare cod de stare.

Coduri de stare HTTP

`2xx (success)`

Google ia în considerare conținutul pentru procesare (de exemplu, în cazul Google Search, pentru indexare). Dacă conținutul sugerează o eroare pentru Google Search, o pagină goală sau un mesaj de eroare, Search Console va afișa o eroare soft 404.

`200 (success)`	Google transmite mai departe ceea ce a primit către următorul pas de procesare (care este specific produsului). Pentru Google Search, următorul sistem este pipeline-ul de indexare. Sistemele de indexare pot indexa conținutul, dar acest lucru nu este garantat.
`201 (created)`
`202 (accepted)`	Google așteaptă conținutul pentru o perioadă limitată de timp, apoi transmite mai departe ceea ce a primit către următorul pas de procesare (care este specific produsului). Timeout-ul depinde de agentul utilizatorului, de exemplu Googlebot Smartphone poate avea un timeout diferit față de Googlebot Image.
`204 (no content)`	Google nu a reușit să primească niciun conținut și, prin urmare, nu poate să-l proceseze.

`3xx (redirection)`

În mod implicit, crawler-ele Google urmează până la 10 salturi de redirecționare. Totuși, crawler-ele unor produse specifice pot avea limite diferite. De exemplu, Googlebot urmează în general 10 salturi de redirecționare atunci când scanează conținut web general, dar Instrumentele de Inspecție Google nu urmează redirecționările.

Orice conținut pe care Google îl primește de la URL-ul de redirecționare este ignorat, iar conținutul URL-ului țintă final este procesat în schimb. Pentru fișierele robots.txt, învață cum Google gestionează un robots.txt care returnează un cod de stare 3xx.

`301 (moved permanently)`	Google urmează redirecționarea, iar sistemele Google folosesc redirecționarea ca un semnal puternic că ținta redirecționării ar trebui procesată.
`302 (found)`	În mod implicit, crawler-ele Google urmează redirecționarea, iar sistemele Google folosesc redirecționarea ca un semnal slab că ținta redirecționării ar trebui procesată. Alte produse pot gestiona redirecționarea diferit.
`303 (see other)`
`304 (not modified)`	Crawler-ele Google semnalează următorului sistem de procesare că conținutul este același ca ultima dată când a fost scanat. În cazul Google Search, pipeline-ul de indexare poate recalcula semnalele pentru URL, dar altfel codul de stare nu are efect asupra indexării.
`307 (temporary redirect)`	Echivalent cu `302`.
`308 (moved permanently)`	Echivalent cu `301`.

`4xx (client errors)`

Google nu folosește conținutul de la URL-urile care returnează coduri de stare 4xx. Dacă un URL a fost utilizat anterior, dar acum returnează un cod de stare 4xx, sistemele Google vor înceta să folosească URL-ul în timp. În cazul Google Search, Google nu indexează URL-urile care returnează un cod de stare 4xx, iar URL-urile care sunt deja indexate și returnează un cod de stare 4xx sunt eliminate din index.

Orice conținut pe care Google îl primește de la URL-urile care returnează un cod de stare 4xx este ignorat.

`400 (bad request)`	Toate erorile `4xx`, cu excepția `429`, sunt tratate la fel: crawler-ele Google informează următorul sistem de procesare că conținutul nu există. În cazul Google Search, pipeline-ul de indexare elimină URL-ul din index dacă a fost indexat anterior. Paginile `404` nou întâlnite nu sunt procesate. Frecvența de scanare scade treptat. Nu folosi codurile de stare `401` și `403` pentru a limita rata de scanare. Codurile de stare `4xx`, cu excepția `429`, nu au efect asupra ratei de scanare. Învață cum să limitezi rata de scanare.
`401 (unauthorized)`
`403 (forbidden)`
`404 (not found)`
`410 (gone)`
`411 (length required)`
`429 (too many requests)`	Crawler-ele Google tratează codul de stare `429` ca un semnal că serverul este supraîncărcat și este considerat o eroare de server.

`5xx (server errors)`

Erorile de server 5xx și 429 determină crawler-ele Google să încetinească temporar scanarea. Pentru Google Search, URL-urile deja indexate sunt păstrate în index, dar în cele din urmă sunt eliminate.

Orice conținut pe care Google îl primește de la URL-urile care returnează un cod de stare 5xx este ignorat. Pentru fișierele robots.txt, învață cum Google gestionează un robots.txt care returnează un cod de stare 5xx.

Odată ce serverul începe să răspundă cu un cod de stare 2xx, Google crește treptat rata de scanare pentru site.

`500 (internal server error)`	Google reduce rata de scanare pentru site. Reducerea ratei de scanare este proporțională cu numărul de URL-uri individuale care returnează o eroare de server. Pentru Google Search, pipeline-ul de indexare Google elimină din index URL-urile care returnează persistent o eroare de server.
`502 (bad gateway)`
`503 (service unavailable)`

Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.

April 9, 2026

Prezentare generală a crawlerelor și fetcherelor Google (user agents)

Google utilizează crawlere și fetchere pentru a efectua acțiuni pentru produsele sale, fie automat, fie declanșate de cererea utilizatorului. Crawlerul (uneori numit și “robot” sau “spider”) este un termen generic pentru orice program utilizat pentru a
descoperi și scana automat site-uri web.
Fetcherele acționează ca un program similar cu
wget, care de obicei face o singură cerere în numele unui utilizator. Clienții Google se încadrează în trei categorii:

Crawlere comune	Crawlerele comune utilizate pentru produsele Google (cum ar fi Googlebot). Acestea respectă întotdeauna regulile robots.txt pentru crawl-urile automate.
Crawlere pentru cazuri speciale	Crawlerele pentru cazuri speciale sunt similare cu crawlerele comune, dar sunt utilizate de produse specifice unde există un acord între site-ul scanat și produsul Google despre procesul de crawl. De exemplu, `AdsBot` ignoră agentul utilizator global din robots.txt (`*`) cu permisiunea editorului de anunțuri.
Fetchere declanșate de utilizator	Fetcherele declanșate de utilizator fac parte din instrumente și funcții de produs unde utilizatorul final declanșează o cerere de fetch. De exemplu, Google Site Verifier acționează la cererea unui utilizator.

Proprietăți tehnice ale crawlerelor și fetcherelor Google

Crawlerele și fetcherele Google sunt proiectate să ruleze simultan pe mii de mașini pentru a îmbunătăți performanța și a se adapta la creșterea web-ului. Pentru a optimiza utilizarea lățimii de bandă, aceste clienți sunt distribuiți în mai multe centre de date din întreaga lume, astfel încât să fie localizați aproape de site-urile pe care le-ar putea accesa. Prin urmare, jurnalele dvs. pot arăta vizite de la mai multe adrese IP. Google egresează în principal de la adrese IP din Statele Unite. În cazul în care Google detectează că un site blochează cererile din Statele Unite, poate încerca să scaneze de la adrese IP situate în alte țări.

Protocoale de transfer suportate

Crawlerele și fetcherele Google suportă HTTP/1.1 și
HTTP/2. Crawlerele vor utiliza versiunea de protocol care oferă cea mai bună performanță de crawl și pot schimba protocoalele între sesiunile de crawl în funcție de statisticile anterioare de crawl. Versiunea de protocol implicită utilizată de crawlerele Google este HTTP/1.1; crawl-ul prin HTTP/2 poate economisi resurse de calcul (de exemplu, CPU, RAM) pentru site-ul dvs. și Googlebot, dar altfel nu există niciun beneficiu specific produsului Google pentru site (de exemplu, niciun impuls de clasare în Căutarea Google). Pentru a renunța la crawl-ul prin HTTP/2, instruiți serverul care găzduiește site-ul dvs. să răspundă cu un cod de stare HTTP 421 atunci când Google încearcă să acceseze site-ul dvs. prin HTTP/2. Dacă acest lucru nu este fezabil, puteți
trimite un mesaj echipei de Crawl
(totuși această soluție este temporară).

Infrastructura de crawl a Google suportă, de asemenea, crawl-ul prin FTP (așa cum este definit de
RFC959 și actualizările sale) și FTPS (așa cum este definit de
RFC4217 și actualizările sale), totuși crawl-ul prin aceste protocoale este rar.

Codificări de conținut suportate

Crawlerele și fetcherele Google suportă următoarele codificări de conținut (compresii):
gzip,
deflate și
Brotli (br). Codificările de conținut suportate de fiecare agent utilizator Google sunt anunțate în antetul
Accept-Encoding al fiecărei cereri pe care o fac. De exemplu,
Accept-Encoding: gzip, deflate, br.

Limite de dimensiune a fișierelor

În mod implicit, crawlerele și fetcherele Google scanează doar primele 15MB ale unui fișier, iar orice conținut dincolo de această limită este ignorat. Totuși, proiectele individuale pot stabili limite diferite pentru crawlerele și fetcherele lor, și de asemenea pentru diferite tipuri de fișiere. De exemplu, un crawler Google
precum Googlebot poate avea o limită de dimensiune mai mică (de exemplu, 2MB) sau poate specifica o limită de dimensiune mai mare pentru un PDF decât pentru .

Rata de crawl și încărcarea gazdei

Obiectivul nostru este să scanăm cât mai multe pagini de pe site-ul dvs. la fiecare vizită fără a suprasolicita serverul dvs. Dacă site-ul dvs. întâmpină dificultăți în a ține pasul cu cererile de crawl ale Google, puteți
reduce rata de crawl. Rețineți că trimiterea unui cod de răspuns HTTP
inadecvat
către crawlerele Google poate afecta modul în care site-ul dvs. apare în produsele Google.

Caching HTTP

Infrastructura de crawl a Google suportă caching-ul HTTP euristic așa cum este definit de
standardul de caching HTTP,
în special prin antetul de răspuns ETag și antetul de cerere If-None-Match,
și antetul de răspuns Last-Modified și antetul de cerere If-Modified-Since.

Notă: Luați în considerare setarea valorilor Etag și Last-Modified indiferent de preferința crawlerelor Google. Aceste antete sunt utilizate și de alte aplicații, cum ar fi CMS-urile.

Dacă atât câmpurile de antet de răspuns ETag cât și Last-Modified sunt prezente în răspunsul HTTP, crawlerele Google utilizează valoarea ETag așa cum este
cerut de standardul HTTP.
Pentru crawlerele Google în mod specific, Google recomandă utilizarea
ETag
în locul antetului Last-Modified pentru a indica preferința de caching, deoarece
ETag nu are probleme de formatare a datelor.

Alte directive de caching HTTP nu sunt suportate.

Crawlerele și fetcherele Google individuale pot sau nu să utilizeze caching-ul, în funcție de nevoile produsului cu care sunt asociate. De exemplu, Googlebot suportă caching-ul atunci când re-scanăm URL-uri pentru Căutarea Google, iar Storebot-Google suportă caching-ul doar în anumite condiții.

Pentru a implementa caching HTTP pentru site-ul dvs., contactați furnizorul dvs. de găzduire sau sistem de management al conținutului.

`ETag` și `If-None-Match`

Infrastructura de crawl a Google suportă ETag și If-None-Match așa cum sunt definite de
standardul de caching HTTP.
Aflați mai multe despre
ETag
și antetul său de cerere corespondent,
If-None-Match.

Last-Modified și If-Modified-Since

Infrastructura de crawl a Google suportă Last-Modified și
If-Modified-Since așa cum sunt definite de
standardul de caching HTTP
cu următoarele avertismente:

Data din antetul Last-Modified trebuie să fie formatată conform
standardului HTTP.
Pentru a evita problemele de analiză, Google recomandă utilizarea următorului format de dată:
“Ziua săptămânii, DD Mon YYYY HH:MM:SS Fus orar”. De exemplu,
“Fri, 4 Sep 1998 19:15:56 GMT“.
Deși nu este necesar, luați în considerare și setarea câmpului
max-age al antetului de răspuns Cache-Control
pentru a ajuta crawlerele să determine când să re-scanăm URL-ul specific. Setați valoarea câmpului
max-age la numărul de secunde în care conținutul va rămâne neschimbat. De
exemplu, Cache-Control: max-age=94043.

Aflați mai multe despre
Last-Modified
și antetul său de cerere corespondent, If-Modified-Since.

Verificarea crawlerelor și fetcherelor Google

Crawlerele Google se identifică în trei moduri:

Antetul de cerere HTTP user-agent.
Adresa IP sursă a cererii.
Numele de gazdă DNS invers al adresei IP sursă.

Aflați cum să utilizați aceste detalii pentru a
verifica cererile Google.

Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.

April 8, 2026

Googlebot

Googlebot este denumirea generică pentru două tipuri de
crawlere web utilizate de Căutarea Google:

Googlebot Smartphone:
un crawler mobil care simulează un utilizator pe un dispozitiv mobil.
Googlebot Desktop:
un crawler desktop care simulează un utilizator pe desktop.

Poți identifica subtipul de Googlebot analizând
antetul cererii HTTP user-agent
din cerere. Totuși, ambele tipuri de crawlere respectă același token de produs (token user agent) în
robots.txt, astfel încât nu poți viza selectiv fie Googlebot Smartphone, fie Googlebot Desktop folosind robots.txt.

Pentru majoritatea site-urilor, Căutarea Google
indexează în principal versiunea mobilă
a conținutului. Astfel, majoritatea cererilor de crawling ale Googlebot vor fi efectuate folosind crawlerul mobil, iar o minoritate folosind crawlerul desktop.

Cum accesează Googlebot site-ul tău

Pentru majoritatea site-urilor, Googlebot nu ar trebui să acceseze site-ul tău mai des de o dată la câteva secunde, în medie. Totuși, din cauza întârzierilor, este posibil ca rata să pară ușor mai mare pe perioade scurte. Dacă site-ul tău întâmpină dificultăți în a ține pasul cu cererile de crawling ale Google, poți
reduce rata de crawling.

Când efectuează crawling pentru Căutarea Google, Googlebot accesează primii 2MB dintr-un
tip de fișier suportat, și primii 64MB dintr-un fișier PDF. Dintr-o perspectivă de redare, fiecare resursă referențiată în (cum ar fi CSS și JavaScript) este preluată separat, iar fiecare preluare de resurse este limitată de aceeași limită de dimensiune a fișierului care se aplică altor fișiere (cu excepția fișierelor PDF).
Odată ce limita de tăiere este atinsă, Googlebot oprește preluarea și trimite doar partea deja descărcată a fișierului pentru considerare la indexare. Limita de dimensiune a fișierului se aplică datelor necomprimate.
Alte crawlere Google, de exemplu Googlebot Video și Googlebot Image, pot avea
limite diferite.

Când efectuează crawling de la adrese IP din SUA, fusul orar al Googlebot este
Ora Pacificului.

Alte
proprietăți tehnice ale Googlebot
sunt descrise în prezentarea generală a crawlerelor Google.

Blocarea Googlebot de la vizitarea site-ului tău

Googlebot descoperă noi URL-uri de crawling în principal din linkuri încorporate în paginile deja crawl-uite. Este aproape imposibil să păstrezi un site secret prin nepublicarea linkurilor către acesta. De exemplu, de îndată ce cineva face clic pe un link de pe site-ul tău “secret” către un alt site, URL-ul site-ului tău “secret” poate apărea în eticheta referrer și poate fi stocat și publicat de celălalt site în jurnalul său de referințe.

Dacă dorești să împiedici Googlebot să facă crawling pe conținutul site-ului tău, ai la dispoziție
mai multe opțiuni. Amintește-ți că există o diferență între crawling și indexare; blocarea Googlebot de la crawling pe o pagină nu împiedică URL-ul paginii să apară în rezultatele căutării:

Vrei să împiedici Googlebot să facă crawling pe o pagină? Folosește un
fișier robots.txt.
Nu vrei ca Google să indexeze o pagină? Folosește
noindex.
Vrei să împiedici accesul la o pagină atât pentru crawlere, cât și pentru utilizatori? Folosește
o altă metodă, cum ar fi protecția prin parolă.

Blocarea Googlebot afectează Căutarea Google (inclusiv Discover și toate funcțiile Căutării Google), precum și alte produse cum ar fi Google Images, Google Video și Google News.

Verificarea Googlebot

Înainte de a decide să blochezi Googlebot, fii conștient că antetul cererii HTTP user-agent utilizat de Googlebot este adesea falsificat de alte crawlere. Este important să verifici că o cerere problematică provine într-adevăr de la Google. Cea mai bună modalitate de a verifica dacă o cerere provine într-adevăr de la Googlebot este să
folosești o căutare DNS inversă
pe IP-ul sursă al cererii sau să compari IP-ul sursă cu
intervalele de IP Googlebot.

Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.

April 8, 2026

Marcajul de date structurate pe care Google Search îl suportă

Introducere în datele structurate

Google utilizează date structurate pentru a înțelege conținutul de pe pagină și pentru a afișa acel conținut într-un mod mai bogat în rezultatele căutării, ceea ce se numește un rezultat bogat. Pentru a face site-ul dvs. eligibil pentru a apărea ca unul dintre aceste rezultate bogate, urmați ghidul pentru a învăța cum să implementați date structurate pe site-ul dvs. Dacă sunteți la început, vizitați Înțelegeți cum funcționează datele structurate.

Categorii de site-uri și caracteristici de date structurate

Alegeți o categorie care descrie site-ul dvs.

Caracteristici de date structurate		Coloană de filtrare
Articol Un articol de știri, sport sau blog afișat în diverse caracteristici de rezultate bogate, cum ar fi titlul articolului și imagini mai mari decât miniaturile. Începeți		Știri, Sport
Breadcrumb Navigare care indică poziția paginii în ierarhia site-ului. Începeți		Generic
Carousel Rezultate bogate care se afișează într-o listă secvențială sau galerie de pe un singur site. Această caracteristică trebuie combinată cu una dintre următoarele caracteristici: Rețetă, Listă de cursuri, Restaurant, Film. Începeți		Mâncare și băuturi, Educație și știință, Divertisment
Listă de cursuri O listă de cursuri educaționale de la același furnizor de cursuri. Cursurile pot include titlul cursului, furnizorul și o scurtă descriere. Începeți		Educație și știință
Set de date Seturi mari de date care apar în Google Dataset Search. Începeți		Educație și știință
Forum de discuții Conținut generat de utilizatori (în mod tradițional de formă scurtă comparativ cu `Articol`), urmat de o discuție cu fir sau fără fir despre acel subiect. Începeți
Întrebări și răspunsuri educaționale Întrebări și răspunsuri legate de educație care ajută studenții să descopere fișe de studiu pe Google Search. Începeți		Educație și știință
Evaluare agregată a angajatorului O evaluare a unei organizații de angajare compilată de la mulți utilizatori, afișată în experiența de căutare a locurilor de muncă pe Google. Începeți		Locuri de muncă
Eveniment Un rezultat bogat interactiv care arată o listă de evenimente organizate, cum ar fi concerte sau festivaluri de artă, la care oamenii pot participa la un anumit moment și loc. Începeți		Divertisment
Întrebări frecvente O pagină de Întrebări frecvente (FAQ) conține o listă de întrebări și răspunsuri referitoare la un anumit subiect. Începeți
Metadate imagine Când specificați metadate pentru imagini, Google Images poate afișa mai multe detalii despre imagine, cum ar fi cine este creatorul, cum pot oamenii folosi o imagine și informații de credit. Începeți
Anunț de locuri de muncă Un rezultat bogat interactiv care permite căutătorilor de locuri de muncă să găsească un loc de muncă. Experiența de căutare a locurilor de muncă pe Google poate include logo-ul dvs., recenzii, evaluări și detalii despre locul de muncă. Începeți		Locuri de muncă
Afacere locală Detalii despre afacere afișate în panoul de cunoștințe Google, inclusiv orele de deschidere, evaluări, direcții și acțiuni pentru a face programări sau a comanda articole. Începeți		Organizații
Solver matematic Ajutați studenții, profesorii și alții cu probleme matematice adăugând date structurate pentru a indica tipul de probleme matematice și pașii de rezolvare pentru probleme matematice specifice. Începeți	$soluții matematice în rezultatele căutării$	Educație și știință
Film Caruselul de filme ajută utilizatorii să exploreze liste de filme pe Google Search (de exemplu, “cele mai bune filme din 2023”). Puteți oferi detalii despre filme, cum ar fi titlul fiecărui film, informații despre regizor și imagini. Începeți		Divertisment
Organizație Informații despre organizația dvs., cum ar fi logo-ul, numele legal al organizației, adresa, informațiile de contact și identificatorii companiei. Aceste informații pot apărea în panourile de cunoștințe și alte elemente vizuale (cum ar fi atribuirea). Începeți		Organizații
Produs Informații despre un produs, inclusiv prețul, disponibilitatea și evaluările recenziilor. Începeți		Comerț electronic
Pagină de profil O pagină care se concentrează în principal pe informații despre o singură persoană sau organizație care este cumva afiliată cu site-ul general. Începeți
Întrebări și răspunsuri Paginile de Întrebări și Răspunsuri sunt pagini web care conțin date într-un format de întrebare și răspuns, care este o întrebare urmată de răspunsurile sale. Începeți
Rețetă Rețete care se afișează ca un rezultat bogat individual sau parte a unui carusel gazdă. Începeți		Mâncare și băuturi
Fragment de recenzie Un scurt extras dintr-o recenzie sau o evaluare de pe un site de recenzii, de obicei o medie a scorurilor de evaluare combinate de la recenzori. Un fragment de recenzie poate fi despre Carte, Rețetă, Film, Produs, Aplicație software și Afacere locală. Începeți		Organizații, Comerț electronic, Mâncare și băuturi, Divertisment
Aplicație software Informații despre o aplicație software, inclusiv informații de evaluare, o descriere a aplicației și un link către aplicație. Începeți
Vorbibil Permiteți motoarelor de căutare și altor aplicații să identifice conținutul de știri pentru a fi citit cu voce tare pe dispozitivele compatibile cu Google Assistant folosind text-to-speech (TTS). Începeți		Știri
Conținut cu abonament și cu plată Indicați conținutul cu plată de pe site-ul dvs. pentru a ajuta Google să diferențieze conținutul cu plată de practica de cloaking, care încalcă politicile noastre de spam. Începeți		Știri
Închiriere de vacanță Informații despre o proprietate de vacanță, cum ar fi numele, descrierea, imaginile, locația, evaluarea și recenziile. Începeți
Video Informații video în rezultatele căutării, cu opțiunea de a reda videoclipul, de a specifica segmente video și de a transmite conținut în direct. Începeți		Mâncare și băuturi, Știri, Educație și știință, Sport

Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.

April 7, 2026

Category: Ghiduri

Importanța recenziilor de calitate

Practici recomandate pentru recenzii

Auto-evaluează experiența paginii conținutului tău

Resurse pentru experiența paginii

FAQ

Există un singur “semnal de experiență a paginii” pe care Google Search îl folosește pentru clasare?

Ce aspecte ale experienței paginii sunt utilizate în clasare?

Este evaluată experiența paginii la nivel de site sau la nivel de pagină?

Cât de importantă este experiența paginii pentru succesul în clasare?

Actualizări recente pe blogul nostru

Blocarea indexării în căutare cu noindex

Implementarea noindex

<meta> tag

Header de răspuns HTTP

Depanarea problemelor noindex

Introducere în robots.txt

Pentru ce este folosit un fișier robots.txt?

Înțelege limitările unui fișier robots.txt

Creează sau actualizează un fișier robots.txt

Înțelegeți elementele de bază ale SEO pentru JavaScript

Cum procesează Google JavaScript

Descrieți pagina dvs. cu titluri și fragmente unice

Setați URL-ul canonic

Scrieți cod compatibil

Utilizați coduri de stare HTTP semnificative

Evitați erorile soft 404 în aplicațiile cu o singură pagină

Utilizați API-ul History în loc de fragmente

Injectați corect tagul de link rel="canonical"

Utilizați cu atenție tagurile robots meta

Utilizați cache-ul pe termen lung

Utilizați date structurate

Urmați cele mai bune practici pentru componente web

Remediați imaginile și conținutul încărcat la cerere

Cum interpretează Google specificațiile robots.txt

Ce este un fișier robots.txt

Locația fișierului și domeniul de valabilitate

Exemple de URL-uri robots.txt valide

Gestionarea erorilor și codurilor de stare HTTP

Caching

Formatul fișierului

Sintaxa

user-agent

disallow

allow

sitemap

Gruparea liniilor și regulilor

Ordinea de precedență pentru agenți utilizatori

Exemple

user-agent” tabindex=”-1″>Potrivirea câmpurilor user-agent

Gruparea regulilor

Potrivirea URL-urilor pe baza valorilor căilor

Ordinea de precedență pentru reguli

Coduri de stare HTTP

2xx (success)

3xx (redirection)

4xx (client errors)

5xx (server errors)

Prezentare generală a crawlerelor și fetcherelor Google (user agents)

Proprietăți tehnice ale crawlerelor și fetcherelor Google

Protocoale de transfer suportate

Codificări de conținut suportate

Limite de dimensiune a fișierelor

Rata de crawl și încărcarea gazdei

Caching HTTP

ETag și If-None-Match

Last-Modified și If-Modified-Since

Verificarea crawlerelor și fetcherelor Google

Googlebot

Cum accesează Googlebot site-ul tău

Blocarea Googlebot de la vizitarea site-ului tău

Verificarea Googlebot

Introducere în datele structurate

Categorii de site-uri și caracteristici de date structurate

Blocarea indexării în căutare cu `noindex`

Implementarea `noindex`

`<meta>` tag

Depanarea problemelor `noindex`

Evitați erorile `soft 404` în aplicațiile cu o singură pagină

Injectați corect tagul de link `rel="canonical"`

Utilizați cu atenție tagurile robots `meta`

`user-agent`

`disallow`

`allow`

`sitemap`

user-agent” tabindex=”-1″>Potrivirea câmpurilor `user-agent`

`2xx (success)`

`3xx (redirection)`

`4xx (client errors)`

`5xx (server errors)`

`ETag` și `If-None-Match`