Cum afectează codurile de stare HTTP crawler-ele Google

Coduri de stare HTTP

Codurile de stare HTTP sunt generate de serverul care găzduiește site-ul atunci când răspunde la o cerere făcută de un client, de exemplu un browser sau un crawler. Fiecare cod de stare HTTP are o semnificație diferită, dar adesea rezultatul cererii este același. De exemplu, există mai multe coduri de stare care semnalează redirecționarea, dar rezultatul lor este același.

Search Console generează mesaje de eroare pentru codurile de stare din intervalul 4xx—5xx, și pentru redirecționările eșuate (3xx). Dacă serverul a răspuns cu un cod de stare 2xx, conținutul primit în răspuns poate fi luat în considerare pentru indexare.

Tabelul următor conține cele mai întâlnite coduri de stare HTTP de către Google și o explicație despre cum gestionează Google fiecare cod de stare.

Coduri de stare HTTP

2xx (success)

Google ia în considerare conținutul pentru procesare (de exemplu, în cazul Google Search, pentru indexare). Dacă conținutul sugerează o eroare pentru Google Search, o pagină goală sau un mesaj de eroare, Search Console va afișa o eroare soft 404.

200 (success)

Google transmite mai departe ceea ce a primit către următorul pas de procesare (care este specific produsului). Pentru Google Search, următorul sistem este pipeline-ul de indexare. Sistemele de indexare pot indexa conținutul, dar acest lucru nu este garantat.

201 (created)
202 (accepted)

Google așteaptă conținutul pentru o perioadă limitată de timp, apoi transmite mai departe ceea ce a primit către următorul pas de procesare (care este specific produsului). Timeout-ul depinde de agentul utilizatorului, de exemplu Googlebot Smartphone poate avea un timeout diferit față de Googlebot Image.

204 (no content)

Google nu a reușit să primească niciun conținut și, prin urmare, nu poate să-l proceseze.

3xx (redirection)

În mod implicit, crawler-ele Google urmează până la 10 salturi de redirecționare. Totuși, crawler-ele unor produse specifice pot avea limite diferite. De exemplu, Googlebot urmează în general 10 salturi de redirecționare atunci când scanează conținut web general, dar Instrumentele de Inspecție Google nu urmează redirecționările.

Orice conținut pe care Google îl primește de la URL-ul de redirecționare este ignorat, iar conținutul URL-ului țintă final este procesat în schimb. Pentru fișierele robots.txt, învață cum Google gestionează un robots.txt care returnează un cod de stare 3xx.

301 (moved permanently)

Google urmează redirecționarea, iar sistemele Google folosesc redirecționarea ca un semnal puternic că ținta redirecționării ar trebui procesată.

302 (found)

În mod implicit, crawler-ele Google urmează redirecționarea, iar sistemele Google folosesc redirecționarea ca un semnal slab că ținta redirecționării ar trebui procesată. Alte produse pot gestiona redirecționarea diferit.

303 (see other)
304 (not modified)

Crawler-ele Google semnalează următorului sistem de procesare că conținutul este același ca ultima dată când a fost scanat. În cazul Google Search, pipeline-ul de indexare poate recalcula semnalele pentru URL, dar altfel codul de stare nu are efect asupra indexării.

307 (temporary redirect) Echivalent cu 302.
308 (moved permanently) Echivalent cu 301.

4xx (client errors)

Google nu folosește conținutul de la URL-urile care returnează coduri de stare 4xx. Dacă un URL a fost utilizat anterior, dar acum returnează un cod de stare 4xx, sistemele Google vor înceta să folosească URL-ul în timp. În cazul Google Search, Google nu indexează URL-urile care returnează un cod de stare 4xx, iar URL-urile care sunt deja indexate și returnează un cod de stare 4xx sunt eliminate din index.

Orice conținut pe care Google îl primește de la URL-urile care returnează un cod de stare 4xx este ignorat.

400 (bad request)

Toate erorile 4xx, cu excepția 429, sunt tratate la fel: crawler-ele Google informează următorul sistem de procesare că conținutul nu există.

În cazul Google Search, pipeline-ul de indexare elimină URL-ul din index dacă a fost indexat anterior. Paginile 404 nou întâlnite nu sunt procesate. Frecvența de scanare scade treptat.

401 (unauthorized)
403 (forbidden)
404 (not found)
410 (gone)
411 (length required)
429 (too many requests)

Crawler-ele Google tratează codul de stare 429 ca un semnal că serverul este supraîncărcat și este considerat o eroare de server.

5xx (server errors)

Erorile de server 5xx și 429 determină crawler-ele Google să încetinească temporar scanarea. Pentru Google Search, URL-urile deja indexate sunt păstrate în index, dar în cele din urmă sunt eliminate.

Orice conținut pe care Google îl primește de la URL-urile care returnează un cod de stare 5xx este ignorat. Pentru fișierele robots.txt, învață cum Google gestionează un robots.txt care returnează un cod de stare 5xx.

Odată ce serverul începe să răspundă cu un cod de stare 2xx, Google crește treptat rata de scanare pentru site.

500 (internal server error)

Google reduce rata de scanare pentru site. Reducerea ratei de scanare este proporțională cu numărul de URL-uri individuale care returnează o eroare de server. Pentru Google Search, pipeline-ul de indexare Google elimină din index URL-urile care returnează persistent o eroare de server.

502 (bad gateway)
503 (service unavailable)

Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.

Comments

Leave a Reply

Your email address will not be published. Required fields are marked *