Pentru a elimina rapid imaginile găzduite pe site-ul tău din rezultatele căutării Google, utilizează instrumentul de eliminare.
Reține că, dacă nu elimini și imaginile de pe site-ul tău sau nu le blochezi conform descrierii din secțiunea de eliminare non-urgentă a imaginilor,
imaginile pot reapărea în rezultatele căutării Google odată ce cererea de eliminare expiră.
Eliminarea non-urgentă a imaginilor
Există două modalități de a elimina imaginile de pe site-ul tău din rezultatele căutării Google:
Cele două metode au același efect, alege metoda care este mai convenabilă pentru site-ul tău.
Reține că Googlebot trebuie să acceseze URL-urile pentru a extrage anteturile HTTP, așa că implementarea
ambelor metode în același timp nu are sens.
Dacă nu ai acces la site-ul care găzduiește imaginile tale (de exemplu, un CDN) sau CMS-ul tău
nu oferă o modalitate de a bloca imaginile cu antetul HTTP noindexX-Robots-Tag
sau robots.txt, poate fi necesar să ștergi complet imaginile de pe site-ul tău.
Eliminarea imaginilor folosind reguli robots.txt
Pentru a preveni apariția imaginilor de pe site-ul tău în rezultatele căutării Google, adaugă un fișier robots.txt la rădăcina site-ului
care găzduiește imaginea, de exemplu https://yoursite.example.com/robots.txt. Deși
durează mai mult să elimini o imagine din rezultatele căutării Google folosind reguli robots.txt decât
utilizând instrumentul de eliminare, îți oferă mai multă flexibilitate și control prin utilizarea
caracterelor wildcard sau blocarea subcailor. De asemenea, se aplică tuturor motoarelor de căutare, în timp ce
instrumentul de eliminare se aplică doar pentru Google.
De exemplu, dacă dorești ca Google să excludă imaginea dogs.jpg care apare pe
site-ul tău la yoursite.example.com/images/dogs.jpg, adaugă următoarele în fișierul tău robots.txt:
Data viitoare când Google accesează imaginea dogs.jpg, va vedea această regulă și va elimina
imaginea din rezultatele căutării.
Regulile pot include caractere speciale
pentru mai multă flexibilitate și control. În mod specific, caracterul * se potrivește cu orice secvență
de caractere, permițându-ți să potrivești mai multe căi de imagini cu o singură regulă.
Pentru a elimina mai multe imagini de pe site-ul tău din indexul Google, adaugă o regulă disallow pentru
fiecare imagine sau, dacă imaginile împărtășesc un model comun, cum ar fi un sufix în numele fișierului, folosește
caracterul * în numele fișierului. De exemplu:
User-agent: Googlebot-Image
# Reguli 'disallow' repetate pentru fiecare imagine:
Disallow: /images/dogs.jpg
Disallow: /images/cats.jpg
Disallow: /images/llamas.jpg
# Caracter wildcard în numele fișierului pentru
# imagini care împărtășesc un sufix comun. De exemplu,
# animal-picture-UNICORN.jpg și
# animal-picture-SQUIRREL.jpg
# în directorul "images"
# vor fi potrivite de acest model.
Disallow: /images/animal-picture-*.jpg
Pentru a elimina toate imaginile de pe site-ul tău din indexul nostru, plasează următoarea regulă în fișierul tău robots.txt:
User-agent: Googlebot-Image
Disallow: /
Pentru a elimina toate fișierele de un anumit tip (de exemplu, pentru a include .jpg dar nu .gif), ai folosi următoarea intrare în robots.txt:
User-agent: Googlebot-Image
Disallow: /*.gif$
Specificând Googlebot-Image ca User-agent, imaginile vor fi
excluse din Google Images. Dacă dorești să excluzi imaginile din toate căutările Google
(inclusiv Google Search și Google Images), specifică agentul utilizator Googlebot.
Eliminarea imaginilor cu antetul HTTP noindex X-Robots-Tag
Alternativ, poți elimina imaginile găzduite pe site-ul tău din rezultatele căutării Google prin
adăugarea noindexX-Robots-Tag la anteturile de răspuns HTTP ale
imaginilor pe care dorești să le elimini. În acest caz, trebuie să permiți accesarea URL-urilor imaginilor pentru ca
Googlebot să poată extrage regula noindex. Pentru a implementa
antetul HTTP noindexX-Robots-Tag, urmează documentația noastră despre noindex.
Reține că adăugarea etichetei robots noimageindex la o anumită pagină va preveni, de asemenea,
indexarea imaginilor încorporate în acea pagină. Totuși, dacă aceleași imagini apar și în
alte pagini, ele ar putea fi indexate prin acele pagini. Pentru a te asigura că o anumită imagine este
blocată indiferent unde apare, folosește antetul HTTP noindexX-Robots-Tag.
Cum elimin imagini de pe proprietăți pe care nu le dețin?
Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.
Când specifici metadatele unei imagini, Google Images poate afișa mai multe detalii despre imagine, cum ar fi cine este creatorul, cum poate fi utilizată imaginea și informații de credit. De exemplu, furnizarea informațiilor de licențiere poate face imaginea eligibilă pentru insigna Licensable, care oferă un link către licență și mai multe detalii despre cum poate fi utilizată imaginea.
Disponibilitatea funcției
Această funcție este disponibilă pe mobil și desktop, și în toate regiunile și limbile în care este disponibilă Căutarea Google.
Pregătește paginile web și imaginile
Pentru a te asigura că Google poate descoperi și indexa imaginile tale:
Asigură-te că oamenii pot accesa și vizualiza paginile tale care conțin imagini fără a avea nevoie de un cont sau de autentificare.
Asigură-te că Googlebot poate accesa paginile tale care conțin imagini (adică, paginile tale nu sunt interzise de un fișier robots.txt sau de un tag meta robots). Poți vedea toate paginile blocate pe site-ul tău în raportul de indexare a paginilor, sau poți testa o pagină specifică folosind instrumentul de inspecție URL.
Pentru a informa Google despre metadatele imaginii tale, adaugă date structurate sau metadate foto IPTC la fiecare imagine de pe site-ul tău. Dacă ai aceeași imagine pe mai multe pagini, adaugă date structurate sau metadate foto IPTC la fiecare imagine de pe fiecare pagină unde apare.
Există două moduri prin care poți adăuga metadate foto la imaginea ta. Trebuie să furnizezi Google doar o formă de informație pentru a fi eligibil pentru îmbunătățiri precum insigna Licensable, și oricare dintre metodele următoare este suficientă:
Date structurate: Datele structurate sunt o asociere între imagine și pagina unde apare cu marcajul. Trebuie să adaugi date structurate pentru fiecare instanță în care este utilizată o imagine, chiar dacă este aceeași imagine.
Metadate foto IPTC: Metadatele foto IPTC sunt încorporate în imagine însăși, iar imaginea și metadatele pot fi mutate de la o pagină la alta, rămânând intacte. Trebuie să încorporezi metadatele foto IPTC o singură dată pe imagine.
Diagrama următoare arată cum pot apărea informațiile despre licență în Google Images:
Date structurate
Un mod de a informa Google despre metadatele imaginii tale este să adaugi câmpuri de date structurate. Datele structurate sunt un format standardizat pentru a furniza informații despre o pagină și a clasifica conținutul paginii. Dacă ești nou în datele structurate, poți afla mai multe despre cum funcționează datele structurate.
Iată o prezentare generală despre cum să construiești, testezi și să lansezi date structurate.
Publică câteva pagini care includ datele tale structurate și folosește instrumentul de inspecție URL pentru a testa cum vede Google pagina. Asigură-te că pagina ta este accesibilă pentru Google și nu este blocată de un fișier robots.txt, tagul noindex sau cerințe de autentificare. Dacă pagina arată bine, poți cere Google să recrawleze URL-urile tale.
Cum pot apărea metadatele C2PA în rezultatele Căutării Google
Dacă o imagine conține metadate C2PA, Google poate extrage acele detalii și poate afișa informații în funcția “Despre această imagine“, cum ar fi cum a fost creată imaginea sau dacă a fost editată cu instrumente AI. Aceste metadate provin de la un semnatar, care este de obicei o aplicație, un dispozitiv sau un serviciu (de exemplu, software de editare foto, camera însăși sau alte servicii care modifică sau creează imagini) care îndeplinește următoarele condiții:
Aplicația, dispozitivul sau serviciul a adoptat versiunea C2PA 2.1 sau mai recentă.
Manifestul imaginii trebuie să fie semnat de un certificat de la o Autoritate de Certificare pe Lista de Încredere C2PA.
Depanare
Dacă întâmpini probleme în implementarea metadatelor imaginii pentru Google Images, iată câteva resurse care te pot ajuta.
Dacă ai primit o acțiune manuală pentru date structurate împotriva paginii tale, datele structurate de pe pagină vor fi ignorate (deși pagina poate apărea în rezultatele Căutării Google). Pentru a remedia problemele de date structurate, folosește raportul de acțiuni manuale.
Revizuiește ghidurile din nou pentru a identifica dacă conținutul tău nu este conform cu ghidurile.
Eliminarea metadatelor imaginii poate reduce dimensiunea fișierului imaginii, ceea ce ajută paginile web să se încarce mai repede. Totuși, fii atent, deoarece eliminarea metadatelor poate fi ilegală în anumite jurisdicții. Metadatele imaginii furnizează informații despre drepturile de autor și licențiere online. Google recomandă ca, cel puțin, să păstrezi metadatele critice legate de informațiile despre drepturile imaginii și identificare. De exemplu, ori de câte ori este posibil, încearcă să păstrezi câmpurile IPTC creator, linie de credit, și notificare de drepturi de autor pentru a oferi o atribuire corectă.
Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.
Creșterea bruscă a accesării poate fi cauzată de ineficiențe în structura site-ului dvs. sau de alte probleme ale site-ului. Pe baza rapoartelor primite în trecut, cele mai comune cauze sunt:
Configurarea ineficientă a URL-urilor pe site, care este de obicei cauzată de o funcționalitate specifică a site-ului:
Navigație cu fațete sau alte funcționalități de sortare și filtrare ale site-ului
Un calendar cu multe URL-uri pentru date specifice
Google recomandă cu tărie să verificați cu compania de găzduire și să analizați jurnalele de acces recente ale serverului dvs. pentru a înțelege sursa traficului și pentru a vedea dacă se încadrează în cauzele comune menționate ale creșterii bruște a accesării. Apoi, consultați ghidurile Google despre gestionarea accesării URL-urilor cu navigație cu fațete
și optimizarea eficienței accesării.
Reduceți urgent traficul crawler-ului (pentru situații de urgență)
Dacă trebuie să reduceți urgent rata de accesare pentru o perioadă scurtă de timp (de exemplu, câteva ore sau 1-2 zile), atunci returnați codurile de stare HTTP 500, 503 sau 429 în loc de 200 la cererile de accesare. Infrastructura de accesare Google reduce rata de accesare a site-ului dvs. atunci când întâlnește un număr semnificativ de URL-uri cu coduri de stare HTTP 500, 503 sau 429 (de exemplu, dacă ați dezactivat site-ul dvs.).
Rata redusă de accesare afectează întregul nume de gazdă al site-ului dvs. (de exemplu, subdomain.example.com), atât accesarea URL-urilor care returnează erori, cât și a celor care returnează conținut. Odată ce numărul acestor erori este redus, rata de accesare va începe automat să crească din nou.
Cereri excepționale pentru reducerea ratei de accesare
Dacă returnarea erorilor către crawler-ele Google nu este fezabilă pe infrastructura dvs., depuneți o cerere specială
pentru a raporta o problemă cu o rată de accesare neobișnuit de mare, menționând rata optimă pentru site-ul dvs. în cererea dvs. Nu puteți solicita o creștere a ratei de accesare, iar evaluarea și îndeplinirea cererii poate dura câteva zile.
Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.
Google poate indexa conținutul majorității fișierelor textuale și a anumitor formate de documente codificate. Tipul de fișier este determinat de antetul HTTP Content-Type returnat atunci când Google accesează fișierul, deși în unele cazuri Google poate folosi extensia fișierului sau poate re-analiza fișierul folosind un alt parser dacă antetul Content-Type lipsește sau este incorect.
Următoarele tipuri de fișiere plate sunt suportate. Acestea sunt fișiere în care conținutul este stocat în text simplu, necodificat (deși pot folosi etichete de marcare).
Valori separate prin virgulă (.csv)
Google Earth (.kml, .kmz)
Format de schimb GPS (.gpx)
(.htm, ., alte extensii de fișiere)
Grafică vectorială scalabilă (.svg)
TeX/LaTeX (.tex)
Text (.txt, .text, alte extensii de fișiere), inclusiv cod sursă în limbaje de programare comune, cum ar fi:
Cod sursă Basic (.bas)
Cod sursă C/C++ (.c, .cc, .cpp, .cxx, .h, .hpp)
Cod sursă C# (.cs)
Cod sursă Java (.java)
Cod sursă Perl (.pl)
Cod sursă Python (.py)
Limbaj de marcare wireless (.wml, .wap)
XML (.xml)
Tipuri de fișiere codificate suportate
Următoarele tipuri de fișiere codificate sunt suportate. Acestea sunt fișiere binare sau containere complexe care necesită un parser specific pentru a extrage textul lizibil de către oameni.
Format de document portabil Adobe (.pdf)
PostScript Adobe (.ps)
Publicație electronică (.epub)
Hancom Hanword (.hwp)
Microsoft Excel (.xls, .xlsx)
Microsoft PowerPoint (.ppt, .pptx)
Microsoft Word (.doc, .docx)
Prezentare OpenOffice (.odp)
Foaie de calcul OpenOffice (.ods)
Text OpenOffice (.odt)
Format de text îmbogățit (.rtf)
Formate media suportate
Google poate indexa și următoarele formate media:
Formate de imagine: BMP, GIF, JPEG, PNG, WebP, SVG și AVIF
Poți folosi operatorul filetype: în Căutarea Google pentru a limita rezultatele la un anumit tip de fișier sau extensie de fișier. De exemplu, filetype:rtf galway va căuta fișiere RTF și URL-uri care se termină în .rtf al căror conținut conține termenul “galway“.
Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.
Pentru a te asigura că Google vede tot conținutul de pe pagina ta, asigură-te că implementarea încărcării lazy încarcă tot conținutul relevant ori de câte ori acesta este vizibil în viewport. Iată câteva metode de a implementa încărcarea lazy:
O bibliotecă JavaScript care suportă încărcarea datelor când acestea intră în viewport
Metodele menționate nu se bazează pe acțiuni ale utilizatorului, cum ar fi derularea sau clicurile, pentru a încărca conținutul, ceea ce este important deoarece Google Search nu interacționează cu pagina ta.
Nu adăuga încărcare lazy la conținutul care este probabil să fie vizibil imediat când un utilizator deschide o pagină. Acest lucru ar putea face ca încărcarea și afișarea conținutului în browser să dureze mai mult, ceea ce va fi foarte vizibil pentru utilizator.
Suportă încărcarea paginată pentru derularea infinită
La un nivel înalt, derularea infinită este o tehnică ce încarcă mai mult conținut, mai multe pagini distincte, pe măsură ce utilizatorul derulează în jos pe o pagină lungă. Acesta ar putea fi un articol lung împărțit în mai multe bucăți sau o colecție de elemente împărțită similar în bucăți. Pentru a implementa derularea infinită într-un mod indexabil, asigură-te că site-ul tău suportă încărcarea paginată a acestor bucăți prin următoarele acțiuni:
Oferă fiecărei bucăți un URL unic și persistent.
Asigură-te că conținutul afișat pe fiecare URL rămâne același de fiecare dată când este încărcat într-un browser. O modalitate de a face acest lucru este să folosești numere de pagină absolute în URL, de exemplu folosind ?page=12 ca parametru de interogare.
Evită utilizarea elementelor relative precum ?date=yesterday în aceste URL-uri. Acest lucru permite motoarelor de căutare și utilizatorilor să găsească în mod constant același conținut sub un URL dat, facilitând indexarea corectă a conținutului de către motoarele de căutare și permițând utilizatorilor să partajeze și să revină la acea parte a conținutului tău.
Când o nouă bucată de pagină este încărcată ca răspuns la derularea utilizatorului și devine elementul principal vizibil pentru utilizator, actualizează URL-ul afișat folosind API-ul History. Acest lucru permite utilizatorului să reîmprospăteze, să partajeze și să facă legătura cu URL-ul curent afișat în browser.
Testează
După ce ai configurat implementarea, asigură-te că funcționează corect. Poți folosi Instrumentul de Inspectare a URL-urilor din Search Console pentru a vedea dacă tot conținutul a fost încărcat. Verifică -ul redat pentru a te asigura că conținutul tău este în -ul redat căutându-l în Instrumentul de Inspectare a URL-urilor. Dacă URL-urile imaginilor sau videoclipurilor tale apar în atributul src pe elementele <img> sau <video> din -ul redat, configurarea ta funcționează corect.
Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.
Acest ghid descrie cum să optimizezi crawl-ul Google pentru site-uri foarte mari și frecvent actualizate.
Dacă site-ul tău nu are un număr mare de pagini care se schimbă rapid sau dacă paginile tale par să fie crawl-uite în aceeași zi în care sunt publicate, nu este necesar să citești acest ghid. Pentru Google Search, este suficient să menții sitemap-ul actualizat și să verifici acoperirea indexului în mod regulat.
Pentru cine este acest ghid
Deși recomandările din acest ghid sunt, în general, bune practici, acesta este un ghid avansat destinat în principal următoarelor tipuri de site-uri:
Site-uri mari (peste 1 milion de pagini unice) cu conținut care se schimbă moderat de des (o dată pe săptămână)
Site-uri medii sau mai mari (peste 10.000 de pagini unice) cu conținut care se schimbă foarte rapid (zilnic)
Web-ul este un spațiu aproape infinit, depășind capacitatea Google de a explora și indexa fiecare URL disponibil. Ca rezultat, există limite în ceea ce privește cât timp pot petrece crawlerele Google pe un singur site, unde un site este definit de numele de gazdă. De exemplu, https://www.example.com/ și https://code.example.com/ sunt două nume de gazdă diferite și, prin urmare, au bugete de crawl separate. Cantitatea de timp și resurse pe care Google le alocă pentru a crawl-ui un site este denumită în mod obișnuit bugetul de crawl al site-ului și este determinată de două elemente principale: limita capacității de crawl și cererea de crawl.
Limita capacității de crawl
Google dorește să crawl-uiască site-ul tău fără a suprasolicita serverele tale. Pentru a preveni acest lucru, crawlerele Google calculează o limită a capacității de crawl, care este numărul maxim de conexiuni paralele simultane pe care Google le poate folosi pentru a crawl-ui un site, precum și întârzierea dintre preluări. Aceasta este calculată pentru a oferi acoperire pentru tot conținutul tău important fără a suprasolicita serverele tale.
Limita capacității de crawl poate crește sau scădea în funcție de câțiva factori:
Sănătatea crawl-ului: Dacă site-ul răspunde rapid pentru o perioadă, limita crește, ceea ce înseamnă că mai multe conexiuni pot fi folosite pentru a crawl-ui. Dacă site-ul încetinește sau răspunde cu erori de server, limita scade și Google crawl-uiește mai puțin.
Limitele de crawl ale Google: Google are multe mașini, dar nu infinite. Trebuie să facem alegeri cu resursele pe care le avem.
Cererea de crawl
Fiecare crawler are propria sa “cerere” când vine vorba de crawl-ul web-ului. De exemplu, AdsBot are în general o cerere mai mare atunci când un site rulează ținte dinamice de anunțuri, Google Shopping are o cerere mai mare pentru produsele pe care le ai în feed-urile tale de comercianți, iar cererea Googlebot variază în funcție de dimensiunea site-ului, frecvența actualizărilor, calitatea paginii și relevanța, comparativ cu alte site-uri.
În general, factorii care joacă un rol semnificativ în determinarea cererii de crawl sunt:
Inventarul perceput: Fără îndrumare din partea ta, Google încearcă să crawl-uiască toate sau majoritatea URL-urilor pe care le cunoaște despre site-ul tău. Dacă multe dintre aceste URL-uri sunt duplicate sau nu dorești să fie crawl-uite din alte motive (eliminate, neimportante etc.), acest lucru irosește mult timp de crawl Google pe site-ul tău. Acesta este factorul pe care îl poți controla cel mai pozitiv.
Popularitatea: URL-urile care sunt mai populare pe Internet tind să fie crawl-uite mai des pentru a le menține mai proaspete în sistemele noastre.
Vechea: Sistemele noastre doresc să recrawl-uiască documentele suficient de frecvent pentru a detecta orice schimbări.
În plus, evenimente la nivel de site, cum ar fi mutările de site, pot declanșa o creștere a cererii de crawl pentru a reprocesa conținutul sub noile URL-uri.
În concluzie
Luând în considerare capacitatea de crawl și cererea de crawl împreună, Google definește bugetul de crawl al unui site ca setul de URL-uri pe care Google le poate și dorește să le crawl-uiască. Chiar dacă limita capacității de crawl nu este atinsă, dacă cererea de crawl este scăzută, Google va crawl-ui mai puțin site-ul tău.
Cele mai bune practici
Pentru a maximiza eficiența crawl-ului, urmează aceste bune practici:
Gestionează inventarul URL-urilor: Folosește instrumentele adecvate pentru a spune Google ce pagini să crawl-uiască și ce pagini să nu crawl-uiască. Dacă Google petrece prea mult timp crawl-uind URL-uri pe care nu ar trebui, crawlerele Google ar putea decide că nu merită timpul să se uite la restul site-ului tău (sau să-ți mărească bugetul pentru a face acest lucru).
Consolidează conținutul duplicat.
Elimină conținutul duplicat pentru a concentra crawl-ul pe conținut unic, mai degrabă decât pe URL-uri unice.
Blochează crawl-ul URL-urilor folosind robots.txt. Unele pagini ar putea fi importante pentru utilizatori, dar nu dorești neapărat să apară pe suprafețele Google sau să fie reprocesate de sistemele Google. De exemplu, pagini cu derulare infinită care duplică informații pe paginile legate sau versiuni sortate diferit ale aceleași pagini. Dacă nu le poți consolida așa cum este descris în primul punct, blochează aceste pagini neimportante folosind robots.txt. Blocarea URL-urilor cu robots.txt împiedică Google să le crawl-uiască și reduce semnificativ șansa ca URL-urile să fie procesate de alte sisteme Google (cum ar fi indexarea de către Google Search).
Returnează un cod de stare 404 sau 410 pentru paginile eliminate permanent. Google nu va uita un URL pe care îl cunoaște, dar un cod de stare 404 este un semnal puternic pentru a nu crawl-ui acel URL din nou. URL-urile blocate, totuși, vor rămâne parte din coada ta de crawl mult mai mult timp și vor fi recrawl-uite când blocarea este eliminată.
Menține sitemap-urile actualizate. Google citește sitemap-ul tău în mod regulat, așa că asigură-te că incluzi tot conținutul pe care dorești ca Google să-l crawl-uiască. Dacă site-ul tău include conținut actualizat, recomandăm includerea tag-ului <lastmod>.
Evită lanțurile lungi de redirecționare, care au un efect negativ asupra crawl-ului.
Depanează problemele cu bugetul de crawl.
Verifică dacă site-ul tău a avut probleme de disponibilitate în timpul crawl-ului și caută modalități de a face crawl-ul mai eficient.
Cum obțin mai mult buget de crawl?
Există două modalități de a crește bugetul de crawl:
Adaugă mai multe resurse de server: Dacă site-ul tău nu poate fi crawl-uit din cauza capacității serverului de pe partea ta (de exemplu, primești Hostload depășit în instrumentul de inspecție URL), adaugă mai multe resurse de server dacă acest lucru are sens pentru afacerea ta.
Optimizează calitatea conținutului tău pentru produsul Google pe care îl vizezi: Google determină resursele de crawl alocate fiecărui site prin factorizarea elementelor relevante pentru produsul Google specific. De exemplu, pentru Google Search, acest lucru include lucruri precum popularitatea, valoarea generală pentru utilizatori, unicitatea conținutului și capacitatea de servire.
Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.
Practici generale recomandate pentru mutarea site-urilor
Împarte mutarea în pași mai mici, dacă are sens pentru site-ul tău.
Dacă site-ul tău este mare și este tehnic posibil, Google recomandă să muți inițial doar o parte a site-ului pentru a testa orice efecte asupra traficului și indexării în căutare. După aceea, poți muta restul site-ului dintr-o dată sau în bucăți. Când alegi secțiunea inițială de testare a site-ului, alege o secțiune care se schimbă mai rar și nu este semnificativ afectată de evenimente frecvente sau imprevizibile. De asemenea, ține cont că, deși mutarea unei singure secțiuni este o modalitate excelentă de a testa mutarea, nu este neapărat reprezentativă pentru o mutare completă a site-ului în ceea ce privește Căutarea. Cu cât muți mai multe pagini, cu atât este mai probabil să întâlnești probleme suplimentare de rezolvat. Planificarea atentă poate minimiza problemele.
Schimbă un singur lucru la un moment dat
Planifică-ți schimbările pe site una după alta, nu toate în același timp. De exemplu, dacă dorești să muți site-ul pe un nou nume de domeniu, să schimbi sistemul de gestionare a conținutului (CMS) și să actualizezi site-ul pentru a folosi un nou layout, fă-le pe rând: mută-te pe un nou domeniu, apoi schimbă layout-ul site-ului.
Programează mutarea să coincidă cu perioade de trafic mai scăzut, dacă este posibil.
Dacă traficul tău este sezonier sau scade în anumite zile ale săptămânii, are sens să muți site-ul în timpul acestor scăderi recurente de trafic. Acest lucru înseamnă că mai puțini oameni vor fi afectați de problemele potențiale care pot apărea în timpul mutării site-ului, iar mai multe resurse ale serverului tău pot fi dedicate pentru crawling-ul site-ului de către Googlebot.
Așteaptă-te la fluctuații temporare în clasamentul site-ului în timpul mutării.
Cu orice schimbare semnificativă a unui site, poți experimenta fluctuații de clasament în timp ce Google recrawlează și reindexează site-ul tău. Ca regulă generală, un site de dimensiuni medii poate dura câteva săptămâni pentru ca majoritatea paginilor să fie mutate în indexul nostru; site-urile mai mari pot dura mai mult. Viteza cu care Googlebot și sistemele noastre descoperă și procesează URL-urile mutate depinde în mare măsură de numărul de URL-uri și de viteza serverului tău. Trimiterea unui sitemap poate ajuta la accelerarea procesului de descoperire și este în regulă să muți site-ul în secțiuni.
Folosește Search Console.
Search Console este prietenul tău, mai ales în timpul unei mutări de site. Verifică datele pentru fiecare proprietate separat în Search Console. Folosește raportul Index Status
pentru o privire de ansamblu. Folosește raportul Sitemaps
pentru a vedea câte URL-uri trimise într-un sitemap au fost indexate.
Fii răbdător, acordă-i timp
Pentru a considera o mutare de site completă, Googlebot va trebui să viziteze fiecare URL de pe vechiul și noul tău site cel puțin o dată. Nu există frecvențe fixe de crawling; cât de rapid crawl-ează Googlebot depinde de dimensiunea site-ului tău și de viteza de crawling posibilă. Mutarea are loc pe baza fiecărui URL în parte.
Pregătește noul site
Detaliile pregătirii site-ului variază pentru fiecare mutare de site, dar de obicei vei face una sau mai multe dintre următoarele:
Configurează CMS-ul (de preferință același pe care l-a folosit site-ul vechi) și importă conținutul de pe site-ul vechi.
Transferă imaginile și descărcările (cum ar fi documentele PDF) pe care le găzduiești.
Acestea ar putea deja să primească trafic din Căutarea Google sau link-uri, și este util să informezi utilizatorii și Googlebot despre noua lor locație.
Pentru o mutare la HTTPS, obține și configurează certificatele TLS necesare pe serverul tău.
Configurează un fișier robots.txt pentru noul site și asigură-te că regulile din fișierul robots.txt al noului site reflectă corect părțile pe care dorești să le blochezi de la crawling.
Reține că unii proprietari de site-uri blochează tot crawling-ul în timpul dezvoltării. Dacă urmezi această strategie, asigură-te că pregătești cum ar trebui să arate fișierul robots.txt odată ce începe mutarea site-ului. De asemenea, dacă folosești reguli noindex în timpul dezvoltării, pregătește o listă de URL-uri de la care vei elimina regulile noindex când începi mutarea site-ului.
Furnizează erori pentru conținutul șters sau fuzionat dacă nu muți pe noul site tot conținutul vechi, asigură-te că acele URL-uri returnează corect un cod de răspuns HTTP 404 sau 410 pe noul site.
Asigură-te că setările Search Console sunt corecte și pot ajuta la mutarea site-ului.
Dacă nu ai făcut-o deja, verifică
atât site-urile vechi, cât și cele noi în Search Console. Asigură-te că verifici toate variantele atât ale site-ului vechi, cât și ale celui nou. De exemplu, verifică www.example.com și example.com, și include atât variantele de site HTTPS, cât și HTTP dacă folosești URL-uri HTTPS. Fă acest lucru pentru ambele site-uri, vechi și noi.
Revizuiește verificarea Search Console
Asigură-te că verificarea Search Console va continua să funcționeze după mutarea site-ului. Dacă folosești o metodă diferită de verificare, ține cont că tokenurile de verificare pot fi diferite atunci când URL-ul se schimbă.
Dacă folosești metoda fișierului
pentru a verifica proprietatea site-ului tău în Search Console, asigură-te că nu uiți să incluzi fișierul de verificare curent în noua copie a site-ului.
De asemenea, dacă verifici proprietatea cu un fișier de includere care face referire la meta tag
sau Google Analytics
pentru a verifica proprietatea, asigură-te că noua copie CMS include și acestea.
Revizuiește orice setări configurate în Search Console pe care le-ai făcut pentru site-ul vechi și asigură-te că setările noului site sunt actualizate pentru a reflecta acele schimbări. De exemplu:
Rata de crawling:
Setează rata de crawling la “Lasă Googlebot să determine” pentru ambele site-uri, vechi și noi.
Backlink-uri dezavuate:
Dacă ai încărcat un fișier pentru a dezavua link-uri pe site-ul tău vechi, Google recomandă să-l încarci din nou folosind contul Search Console al noului site.
Curăță domeniul recent achiziționat; vei dori să te asiguri că este curat de orice probleme restante de la proprietarul anterior. Verifică următoarele setări:
Acțiuni manuale
pentru spam anterior. Dacă există acțiuni manuale aplicate noului site, abordează orice probleme listate acolo și depune o cerere de reconsiderare.
URL-uri eliminate.
Asigură-te că nu există eliminări de URL-uri rămase de la proprietarul anterior, în special o eliminare de URL-uri la nivel de site.
Folosește analize web pentru a analiza utilizarea pe ambele site-uri, vechi și noi. Software-ul de analize web poate ajuta cu acest lucru. De obicei, configurarea analizelor web constă într-o bucată de JavaScript încorporată în paginile tale. Detaliile pentru urmărirea diferitelor site-uri variază în funcție de software-ul tău de analize și de setările sale de înregistrare, procesare sau filtrare. Verifică cu furnizorul tău de software de analize pentru ajutor. În plus, dacă ai planificat să faci modificări de configurare la software-ul tău de analize, acum este un moment bun. Dacă folosești Google Analytics, ia în considerare crearea unui nou profil pentru noul tău site dacă dorești o separare clară în rapoartele tale de conținut.
Asigură-te că serverul tău are suficiente resurse de calcul: după o migrare, Google va crawl-ui temporar noul tău site mai intens decât de obicei. Acest lucru se datorează faptului că site-ul tău redirecționează traficul de la vechiul la noul site, și orice crawl-uri ale vechiului site vor fi redirecționate către noul site, în plus față de orice alt crawling. Asigură-te că noul tău site are capacitate suficientă pentru a face față traficului crescut de la Google. Dacă site-ul tău este deosebit de mare, ia legătura cu furnizorii tăi de hosting și informează-i despre mutarea site-ului pe care o planifici.
Pregătește maparea URL-urilor
Este important să mapezi URL-urile vechi ale site-ului tău la URL-urile pentru noul site. Această secțiune descrie o serie de abordări generale pe care le poți lua pentru a evalua corect URL-urile de pe cele două site-uri și pentru a facilita maparea. Detaliile exacte ale modului în care generezi această mapare vor varia în funcție de infrastructura actuală a site-ului tău și de detaliile mutării site-ului.
Determină URL-urile vechi
În cele mai simple mutări de site, s-ar putea să nu fie nevoie să generezi o listă a URL-urilor tale vechi. De exemplu, ai putea folosi o redirecționare wildcard pe partea de server dacă schimbi domeniul site-ului tău (de exemplu, mutându-te de la example.com la example.net).
În mutările de site mai complexe, va trebui să generezi o listă de URL-uri vechi și să le mapezi la noile lor destinații. Cum obții o listă de URL-uri vechi depinde de configurația actuală a site-ului tău, dar iată câteva sfaturi utile:
Începe cu URL-urile tale importante. Pentru a le găsi:
Uită-te în sitemaps
deoarece este probabil ca URL-urile tale cele mai importante să fi fost trimise în Search Console în acest fel
Verifică jurnalele serverului sau software-ul de analize pentru URL-urile care primesc cel mai mult trafic
Folosește sistemul tău de gestionare a conținutului, care poate oferi de obicei o modalitate simplă de a obține o listă a tuturor URL-urilor care găzduiesc conținut.
Verifică jurnalele serverului tău pentru URL-uri care au fost vizitate cel puțin o dată recent. Alege o perioadă de timp care are sens pentru site-ul tău, ținând cont de variația sezonieră a traficului.
Include imagini și videoclipuri—Asigură-te că incluzi URL-urile conținutului încorporat în planurile tale de mutare a site-ului: videoclipuri, imagini, fișiere JavaScript și CSS. Aceste URL-uri trebuie mutate în același mod ca și tot conținutul de pe site-ul tău.
Creează o mapare a URL-urilor vechi către cele noi
Odată ce ai lista de URL-uri vechi, decide unde ar trebui să redirecționeze fiecare. Cum stochezi această mapare depinde de serverele tale și de mutarea site-ului. Ai putea folosi o bază de date sau să configurezi câteva reguli de rescriere a URL-urilor pe sistemul tău pentru modele comune de redirecționare.
Actualizează toate detaliile URL-urilor pe noul site
Odată ce ai definit maparea URL-urilor, vei dori să faci trei lucruri pentru a pregăti paginile pentru a primi trafic.
Actualizează adnotările pentru a indica noile URL-uri în sau în intrarea sitemap pentru fiecare pagină:
Dacă site-ul pe care l-ai mutat are pagini multilingve sau multinaționale adnotate folosind rel-alternate-hreflang adnotări,
asigură-te că actualizezi adnotările pentru a folosi noile URL-uri.
Actualizează link-urile interne.
Schimbă link-urile interne de pe noul site de la URL-urile vechi la noile URL-uri. Poți folosi maparea generată anterior pentru a ajuta la găsirea și actualizarea link-urilor după cum este necesar.
Salvează următoarele liste pentru mutarea finală:
Un fișier sitemap care conține noile URL-uri din mapare. Vezi documentația noastră despre construirea unui sitemap.
O listă de site-uri care fac link către URL-urile tale vechi. Poți găsi link-urile către site-ul tău
în Search Console.
Planifică-ți strategia de redirecționare
Odată ce ai o mapare și noul tău site este gata, următorul pas este să-ți planifici strategia de redirecționare. Google recomandă redirecționări permanente pe partea de server de la URL-urile vechi la noile URL-uri așa cum ai indicat în mapare. Verifică cu administratorul serverului tău (sau compania de hosting) ce fel de redirecționări pe partea de server poți face tehnic. Ar putea fi reguli de redirecționare în fișierele tale .htaccess dacă serverul tău folosește Apache HTTP server sau funcții de redirecționare în CMS-ul tău.
Dacă niciuna dintre configurările de redirecționare pe partea de server nu este posibilă, poți recurge la redirecționări pe partea de client ca ultimă soluție.
Decide cum vei muta site-ul – totul dintr-o dată sau în secțiuni:
Site-uri mici sau medii: Google recomandă să muți toate URL-urile de pe site-ul tău simultan în loc să muți o secțiune la un moment dat. Acest lucru ajută utilizatorii să interacționeze mai bine cu site-ul în noua sa formă și ajută algoritmii să detecteze mutarea site-ului și să actualizeze indexul mai rapid.
Site-uri mari: Poți alege să muți site-uri mai mari o secțiune la un moment dat. Acest lucru poate face mai ușor să monitorizezi, să detectezi și să rezolvi problemele mai rapid.
Ține cont de următoarele:
Folosește redirecționări permanente pe partea de server dacă este posibil tehnic. Deși Googlebot suportă mai multe tipuri de redirecționări, Google recomandă să folosești redirecționări permanente HTTP dacă este posibil, cum ar fi 301 și 308.
Evită lanțurile de redirecționare. Deși Googlebot poate urma până la 10 salturi
într-un “lanț” de redirecționări multiple (de exemplu, Pagina 1 > Pagina 2 > Pagina 3), Google recomandă să redirecționezi direct la destinația finală. Dacă acest lucru nu este posibil, menține numărul de redirecționări în lanț scăzut, ideal nu mai mult de 3 și mai puțin de 5. Lanțurile de redirecționare adaugă latență pentru utilizatori, și nu toate agențiile de utilizatori și browserele suportă lanțuri lungi de redirecționare.
Începe mutarea site-ului
Odată ce maparea URL-urilor este corectă și ai finalizat planul pentru cum vei redirecționa, ești gata să muți.
Implementează sau activează redirecționările: în funcție de deciziile tale privind strategia de redirecționare, acest lucru ar putea însemna să faci un update la fișierele de configurare ale serverului tău sau să actualizezi CMS-ul tău, probabil cu cod personalizat.
Verifică adnotările rel="canonical"link și regulile robotsmeta:
Odată ce redirecționările sunt active, asigură-te că adnotările rel="canonical" link de pe noul site folosesc noile URL-uri. În mod similar, dacă ai adăugat reguli noindexrobotsmeta pe noul site pentru a evita indexarea prematură a noilor URL-uri, asigură-te că le actualizezi.
Testează redirecționările. Poți folosi Instrumentul de inspectare a URL-urilor
pentru a testa URL-uri individuale sau instrumente de linie de comandă sau scripturi pentru a testa un număr mare de URL-uri.
Păstrează redirecționările cât mai mult posibil, în general cel puțin 1 an.
Acest interval de timp permite Google să transfere toate semnalele către noile URL-uri, inclusiv recrawling-ul și realocarea link-urilor de pe alte site-uri care indică URL-urile tale vechi.
Din perspectiva utilizatorilor, ia în considerare păstrarea redirecționărilor pe termen nelimitat. Totuși, redirecționările sunt lente pentru utilizatori, așa că încearcă să actualizezi propriile link-uri și orice link-uri cu volum mare de pe alte site-uri pentru a indica noile URL-uri.
Trimite noul sitemap în Search Console. Acest lucru va ajuta Google să afle despre noile URL-uri. În acest moment poți elimina vechiul sitemap, deoarece Google va folosi noul sitemap de acum înainte.
Timpul necesar pentru ca Googlebot și sistemele noastre să descopere și să proceseze toate URL-urile în mutarea site-ului depinde de cât de rapide sunt serverele tale și de câte URL-uri sunt implicate. Ca regulă generală, un site mic până la mediu poate dura câteva săptămâni pentru ca majoritatea paginilor să fie mutate, iar site-urile mai mari durează mai mult. Viteza cu care Googlebot și sistemele noastre descoperă și procesează URL-urile mutate depinde de numărul de URL-uri și de viteza serverului.
Actualizează link-urile
Imediat după ce mutarea site-ului a început, încearcă să actualizezi cât mai multe link-uri posibil pentru a îmbunătăți experiența utilizatorului și a reduce încărcarea serverului tău. Acestea includ:
Link-uri interne: pe baza mapării URL-urilor pe care ai creat-o anterior, înlocuiește toate URL-urile care indicau către propriile tale pagini.
Link-uri externe: Încearcă să contactezi site-urile din lista salvată de site-uri care fac link către conținutul tău curent, cerându-le să-și actualizeze link-urile către noul tău site. Ia în considerare prioritizarea eforturilor tale în funcție de numărul de vizite de intrare pentru fiecare link.
Link-uri de profil, cum ar fi de pe Facebook, Twitter și LinkedIn.
Campanii publicitare pentru a indica noile pagini de destinație.
Monitorizează traficul
Odată ce ai început mutarea site-ului, monitorizează cum se schimbă traficul utilizatorilor și al crawler-ului pe noul site și, de asemenea, pe vechiul site. Ideal, traficul pe vechiul site va scădea, în timp ce pe noul site traficul va crește. Poți monitoriza activitatea utilizatorilor și a crawler-ului pe site-uri cu Search Console
și alte instrumente.
Folosește Search Console pentru a monitoriza traficul
Multe funcții ale Search Console te ajută să monitorizezi o mutare de site, inclusiv:
Sitemaps:
Trimite cele două sitemaps pe care le-ai salvat anterior din mapare. Inițial, sitemap-ul care conține noile URL-uri ar avea zero pagini indexate, în timp ce sitemap-ul URL-urilor vechi ar avea multe pagini indexate. În timp, numărul de pagini indexate din sitemap-ul URL-urilor vechi ar scădea la zero, cu o creștere corespunzătoare a indexării noilor URL-uri. Reține că Search Console poate afișa avertismente pentru sitemap-ul care conține URL-urile vechi despre redirecționarea URL-urilor; acest lucru este normal și poți ignora aceste avertismente: la urma urmei, te muți la noi URL-uri.
Raportul de acoperire a indexului:
Graficele ar reflecta mutarea site-ului, arătând o scădere a numărului de URL-uri indexate pe vechiul site și o creștere a indexării pe noul site. Verifică regulat pentru orice erori de crawling neașteptate.
Interogări de căutare:
Pe măsură ce mai multe pagini ale noului site sunt indexate și încep să se claseze, rapoartele de interogări de căutare ar începe să arate URL-urile de pe noul site obținând impresii și clicuri de căutare.
Folosește alte instrumente pentru a monitoriza traficul
Fii atent la jurnalele de acces și de erori ale serverului tău. În special, verifică pentru crawling de către Googlebot, orice URL-uri care returnează în mod neașteptat coduri de stare HTTP de eroare și traficul normal al utilizatorilor.
Dacă ai instalat vreun software de analize web pe site-ul tău sau dacă CMS-ul tău oferă analize, este de asemenea recomandat să revizuiești traficul în acest fel, astfel încât să poți vedea progresul traficului de la vechiul la noul site. În special, Google Analytics oferă raportare în timp real, și aceasta este o caracteristică utilă de utilizat în timpul fazei inițiale de mutare a site-ului. Ar trebui să te aștepți să vezi o scădere a traficului pe vechiul site și o creștere pe noul site.
Dacă ești blocat în orice punct, caută ajutor pe Google Search Central.
Există o mulțime de sfaturi bune pe pagina noastră de ajutor și cazuri specifice răspunse în forumurile noastre de utilizatori.
Dacă nu poți găsi un răspuns, poți pune o întrebare unuia dintre specialiștii Google Search în timpul orelor de birou SEO.
Depanarea mutării site-ului tău
Iată câteva greșeli comune atunci când migrezi un site cu schimbări de URL-uri (inclusiv de la HTTP la HTTPS). Aceste greșeli pot împiedica indexarea completă a noului tău site.
Greșeli comune
noindex sau blocuri robots.txt
Nu uita să elimini orice noindex sau blocuri robots.txt care au fost necesare doar pentru migrare.
Este în regulă dacă nu ai un fișier robots.txt pe site-ul tău, dar asigură-te că returnezi un cod de stare HTTP 404 corect dacă fișierul robots.txt nu există.
Pentru a testa:
Examinează fișierul tău robots.txt în site-ul HTTPS și vezi dacă ceva trebuie schimbat.
Verifică redirecționările de la vechiul site la cel nou. Vedem frecvent oameni care redirecționează către URL-uri greșite (inexistente) pe noul site.
Poți folosi Search Console pentru a vedea dacă există un număr neobișnuit de mare de erori “Nu a fost găsit” raportate sau poți folosi alte instrumente, cum ar fi Screaming Frog
pentru a-ți crawl-ui propriul site și a vedea dacă redirecționările funcționează așa cum te aștepți.
După o migrare, Google va crawl-ui noul tău site mai intens decât de obicei. Acest lucru se datorează faptului că site-ul tău redirecționează traficul de la vechiul la noul site, și orice crawl-uri ale vechiului site vor fi redirecționate către noul site, în plus față de orice alt crawling. Asigură-te că site-ul tău are capacitate suficientă pentru a face față traficului crescut de la Google.
Neactualizarea sitemaps
Asigură-te că toate sitemaps-urile tale sunt actualizate cu noile URL-uri.
Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.
Verifică dacă Googlebot întâmpină probleme de disponibilitate pe site-ul tău
Îmbunătățirea disponibilității site-ului tău nu va crește neapărat bugetul de crawling; Google determină cea mai bună rată de crawling pe baza cererii de crawling, așa cum a fost descris anterior. Totuși, problemele de disponibilitate împiedică Google să îți acceseze site-ul atât cât ar dori.
Diagnosticare:
Utilizează raportul Crawl Stats
pentru a vedea istoricul de crawling al Googlebot pentru site-ul tău. Raportul arată când Google a întâmpinat probleme de disponibilitate pe site-ul tău. Dacă sunt raportate erori sau avertismente de disponibilitate pentru site-ul tău, caută instanțe în graficele Host availability unde cererile Googlebot au depășit linia roșie de limită, fă clic pe grafic pentru a vedea care URL-uri au eșuat și încearcă să corelezi acele URL-uri cu problemele de pe site-ul tău.
De asemenea, poți folosi Instrumentul de Inspectare a URL-urilor
pentru a testa câteva URL-uri de pe site-ul tău. Dacă instrumentul returnează Hostload exceeded
avertismente, înseamnă că Googlebot nu poate accesa atât de multe URL-uri de pe site-ul tău pe cât a descoperit.
Mărește capacitatea serverului tău. Dacă Google pare să acceseze constant site-ul tău la limita capacității de servire, dar ai încă URL-uri importante care nu sunt accesate sau actualizate atât cât este necesar, având mai multe resurse de servire ar putea permite Google să solicite mai multe pagini de pe site-ul tău. Verifică istoricul disponibilității gazdei în raportul Crawl Stats pentru a vedea dacă rata de crawling a Google pare să depășească frecvent linia de limită. Dacă da, mărește resursele de servire pentru o lună și vezi dacă cererile de crawling au crescut în aceeași perioadă.
Verifică dacă există părți ale site-ului tău care nu sunt accesate, dar ar trebui să fie
Google petrece atât timp cât este necesar pe site-ul tău pentru a indexa tot conținutul de înaltă calitate și valoros pentru utilizatori pe care îl poate găsi. Dacă crezi că Googlebot ratează conținut important, fie nu știe despre conținut, fie conținutul este blocat de Google, fie disponibilitatea site-ului tău limitează accesul Google (sau Google încearcă să nu suprasolicite site-ul tău).
Diagnosticare:
Search Console nu oferă un istoric de crawling pentru site-ul tău care poate fi filtrat după URL sau cale, dar poți inspecta jurnalele site-ului tău pentru a vedea dacă URL-uri specifice au fost accesate de Googlebot. Dacă acele URL-uri accesate au fost indexate este o altă poveste.
Amintește-ți că pentru majoritatea site-urilor, paginile noi vor dura câteva zile minim pentru a fi observate; majoritatea site-urilor nu ar trebui să se aștepte la crawling în aceeași zi pentru URL-uri, cu excepția site-urilor sensibile la timp, cum ar fi site-urile de știri.
Tratament:
Dacă adaugi pagini pe site-ul tău și acestea nu sunt accesate într-un timp rezonabil, fie Google nu știe despre ele, fie conținutul este blocat, fie site-ul tău a atins capacitatea maximă de servire, fie ești în afara bugetului de crawling.
Informează Google despre noile tale pagini: actualizează sitemaps pentru a reflecta noile URL-uri.
Examinează regulile tale robots.txt pentru a confirma că nu blochezi accidental paginile.
Reține că paginile ar putea să nu fie afișate în rezultatele căutării, chiar dacă sunt accesate, dacă nu există suficientă valoare sau cerere din partea utilizatorilor pentru conținut.
Verifică dacă actualizările sunt accesate suficient de rapid
Dacă ne lipsesc pagini noi sau actualizate pe site-ul tău, poate fi pentru că nu le-am văzut sau nu am observat că sunt actualizate. Iată cum poți ajuta Google să fie conștient de actualizările paginilor.
Reține că Google se străduiește să verifice și să indexeze paginile într-un mod rezonabil de rapid. Pentru majoritatea site-urilor, acest lucru durează trei zile sau mai mult. Nu te aștepta ca Google să indexeze paginile în aceeași zi în care le publici, cu excepția cazului în care ești un site de știri sau ai alt conținut de mare valoare, extrem de sensibil la timp.
Diagnosticare:
Examinează jurnalele site-ului tău pentru a vedea când URL-uri specifice au fost accesate de Googlebot.
Pentru a afla data indexării, folosește instrumentul de Inspectare a URL-urilor sau efectuează o căutare pentru URL-urile pe care le-ai actualizat.
Tratament:
Fă:
Folosește un sitemap de știri dacă site-ul tău are conținut de știri.
Folosește eticheta <lastmod> în sitemaps pentru a indica când un URL indexat a fost actualizat.
Oferă linkuri standard, accesibile <a> pentru a ajuta Google să găsească paginile tale.
Dacă site-ul tău folosește separat pentru versiunile mobile și desktop, oferă același set de linkuri pe versiunea mobilă ca și pe versiunea desktop. Dacă nu este posibil să oferi același set de linkuri pe versiunea mobilă, asigură-te că sunt incluse într-un fișier sitemap. Google indexează doar versiunea mobilă a paginilor, iar limitarea linkurilor afișate acolo poate încetini descoperirea de pagini noi.
Evită:
Trimiterea aceluiași sitemap, neschimbat, de mai multe ori pe zi.
Așteptarea ca Googlebot să acceseze totul dintr-un sitemap sau să le acceseze imediat. Sitemaps sunt sugestii utile pentru Googlebot, nu cerințe absolute.
Includerea URL-urilor în sitemaps pe care nu dorești să apară în Căutare. Acest lucru poate irosi bugetul de crawling pe pagini pe care nu dorești să le indexezi.
Crawling-ul Google este limitat de lățimea de bandă, timp și disponibilitatea instanțelor Googlebot. Dacă serverul tău răspunde mai rapid la cereri, am putea să accesăm mai multe pagini de pe site-ul tău. Asta fiind spus, Google dorește să acceseze doar conținut de înaltă calitate, așa că doar făcând paginile de calitate scăzută mai rapide nu va încuraja Googlebot să acceseze mai mult site-ul tău; invers, dacă credem că ne lipsesc conținuturi de înaltă calitate pe site-ul tău, probabil vom crește bugetul tău pentru a accesa acel conținut.
Iată cum poți optimiza paginile și resursele pentru crawling:
Previne încărcarea resurselor mari, dar neimportante, de către Googlebot folosind robots.txt. Asigură-te că blochezi doar resursele non-critice, adică resursele care nu sunt importante pentru înțelegerea semnificației paginii (cum ar fi imaginile decorative).
Asigură-te că paginile tale se încarcă rapid.
Fii atent la lanțurile lungi de redirecționare, care au un efect negativ asupra crawling-ului.
Atât timpul de răspuns la cererile serverului, cât și timpul necesar pentru a reda paginile contează, inclusiv timpul de încărcare și rulare pentru resursele încorporate, cum ar fi imaginile și scripturile. Fii conștient de resursele mari sau lente necesare pentru indexare.
Specifică modificările de conținut cu coduri de stare HTTP
Google suportă în general anteturile de cerere HTTP If-Modified-Since și If-None-Match
pentru crawling. Crawler-ele Google nu trimit anteturile cu toate încercările de crawling; depinde de cazul de utilizare al cererii (de exemplu, AdsBot este mai probabil să seteze anteturile de cerere HTTP If-Modified-Since și If-None-Match). Dacă crawler-ele noastre trimit antetul If-Modified-Since, valoarea antetului este data și ora
la care conținutul a fost accesat ultima dată. Pe baza acelei valori, serverul poate alege să returneze un cod de stare HTTP 304 (Not Modified) fără corp de răspuns, caz în care Google va reutiliza versiunea de conținut accesată ultima dată. Dacă conținutul este mai nou decât data specificată de crawler în antetul If-Modified-Since, serverul poate returna un cod de stare HTTP 200 (OK) cu corpul de răspuns.
Independent de anteturile de cerere, poți trimite un cod de stare HTTP 304 (Not Modified) și fără corp de răspuns pentru orice cerere Googlebot dacă conținutul nu s-a schimbat de la ultima vizită a Googlebot la URL. Acest lucru va economisi timp și resurse de procesare ale serverului tău, ceea ce poate îmbunătăți indirect eficiența crawling-ului.
Ascunde URL-urile pe care nu le dorești în rezultatele căutării
Risipirea resurselor serverului pe pagini inutile poate reduce activitatea de crawling de pe paginile care sunt importante pentru tine, ceea ce poate cauza o întârziere semnificativă în descoperirea de conținut nou sau actualizat pe un site.
Expunerea multor URL-uri pe site-ul tău pe care nu dorești să fie accesate de Căutare poate afecta negativ crawling-ul și indexarea unui site. De obicei, aceste URL-uri se încadrează în următoarele categorii:
Pagini de coș de cumpărături, pagini cu derulare infinită și pagini care efectuează o acțiune (cum ar fi paginile “înregistrează-te” sau “cumpără acum”).
Fă:
Folosește robots.txt dacă nu dorești ca Google să acceseze o resursă sau o pagină deloc.
Dacă o resursă comună este reutilizată pe mai multe pagini (cum ar fi o imagine sau un fișier JavaScript partajat), referențiază resursa de la același URL în fiecare pagină, astfel încât Google să poată cache și reutiliza aceeași resursă fără a fi nevoie să solicite aceeași resursă de mai multe ori.
Evită:
Nu adăuga sau elimina pagini sau directoare din robots.txt în mod regulat ca o modalitate de a realoca bugetul de crawling pentru site-ul tău. Folosește robots.txt doar pentru paginile sau resursele pe care nu dorești să apară pe Google pe termen lung.
Nu roti sitemaps sau folosi alte mecanisme temporare de ascundere pentru a realoca bugetul.
erori soft 404
O eroare soft 404 apare atunci când un URL returnează o pagină care spune utilizatorului că pagina nu există și, de asemenea, un cod de stare 200 (success). În unele cazuri, ar putea fi o pagină fără conținut principal sau o pagină goală.
Astfel de pagini pot fi generate din diverse motive de serverul web al site-ului tău sau de sistemul de gestionare a conținutului, sau de browserul utilizatorului. De exemplu:
Un fișier include lipsă pe partea de server.
O conexiune ruptă la baza de date.
O pagină de rezultate de căutare internă goală.
Un fișier JavaScript neîncărcat sau lipsă.
Este o experiență proastă pentru utilizator să returnezi un cod de stare 200 (success), dar apoi să afișezi sau să sugerezi un mesaj de eroare sau un fel de eroare pe pagină. Utilizatorii ar putea crede că pagina este una activă și funcțională, dar apoi sunt prezentați cu un fel de eroare. Astfel de pagini sunt excluse din Căutare.
Când algoritmii Google detectează că pagina este de fapt o pagină de eroare pe baza conținutului său, Search Console va afișa o eroare soft 404 în raportul de Indexare a Paginilor al site-ului.
Remediază erorile soft 404
În funcție de starea paginii și de rezultatul pe care îl dorești, poți rezolva erorile soft 404 în mai multe moduri:
Încearcă să determini care soluție ar fi cea mai bună pentru utilizatorii tăi.
Pagina și conținutul nu mai sunt disponibile
Dacă ai eliminat pagina și nu există o pagină de înlocuire pe site-ul tău cu conținut similar, returnează un cod de răspuns (status) 404 (not found) sau 410 (gone)
pentru pagină. Aceste coduri de stare indică motoarelor de căutare că pagina nu există și nu dorești ca motoarele de căutare să indexeze pagina.
Dacă ai acces la fișierele de configurare ale serverului tău, poți face aceste pagini de eroare utile pentru utilizatori personalizându-le. O pagină personalizată 404 bună ajută oamenii să găsească informațiile pe care le caută și oferă, de asemenea, alt conținut util care încurajează oamenii să exploreze mai departe site-ul tău. Iată câteva sfaturi pentru a proiecta o pagină personalizată 404 utilă:
Spune vizitatorilor clar că pagina pe care o caută nu poate fi găsită. Folosește un limbaj prietenos și primitor.
Asigură-te că pagina ta 404 are același aspect și senzație (inclusiv navigare) ca restul site-ului tău.
Ia în considerare adăugarea de linkuri către cele mai populare articole sau postări ale tale, precum și un link către pagina de start a site-ului tău.
Gândește-te să oferi o modalitate pentru utilizatori de a raporta un link rupt.
Paginile personalizate 404 sunt create exclusiv pentru utilizatori. Deoarece aceste pagini sunt inutile din perspectiva unui motor de căutare, asigură-te că serverul returnează un cod de stare HTTP 404 pentru a preveni indexarea paginilor.
Pagina sau conținutul se află acum în altă parte
Dacă pagina ta s-a mutat sau are o înlocuire clară pe site-ul tău, returnează un 301 (permanent redirect)
pentru a redirecționa utilizatorul. Acest lucru nu va întrerupe experiența de navigare a utilizatorului și este, de asemenea, o modalitate excelentă de a informa motoarele de căutare despre noua locație a paginii. Folosește instrumentul de Inspectare a URL-urilor
pentru a verifica dacă URL-ul tău returnează de fapt codul corect.
Pagina și conținutul încă există
Dacă o pagină bună a fost marcată cu o eroare soft 404, este probabil că nu s-a încărcat corect pentru Googlebot, lipsea resurse critice sau a afișat un mesaj de eroare proeminent în timpul redării. Folosește instrumentul de Inspectare a URL-urilor
pentru a examina conținutul redat și codul HTTP returnat. Dacă pagina redată este goală, aproape goală sau conținutul are un mesaj de eroare, ar putea fi că pagina ta face referire la multe resurse care nu pot fi încărcate (imagini, scripturi și alte elemente non-textuale), care pot fi interpretate ca un soft 404.
Motivele pentru care resursele nu pot fi încărcate includ resurse blocate (blocate de robots.txt), având prea multe resurse pe o pagină, diverse erori de server sau resurse foarte mari sau care se încarcă lent.
Googlebot are algoritmi pentru a preveni copleșirea site-ului tău cu cereri de crawling. Totuși, dacă descoperi că Googlebot îți copleșește site-ul, există câteva lucruri pe care le poți face.
Diagnosticare:
Monitorizează serverul tău pentru cereri excesive de la Googlebot către site-ul tău.
Tratament:
Într-o situație de urgență, Google recomandă următorii pași pentru a încetini un crawling copleșitor de la Googlebot:
Returnează coduri de răspuns HTTP 503 sau 429temporar pentru cererile Googlebot atunci când serverul tău este suprasolicitat. Googlebot va reîncerca aceste URL-uri timp de aproximativ 2 zile. Reține că returnarea codurilor “fără disponibilitate” pentru mai mult de câteva zile va determina Google să încetinească sau să oprească permanent crawling-ul URL-urilor de pe site-ul tău, așa că urmează pașii suplimentari următori.
Când rata de crawling scade, oprește returnarea codurilor de răspuns HTTP 503 sau 429 pentru cererile de crawling; returnarea codurilor 503 sau 429 pentru mai mult de 2 zile va determina Google să elimine acele URL-uri din index.
Monitorizează crawling-ul și capacitatea gazdei tale în timp.
Dacă crawler-ul problematic este unul dintre crawler-ele AdsBot,
problema este probabil că ai creat ținte de Anunțuri de Căutare Dinamică
pentru site-ul tău pe care Google încearcă să le acceseze. Acest crawling va reapărea la fiecare 3 săptămâni. Dacă nu ai capacitatea serverului pentru a gestiona aceste crawling-uri, fie limitează țintele de anunțuri, fie obține o capacitate de servire crescută.
Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.
Dacă site-ul tău are pagini adaptate pentru locație (adică site-ul tău returnează conținut diferit în funcție de țara percepută sau limba preferată a vizitatorului), este posibil ca Google să nu acceseze, indexeze sau să clasifice tot conținutul tău pentru diferite locații. Acest lucru se datorează faptului că adresele IP implicite ale crawler-ului Googlebot par să fie bazate în SUA. În plus, crawler-ul trimite cereri HTTP fără a seta Accept-Language în antetul cererii.
Googlebot accesează cu adrese IP bazate și în afara SUA, pe lângă adresele IP bazate în SUA.
Așa cum Google a recomandat întotdeauna, când Googlebot pare să vină dintr-o anumită țară, tratează-l așa cum ai trata orice alt utilizator din acea țară. Aceasta înseamnă că, dacă blochezi utilizatorii din SUA să acceseze conținutul tău, dar permiți vizitatorilor din Australia să îl vadă, serverul tău ar trebui să blocheze Googlebot dacă pare să vină din SUA, dar să permită accesul la Googlebot dacă pare să vină din Australia.
Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.
Informați Google despre versiunile localizate ale paginii dvs.
Dacă aveți mai multe versiuni ale unei pagini pentru diferite limbi sau regiuni, informați Google despre aceste variații. Acest lucru va ajuta Google Search să direcționeze utilizatorii către cea mai potrivită versiune a paginii dvs. în funcție de limbă sau regiune.
Rețineți că, chiar și fără a lua măsuri, Google ar putea găsi versiuni alternative ale paginii dvs., dar este de obicei mai bine să indicați explicit paginile specifice limbii sau regiunii.
Exemple de scenarii în care este recomandat să indicați pagini alternative:
Dacă păstrați conținutul principal într-o singură limbă și traduceți doar șablonul, cum ar fi navigarea și subsolul. Paginile care prezintă conținut generat de utilizatori, cum ar fi forumurile, fac de obicei acest lucru.
Dacă conținutul dvs. are variații regionale mici cu conținut similar, într-o singură limbă. De exemplu, puteți avea conținut în limba engleză destinat SUA, GB și Irlanda.
Dacă conținutul site-ului dvs. este complet tradus în mai multe limbi. De exemplu, aveți atât versiuni în germană, cât și în engleză ale fiecărei pagini.
Versiunile localizate ale unei pagini sunt considerate duplicate doar dacă conținutul principal al paginii rămâne netradus.
Metode pentru a indica paginile alternative
Există trei modalități de a indica versiunile multiple de limbă/locale ale unei pagini către Google:
Aceste trei metode sunt echivalente din perspectiva Google și puteți alege metoda care este cea mai convenabilă pentru site-ul dvs. Deși puteți folosi toate cele trei metode în același timp, nu există niciun beneficiu în Search (de fapt, poate fi mult mai dificil să gestionați trei implementări în loc să alegeți doar una).
Utilizați hreflang pentru a informa Google despre variațiile conținutului dvs., astfel încât să putem înțelege că aceste pagini sunt variații localizate ale aceluiași conținut. Google nu folosește hreflang sau atributul lang pentru a detecta limba unei pagini; în schimb, folosim algoritmi pentru a determina limba.
Ghiduri pentru toate metodele
Fiecare versiune de limbă trebuie să listeze atât pe ea însăși, cât și toate celelalte versiuni de limbă.
URL-urile alternative trebuie să fie complet calificate, inclusiv metoda de transport (http/https), astfel: https://example.com/foo, nu//example.com/foo sau /foo
URL-urile alternative nu trebuie să fie în același domeniu.
Dacă aveți mai multe URL-uri alternative destinate utilizatorilor cu aceeași limbă, dar în locații diferite, este o idee bună să oferiți și un URL general pentru utilizatorii geografici nespecificați ai acelei limbi. De exemplu, dacă aveți URL-uri specifice pentru vorbitorii de engleză din Irlanda (en-ie), Canada (en-ca) și Australia (en-au), oferiți o pagină generică în engleză (en) pentru căutătorii din SUA, Marea Britanie și toate celelalte locații vorbitoare de engleză. Poate fi una dintre paginile specifice, dacă alegeți.
Dacă două pagini nu indică reciproc una către cealaltă, etichetele vor fi ignorate. Acest lucru este pentru ca cineva de pe un alt site să nu poată crea arbitrar o etichetă care să se numească pe sine ca o versiune alternativă a uneia dintre paginile dvs.
Dacă devine dificil să mențineți un set complet de linkuri bidirecționale pentru fiecare limbă, puteți omite unele limbi pe unele pagini; Google va procesa în continuare cele care indică reciproc una către cealaltă. Cu toate acestea, este important să legați bidirecțional paginile de limbă nou extinse de limbile de origine/dominante. De exemplu, dacă site-ul dvs. a fost creat inițial în franceză cu URL-uri pe .fr, este mai important să legați bidirecțional paginile noi în mexicană (.mx) și spaniolă (.es) de prezența dvs. puternică .fr, decât să legați bidirecțional paginile noi de variantă de limbă spaniolă (.mx și .es) între ele.
Luați în considerare adăugarea unei pagini de rezervă pentru limbile necorespunzătoare, în special pe selectoarele de limbă/țară sau pe paginile de pornire cu redirecționare automată. Utilizați valoarea x-default: <link rel="alternate" href="https://example.com/" hreflang="x-default" />
Etichete
Adăugați elemente <link rel="alternate" hreflang="lang_code"... > în antetul paginii dvs. pentru a informa Google despre toate variantele de limbă și regiune ale unei pagini. Acest lucru este util dacă nu aveți un sitemap sau capacitatea de a specifica anteturi de răspuns HTTP pentru site-ul dvs.
Pentru fiecare variație a paginii, includeți un set de elemente <link> în elementul <head>, un link pentru fiecare variantă de pagină inclusiv ea însăși. Setul de linkuri este identic pentru fiecare versiune a paginii. Consultați ghidurile suplimentare.
Un cod de limbă/regiune suportat vizat de această versiune a paginii, sau x-default pentru a se potrivi cu orice limbă care nu este listată explicit de o etichetă hreflang pe pagină.
url_of_page
URL-ul complet calificat pentru versiunea acestei pagini pentru limba/regiunea specificată.
Etichetele <link> trebuie să fie în interiorul unei secțiuni <head> bine formate a -ului. Dacă aveți îndoieli, lipiți codul din pagina dvs. redată într-un validator pentru a vă asigura că linkurile sunt în interiorul elementului <head>. De asemenea, nu combinați etichetele link pentru reprezentări alternative ale documentului; de exemplu, nu combinați adnotările hreflang cu alte atribute, cum ar fi media, într-o singură etichetă <link>.
Exemplu
Example Widgets, Inc are un site web care servește utilizatorii din SUA, Marea Britanie și Germania. Următoarele URL-uri conțin în mare parte același conținut, dar cu variații regionale:
URL-uri cu variații regionale
https://en.example.com/page.
Pagina principală generică în limba engleză care conține informații despre taxele pentru expedierea internațională din SUA.
https://en-gb.example.com/page.
Pagina principală din Marea Britanie care afișează prețurile în lire sterline.
https://en-us.example.com/page.
Pagina principală din SUA care afișează prețurile în dolari americani.
https://de.example.com/page.
Pagina principală în limba germană.
https://www.example.com/
Pagina implicită care nu vizează nicio limbă sau locație; are selectoare pentru a permite utilizatorilor să-și aleagă limba și regiunea.
Rețineți că subdomeniile specifice limbii din aceste URL-uri (en, en-gb, en-us, de) nu sunt utilizate de Google pentru a determina publicul țintă al paginii; trebuie să mapați explicit publicul țintă.
Iată -ul care ar fi în secțiunea <head> a tuturor paginilor listate în tabelul cu variații regionale ale URL-urilor. Ar direcționa vorbitorii de engleză din SUA, Marea Britanie, vorbitorii generici de engleză și vorbitorii de germană către pagini localizate, iar pe toți ceilalți către o pagină principală generică. Google Search returnează rezultatul adecvat pentru utilizator, conform setărilor browserului lor.
Puteți returna un antet HTTP cu răspunsul GET al paginii dvs. pentru a informa Google despre toate variantele de limbă și regiune ale unei pagini. Acest lucru este util pentru fișiere non- (cum ar fi PDF-urile).
URL-ul complet calificat al paginii alternative corespunzătoare șirului de localizare atribuit atributului hreflang asociat. URL-ul trebuie să includă marcajele de încadrare < și >. Exemplu:<https://www.google.com>
lang_code_x
Un cod de limbă/regiune suportat vizat de această versiune a paginii, sau x-default pentru a se potrivi cu orice limbă care nu este listată explicit de o etichetă hreflang pe pagină.
Trebuie să specificați un set de valori <url>, rel="alternate" și hreflang pentru fiecare versiune a paginii inclusiv versiunea solicitată, separate prin virgulă, așa cum se arată în exemplul următor. Antetul Link: returnat pentru fiecare versiune a unei pagini este identic. Consultați ghidurile suplimentare.
Exemplu
Iată un exemplu de antet Link: returnat de un site care are trei versiuni ale unui fișier PDF: una pentru vorbitorii de engleză, una pentru vorbitorii de germană din Elveția și una pentru toți ceilalți vorbitori de germană:
Puteți utiliza un sitemap XML pentru a informa Google despre toate variantele de limbă și regiune pentru fiecare URL. Pentru a face acest lucru, adăugați un element <loc> care specifică un singur URL, cu intrări copil <x:link> care listează fiecare variantă de limbă/locale a paginii, inclusiv ea însăși. Prin urmare, dacă aveți 3 versiuni ale unei pagini, sitemap-ul dvs. va avea intrări pentru URL-urile fiecărei versiuni, iar fiecare intrare va avea 3 intrări copil identice.
Reguli pentru sitemap:
Specificați spațiul de nume x astfel:
xmlns:x="http://www.w3.org/1999/x"
Creați un element <url> separat pentru fiecare URL, așa cum ați face cu orice alt sitemap.
Fiecare element <url> trebuie să includă un copil <loc> care indică URL-ul paginii.
Fiecare element <url> trebuie să aibă un element copil <x:link rel="alternate" hreflang="supported_language-code"> care listează fiecare versiune alternativă a paginii, inclusiv ea însăși. Ordinea acestor elemente copil nu contează, deși poate doriți să le păstrați în aceeași ordine pentru a le verifica mai ușor pentru greșeli. Elementele copil nu contează în limita URL-urilor pentru sitemaps.
Încărcați sitemap-ul într-un director de pe site-ul dvs. la care sitemap-ul este aplicabil. Rețineți că un sitemap poate conține doar URL-uri descendente ale directorului din care este găzduit sitemap-ul.
Iată o pagină în limba engleză destinată vorbitorilor de engleză din întreaga lume, cu versiuni echivalente ale acestei pagini destinate vorbitorilor de germană din întreaga lume și vorbitorilor de germană din Elveția. Iată toate URL-urile prezente pe site-ul dvs.:
www.example.com/english/page. destinat vorbitorilor de engleză.
www.example.de/deutsch/page. destinat vorbitorilor de germană.
www.example.de/schweiz-deutsch/page. destinat vorbitorilor de germană din Elveția.
Valoarea atributului hreflang este compusă din una sau opțional două valori, separate printr-o cratimă. De exemplu, en-US. Primul cod al atributului hreflang este codul limbii (în format ISO 639-1), urmat de un al doilea cod opțional care reprezintă codul regiunii (în format ISO 3166-1 Alpha 2) al unui URL alternativ. Sunt suportate doar codurile de limbă listate în ISO 639-1 și codurile de regiune listate în ISO 3166-1 Alpha 2; alte coduri care nu sunt listate în acele standarde, cum ar fi es-419, nu sunt suportate.
Pentru a viza vorbitorii de limbi diferite din Belgia, puteți utiliza următoarele coduri de limbă și regiune:
Bun (germană pentru utilizatorii din Belgia): de-be
Bun (olandeză pentru utilizatorii din Belgia): nl-be
Bun (franceză pentru utilizatorii din Belgia): fr-be
Rău deoarece primul cod este pentru limbă (be este codul de limbă pentru belarusă): be
Pentru a simplifica etichetarea, puteți specifica un cod de limbă de unul singur. De exemplu:
de: conținut în limba germană, independent de regiune
en-GB: conținut în limba engleză, pentru utilizatorii din Marea Britanie
de-ES: conținut în limba germană, pentru utilizatorii din Spania
Pentru variațiile de script de limbă, scriptul corect este derivat din țară. De exemplu, când utilizați zh-TW pentru utilizatorii din Taiwan, scriptul limbii este derivat automat (în acest exemplu: chineză-tradițională). De asemenea, puteți specifica scriptul în sine explicit folosind ISO 15924, astfel:
zh-Hant: chineză (tradițională)
zh-Hans: chineză (simplificată)
Ca și în cazul altor coduri de limbă, puteți specifica și o regiune opțională. De exemplu, utilizați zh-Hans-US pentru a specifica chineză (simplificată) pentru utilizatorii din Statele Unite.
Utilizați valoarea x-default pentru limbile necorespunzătoare
Valoarea rezervată x-default este utilizată atunci când nicio altă limbă/regiune nu se potrivește cu setările browserului utilizatorului. Această valoare este recomandată pentru a specifica pagina de rezervă pentru utilizatorii ale căror setări de limbă nu se potrivesc cu nicio versiune localizată a site-ului dvs. Deși puteți utiliza valoarea x-default pentru orice pagină, a fost concepută pentru paginile de selectare a limbii și astfel va funcționa cel mai bine cu acestea.
Nu este nevoie să specificați un cod de limbă pentru valoarea x-default; pagina este destinată utilizatorilor ale căror setări de limbă nu sunt potrivite pe site-ul dvs., astfel încât limba paginii este irelevantă.
Pentru a implementa adnotarea hreflang="x-default", adăugați o etichetă link suplimentară la adnotările hreflang existente și setați atributul href la URL-ul unde doriți ca utilizatorii dvs. să ajungă dacă site-ul dvs. nu suportă limba lor. De exemplu, o implementare poate arăta astfel:
Iată cele mai comune greșeli în utilizarea hreflang:
Lipsa linkurilor de întoarcere: Dacă pagina X leagă la pagina Y, pagina Y trebuie să lege înapoi la pagina X. Dacă acest lucru nu este cazul pentru toate paginile care utilizează adnotări hreflang, acele adnotări pot fi ignorate sau nu sunt interpretate corect. De exemplu, având în vedere acest link pe https://de.example.com/index.:
Coduri de limbă incorecte: Asigurați-vă că toate codurile de limbă pe care le utilizați identifică limba (în format ISO 639-1) și opțional regiunea (în format ISO 3166-1 Alpha 2) a unui URL alternativ. Specificarea doar a regiunii nu este validă.
Coduri de regiune incorecte: Asigurați-vă că utilizați elemente de cod oficiale atribuite pentru regiunile pe care încercați să le identificați (în format ISO 3166-1 Alpha 2). Dacă utilizați coduri care sunt listate ca rezervate pentru altceva, Google Search ignoră acea parte a adnotării (de exemplu, utilizarea EU, UN sau UK în adnotările hreflang nu are efect asupra Google Search).
Depanarea erorilor hreflang
Există multe instrumente terțe disponibile pe care le puteți utiliza pentru a depana adnotările hreflang. Iată câteva instrumente populare. Aceste instrumente nu sunt întreținute sau verificate de Google.
Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.