Category: Ghiduri

  • Eliminarea imaginilor găzduite pe site-ul tău din rezultatele căutării

    Eliminarea imaginilor găzduite pe site-ul tău din rezultatele căutării

    Eliminarea de urgență a imaginilor

    Pentru a elimina rapid imaginile găzduite pe site-ul tău din rezultatele căutării Google, utilizează
    instrumentul de eliminare.
    Reține că, dacă nu elimini și imaginile de pe site-ul tău sau nu le blochezi conform descrierii din
    secțiunea de eliminare non-urgentă a imaginilor,
    imaginile pot reapărea în rezultatele căutării Google odată ce cererea de eliminare expiră.

    Eliminarea non-urgentă a imaginilor

    Există două modalități de a elimina imaginile de pe site-ul tău din rezultatele căutării Google:

    Cele două metode au același efect, alege metoda care este mai convenabilă pentru site-ul tău.
    Reține că Googlebot trebuie să acceseze URL-urile pentru a extrage anteturile HTTP, așa că implementarea
    ambelor metode în același timp nu are sens.

    Dacă nu ai acces la site-ul care găzduiește imaginile tale (de exemplu, un CDN) sau CMS-ul tău
    nu oferă o modalitate de a bloca imaginile cu antetul HTTP noindex X-Robots-Tag
    sau robots.txt, poate fi necesar să ștergi complet imaginile de pe site-ul tău.

    Eliminarea imaginilor folosind reguli robots.txt

    Pentru a preveni apariția imaginilor de pe site-ul tău în rezultatele căutării Google, adaugă un
    fișier robots.txt la rădăcina site-ului
    care găzduiește imaginea, de exemplu https://yoursite.example.com/robots.txt. Deși
    durează mai mult să elimini o imagine din rezultatele căutării Google folosind reguli robots.txt decât
    utilizând instrumentul de eliminare, îți oferă mai multă flexibilitate și control prin utilizarea
    caracterelor wildcard sau blocarea subcailor. De asemenea, se aplică tuturor motoarelor de căutare, în timp ce
    instrumentul de eliminare se aplică doar pentru Google.

    De exemplu, dacă dorești ca Google să excludă imaginea dogs.jpg care apare pe
    site-ul tău la yoursite.example.com/images/dogs.jpg, adaugă următoarele în fișierul tău robots.txt:

    User-agent: Googlebot-Image
    Disallow: /images/dogs.jpg

    Data viitoare când Google accesează imaginea dogs.jpg, va vedea această regulă și va elimina
    imaginea din rezultatele căutării.

    Regulile pot include
    caractere speciale
    pentru mai multă flexibilitate și control. În mod specific, caracterul * se potrivește cu orice secvență
    de caractere, permițându-ți să potrivești mai multe căi de imagini cu o singură regulă.

    Pentru a elimina mai multe imagini de pe site-ul tău din indexul Google, adaugă o regulă disallow pentru
    fiecare imagine sau, dacă imaginile împărtășesc un model comun, cum ar fi un sufix în numele fișierului, folosește
    caracterul * în numele fișierului. De exemplu:

    User-agent: Googlebot-Image
    # Reguli 'disallow' repetate pentru fiecare imagine:
    Disallow: /images/dogs.jpg
    Disallow: /images/cats.jpg
    Disallow: /images/llamas.jpg
    
    # Caracter wildcard în numele fișierului pentru
    # imagini care împărtășesc un sufix comun. De exemplu,
    #   animal-picture-UNICORN.jpg și
    #   animal-picture-SQUIRREL.jpg
    # în directorul "images"
    # vor fi potrivite de acest model.
    Disallow: /images/animal-picture-*.jpg

    Pentru a elimina toate imaginile de pe site-ul tău din indexul nostru, plasează următoarea regulă în fișierul tău robots.txt:

    User-agent: Googlebot-Image
    Disallow: /

    Pentru a elimina toate fișierele de un anumit tip (de exemplu, pentru a include .jpg dar nu
    .gif), ai folosi următoarea intrare în robots.txt:

    User-agent: Googlebot-Image
    Disallow: /*.gif$

    Specificând Googlebot-Image ca User-agent, imaginile vor fi
    excluse din Google Images. Dacă dorești să excluzi imaginile din toate căutările Google
    (inclusiv Google Search și Google Images), specifică agentul utilizator Googlebot.

    Eliminarea imaginilor cu antetul HTTP noindex X-Robots-Tag

    Alternativ, poți elimina imaginile găzduite pe site-ul tău din rezultatele căutării Google prin
    adăugarea noindex X-Robots-Tag la anteturile de răspuns HTTP ale
    imaginilor pe care dorești să le elimini. În acest caz, trebuie să permiți accesarea URL-urilor imaginilor pentru ca
    Googlebot să poată extrage regula noindex. Pentru a implementa
    antetul HTTP noindex X-Robots-Tag,
    urmează documentația noastră despre noindex.

    Reține că adăugarea etichetei robots noimageindex la o anumită pagină va preveni, de asemenea,
    indexarea imaginilor încorporate în acea pagină. Totuși, dacă aceleași imagini apar și în
    alte pagini, ele ar putea fi indexate prin acele pagini. Pentru a te asigura că o anumită imagine este
    blocată indiferent unde apare, folosește antetul HTTP noindex X-Robots-Tag.

    Cum elimin imagini de pe proprietăți pe care nu le dețin?

    Vezi
    documentația de ajutor Google Search despre cum să elimini o imagine din rezultatele căutării.


    Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.

  • Metadate imagine în Google Images

    Metadate imagine în Google Images

    Metadate imagine în Google Images

    Când specifici metadatele unei imagini, Google Images poate afișa mai multe detalii despre imagine, cum ar fi cine este creatorul, cum poate fi utilizată imaginea și informații de credit. De exemplu, furnizarea informațiilor de licențiere poate face imaginea eligibilă pentru insigna Licensable, care oferă un link către licență și mai multe detalii despre cum poate fi utilizată imaginea.

    Disponibilitatea funcției

    Această funcție este disponibilă pe mobil și desktop, și în toate regiunile și limbile în care este disponibilă Căutarea Google.

    Pregătește paginile web și imaginile

    Pentru a te asigura că Google poate descoperi și indexa imaginile tale:

    Adaugă date structurate sau metadate foto IPTC

    Pentru a informa Google despre metadatele imaginii tale, adaugă date structurate sau metadate foto IPTC la fiecare imagine de pe site-ul tău. Dacă ai aceeași imagine pe mai multe pagini, adaugă date structurate sau metadate foto IPTC la fiecare imagine de pe fiecare pagină unde apare.

    Există două moduri prin care poți adăuga metadate foto la imaginea ta. Trebuie să furnizezi Google doar o formă de informație pentru a fi eligibil pentru îmbunătățiri precum insigna Licensable, și oricare dintre metodele următoare este suficientă:

    • Date structurate: Datele structurate sunt o asociere între imagine și pagina unde apare cu marcajul. Trebuie să adaugi date structurate pentru fiecare instanță în care este utilizată o imagine, chiar dacă este aceeași imagine.
    • Metadate foto IPTC: Metadatele foto IPTC sunt încorporate în imagine însăși, iar imaginea și metadatele pot fi mutate de la o pagină la alta, rămânând intacte. Trebuie să încorporezi metadatele foto IPTC o singură dată pe imagine.

    Diagrama următoare arată cum pot apărea informațiile despre licență în Google Images:

    Date structurate

    Un mod de a informa Google despre metadatele imaginii tale este să adaugi câmpuri de date structurate. Datele structurate sunt un format standardizat pentru a furniza informații despre o pagină și a clasifica conținutul paginii. Dacă ești nou în datele structurate, poți afla mai multe despre cum funcționează datele structurate.

    Iată o prezentare generală despre cum să construiești, testezi și să lansezi date structurate.

    1. Adaugă proprietățile necesare. În funcție de formatul pe care îl folosești, învață unde să insertezi date structurate pe pagină.
    2. Urmează Ghidurile generale pentru date structurate.
    3. Validează codul tău folosind Testul pentru rezultate bogate.
    4. Publică câteva pagini care includ datele tale structurate și folosește instrumentul de inspecție URL pentru a testa cum vede Google pagina. Asigură-te că pagina ta este accesibilă pentru Google și nu este blocată de un fișier robots.txt, tagul noindex sau cerințe de autentificare. Dacă pagina arată bine, poți cere Google să recrawleze URL-urile tale.
    5. Pentru a menține Google informat despre modificările viitoare, recomandăm să trimiți un sitemap. Poți automatiza acest lucru cu API-ul Sitemap din Search Console.

    Exemple

    Imagine unică

    Iată un exemplu de pagină cu o singură imagine.

    Imagine unică într-un tag srcset

    Iată un exemplu de pagină cu o singură imagine într-un tag srcset.

    Imagini multiple pe o pagină

    Iată un exemplu de pagină cu imagini multiple.

    Definiții de tip pentru date structurate

    Definiția completă a ImageObject este furnizată pe schema.org/ImageObject. Proprietățile suportate de Google sunt următoarele:

    Metadate foto IPTC

    Alternativ, poți încorpora metadate foto IPTC direct într-o imagine. Google recomandă utilizarea software-ului de gestionare a metadatelor pentru a gestiona metadatele imaginii tale. Tabelul următor conține proprietățile pe care Google le extrage:

    Cum pot apărea metadatele C2PA în rezultatele Căutării Google

    Dacă o imagine conține metadate C2PA, Google poate extrage acele detalii și poate afișa informații în funcția “Despre această imagine“, cum ar fi cum a fost creată imaginea sau dacă a fost editată cu instrumente AI. Aceste metadate provin de la un semnatar, care este de obicei o aplicație, un dispozitiv sau un serviciu (de exemplu, software de editare foto, camera însăși sau alte servicii care modifică sau creează imagini) care îndeplinește următoarele condiții:

    • Aplicația, dispozitivul sau serviciul a adoptat versiunea C2PA 2.1 sau mai recentă.
    • Manifestul imaginii trebuie să fie semnat de un certificat de la o Autoritate de Certificare pe Lista de Încredere C2PA.

    Depanare

    Dacă întâmpini probleme în implementarea metadatelor imaginii pentru Google Images, iată câteva resurse care te pot ajuta.

    Este în regulă să elimini metadatele imaginii?

    Eliminarea metadatelor imaginii poate reduce dimensiunea fișierului imaginii, ceea ce ajută paginile web să se încarce mai repede. Totuși, fii atent, deoarece eliminarea metadatelor poate fi ilegală în anumite jurisdicții. Metadatele imaginii furnizează informații despre drepturile de autor și licențiere online. Google recomandă ca, cel puțin, să păstrezi metadatele critice legate de informațiile despre drepturile imaginii și identificare. De exemplu, ori de câte ori este posibil, încearcă să păstrezi câmpurile IPTC creator, linie de credit, și notificare de drepturi de autor pentru a oferi o atribuire corectă.


    Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.

  • Reduceți rata de accesare Google

    Reduceți rata de accesare Google

    Înțelegeți cauza creșterii bruște a accesării

    Creșterea bruscă a accesării poate fi cauzată de ineficiențe în structura site-ului dvs. sau de alte probleme ale site-ului. Pe baza rapoartelor primite în trecut, cele mai comune cauze sunt:

    • Configurarea ineficientă a URL-urilor pe site, care este de obicei cauzată de o funcționalitate specifică a site-ului:

      • Navigație cu fațete sau alte funcționalități de sortare și filtrare ale site-ului
      • Un calendar cu multe URL-uri pentru date specifice
    • O țintă de anunțuri de căutare dinamică

    Google recomandă cu tărie să verificați cu compania de găzduire și să analizați jurnalele de acces recente ale serverului dvs. pentru a înțelege sursa traficului și pentru a vedea dacă se încadrează în cauzele comune menționate ale creșterii bruște a accesării. Apoi, consultați ghidurile Google despre
    gestionarea accesării URL-urilor cu navigație cu fațete
    și
    optimizarea eficienței accesării.

    Reduceți urgent traficul crawler-ului (pentru situații de urgență)

    Dacă trebuie să reduceți urgent rata de accesare pentru o perioadă scurtă de timp (de exemplu, câteva ore sau 1-2 zile), atunci returnați codurile de stare HTTP 500, 503 sau 429 în loc de 200 la cererile de accesare. Infrastructura de accesare Google reduce rata de accesare a site-ului dvs. atunci când întâlnește un număr semnificativ de URL-uri cu coduri de stare HTTP 500, 503 sau 429 (de exemplu, dacă
    ați dezactivat site-ul dvs.).
    Rata redusă de accesare afectează întregul nume de gazdă al site-ului dvs. (de exemplu, subdomain.example.com), atât accesarea URL-urilor care returnează erori, cât și a celor care returnează conținut. Odată ce numărul acestor erori este redus, rata de accesare va începe automat să crească din nou.

    Cereri excepționale pentru reducerea ratei de accesare

    Dacă returnarea erorilor către crawler-ele Google nu este fezabilă pe infrastructura dvs.,
    depuneți o cerere specială
    pentru a raporta o problemă cu o rată de accesare neobișnuit de mare, menționând rata optimă pentru site-ul dvs. în cererea dvs. Nu puteți solicita o creștere a ratei de accesare, iar evaluarea și îndeplinirea cererii poate dura câteva zile.


    Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.

  • Tipuri de fișiere indexabile de Google

    Tipuri de fișiere indexabile de Google

    Tipuri de fișiere plate suportate

    Google poate indexa conținutul majorității fișierelor textuale și a anumitor formate de documente codificate. Tipul de fișier este determinat de antetul HTTP Content-Type returnat atunci când Google accesează fișierul, deși în unele cazuri Google poate folosi extensia fișierului sau poate re-analiza fișierul folosind un alt parser dacă antetul Content-Type lipsește sau este incorect.

    Următoarele tipuri de fișiere plate sunt suportate. Acestea sunt fișiere în care conținutul este stocat în text simplu, necodificat (deși pot folosi etichete de marcare).

    • Valori separate prin virgulă (.csv)
    • Google Earth (.kml, .kmz)
    • Format de schimb GPS (.gpx)
    • (.htm, ., alte extensii de fișiere)
    • Grafică vectorială scalabilă (.svg)
    • TeX/LaTeX (.tex)
    • Text (.txt, .text, alte extensii de fișiere), inclusiv cod sursă în limbaje de programare comune, cum ar fi:

      • Cod sursă Basic (.bas)
      • Cod sursă C/C++ (.c, .cc, .cpp, .cxx, .h, .hpp)
      • Cod sursă C# (.cs)
      • Cod sursă Java (.java)
      • Cod sursă Perl (.pl)
      • Cod sursă Python (.py)
    • Limbaj de marcare wireless (.wml, .wap)
    • XML (.xml)

    Tipuri de fișiere codificate suportate

    Următoarele tipuri de fișiere codificate sunt suportate. Acestea sunt fișiere binare sau containere complexe care necesită un parser specific pentru a extrage textul lizibil de către oameni.

    • Format de document portabil Adobe (.pdf)
    • PostScript Adobe (.ps)
    • Publicație electronică (.epub)
    • Hancom Hanword (.hwp)
    • Microsoft Excel (.xls, .xlsx)
    • Microsoft PowerPoint (.ppt, .pptx)
    • Microsoft Word (.doc, .docx)
    • Prezentare OpenOffice (.odp)
    • Foaie de calcul OpenOffice (.ods)
    • Text OpenOffice (.odt)
    • Format de text îmbogățit (.rtf)

    Formate media suportate

    Google poate indexa și următoarele formate media:

    • Formate de imagine: BMP, GIF, JPEG, PNG, WebP, SVG și AVIF
    • Formate video: 3GP, 3G2, ASF, AVI, DivX, M2V, M3U, M3U8, M4V, MKV, MOV, MP4, MPEG, OGV, QVT, RAM, RM, VOB, WebM, WMV și XAP

    Căutare după tip de fișier

    Poți folosi operatorul filetype: în Căutarea Google pentru a limita rezultatele la un anumit tip de fișier sau extensie de fișier. De exemplu, filetype:rtf galway va căuta fișiere RTF și URL-uri care se termină în .rtf al căror conținut conține termenul “galway“.


    Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.

  • Remediază conținutul încărcat lazy

    Remediază conținutul încărcat lazy

    Încarcă conținutul când este vizibil în viewport

    Pentru a te asigura că Google vede tot conținutul de pe pagina ta, asigură-te că implementarea încărcării lazy încarcă tot conținutul relevant ori de câte ori acesta este vizibil în viewport. Iată câteva metode de a implementa încărcarea lazy:

    Metodele menționate nu se bazează pe acțiuni ale utilizatorului, cum ar fi derularea sau clicurile, pentru a încărca conținutul, ceea ce este important deoarece Google Search nu interacționează cu pagina ta.

    Nu adăuga încărcare lazy la conținutul care este probabil să fie vizibil imediat când un utilizator deschide o pagină. Acest lucru ar putea face ca încărcarea și afișarea conținutului în browser să dureze mai mult, ceea ce va fi foarte vizibil pentru utilizator.

    Asigură-te că testezi implementarea ta.

    Suportă încărcarea paginată pentru derularea infinită

    La un nivel înalt, derularea infinită este o tehnică ce încarcă mai mult conținut, mai multe pagini distincte, pe măsură ce utilizatorul derulează în jos pe o pagină lungă. Acesta ar putea fi un articol lung împărțit în mai multe bucăți sau o colecție de elemente împărțită similar în bucăți. Pentru a implementa derularea infinită într-un mod indexabil, asigură-te că site-ul tău suportă încărcarea paginată a acestor bucăți prin următoarele acțiuni:

    • Oferă fiecărei bucăți un URL unic și persistent.
    • Asigură-te că conținutul afișat pe fiecare URL rămâne același de fiecare dată când este încărcat într-un browser. O modalitate de a face acest lucru este să folosești numere de pagină absolute în URL, de exemplu folosind ?page=12 ca parametru de interogare.
    • Evită utilizarea elementelor relative precum ?date=yesterday în aceste URL-uri. Acest lucru permite motoarelor de căutare și utilizatorilor să găsească în mod constant același conținut sub un URL dat, facilitând indexarea corectă a conținutului de către motoarele de căutare și permițând utilizatorilor să partajeze și să revină la acea parte a conținutului tău.
    • Leagă secvențial URL-urile individuale astfel încât motoarele de căutare să poată descoperi URL-urile într-un set paginat. Află mai multe despre cele mai bune practici atunci când implementezi paginarea.
    • Când o nouă bucată de pagină este încărcată ca răspuns la derularea utilizatorului și devine elementul principal vizibil pentru utilizator, actualizează URL-ul afișat folosind API-ul History. Acest lucru permite utilizatorului să reîmprospăteze, să partajeze și să facă legătura cu URL-ul curent afișat în browser.

    Testează

    După ce ai configurat implementarea, asigură-te că funcționează corect. Poți folosi Instrumentul de Inspectare a URL-urilor din Search Console pentru a vedea dacă tot conținutul a fost încărcat. Verifică -ul redat pentru a te asigura că conținutul tău este în -ul redat căutându-l în Instrumentul de Inspectare a URL-urilor. Dacă URL-urile imaginilor sau videoclipurilor tale apar în atributul src pe elementele <img> sau <video> din -ul redat, configurarea ta funcționează corect.


    Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.

  • Optimizează bugetul de crawl

    Optimizează bugetul de crawl

    Optimizează bugetul de crawl

    Acest ghid descrie cum să optimizezi crawl-ul Google pentru site-uri foarte mari și frecvent actualizate.

    Dacă site-ul tău nu are un număr mare de pagini care se schimbă rapid sau dacă paginile tale par să fie crawl-uite în aceeași zi în care sunt publicate, nu este necesar să citești acest ghid. Pentru Google Search, este suficient să
    menții sitemap-ul actualizat și să
    verifici acoperirea indexului în mod regulat.

    Pentru cine este acest ghid

    Deși recomandările din acest ghid sunt, în general, bune practici, acesta este un ghid avansat destinat în principal următoarelor tipuri de site-uri:

    • Site-uri mari (peste 1 milion de pagini unice) cu conținut care se schimbă moderat de des (o dată pe săptămână)
    • Site-uri medii sau mai mari (peste 10.000 de pagini unice) cu conținut care se schimbă foarte rapid (zilnic)
    • Site-uri cu o mare parte din totalul URL-urilor clasificate de Search Console ca
      Descoperite – momentan neindexate

    Teoria generală a crawl-ului


    Web-ul este un spațiu aproape infinit, depășind capacitatea Google de a explora și indexa fiecare URL disponibil. Ca rezultat, există limite în ceea ce privește cât timp pot petrece crawlerele Google pe un singur site, unde un site este definit de numele de gazdă. De exemplu, https://www.example.com/ și https://code.example.com/ sunt două nume de gazdă diferite și, prin urmare, au bugete de crawl separate. Cantitatea de timp și resurse pe care Google le alocă pentru a crawl-ui un site este denumită în mod obișnuit bugetul de crawl al site-ului și este determinată de două elemente principale: limita capacității de crawl și cererea de crawl.

    Limita capacității de crawl

    Google dorește să crawl-uiască site-ul tău fără a suprasolicita serverele tale. Pentru a preveni acest lucru, crawlerele Google calculează o limită a capacității de crawl, care este numărul maxim de conexiuni paralele simultane pe care Google le poate folosi pentru a crawl-ui un site, precum și întârzierea dintre preluări. Aceasta este calculată pentru a oferi acoperire pentru tot conținutul tău important fără a suprasolicita serverele tale.

    Limita capacității de crawl poate crește sau scădea în funcție de câțiva factori:

    • Sănătatea crawl-ului: Dacă site-ul răspunde rapid pentru o perioadă, limita crește, ceea ce înseamnă că mai multe conexiuni pot fi folosite pentru a crawl-ui. Dacă site-ul încetinește sau răspunde cu erori de server, limita scade și Google crawl-uiește mai puțin.
    • Limitele de crawl ale Google: Google are multe mașini, dar nu infinite. Trebuie să facem alegeri cu resursele pe care le avem.

    Cererea de crawl

    Fiecare crawler are propria sa “cerere” când vine vorba de crawl-ul web-ului. De exemplu, AdsBot are în general o cerere mai mare atunci când un site rulează ținte dinamice de anunțuri, Google Shopping are o cerere mai mare pentru produsele pe care le ai în feed-urile tale de comercianți, iar cererea Googlebot variază în funcție de dimensiunea site-ului, frecvența actualizărilor, calitatea paginii și relevanța, comparativ cu alte site-uri.

    În general, factorii care joacă un rol semnificativ în determinarea cererii de crawl sunt:

    • Inventarul perceput: Fără îndrumare din partea ta, Google încearcă să crawl-uiască toate sau majoritatea URL-urilor pe care le cunoaște despre site-ul tău. Dacă multe dintre aceste URL-uri sunt duplicate sau nu dorești să fie crawl-uite din alte motive (eliminate, neimportante etc.), acest lucru irosește mult timp de crawl Google pe site-ul tău. Acesta este factorul pe care îl poți controla cel mai pozitiv.
    • Popularitatea: URL-urile care sunt mai populare pe Internet tind să fie crawl-uite mai des pentru a le menține mai proaspete în sistemele noastre.
    • Vechea: Sistemele noastre doresc să recrawl-uiască documentele suficient de frecvent pentru a detecta orice schimbări.

    În plus, evenimente la nivel de site, cum ar fi mutările de site, pot declanșa o creștere a cererii de crawl pentru a reprocesa conținutul sub noile URL-uri.

    În concluzie

    Luând în considerare capacitatea de crawl și cererea de crawl împreună, Google definește bugetul de crawl al unui site ca setul de URL-uri pe care Google le poate și dorește să le crawl-uiască. Chiar dacă limita capacității de crawl nu este atinsă, dacă cererea de crawl este scăzută, Google va crawl-ui mai puțin site-ul tău.

    Cele mai bune practici

    Pentru a maximiza eficiența crawl-ului, urmează aceste bune practici:

    • Gestionează inventarul URL-urilor: Folosește instrumentele adecvate pentru a spune Google ce pagini să crawl-uiască și ce pagini să nu crawl-uiască. Dacă Google petrece prea mult timp crawl-uind URL-uri pe care nu ar trebui, crawlerele Google ar putea decide că nu merită timpul să se uite la restul site-ului tău (sau să-ți mărească bugetul pentru a face acest lucru).
      • Consolidează conținutul duplicat.
        Elimină conținutul duplicat pentru a concentra crawl-ul pe conținut unic, mai degrabă decât pe URL-uri unice.
      • Blochează crawl-ul URL-urilor folosind robots.txt. Unele pagini ar putea fi importante pentru utilizatori, dar nu dorești neapărat să apară pe suprafețele Google sau să fie reprocesate de sistemele Google. De exemplu, pagini cu derulare infinită care duplică informații pe paginile legate sau versiuni sortate diferit ale aceleași pagini. Dacă nu le poți consolida așa cum este descris în primul punct, blochează aceste pagini neimportante folosind
        robots.txt. Blocarea URL-urilor cu robots.txt împiedică Google să le crawl-uiască și reduce semnificativ șansa ca URL-urile să fie procesate de alte sisteme Google (cum ar fi indexarea de către Google Search).

      • Returnează un cod de stare 404 sau 410 pentru paginile eliminate permanent. Google nu va uita un URL pe care îl cunoaște, dar un cod de stare 404 este un semnal puternic pentru a nu crawl-ui acel URL din nou. URL-urile blocate, totuși, vor rămâne parte din coada ta de crawl mult mai mult timp și vor fi recrawl-uite când blocarea este eliminată.
      • Elimină erorile soft 404. Paginile soft 404 vor continua să fie crawl-uite și vor irosi bugetul tău. Verifică
        raportul de acoperire a indexului pentru erori soft 404.
      • Menține sitemap-urile actualizate. Google citește sitemap-ul tău în mod regulat, așa că asigură-te că incluzi tot conținutul pe care dorești ca Google să-l crawl-uiască. Dacă site-ul tău include conținut actualizat, recomandăm includerea tag-ului <lastmod>.
      • Evită lanțurile lungi de redirecționare, care au un efect negativ asupra crawl-ului.
    • Fă paginile tale eficiente de încărcat.
      Dacă Google poate încărca și reda paginile tale mai rapid, ar putea citi mai mult conținut de pe site-ul tău.
    • Depanează problemele cu bugetul de crawl.
      Verifică dacă site-ul tău a avut probleme de disponibilitate în timpul crawl-ului și caută modalități de a face crawl-ul mai eficient.

    Cum obțin mai mult buget de crawl?

    Există două modalități de a crește bugetul de crawl:

    • Adaugă mai multe resurse de server: Dacă site-ul tău nu poate fi crawl-uit din cauza capacității serverului de pe partea ta (de exemplu, primești
      Hostload depășit în instrumentul de inspecție URL), adaugă mai multe resurse de server dacă acest lucru are sens pentru afacerea ta.
    • Optimizează calitatea conținutului tău pentru produsul Google pe care îl vizezi: Google determină resursele de crawl alocate fiecărui site prin factorizarea elementelor relevante pentru produsul Google specific. De exemplu, pentru Google Search, acest lucru include lucruri precum popularitatea, valoarea generală pentru utilizatori, unicitatea conținutului și capacitatea de servire.

    Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.

  • Cum să muți un site

    Cum să muți un site

    Prezentare generală

    1. Practici generale recomandate pentru mutarea site-urilor.
      Află la ce să te aștepți și cum ar putea afecta utilizatorii și clasamentele tale. Dacă te muți de la HTTP la HTTPS, revizuiește
      cele mai bune practici pentru HTTPS.
    2. Pregătește noul site și testează-l temeinic.
    3. Pregătește o mapare a URL-urilor de la URL-urile curente la formatul lor nou corespunzător.
    4. Începe mutarea site-ului configurând serverul pentru a redirecționa de la URL-urile vechi la cele noi.
    5. Monitorizează traficul pe ambele URL-uri, vechi și noi.

    Practici generale recomandate pentru mutarea site-urilor

    • Împarte mutarea în pași mai mici, dacă are sens pentru site-ul tău.
      Dacă site-ul tău este mare și este tehnic posibil, Google recomandă să muți inițial doar o parte a site-ului pentru a testa orice efecte asupra traficului și indexării în căutare. După aceea, poți muta restul site-ului dintr-o dată sau în bucăți. Când alegi secțiunea inițială de testare a site-ului, alege o secțiune care se schimbă mai rar și nu este semnificativ afectată de evenimente frecvente sau imprevizibile. De asemenea, ține cont că, deși mutarea unei singure secțiuni este o modalitate excelentă de a testa mutarea, nu este neapărat reprezentativă pentru o mutare completă a site-ului în ceea ce privește Căutarea. Cu cât muți mai multe pagini, cu atât este mai probabil să întâlnești probleme suplimentare de rezolvat. Planificarea atentă poate minimiza problemele.
    • Schimbă un singur lucru la un moment dat
      Planifică-ți schimbările pe site una după alta, nu toate în același timp. De exemplu, dacă dorești să muți site-ul pe un nou nume de domeniu, să schimbi sistemul de gestionare a conținutului (CMS) și să actualizezi site-ul pentru a folosi un nou layout, fă-le pe rând: mută-te pe un nou domeniu, apoi schimbă layout-ul site-ului.
    • Programează mutarea să coincidă cu perioade de trafic mai scăzut, dacă este posibil.
      Dacă traficul tău este sezonier sau scade în anumite zile ale săptămânii, are sens să muți site-ul în timpul acestor scăderi recurente de trafic. Acest lucru înseamnă că mai puțini oameni vor fi afectați de problemele potențiale care pot apărea în timpul mutării site-ului, iar mai multe resurse ale serverului tău pot fi dedicate pentru crawling-ul site-ului de către Googlebot.
    • Așteaptă-te la fluctuații temporare în clasamentul site-ului în timpul mutării.
      Cu orice schimbare semnificativă a unui site, poți experimenta fluctuații de clasament în timp ce Google recrawlează și reindexează site-ul tău. Ca regulă generală, un site de dimensiuni medii poate dura câteva săptămâni pentru ca majoritatea paginilor să fie mutate în indexul nostru; site-urile mai mari pot dura mai mult. Viteza cu care Googlebot și sistemele noastre descoperă și procesează URL-urile mutate depinde în mare măsură de numărul de URL-uri și de viteza serverului tău.
      Trimiterea unui sitemap poate ajuta la accelerarea procesului de descoperire și este în regulă să muți site-ul în secțiuni.
    • Nu te îngrijora de creditul link-urilor.
      301 și
      alte redirecționări permanente
      nu cauzează pierderi în
      PageRank.
    • Folosește Search Console.
      Search Console este prietenul tău, mai ales în timpul unei mutări de site. Verifică datele pentru fiecare proprietate separat în Search Console. Folosește
      raportul Index Status
      pentru o privire de ansamblu. Folosește
      raportul Sitemaps
      pentru a vedea câte URL-uri trimise într-un sitemap au fost indexate.
    • Fii răbdător, acordă-i timp
      Pentru a considera o mutare de site completă, Googlebot va trebui să viziteze fiecare URL de pe vechiul și noul tău site cel puțin o dată. Nu există frecvențe fixe de crawling; cât de rapid crawl-ează Googlebot depinde de dimensiunea site-ului tău și de viteza de crawling posibilă. Mutarea are loc pe baza fiecărui URL în parte.

    Pregătește noul site

    Detaliile pregătirii site-ului variază pentru fiecare mutare de site, dar de obicei vei face una sau mai multe dintre următoarele:

    • Configurează CMS-ul (de preferință același pe care l-a folosit site-ul vechi) și importă conținutul de pe site-ul vechi.
    • Transferă imaginile și descărcările (cum ar fi documentele PDF) pe care le găzduiești.
      Acestea ar putea deja să primească trafic din Căutarea Google sau link-uri, și este util să informezi utilizatorii și Googlebot despre noua lor locație.
    • Pentru o mutare la HTTPS, obține și configurează certificatele TLS necesare pe serverul tău.
    • Configurează un fișier robots.txt pentru noul site și asigură-te că regulile din fișierul robots.txt al noului site reflectă corect părțile pe care dorești să le blochezi de la crawling.

      Reține că unii proprietari de site-uri blochează tot crawling-ul în timpul dezvoltării. Dacă urmezi această strategie, asigură-te că pregătești cum ar trebui să arate fișierul robots.txt odată ce începe mutarea site-ului. De asemenea, dacă folosești reguli noindex în timpul dezvoltării, pregătește o listă de URL-uri de la care vei elimina regulile noindex când începi mutarea site-ului.

    • Furnizează erori pentru conținutul șters sau fuzionat dacă nu muți pe noul site tot conținutul vechi, asigură-te că acele URL-uri returnează corect un cod de răspuns HTTP 404 sau 410 pe noul site.

    • Asigură-te că setările Search Console sunt corecte și pot ajuta la mutarea site-ului.

      Dacă nu ai făcut-o deja,
      verifică
      atât site-urile vechi, cât și cele noi în Search Console. Asigură-te că verifici toate variantele atât ale site-ului vechi, cât și ale celui nou. De exemplu, verifică www.example.com și example.com, și include atât variantele de site HTTPS, cât și HTTP dacă folosești URL-uri HTTPS. Fă acest lucru pentru ambele site-uri, vechi și noi.

      • Revizuiește verificarea Search Console

        Asigură-te că verificarea Search Console va continua să funcționeze după mutarea site-ului. Dacă folosești o metodă diferită de verificare, ține cont că tokenurile de verificare pot fi diferite atunci când URL-ul se schimbă.

        Dacă folosești metoda
        fișierului
        pentru a verifica proprietatea site-ului tău în Search Console, asigură-te că nu uiți să incluzi fișierul de verificare curent în noua copie a site-ului.

        De asemenea, dacă verifici proprietatea cu un fișier de includere care face referire la
        meta tag
        sau
        Google Analytics
        pentru a verifica proprietatea, asigură-te că noua copie CMS include și acestea.

      • Revizuiește orice setări configurate în Search Console pe care le-ai făcut pentru site-ul vechi și asigură-te că setările noului site sunt actualizate pentru a reflecta acele schimbări. De exemplu:

        • Rata de crawling:
          Setează rata de crawling la “Lasă Googlebot să determine” pentru ambele site-uri, vechi și noi.
        • Backlink-uri dezavuate:
          Dacă ai încărcat un fișier pentru a dezavua link-uri pe site-ul tău vechi, Google recomandă să-l încarci din nou folosind contul Search Console al noului site.
      • Curăță domeniul recent achiziționat; vei dori să te asiguri că este curat de orice probleme restante de la proprietarul anterior. Verifică următoarele setări:

        • Acțiuni manuale
          pentru spam anterior. Dacă există acțiuni manuale aplicate noului site, abordează orice probleme listate acolo și depune o
          cerere de reconsiderare.
        • URL-uri eliminate.
          Asigură-te că nu există eliminări de URL-uri rămase de la proprietarul anterior, în special o eliminare de URL-uri la nivel de site.
    • Folosește analize web pentru a analiza utilizarea pe ambele site-uri, vechi și noi. Software-ul de analize web poate ajuta cu acest lucru. De obicei, configurarea analizelor web constă într-o bucată de JavaScript încorporată în paginile tale. Detaliile pentru urmărirea diferitelor site-uri variază în funcție de software-ul tău de analize și de setările sale de înregistrare, procesare sau filtrare. Verifică cu furnizorul tău de software de analize pentru ajutor. În plus, dacă ai planificat să faci modificări de configurare la software-ul tău de analize, acum este un moment bun. Dacă folosești Google Analytics, ia în considerare crearea unui nou profil pentru noul tău site dacă dorești o separare clară în rapoartele tale de conținut.

    • Asigură-te că serverul tău are suficiente resurse de calcul: după o migrare, Google va crawl-ui temporar noul tău site mai intens decât de obicei. Acest lucru se datorează faptului că site-ul tău redirecționează traficul de la vechiul la noul site, și orice crawl-uri ale vechiului site vor fi redirecționate către noul site, în plus față de orice alt crawling. Asigură-te că noul tău site are capacitate suficientă pentru a face față traficului crescut de la Google. Dacă site-ul tău este deosebit de mare, ia legătura cu furnizorii tăi de hosting și informează-i despre mutarea site-ului pe care o planifici.

    Pregătește maparea URL-urilor

    Este important să mapezi URL-urile vechi ale site-ului tău la URL-urile pentru noul site. Această secțiune descrie o serie de abordări generale pe care le poți lua pentru a evalua corect URL-urile de pe cele două site-uri și pentru a facilita maparea. Detaliile exacte ale modului în care generezi această mapare vor varia în funcție de infrastructura actuală a site-ului tău și de detaliile mutării site-ului.

    Determină URL-urile vechi

    În cele mai simple mutări de site, s-ar putea să nu fie nevoie să generezi o listă a URL-urilor tale vechi. De exemplu, ai putea folosi o redirecționare wildcard pe partea de server dacă schimbi domeniul site-ului tău (de exemplu, mutându-te de la example.com la example.net).

    În mutările de site mai complexe, va trebui să generezi o listă de URL-uri vechi și să le mapezi la noile lor destinații. Cum obții o listă de URL-uri vechi depinde de configurația actuală a site-ului tău, dar iată câteva sfaturi utile:

    • Începe cu URL-urile tale importante. Pentru a le găsi:

      • Uită-te în sitemaps
        deoarece este probabil ca URL-urile tale cele mai importante să fi fost trimise în Search Console în acest fel
      • Verifică jurnalele serverului sau software-ul de analize pentru URL-urile care primesc cel mai mult trafic
      • Verifică
        Funcția de link-uri către site-ul tău
        în Search Console pentru paginile care au link-uri interne și externe
    • Folosește sistemul tău de gestionare a conținutului, care poate oferi de obicei o modalitate simplă de a obține o listă a tuturor URL-urilor care găzduiesc conținut.
    • Verifică jurnalele serverului tău pentru URL-uri care au fost vizitate cel puțin o dată recent. Alege o perioadă de timp care are sens pentru site-ul tău, ținând cont de variația sezonieră a traficului.
    • Include imagini și videoclipuri—Asigură-te că incluzi URL-urile conținutului încorporat în planurile tale de mutare a site-ului: videoclipuri, imagini, fișiere JavaScript și CSS. Aceste URL-uri trebuie mutate în același mod ca și tot conținutul de pe site-ul tău.

    Creează o mapare a URL-urilor vechi către cele noi

    Odată ce ai lista de URL-uri vechi, decide unde ar trebui să redirecționeze fiecare. Cum stochezi această mapare depinde de serverele tale și de mutarea site-ului. Ai putea folosi o bază de date sau să configurezi câteva reguli de rescriere a URL-urilor pe sistemul tău pentru modele comune de redirecționare.

    Actualizează toate detaliile URL-urilor pe noul site

    Odată ce ai definit maparea URL-urilor, vei dori să faci trei lucruri pentru a pregăti paginile pentru a primi trafic.

    1. Actualizează adnotările pentru a indica noile URL-uri în sau în intrarea sitemap pentru fiecare pagină:

      1. Fiecare nou URL ar trebui să aibă un tag
        rel="canonical" <link> auto-referențial.
      2. Dacă site-ul pe care l-ai mutat are pagini multilingve sau multinaționale adnotate folosind
        rel-alternate-hreflang adnotări,
        asigură-te că actualizezi adnotările pentru a folosi noile URL-uri.
    2. Actualizează link-urile interne.
      Schimbă link-urile interne de pe noul site de la URL-urile vechi la noile URL-uri. Poți folosi maparea generată anterior pentru a ajuta la găsirea și actualizarea link-urilor după cum este necesar.
    3. Salvează următoarele liste pentru mutarea finală:

    Planifică-ți strategia de redirecționare

    Odată ce ai o mapare și noul tău site este gata, următorul pas este să-ți planifici strategia de redirecționare. Google recomandă redirecționări permanente pe partea de server
    de la URL-urile vechi la noile URL-uri așa cum ai indicat în mapare. Verifică cu administratorul serverului tău (sau compania de hosting) ce fel de redirecționări pe partea de server poți face tehnic. Ar putea fi reguli de redirecționare în fișierele tale .htaccess dacă serverul tău folosește
    Apache HTTP server sau funcții de redirecționare în CMS-ul tău.

    Dacă niciuna dintre configurările de redirecționare pe partea de server nu este posibilă, poți recurge la redirecționări pe partea de client ca ultimă soluție.

    Decide cum vei muta site-ul – totul dintr-o dată sau în secțiuni:

    • Site-uri mici sau medii: Google recomandă să muți toate URL-urile de pe site-ul tău simultan în loc să muți o secțiune la un moment dat. Acest lucru ajută utilizatorii să interacționeze mai bine cu site-ul în noua sa formă și ajută algoritmii să detecteze mutarea site-ului și să actualizeze indexul mai rapid.
    • Site-uri mari: Poți alege să muți site-uri mai mari o secțiune la un moment dat. Acest lucru poate face mai ușor să monitorizezi, să detectezi și să rezolvi problemele mai rapid.

    Ține cont de următoarele:

    • Folosește redirecționări permanente pe partea de server dacă este posibil tehnic. Deși Googlebot suportă
      mai multe tipuri de redirecționări, Google recomandă să folosești redirecționări permanente HTTP dacă este posibil, cum ar fi 301 și 308.
    • Evită lanțurile de redirecționare. Deși Googlebot poate
      urma până la 10 salturi
      într-un “lanț” de redirecționări multiple (de exemplu, Pagina 1
      > Pagina 2
      > Pagina 3), Google recomandă să redirecționezi direct la destinația finală. Dacă acest lucru nu este posibil, menține numărul de redirecționări în lanț scăzut, ideal nu mai mult de 3 și mai puțin de 5. Lanțurile de redirecționare adaugă latență pentru utilizatori, și nu toate agențiile de utilizatori și browserele suportă lanțuri lungi de redirecționare.

    Începe mutarea site-ului

    Odată ce maparea URL-urilor este corectă și ai finalizat planul pentru cum vei redirecționa, ești gata să muți.

    1. Implementează sau activează redirecționările: în funcție de deciziile tale privind strategia de redirecționare, acest lucru ar putea însemna să faci un update la fișierele de configurare ale serverului tău sau să actualizezi CMS-ul tău, probabil cu cod personalizat.


    2. Verifică adnotările rel="canonical" link și regulile robots meta:

      Odată ce redirecționările sunt active, asigură-te că adnotările rel="canonical"
      link de pe noul site folosesc noile URL-uri. În mod similar, dacă ai adăugat reguli noindex robots meta pe noul site pentru a evita indexarea prematură a noilor URL-uri, asigură-te că le actualizezi.
    3. Testează redirecționările. Poți folosi
      Instrumentul de inspectare a URL-urilor
      pentru a testa URL-uri individuale sau instrumente de linie de comandă sau scripturi pentru a testa un număr mare de URL-uri.

    4. Trimite o
      Schimbare de adresă
      în Search Console pentru site-ul vechi
      .

    5. Păstrează redirecționările cât mai mult posibil, în general cel puțin 1 an.
      Acest interval de timp permite Google să transfere toate semnalele către noile URL-uri, inclusiv recrawling-ul și realocarea link-urilor de pe alte site-uri care indică URL-urile tale vechi.

      Din perspectiva utilizatorilor, ia în considerare păstrarea redirecționărilor pe termen nelimitat. Totuși, redirecționările sunt lente pentru utilizatori, așa că încearcă să actualizezi propriile link-uri și orice link-uri cu volum mare de pe alte site-uri pentru a indica noile URL-uri.

    6. Trimite noul sitemap în Search Console. Acest lucru va ajuta Google să afle despre noile URL-uri. În acest moment poți elimina vechiul sitemap, deoarece Google va folosi noul sitemap de acum înainte.

    Timpul necesar pentru ca Googlebot și sistemele noastre să descopere și să proceseze toate URL-urile în mutarea site-ului depinde de cât de rapide sunt serverele tale și de câte URL-uri sunt implicate. Ca regulă generală, un site mic până la mediu poate dura câteva săptămâni pentru ca majoritatea paginilor să fie mutate, iar site-urile mai mari durează mai mult. Viteza cu care Googlebot și sistemele noastre descoperă și procesează URL-urile mutate depinde de numărul de URL-uri și de viteza serverului.

    Imediat după ce mutarea site-ului a început, încearcă să actualizezi cât mai multe link-uri posibil pentru a îmbunătăți experiența utilizatorului și a reduce încărcarea serverului tău. Acestea includ:

    • Link-uri interne: pe baza mapării URL-urilor pe care ai creat-o anterior, înlocuiește toate URL-urile care indicau către propriile tale pagini.
    • Link-uri externe: Încearcă să contactezi site-urile din lista salvată de site-uri care fac link către conținutul tău curent, cerându-le să-și actualizeze link-urile către noul tău site. Ia în considerare prioritizarea eforturilor tale în funcție de numărul de vizite de intrare pentru fiecare link.
    • Link-uri de profil, cum ar fi de pe Facebook, Twitter și LinkedIn.
    • Campanii publicitare pentru a indica noile pagini de destinație.

    Monitorizează traficul

    Odată ce ai început mutarea site-ului, monitorizează cum se schimbă traficul utilizatorilor și al crawler-ului pe noul site și, de asemenea, pe vechiul site. Ideal, traficul pe vechiul site va scădea, în timp ce pe noul site traficul va crește. Poți monitoriza activitatea utilizatorilor și a crawler-ului pe site-uri cu
    Search Console
    și alte instrumente.

    Folosește Search Console pentru a monitoriza traficul

    Multe funcții ale Search Console te ajută să monitorizezi o mutare de site, inclusiv:

    • Sitemaps:
      Trimite cele două sitemaps pe care le-ai salvat anterior din mapare. Inițial, sitemap-ul care conține noile URL-uri ar avea zero pagini indexate, în timp ce sitemap-ul URL-urilor vechi ar avea multe pagini indexate. În timp, numărul de pagini indexate din sitemap-ul URL-urilor vechi ar scădea la zero, cu o creștere corespunzătoare a indexării noilor URL-uri. Reține că Search Console poate afișa avertismente pentru sitemap-ul care conține URL-urile vechi despre redirecționarea URL-urilor; acest lucru este normal și poți ignora aceste avertismente: la urma urmei, te muți la noi URL-uri.
    • Raportul de acoperire a indexului:
      Graficele ar reflecta mutarea site-ului, arătând o scădere a numărului de URL-uri indexate pe vechiul site și o creștere a indexării pe noul site. Verifică regulat pentru orice erori de crawling neașteptate.
    • Interogări de căutare:
      Pe măsură ce mai multe pagini ale noului site sunt indexate și încep să se claseze, rapoartele de interogări de căutare ar începe să arate URL-urile de pe noul site obținând impresii și clicuri de căutare.

    Folosește alte instrumente pentru a monitoriza traficul

    Fii atent la jurnalele de acces și de erori ale serverului tău. În special, verifică pentru crawling de către Googlebot, orice URL-uri care returnează în mod neașteptat coduri de stare HTTP de eroare și traficul normal al utilizatorilor.

    Dacă ai instalat vreun software de analize web pe site-ul tău sau dacă CMS-ul tău oferă analize, este de asemenea recomandat să revizuiești traficul în acest fel, astfel încât să poți vedea progresul traficului de la vechiul la noul site. În special, Google Analytics oferă raportare în timp real, și aceasta este o caracteristică utilă de utilizat în timpul fazei inițiale de mutare a site-ului. Ar trebui să te aștepți să vezi o scădere a traficului pe vechiul site și o creștere pe noul site.

    Mai multe resurse

    Migrațiile de site-uri pot fi copleșitoare și complicate, așa că există multe abordări despre cum să procedezi. Google a găsit
    listele de verificare pentru migrarea site-urilor ale Aleyda Solis
    deosebit de utile, precum și
    ghidul de utilizare a instrumentului Screaming Frog pentru migrarea site-urilor.

    Dacă ești blocat în orice punct, caută ajutor pe Google Search Central.
    Există o mulțime de sfaturi bune pe
    pagina noastră de ajutor și cazuri specifice răspunse în
    forumurile noastre de utilizatori.
    Dacă nu poți găsi un răspuns, poți pune o întrebare unuia dintre specialiștii Google Search în timpul
    orelor de birou SEO.

    Depanarea mutării site-ului tău

    Iată câteva greșeli comune atunci când migrezi un site cu schimbări de URL-uri (inclusiv de la HTTP la HTTPS). Aceste greșeli pot împiedica indexarea completă a noului tău site.

    Greșeli comune

    noindex sau blocuri robots.txt

    Nu uita să elimini orice noindex sau blocuri robots.txt care au fost necesare doar pentru migrare.

    Este în regulă dacă nu ai un fișier robots.txt pe site-ul tău, dar asigură-te că returnezi un cod de stare HTTP 404 corect dacă fișierul robots.txt nu există.

    Pentru a testa:

    • Examinează fișierul tău robots.txt în site-ul HTTPS și vezi dacă ceva trebuie schimbat.
    • Folosește
      instrumentul de inspectare a URL-urilor
      pentru orice pagini care par să lipsească din Google pe noul site.

    Redirecționări incorecte

    Verifică redirecționările de la vechiul site la cel nou. Vedem frecvent oameni care redirecționează către URL-uri greșite (inexistente) pe noul site.

    Poți folosi Search Console pentru a vedea dacă există un număr neobișnuit de mare de erori “Nu a fost găsit” raportate sau poți folosi alte instrumente, cum ar fi
    Screaming Frog
    pentru a-ți crawl-ui propriul site și a vedea dacă redirecționările funcționează așa cum te aștepți.

    Alte erori de crawling

    Examinează raportul de acoperire a indexului
    pentru o creștere a altor erori pe noul tău site în timpul evenimentelor de migrare.

    Capacitate insuficientă a serverului

    După o migrare, Google va crawl-ui noul tău site mai intens decât de obicei. Acest lucru se datorează faptului că site-ul tău redirecționează traficul de la vechiul la noul site, și orice crawl-uri ale vechiului site vor fi redirecționate către noul site, în plus față de orice alt crawling. Asigură-te că site-ul tău are capacitate suficientă pentru a face față traficului crescut de la Google.

    Neactualizarea sitemaps

    Asigură-te că toate sitemaps-urile tale sunt actualizate cu noile URL-uri.


    Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.

  • Depanarea erorilor de crawling Google Search

    Depanarea erorilor de crawling Google Search

    Verifică dacă Googlebot întâmpină probleme de disponibilitate pe site-ul tău

    Îmbunătățirea disponibilității site-ului tău nu va crește neapărat bugetul de crawling; Google determină cea mai bună rată de crawling pe baza cererii de crawling, așa cum a fost descris anterior. Totuși, problemele de disponibilitate împiedică Google să îți acceseze site-ul atât cât ar dori.

    Diagnosticare:

    Utilizează raportul Crawl Stats
    pentru a vedea istoricul de crawling al Googlebot pentru site-ul tău. Raportul arată când Google a întâmpinat probleme de disponibilitate pe site-ul tău. Dacă sunt raportate erori sau avertismente de disponibilitate pentru site-ul tău, caută instanțe în graficele Host availability unde cererile Googlebot au depășit linia roșie de limită, fă clic pe grafic pentru a vedea care URL-uri au eșuat și încearcă să corelezi acele URL-uri cu problemele de pe site-ul tău.

    De asemenea, poți folosi
    Instrumentul de Inspectare a URL-urilor
    pentru a testa câteva URL-uri de pe site-ul tău. Dacă instrumentul returnează
    Hostload exceeded
    avertismente, înseamnă că Googlebot nu poate accesa atât de multe URL-uri de pe site-ul tău pe cât a descoperit.

    Tratament:

    • Citește documentația pentru raportul Crawl Stats pentru a învăța cum să găsești și să gestionezi unele probleme de disponibilitate.
    • Blochează paginile de la crawling dacă nu dorești să fie accesate. (Vezi gestionează inventarul tău)
    • Creează o viteză mai mare de încărcare și redare a paginilor. (Vezi Îmbunătățește eficiența crawling-ului site-ului tău)
    • Mărește capacitatea serverului tău. Dacă Google pare să acceseze constant site-ul tău la limita capacității de servire, dar ai încă URL-uri importante care nu sunt accesate sau actualizate atât cât este necesar, având mai multe resurse de servire ar putea permite Google să solicite mai multe pagini de pe site-ul tău. Verifică istoricul disponibilității gazdei în
      raportul Crawl Stats pentru a vedea dacă rata de crawling a Google pare să depășească frecvent linia de limită. Dacă da, mărește resursele de servire pentru o lună și vezi dacă cererile de crawling au crescut în aceeași perioadă.

    Verifică dacă există părți ale site-ului tău care nu sunt accesate, dar ar trebui să fie

    Google petrece atât timp cât este necesar pe site-ul tău pentru a indexa tot conținutul de înaltă calitate și valoros pentru utilizatori pe care îl poate găsi. Dacă crezi că Googlebot ratează conținut important, fie nu știe despre conținut, fie conținutul este blocat de Google, fie disponibilitatea site-ului tău limitează accesul Google (sau Google încearcă să nu suprasolicite site-ul tău).

    Diagnosticare:

    Search Console nu oferă un istoric de crawling pentru site-ul tău care poate fi filtrat după URL sau cale, dar poți inspecta jurnalele site-ului tău pentru a vedea dacă URL-uri specifice au fost accesate de
    Googlebot. Dacă acele URL-uri accesate au fost indexate este o altă poveste.

    Amintește-ți că pentru majoritatea site-urilor, paginile noi vor dura câteva zile minim pentru a fi observate; majoritatea site-urilor nu ar trebui să se aștepte la crawling în aceeași zi pentru URL-uri, cu excepția site-urilor sensibile la timp, cum ar fi site-urile de știri.

    Tratament:

    Dacă adaugi pagini pe site-ul tău și acestea nu sunt accesate într-un timp rezonabil, fie Google nu știe despre ele, fie conținutul este blocat, fie site-ul tău a atins capacitatea maximă de servire, fie ești
    în afara bugetului de crawling.

    1. Informează Google despre noile tale pagini: actualizează sitemaps pentru a reflecta noile URL-uri.
    2. Examinează regulile tale robots.txt pentru a confirma că nu blochezi accidental paginile.
    3. Revizuiește prioritățile tale de crawling (a.k.a. folosește-ți bugetul de crawling cu înțelepciune). Gestionează inventarul tău și îmbunătățește eficiența crawling-ului site-ului tău.
    4. Verifică dacă nu rămâi fără capacitate de servire. Googlebot va reduce crawling-ul dacă detectează că serverele tale au probleme în a răspunde la cererile de crawling.

    Reține că paginile ar putea să nu fie afișate în rezultatele căutării, chiar dacă sunt accesate, dacă nu există suficientă valoare sau cerere din partea utilizatorilor pentru conținut.

    Verifică dacă actualizările sunt accesate suficient de rapid

    Dacă ne lipsesc pagini noi sau actualizate pe site-ul tău, poate fi pentru că nu le-am văzut sau nu am observat că sunt actualizate. Iată cum poți ajuta Google să fie conștient de actualizările paginilor.

    Reține că Google se străduiește să verifice și să indexeze paginile într-un mod rezonabil de rapid. Pentru majoritatea site-urilor, acest lucru durează trei zile sau mai mult. Nu te aștepta ca Google să indexeze paginile în aceeași zi în care le publici, cu excepția cazului în care ești un site de știri sau ai alt conținut de mare valoare, extrem de sensibil la timp.

    Diagnosticare:

    Examinează jurnalele site-ului tău pentru a vedea când URL-uri specifice au fost accesate de
    Googlebot.

    Pentru a afla data indexării, folosește instrumentul de Inspectare a URL-urilor sau efectuează o căutare pentru URL-urile pe care le-ai actualizat.

    Tratament:

    Fă:

    • Folosește un sitemap de știri dacă site-ul tău are conținut de știri.
    • Folosește eticheta <lastmod> în sitemaps pentru a indica când un URL indexat a fost actualizat.
    • Folosește o structură de URL-uri accesibilă pentru a ajuta Google să găsească paginile tale.
    • Oferă linkuri standard, accesibile <a> pentru a ajuta Google să găsească paginile tale.
    • Dacă site-ul tău folosește separat pentru versiunile mobile și desktop, oferă același set de linkuri pe versiunea mobilă ca și pe versiunea desktop. Dacă nu este posibil să oferi același set de linkuri pe versiunea mobilă, asigură-te că sunt incluse într-un fișier
      sitemap. Google indexează doar
      versiunea mobilă a paginilor, iar limitarea linkurilor afișate acolo poate încetini descoperirea de pagini noi.

    Evită:

    • Trimiterea aceluiași sitemap, neschimbat, de mai multe ori pe zi.
    • Așteptarea ca Googlebot să acceseze totul dintr-un sitemap sau să le acceseze imediat. Sitemaps sunt sugestii utile pentru Googlebot, nu cerințe absolute.
    • Includerea URL-urilor în sitemaps pe care nu dorești să apară în Căutare. Acest lucru poate irosi bugetul de crawling pe pagini pe care nu dorești să le indexezi.

    Îmbunătățește eficiența crawling-ului site-ului tău

    Crește viteza de încărcare a paginilor tale

    Crawling-ul Google este limitat de lățimea de bandă, timp și disponibilitatea instanțelor Googlebot. Dacă serverul tău răspunde mai rapid la cereri, am putea să accesăm mai multe pagini de pe site-ul tău. Asta fiind spus, Google dorește să acceseze doar conținut de înaltă calitate, așa că doar făcând paginile de calitate scăzută mai rapide nu va încuraja Googlebot să acceseze mai mult site-ul tău; invers, dacă credem că ne lipsesc conținuturi de înaltă calitate pe site-ul tău, probabil vom crește bugetul tău pentru a accesa acel conținut.

    Iată cum poți optimiza paginile și resursele pentru crawling:

    • Previne încărcarea resurselor mari, dar neimportante, de către Googlebot folosind robots.txt. Asigură-te că blochezi doar resursele non-critice, adică resursele care nu sunt importante pentru înțelegerea semnificației paginii (cum ar fi imaginile decorative).
    • Asigură-te că paginile tale se încarcă rapid.
    • Fii atent la lanțurile lungi de redirecționare, care au un efect negativ asupra crawling-ului.
    • Atât timpul de răspuns la cererile serverului, cât și timpul necesar pentru a reda paginile contează, inclusiv timpul de încărcare și rulare pentru resursele încorporate, cum ar fi imaginile și scripturile. Fii conștient de resursele mari sau lente necesare pentru indexare.

    Specifică modificările de conținut cu coduri de stare HTTP

    Google suportă în general anteturile de cerere HTTP
    If-Modified-Since și If-None-Match
    pentru crawling. Crawler-ele Google nu trimit anteturile cu toate încercările de crawling; depinde de cazul de utilizare al cererii (de exemplu,
    AdsBot este mai probabil să seteze anteturile de cerere HTTP If-Modified-Since și If-None-Match). Dacă crawler-ele noastre trimit antetul If-Modified-Since, valoarea antetului este
    data și ora
    la care conținutul a fost accesat ultima dată. Pe baza acelei valori, serverul poate alege să returneze un cod de stare HTTP
    304 (Not Modified) fără corp de răspuns, caz în care Google va reutiliza versiunea de conținut accesată ultima dată. Dacă conținutul este mai nou decât data specificată de crawler în antetul If-Modified-Since, serverul poate returna un cod de stare HTTP
    200 (OK) cu corpul de răspuns.

    Independent de anteturile de cerere, poți trimite un cod de stare HTTP 304 (Not Modified) și fără corp de răspuns pentru orice cerere Googlebot dacă conținutul nu s-a schimbat de la ultima vizită a Googlebot la URL. Acest lucru va economisi timp și resurse de procesare ale serverului tău, ceea ce poate îmbunătăți indirect eficiența crawling-ului.

    Ascunde URL-urile pe care nu le dorești în rezultatele căutării

    Risipirea resurselor serverului pe pagini inutile poate reduce activitatea de crawling de pe paginile care sunt importante pentru tine, ceea ce poate cauza o întârziere semnificativă în descoperirea de conținut nou sau actualizat pe un site.

    Expunerea multor URL-uri pe site-ul tău pe care nu dorești să fie accesate de Căutare poate afecta negativ crawling-ul și indexarea unui site. De obicei, aceste URL-uri se încadrează în următoarele categorii:

    Fă:

    • Folosește robots.txt dacă nu dorești ca Google să acceseze o resursă sau o pagină deloc.
    • Dacă o resursă comună este reutilizată pe mai multe pagini (cum ar fi o imagine sau un fișier JavaScript partajat), referențiază resursa de la același URL în fiecare pagină, astfel încât Google să poată cache și reutiliza aceeași resursă fără a fi nevoie să solicite aceeași resursă de mai multe ori.

    Evită:

    • Nu adăuga sau elimina pagini sau directoare din robots.txt în mod regulat ca o modalitate de a realoca bugetul de crawling pentru site-ul tău. Folosește robots.txt doar pentru paginile sau resursele pe care nu dorești să apară pe Google pe termen lung.
    • Nu roti sitemaps sau folosi alte mecanisme temporare de ascundere pentru a realoca bugetul.

    erori soft 404

    O eroare soft 404 apare atunci când un URL returnează o pagină care spune utilizatorului că pagina nu există și, de asemenea, un cod de stare
    200 (success)
    . În unele cazuri, ar putea fi o pagină fără conținut principal sau o pagină goală.

    Astfel de pagini pot fi generate din diverse motive de serverul web al site-ului tău sau de sistemul de gestionare a conținutului, sau de browserul utilizatorului. De exemplu:

    • Un fișier include lipsă pe partea de server.
    • O conexiune ruptă la baza de date.
    • O pagină de rezultate de căutare internă goală.
    • Un fișier JavaScript neîncărcat sau lipsă.

    Este o experiență proastă pentru utilizator să returnezi un cod de stare 200 (success), dar apoi să afișezi sau să sugerezi un mesaj de eroare sau un fel de eroare pe pagină. Utilizatorii ar putea crede că pagina este una activă și funcțională, dar apoi sunt prezentați cu un fel de eroare. Astfel de pagini sunt excluse din Căutare.

    Când algoritmii Google detectează că pagina este de fapt o pagină de eroare pe baza conținutului său, Search Console va afișa o eroare soft 404 în
    raportul de Indexare a Paginilor al site-ului.

    Remediază erorile soft 404

    În funcție de starea paginii și de rezultatul pe care îl dorești, poți rezolva erorile soft 404 în mai multe moduri:

    Încearcă să determini care soluție ar fi cea mai bună pentru utilizatorii tăi.

    Pagina și conținutul nu mai sunt disponibile

    Dacă ai eliminat pagina și nu există o pagină de înlocuire pe site-ul tău cu conținut similar, returnează un cod de răspuns (status)
    404 (not found) sau 410 (gone)
    pentru pagină. Aceste coduri de stare indică motoarelor de căutare că pagina nu există și nu dorești ca motoarele de căutare să indexeze pagina.

    Dacă ai acces la fișierele de configurare ale serverului tău, poți face aceste pagini de eroare utile pentru utilizatori personalizându-le. O pagină personalizată 404 bună ajută oamenii să găsească informațiile pe care le caută și oferă, de asemenea, alt conținut util care încurajează oamenii să exploreze mai departe site-ul tău. Iată câteva sfaturi pentru a proiecta o pagină personalizată 404 utilă:

    • Spune vizitatorilor clar că pagina pe care o caută nu poate fi găsită. Folosește un limbaj prietenos și primitor.
    • Asigură-te că pagina ta 404 are același aspect și senzație (inclusiv navigare) ca restul site-ului tău.
    • Ia în considerare adăugarea de linkuri către cele mai populare articole sau postări ale tale, precum și un link către pagina de start a site-ului tău.
    • Gândește-te să oferi o modalitate pentru utilizatori de a raporta un link rupt.

    Paginile personalizate 404 sunt create exclusiv pentru utilizatori. Deoarece aceste pagini sunt inutile din perspectiva unui motor de căutare, asigură-te că serverul returnează un cod de stare HTTP 404 pentru a preveni indexarea paginilor.

    Pagina sau conținutul se află acum în altă parte

    Dacă pagina ta s-a mutat sau are o înlocuire clară pe site-ul tău, returnează un
    301 (permanent redirect)
    pentru a redirecționa utilizatorul. Acest lucru nu va întrerupe experiența de navigare a utilizatorului și este, de asemenea, o modalitate excelentă de a informa motoarele de căutare despre noua locație a paginii. Folosește
    instrumentul de Inspectare a URL-urilor
    pentru a verifica dacă URL-ul tău returnează de fapt codul corect.

    Pagina și conținutul încă există

    Dacă o pagină bună a fost marcată cu o eroare soft 404, este probabil că nu s-a încărcat corect pentru Googlebot, lipsea resurse critice sau a afișat un mesaj de eroare proeminent în timpul redării. Folosește
    instrumentul de Inspectare a URL-urilor
    pentru a examina conținutul redat și codul HTTP returnat. Dacă pagina redată este goală, aproape goală sau conținutul are un mesaj de eroare, ar putea fi că pagina ta face referire la multe resurse care nu pot fi încărcate (imagini, scripturi și alte elemente non-textuale), care pot fi interpretate ca un soft 404.
    Motivele pentru care resursele nu pot fi încărcate includ resurse blocate (blocate de
    robots.txt), având prea multe resurse pe o pagină, diverse erori de server sau resurse foarte mari sau care se încarcă lent.

    Gestionarea supracrawling-ului site-ului tău (urgențe)

    Googlebot are algoritmi pentru a preveni copleșirea site-ului tău cu cereri de crawling. Totuși, dacă descoperi că Googlebot îți copleșește site-ul, există câteva lucruri pe care le poți face.

    Diagnosticare:

    Monitorizează serverul tău pentru cereri excesive de la Googlebot către site-ul tău.

    Tratament:

    Într-o situație de urgență, Google recomandă următorii pași pentru a încetini un crawling copleșitor de la Googlebot:

    1. Returnează coduri de răspuns HTTP 503 sau 429 temporar pentru cererile Googlebot atunci când serverul tău este suprasolicitat. Googlebot va reîncerca aceste URL-uri timp de aproximativ 2 zile. Reține că returnarea codurilor “fără disponibilitate” pentru mai mult de câteva zile va determina Google să încetinească sau să oprească permanent crawling-ul URL-urilor de pe site-ul tău, așa că urmează pașii suplimentari următori.
    2. Când rata de crawling scade, oprește returnarea codurilor de răspuns HTTP 503 sau 429 pentru cererile de crawling; returnarea codurilor 503 sau 429 pentru mai mult de 2 zile va determina Google să elimine acele URL-uri din index.
    3. Monitorizează crawling-ul și capacitatea gazdei tale în timp.
    4. Dacă crawler-ul problematic este unul dintre
      crawler-ele AdsBot,
      problema este probabil că ai creat
      ținte de Anunțuri de Căutare Dinamică
      pentru site-ul tău pe care Google încearcă să le acceseze. Acest crawling va reapărea la fiecare 3 săptămâni. Dacă nu ai capacitatea serverului pentru a gestiona aceste crawling-uri, fie limitează țintele de anunțuri, fie obține o capacitate de servire crescută.

    Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.

  • Cum Google accesează paginile adaptate pentru locație

    Cum Google accesează paginile adaptate pentru locație

    Accesare distribuită geografic

    Dacă site-ul tău are pagini adaptate pentru locație (adică site-ul tău returnează conținut diferit în funcție de țara percepută sau limba preferată a vizitatorului), este posibil ca Google să nu acceseze, indexeze sau să clasifice tot conținutul tău pentru diferite locații. Acest lucru se datorează faptului că adresele IP implicite ale crawler-ului Googlebot par să fie bazate în SUA. În plus, crawler-ul trimite cereri HTTP fără a seta Accept-Language în antetul cererii.

    Googlebot accesează cu adrese IP bazate și în afara SUA, pe lângă adresele IP bazate în SUA.

    Așa cum Google a recomandat întotdeauna, când Googlebot pare să vină dintr-o anumită țară, tratează-l așa cum ai trata orice alt utilizator din acea țară. Aceasta înseamnă că, dacă blochezi utilizatorii din SUA să acceseze conținutul tău, dar permiți vizitatorilor din Australia să îl vadă, serverul tău ar trebui să blocheze Googlebot dacă pare să vină din SUA, dar să permită accesul la Googlebot dacă pare să vină din Australia.

    Alte considerații


    Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.

  • Informați Google despre versiunile localizate ale paginii dvs.

    Informați Google despre versiunile localizate ale paginii dvs.

    Informați Google despre versiunile localizate ale paginii dvs.

    Dacă aveți mai multe versiuni ale unei pagini pentru diferite limbi sau regiuni, informați Google despre aceste variații. Acest lucru va ajuta Google Search să direcționeze utilizatorii către cea mai potrivită versiune a paginii dvs. în funcție de limbă sau regiune.

    Rețineți că, chiar și fără a lua măsuri, Google ar putea găsi versiuni alternative ale paginii dvs., dar este de obicei mai bine să indicați explicit paginile specifice limbii sau regiunii.

    Exemple de scenarii în care este recomandat să indicați pagini alternative:

    • Dacă păstrați conținutul principal într-o singură limbă și traduceți doar șablonul, cum ar fi navigarea și subsolul. Paginile care prezintă conținut generat de utilizatori, cum ar fi forumurile, fac de obicei acest lucru.
    • Dacă conținutul dvs. are variații regionale mici cu conținut similar, într-o singură limbă. De exemplu, puteți avea conținut în limba engleză destinat SUA, GB și Irlanda.
    • Dacă conținutul site-ului dvs. este complet tradus în mai multe limbi. De exemplu, aveți atât versiuni în germană, cât și în engleză ale fiecărei pagini.

    Versiunile localizate ale unei pagini sunt considerate duplicate doar dacă conținutul principal al paginii rămâne netradus.

    Metode pentru a indica paginile alternative

    Există trei modalități de a indica versiunile multiple de limbă/locale ale unei pagini către Google:

    Aceste trei metode sunt echivalente din perspectiva Google și puteți alege metoda care este cea mai convenabilă pentru site-ul dvs. Deși puteți folosi toate cele trei metode în același timp, nu există niciun beneficiu în Search (de fapt, poate fi mult mai dificil să gestionați trei implementări în loc să alegeți doar una).

    Utilizați hreflang pentru a informa Google despre variațiile conținutului dvs., astfel încât să putem înțelege că aceste pagini sunt variații localizate ale aceluiași conținut. Google nu folosește hreflang sau atributul lang pentru a detecta limba unei pagini; în schimb, folosim algoritmi pentru a determina limba.

    Ghiduri pentru toate metodele

    • Fiecare versiune de limbă trebuie să listeze atât pe ea însăși, cât și toate celelalte versiuni de limbă.
    • URL-urile alternative trebuie să fie complet calificate, inclusiv metoda de transport (http/https), astfel:
      https://example.com/foo, nu //example.com/foo sau /foo
    • URL-urile alternative nu trebuie să fie în același domeniu.
    • Dacă aveți mai multe URL-uri alternative destinate utilizatorilor cu aceeași limbă, dar în locații diferite, este o idee bună să oferiți și un URL general pentru utilizatorii geografici nespecificați ai acelei limbi. De exemplu, dacă aveți URL-uri specifice pentru vorbitorii de engleză din Irlanda (en-ie), Canada (en-ca) și Australia (en-au), oferiți o pagină generică în engleză (en) pentru căutătorii din SUA, Marea Britanie și toate celelalte locații vorbitoare de engleză. Poate fi una dintre paginile specifice, dacă alegeți.
    • Dacă două pagini nu indică reciproc una către cealaltă, etichetele vor fi ignorate. Acest lucru este pentru ca cineva de pe un alt site să nu poată crea arbitrar o etichetă care să se numească pe sine ca o versiune alternativă a uneia dintre paginile dvs.
    • Dacă devine dificil să mențineți un set complet de linkuri bidirecționale pentru fiecare limbă, puteți omite unele limbi pe unele pagini; Google va procesa în continuare cele care indică reciproc una către cealaltă. Cu toate acestea, este important să legați bidirecțional paginile de limbă nou extinse de limbile de origine/dominante. De exemplu, dacă site-ul dvs. a fost creat inițial în franceză cu URL-uri pe .fr, este mai important să legați bidirecțional paginile noi în mexicană (.mx) și spaniolă (.es) de prezența dvs. puternică .fr, decât să legați bidirecțional paginile noi de variantă de limbă spaniolă (.mx și .es) între ele.
    • Luați în considerare adăugarea unei pagini de rezervă pentru limbile necorespunzătoare, în special pe selectoarele de limbă/țară sau pe paginile de pornire cu redirecționare automată. Utilizați valoarea x-default:
      <link rel="alternate" href="https://example.com/" hreflang="x-default" />

    Etichete

    Adăugați elemente <link rel="alternate" hreflang="lang_code"... > în antetul paginii dvs. pentru a informa Google despre toate variantele de limbă și regiune ale unei pagini. Acest lucru este util dacă nu aveți un sitemap sau capacitatea de a specifica anteturi de răspuns HTTP pentru site-ul dvs.

    Pentru fiecare variație a paginii, includeți un set de elemente <link> în elementul <head>, un link pentru fiecare variantă de pagină inclusiv ea însăși. Setul de linkuri este identic pentru fiecare versiune a paginii. Consultați ghidurile suplimentare.

    Iată sintaxa fiecărui element link:

    <link rel="alternate" hreflang="lang_code" href="url_of_page" />

    Sintaxă
    lang_code Un cod de limbă/regiune suportat vizat de această versiune a paginii, sau x-default pentru a se potrivi cu orice limbă care nu este listată explicit de o etichetă hreflang pe pagină.
    url_of_page URL-ul complet calificat pentru versiunea acestei pagini pentru limba/regiunea specificată.

    Etichetele <link> trebuie să fie în interiorul unei secțiuni <head> bine formate a -ului. Dacă aveți îndoieli, lipiți codul din pagina dvs. redată într-un validator pentru a vă asigura că linkurile sunt în interiorul elementului <head>. De asemenea, nu combinați etichetele link pentru reprezentări alternative ale documentului; de exemplu, nu combinați adnotările hreflang cu alte atribute, cum ar fi media, într-o singură etichetă <link>.

    Exemplu

    Example Widgets, Inc are un site web care servește utilizatorii din SUA, Marea Britanie și Germania. Următoarele URL-uri conțin în mare parte același conținut, dar cu variații regionale:

    URL-uri cu variații regionale
    https://en.example.com/page. Pagina principală generică în limba engleză care conține informații despre taxele pentru expedierea internațională din SUA.
    https://en-gb.example.com/page. Pagina principală din Marea Britanie care afișează prețurile în lire sterline.
    https://en-us.example.com/page. Pagina principală din SUA care afișează prețurile în dolari americani.
    https://de.example.com/page. Pagina principală în limba germană.
    https://www.example.com/ Pagina implicită care nu vizează nicio limbă sau locație; are selectoare pentru a permite utilizatorilor să-și aleagă limba și regiunea.

    Rețineți că subdomeniile specifice limbii din aceste URL-uri (en, en-gb, en-us, de) nu sunt utilizate de Google pentru a determina publicul țintă al paginii; trebuie să mapați explicit publicul țintă.

    Iată -ul care ar fi în secțiunea <head> a tuturor paginilor listate în tabelul cu variații regionale ale URL-urilor. Ar direcționa vorbitorii de engleză din SUA, Marea Britanie, vorbitorii generici de engleză și vorbitorii de germană către pagini localizate, iar pe toți ceilalți către o pagină principală generică. Google Search returnează rezultatul adecvat pentru utilizator, conform setărilor browserului lor.

    <head>
     <title>Widgets, Inc</title>
      <link rel="alternate" hreflang="en-gb"
           href="https://en-gb.example.com/page." />
      <link rel="alternate" hreflang="en-us"
           href="https://en-us.example.com/page." />
      <link rel="alternate" hreflang="en"
           href="https://en.example.com/page." />
      <link rel="alternate" hreflang="de"
           href="https://de.example.com/page." />
     <link rel="alternate" hreflang="x-default"
           href="https://www.example.com/" />
    </head>

    Anteturi HTTP

    Puteți returna un antet HTTP cu răspunsul GET al paginii dvs. pentru a informa Google despre toate variantele de limbă și regiune ale unei pagini. Acest lucru este util pentru fișiere non- (cum ar fi PDF-urile).

    Iată formatul antetului:

    Link: <url1>; rel="alternate"; hreflang="lang_code_1", <url2>; rel="alternate"; hreflang="lang_code_2", ...

    Sintaxă
    <url_x> URL-ul complet calificat al paginii alternative corespunzătoare șirului de localizare atribuit atributului hreflang asociat. URL-ul trebuie să includă marcajele de încadrare < și >. Exemplu: <https://www.google.com>
    lang_code_x Un cod de limbă/regiune suportat vizat de această versiune a paginii, sau x-default pentru a se potrivi cu orice limbă care nu este listată explicit de o etichetă hreflang pe pagină.

    Trebuie să specificați un set de valori <url>, rel="alternate" și hreflang pentru fiecare versiune a paginii inclusiv versiunea solicitată, separate prin virgulă, așa cum se arată în exemplul următor. Antetul Link: returnat pentru fiecare versiune a unei pagini este identic. Consultați ghidurile suplimentare.

    Exemplu

    Iată un exemplu de antet Link: returnat de un site care are trei versiuni ale unui fișier PDF: una pentru vorbitorii de engleză, una pentru vorbitorii de germană din Elveția și una pentru toți ceilalți vorbitori de germană:

    Link: <https://example.com/file.pdf>; rel="alternate"; hreflang="en",
          <https://de-ch.example.com/file.pdf>; rel="alternate"; hreflang="de-ch",
          <https://de.example.com/file.pdf>; rel="alternate"; hreflang="de"

    Sitemap

    Puteți utiliza un sitemap XML pentru a informa Google despre toate variantele de limbă și regiune pentru fiecare URL. Pentru a face acest lucru, adăugați un element <loc> care specifică un singur URL, cu intrări copil <x:link> care listează fiecare variantă de limbă/locale a paginii, inclusiv ea însăși. Prin urmare, dacă aveți 3 versiuni ale unei pagini, sitemap-ul dvs. va avea intrări pentru URL-urile fiecărei versiuni, iar fiecare intrare va avea 3 intrări copil identice.

    Reguli pentru sitemap:

    • Specificați spațiul de nume x astfel:

      xmlns:x="http://www.w3.org/1999/x"

    • Creați un element <url> separat pentru fiecare URL, așa cum ați face cu orice alt sitemap.
    • Fiecare element <url> trebuie să includă un copil <loc> care indică URL-ul paginii.
    • Fiecare element <url> trebuie să aibă un element copil <x:link rel="alternate" hreflang="supported_language-code"> care listează fiecare versiune alternativă a paginii, inclusiv ea însăși. Ordinea acestor elemente copil nu contează, deși poate doriți să le păstrați în aceeași ordine pentru a le verifica mai ușor pentru greșeli. Elementele copil nu contează în limita URL-urilor pentru sitemaps.
    • Încărcați sitemap-ul într-un director de pe site-ul dvs. la care sitemap-ul este aplicabil. Rețineți că un sitemap poate conține doar URL-uri descendente ale directorului din care este găzduit sitemap-ul.
    • Documentația noastră despre sitemaps se aplică și extensiilor sitemap. Asigurați-vă că urmați ghidurile generale pentru sitemap.
    • Consultați ghidurile suplimentare.

    Exemplu

    Iată o pagină în limba engleză destinată vorbitorilor de engleză din întreaga lume, cu versiuni echivalente ale acestei pagini destinate vorbitorilor de germană din întreaga lume și vorbitorilor de germană din Elveția. Iată toate URL-urile prezente pe site-ul dvs.:

    • www.example.com/english/page. destinat vorbitorilor de engleză.
    • www.example.de/deutsch/page. destinat vorbitorilor de germană.
    • www.example.de/schweiz-deutsch/page. destinat vorbitorilor de germană din Elveția.

    Iată sitemap-ul pentru aceste trei pagini:

    <?xml version="1.0" encoding="UTF-8"?>
    <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"
      xmlns:x="http://www.w3.org/1999/x">
      <url>
        <loc>https://www.example.com/english/page.</loc>
        <x:link
                   rel="alternate"
                   hreflang="de"
                   href="https://www.example.de/deutsch/page."/>
        <x:link
                   rel="alternate"
                   hreflang="de-ch"
                   href="https://www.example.de/schweiz-deutsch/page."/>
        <x:link
                   rel="alternate"
                   hreflang="en"
                   href="https://www.example.com/english/page."/>
      </url>
      <url>
        <loc>https://www.example.de/deutsch/page.</loc>
        <x:link
                   rel="alternate"
                   hreflang="de"
                   href="https://www.example.de/deutsch/page."/>
        <x:link
                   rel="alternate"
                   hreflang="de-ch"
                   href="https://www.example.de/schweiz-deutsch/page."/>
        <x:link
                   rel="alternate"
                   hreflang="en"
                   href="https://www.example.com/english/page."/>
      </url>
      <url>
        <loc>https://www.example.de/schweiz-deutsch/page.</loc>
        <x:link
                   rel="alternate"
                   hreflang="de"
                   href="https://www.example.de/deutsch/page."/>
        <x:link
                   rel="alternate"
                   hreflang="de-ch"
                   href="https://www.example.de/schweiz-deutsch/page."/>
        <x:link
                   rel="alternate"
                   hreflang="en"
                   href="https://www.example.com/english/page."/>
      </url>
    </urlset>

    Coduri de limbă și regiune suportate

    Valoarea atributului hreflang este compusă din una sau opțional două valori, separate printr-o cratimă. De exemplu, en-US. Primul cod al atributului hreflang este codul limbii (în format ISO 639-1), urmat de un al doilea cod opțional care reprezintă codul regiunii (în format ISO 3166-1 Alpha 2) al unui URL alternativ. Sunt suportate doar codurile de limbă listate în ISO 639-1 și codurile de regiune listate în ISO 3166-1 Alpha 2; alte coduri care nu sunt listate în acele standarde, cum ar fi es-419, nu sunt suportate.

    Pentru a viza vorbitorii de limbi diferite din Belgia, puteți utiliza următoarele coduri de limbă și regiune:

    • Bun (germană pentru utilizatorii din Belgia): de-be
    • Bun (olandeză pentru utilizatorii din Belgia): nl-be
    • Bun (franceză pentru utilizatorii din Belgia): fr-be
    • Rău deoarece primul cod este pentru limbă (be este codul de limbă pentru belarusă): be

    Pentru a simplifica etichetarea, puteți specifica un cod de limbă de unul singur. De exemplu:

    • de: conținut în limba germană, independent de regiune
    • en-GB: conținut în limba engleză, pentru utilizatorii din Marea Britanie
    • de-ES: conținut în limba germană, pentru utilizatorii din Spania

    Pentru variațiile de script de limbă, scriptul corect este derivat din țară. De exemplu, când utilizați zh-TW pentru utilizatorii din Taiwan, scriptul limbii este derivat automat (în acest exemplu: chineză-tradițională). De asemenea, puteți specifica scriptul în sine explicit folosind ISO 15924, astfel:

    • zh-Hant: chineză (tradițională)
    • zh-Hans: chineză (simplificată)

    Ca și în cazul altor coduri de limbă, puteți specifica și o regiune opțională. De exemplu, utilizați zh-Hans-US pentru a specifica chineză (simplificată) pentru utilizatorii din Statele Unite.

    Utilizați valoarea x-default pentru limbile necorespunzătoare

    Valoarea rezervată x-default este utilizată atunci când nicio altă limbă/regiune nu se potrivește cu setările browserului utilizatorului. Această valoare este recomandată pentru a specifica pagina de rezervă pentru utilizatorii ale căror setări de limbă nu se potrivesc cu nicio versiune localizată a site-ului dvs. Deși puteți utiliza valoarea x-default pentru orice pagină, a fost concepută pentru paginile de selectare a limbii și astfel va funcționa cel mai bine cu acestea.

    Nu este nevoie să specificați un cod de limbă pentru valoarea x-default; pagina este destinată utilizatorilor ale căror setări de limbă nu sunt potrivite pe site-ul dvs., astfel încât limba paginii este irelevantă.

    Pentru a implementa adnotarea hreflang="x-default", adăugați o etichetă link suplimentară la adnotările hreflang existente și setați atributul href la URL-ul unde doriți ca utilizatorii dvs. să ajungă dacă site-ul dvs. nu suportă limba lor. De exemplu, o implementare poate arăta astfel:

    <link rel="alternate" href="https://example.com/en-gb" hreflang="en-gb" />
    <link rel="alternate" href="https://example.com/en-us" hreflang="en-us" />
    <link rel="alternate" href="https://example.com/en-au" hreflang="en-au" />
    <link rel="alternate" href="https://example.com/country-selector" hreflang="x-default" />

    Depanare

    Greșeli comune

    Iată cele mai comune greșeli în utilizarea hreflang:

    • Lipsa linkurilor de întoarcere: Dacă pagina X leagă la pagina Y, pagina Y trebuie să lege înapoi la pagina X. Dacă acest lucru nu este cazul pentru toate paginile care utilizează adnotări hreflang, acele adnotări pot fi ignorate sau nu sunt interpretate corect. De exemplu, având în vedere acest link pe https://de.example.com/index.:

      <link rel="alternate" hreflang="en-gb" href="https://en-gb.example.com/index." />


      Trebuie să aveți și un link hreflang pe https://en-gb.example.com/index. care să indice înapoi la versiunea de a conținutului:

      <link rel="alternate" hreflang="de" href="https://de.example.com/index." />

    • Coduri de limbă incorecte: Asigurați-vă că toate codurile de limbă pe care le utilizați identifică limba (în format ISO 639-1) și opțional regiunea (în format ISO 3166-1 Alpha 2) a unui URL alternativ. Specificarea doar a regiunii nu este validă.
    • Coduri de regiune incorecte: Asigurați-vă că utilizați elemente de cod oficiale atribuite pentru regiunile pe care încercați să le identificați (în format ISO 3166-1 Alpha 2). Dacă utilizați coduri care sunt listate ca rezervate pentru altceva, Google Search ignoră acea parte a adnotării (de exemplu, utilizarea EU, UN sau UK în adnotările hreflang nu are efect asupra Google Search).

    Depanarea erorilor hreflang

    Există multe instrumente terțe disponibile pe care le puteți utiliza pentru a depana adnotările hreflang. Iată câteva instrumente populare. Aceste instrumente nu sunt întreținute sau verificate de Google.


    Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.