Category: Ghiduri

  • Scrie recenzii de înaltă calitate

    Scrie recenzii de înaltă calitate

    Importanța recenziilor de calitate

    Publicarea de recenzii de înaltă calitate poate ajuta oamenii să afle mai multe despre lucrurile pe care le iau în considerare, cum ar fi produse, servicii, destinații, jocuri, filme sau alte subiecte. De exemplu, poți scrie o recenzie ca:

    • Un membru al personalului expert sau un comerciant care ghidează oamenii între produse concurente.
    • Un blogger care oferă opinii independente.
    • Un membru al personalului editorial la un site de știri sau alt site de publicare.

    Practici recomandate pentru recenzii

    Pentru a ajuta oamenii să descopere paginile tale de recenzii în Căutarea Google și pe alte suprafețe Google, urmează aceste practici recomandate:

    • Evaluează din perspectiva utilizatorului.
    • Demonstrează că ești bine informat despre ceea ce recenzezi—arată că ești un expert.
    • Oferă dovezi, cum ar fi imagini, audio sau alte linkuri ale propriei tale experiențe cu ceea ce recenzezi, pentru a-ți susține expertiza și a întări autenticitatea recenziei tale.
    • Împărtășește măsurători cantitative despre cum se comportă ceva în diverse categorii de performanță.
    • Explică ce diferențiază ceva de concurenții săi.
    • Acoperă lucruri comparabile de luat în considerare sau explică ce ar putea fi cel mai bun pentru anumite utilizări sau circumstanțe.
    • Discută avantajele și dezavantajele unui lucru, bazându-te pe propria ta cercetare originală.
    • Descrie cum un produs a evoluat de la modelele sau versiunile anterioare pentru a aduce îmbunătățiri, a rezolva probleme sau a ajuta utilizatorii în luarea unei decizii de cumpărare.
    • Concentrează-te pe cei mai importanți factori de decizie, bazându-te pe experiența sau expertiza ta (de exemplu, o recenzie auto ar putea determina că economia de combustibil și siguranța sunt factori cheie de decizie și să evalueze performanța în acele domenii).
    • Descrie alegerile cheie în modul în care un produs a fost proiectat și efectul lor asupra utilizatorilor dincolo de ceea ce spune producătorul.
    • Include linkuri către alte resurse utile (ale tale sau de pe alte site-uri) pentru a ajuta un cititor să ia o decizie.
    • Ia în considerare includerea de linkuri către mai mulți vânzători pentru a oferi cititorului opțiunea de a cumpăra de la comerciantul ales.
    • Când recomanzi ceva ca fiind cel mai bun în general sau cel mai bun pentru un anumit scop, include de ce îl consideri cel mai bun, cu dovezi de primă mână care să susțină afirmația.
    • Asigură-te că există suficient conținut util în listele tale clasificate pentru a putea sta pe cont propriu, chiar dacă alegi să scrii recenzii individuale detaliate.

    Recenziile folosesc adesea linkuri de afiliere, astfel încât dacă cineva găsește o recenzie utilă și urmează linkul furnizat pentru a cumpăra, creatorul recenziei este recompensat de vânzător. Dacă faci acest lucru, vezi și
    poziția Google privind programele de afiliere.

    Recenziile pot fi o resursă excelentă pentru oameni atunci când iau decizii. Când scrii recenzii, concentrează-te pe calitatea și originalitatea recenziilor tale, nu pe lungime, urmând cât mai multe dintre practicile recomandate de mai sus. Acest lucru va oferi cea mai mare valoare celor care citesc recenziile tale.


    Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.

  • Înțelegerea experienței paginii în rezultatele căutării Google

    Înțelegerea experienței paginii în rezultatele căutării Google

    Auto-evaluează experiența paginii conținutului tău

    Răspunsul afirmativ la următoarele întrebări înseamnă că probabil ești pe drumul cel bun în a oferi o experiență bună a paginii:

    • Paginile tale au valori bune pentru Core Web Vitals?
    • Sunt paginile tale servite într-un mod securizat?
    • Conținutul tău se afișează bine pe dispozitive mobile?
    • Conținutul tău evită utilizarea excesivă a reclamelor care distrag sau interferează cu conținutul principal?
    • Paginile tale evită utilizarea interstițialelor intruzive?
    • Pagina ta este proiectată astfel încât vizitatorii să poată distinge ușor conținutul principal de alte conținuturi de pe pagină?

    Aceste întrebări nu cuprind toate aspectele experienței paginii care trebuie luate în considerare.
    Totuși, întrebări ca acestea și consultarea resurselor următoare te pot ajuta să te aliniezi cu oferirea unei experiențe generale bune a paginii.

    Resurse pentru experiența paginii

    Iată câteva resurse care te pot ajuta să măsori, să monitorizezi și să optimizezi experiența paginii:

    FAQ

    Există un singur “semnal de experiență a paginii” pe care Google Search îl folosește pentru clasare?

    Nu există un singur semnal. Sistemele noastre de clasare de bază analizează o varietate de semnale care se aliniază cu experiența generală a paginii.

    Ce aspecte ale experienței paginii sunt utilizate în clasare?

    Core Web Vitals sunt utilizate de sistemele noastre de clasare.
    Google recomandă proprietarilor de site-uri să obțină valori bune pentru Core Web Vitals pentru succesul în Căutare și pentru a asigura o experiență excelentă a utilizatorului în general.
    Ține cont că obținerea unor rezultate bune în rapoarte precum raportul Core Web Vitals din Search Console
    sau în instrumente terțe nu garantează că paginile tale vor fi clasate în topul rezultatelor căutării Google;
    există mai mult pentru o experiență excelentă a paginii decât scorurile Core Web Vitals.
    Aceste scoruri sunt menite să te ajute să îmbunătățești site-ul pentru utilizatorii tăi în general,
    iar încercarea de a obține un scor perfect doar din motive SEO poate să nu fie cea mai bună utilizare a timpului tău.

    Dincolo de Core Web Vitals, alte aspecte ale experienței paginii nu ajută direct site-ul tău să se claseze mai sus în rezultatele căutării.
    Totuși, ele pot face ca site-ul tău să fie mai satisfăcător de utilizat, ceea ce este în general aliniat cu ceea ce sistemele noastre de clasare caută să recompenseze.
    Prin urmare, merită totuși să lucrezi pentru a îmbunătăți experiența paginii în general.

    Este evaluată experiența paginii la nivel de site sau la nivel de pagină?

    Sistemele noastre de clasare de bază evaluează în general conținutul la nivel de pagină, inclusiv atunci când înțeleg aspectele legate de experiența paginii. Totuși, avem și unele evaluări la nivel de site.

    Cât de importantă este experiența paginii pentru succesul în clasare?

    Google Search caută întotdeauna să afișeze cel mai relevant conținut, chiar dacă experiența paginii este sub standard. Dar pentru multe interogări, există mult conținut util disponibil. O experiență excelentă a paginii poate contribui la succesul în Căutare, în astfel de cazuri.

    Actualizări recente pe blogul nostru

    Iată tot ce am anunțat despre experiența paginii pe blogul Google Search Central:


    Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.

  • Blocarea indexării în căutare cu noindex

    Blocarea indexării în căutare cu noindex

    Blocarea indexării în căutare cu noindex

    noindex este o regulă setată fie printr-un tag <meta>, fie printr-un header de răspuns HTTP și este utilizată pentru a preveni indexarea conținutului de către motoarele de căutare care suportă regula noindex, cum ar fi Google. Când Googlebot accesează acea pagină și extrage tagul sau headerul, Google va elimina complet acea pagină din rezultatele Căutării Google, indiferent dacă alte site-uri fac legătura către ea.

    Utilizarea noindex este utilă dacă nu aveți acces root la serverul dvs., deoarece vă permite să controlați accesul la site-ul dvs. pe baza fiecărei pagini.

    Implementarea noindex

    Există două modalități de a implementa noindex: ca un tag <meta> și ca un header de răspuns HTTP. Ambele au același efect; alegeți metoda care este mai convenabilă pentru site-ul dvs. și potrivită pentru tipul de conținut. Specificarea regulii noindex în fișierul robots.txt nu este suportată de Google.

    Puteți combina, de asemenea, regula noindex cu alte reguli care controlează indexarea. De exemplu, puteți combina un indiciu nofollow cu o regulă noindex: <meta name="robots" content="noindex, nofollow" />.

    <meta> tag

    Pentru a preveni toate motoarele de căutare care suportă regula noindex să indexeze o pagină de pe site-ul dvs., plasați următorul tag <meta> în secțiunea <head> a paginii dvs.:

    <meta name="robots" content="noindex">

    Pentru a preveni doar crawlerii web Google să indexeze o pagină:

    <meta name="googlebot" content="noindex">

    Fiți conștienți că unele motoare de căutare ar putea interpreta regula noindex diferit. Ca rezultat, este posibil ca pagina dvs. să apară în continuare în rezultatele altor motoare de căutare.

    Citiți mai multe despre tagul noindex <meta>.

    Header de răspuns HTTP

    În loc de un tag <meta>, puteți returna un header HTTP X-Robots-Tag cu o valoare de noindex sau none în răspunsul dvs. Un header de răspuns poate fi utilizat pentru resurse non-, cum ar fi fișiere PDF, fișiere video și fișiere imagine. Iată un exemplu de răspuns HTTP cu un header X-Robots-Tag care instruiește motoarele de căutare să nu indexeze o pagină:

    HTTP/1.1 200 OK
    (...)
    X-Robots-Tag: noindex
    (...)

    Citiți mai multe despre headerul de răspuns noindex.

    Depanarea problemelor noindex

    Trebuie să accesăm pagina dvs. pentru a vedea tagurile <meta> și headerele HTTP. Dacă o pagină apare în continuare în rezultate, probabil că nu am accesat pagina de când ați adăugat regula noindex. În funcție de importanța paginii pe internet, poate dura luni pentru ca Googlebot să reviziteze o pagină. Puteți solicita ca Google să recrawleze o pagină folosind instrumentul de inspectare a URL-urilor.

    Dacă trebuie să eliminați rapid o pagină de pe site-ul dvs. din rezultatele căutării Google, consultați documentația despre eliminări.

    Un alt motiv ar putea fi că fișierul robots.txt blochează URL-ul de la crawlerii web Google, astfel încât aceștia nu pot vedea tagul. Pentru a debloca pagina dvs. de la Google, trebuie să editați fișierul robots.txt.

    În cele din urmă, asigurați-vă că regula noindex este vizibilă pentru Googlebot. Pentru a testa dacă implementarea dvs. noindex este corectă, utilizați instrumentul de inspectare a URL-urilor pentru a vedea -ul pe care Googlebot l-a primit în timp ce accesa pagina. De asemenea, puteți utiliza raportul de indexare a paginilor din Search Console pentru a monitoriza paginile de pe site-ul dvs. din care Googlebot a extras o regulă noindex.


    Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.

  • Introducere în robots.txt

    Introducere în robots.txt

    Introducere în robots.txt


    Un fișier robots.txt indică crawler-elor motoarelor de căutare care URL-uri pot fi accesate pe site-ul tău. Acesta este utilizat în principal pentru a evita supraîncărcarea site-ului cu cereri; nu este un mecanism pentru a împiedica o pagină web să fie indexată de Google. Pentru a împiedica o pagină web să fie indexată de Google, blochează indexarea cu noindex sau protejează pagina cu parolă.

    Pentru ce este folosit un fișier robots.txt?

    Un fișier robots.txt este folosit în principal pentru a gestiona traficul crawler-elor către site-ul tău și de obicei pentru a împiedica un fișier să fie indexat de Google, în funcție de tipul fișierului:

    Efectul robots.txt asupra diferitelor tipuri de fișiere
    Pagină web

    Poți folosi un fișier robots.txt pentru pagini web (, PDF sau alte
    formate non-media pe care Google le poate citi),
    pentru a gestiona traficul de crawling dacă crezi că serverul tău va fi copleșit de cererile
    de la crawler-ul Google sau pentru a evita accesarea paginilor neimportante sau similare de pe site-ul tău.

    Dacă pagina ta web este blocată cu un fișier robots.txt, URL-ul său poate apărea în continuare în rezultatele căutării, dar rezultatul căutării
    nu va avea o descriere.
    Fișierele de imagine, video, PDF și alte fișiere non- încorporate în pagina blocată vor
    fi excluse de la crawling, de asemenea, cu excepția cazului în care sunt referite de alte pagini care sunt permise
    pentru crawling. Dacă vezi acest rezultat al căutării pentru pagina ta și dorești să-l corectezi, elimină
    intrarea din robots.txt care blochează pagina. Dacă dorești să ascunzi complet pagina din Căutare,
    folosește
    o altă metodă.

    Fișier media

    Folosește un fișier robots.txt pentru a gestiona traficul de crawling și, de asemenea, pentru a preveni afișarea fișierelor de imagine, video și
    audio în rezultatele Căutării Google. Acest lucru nu va împiedica alte pagini sau
    utilizatori să facă legături către fișierul tău de imagine, video sau audio.

    Fișier resursă Poți folosi un fișier robots.txt pentru a bloca fișiere de resurse, cum ar fi imagini neimportante, scripturi,
    sau fișiere de stil, dacă crezi că paginile încărcate fără aceste resurse nu vor
    fi afectate semnificativ de lipsa lor
    . Totuși, dacă absența acestor
    resurse face ca pagina să fie mai greu de înțeles pentru crawler-ul Google, nu le bloca,
    altfel Google nu va face o treabă bună în analizarea paginilor care depind de
    acele resurse.

    Înțelege limitările unui fișier robots.txt

    Înainte de a crea sau edita un fișier robots.txt, ar trebui să cunoști limitele acestei metode de blocare a URL-urilor. În funcție de obiectivele și situația ta, s-ar putea să dorești să iei în considerare alte mecanisme pentru a te asigura că URL-urile tale nu sunt găsite pe web.

    • Regulile robots.txt pot să nu fie suportate de toate motoarele de căutare.
      Instrucțiunile din fișierele robots.txt nu pot impune comportamentul crawler-elor pe site-ul tău; depinde de crawler să le respecte. În timp ce Googlebot și alte crawler-e web respectabile respectă
      instrucțiunile dintr-un fișier robots.txt, alte crawler-e s-ar putea să nu o facă. Prin urmare, dacă dorești să păstrezi informațiile în siguranță față de crawler-ele web, este mai bine să folosești alte metode de blocare, cum ar fi
      protejarea cu parolă a fișierelor private pe serverul tău.
    • Diferite crawler-e interpretează sintaxa diferit.
      Deși crawler-ele web respectabile urmează regulile dintr-un fișier robots.txt, fiecare crawler
      ar putea interpreta regulile diferit. Ar trebui să cunoști
      sintaxa corectă pentru a te adresa
      diferitelor crawler-e web, deoarece unele s-ar putea să nu înțeleagă anumite instrucțiuni.
    • O pagină care este interzisă în robots.txt poate
      fi totuși indexată dacă este legată de alte site-uri.

      În timp ce Google nu va accesa sau indexa conținutul blocat de un fișier robots.txt, este posibil să găsim și să indexăm un URL interzis dacă este legat de alte locuri de pe web. Ca rezultat,
      adresa URL și, potențial, alte informații disponibile public, cum ar fi textul ancoră
      în legăturile către pagină, pot apărea în rezultatele Căutării Google. Pentru a preveni corect apariția URL-ului tău
      în rezultatele Căutării Google,
      protejează cu parolă fișierele pe serverul tău,
      folosește eticheta noindex meta sau antetul de răspuns,
      sau elimină complet pagina.

    Creează sau actualizează un fișier robots.txt

    Dacă ai decis că ai nevoie de unul, învață cum să
    creezi un fișier robots.txt. Sau dacă
    ai deja unul, învață cum să
    îl actualizezi.

    Vrei să afli mai multe? Verifică următoarele resurse:


    Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.

  • Înțelegeți elementele de bază ale SEO pentru JavaScript

    Înțelegeți elementele de bază ale SEO pentru JavaScript

    Înțelegeți elementele de bază ale SEO pentru JavaScript

    JavaScript este o parte importantă a platformei web, deoarece oferă multe funcționalități care transformă web-ul într-o platformă puternică pentru aplicații.
    Asigurarea că aplicațiile web alimentate de JavaScript sunt descoperibile prin Căutarea Google vă poate ajuta să găsiți noi utilizatori și să reangajați utilizatorii existenți în timp ce aceștia caută conținutul pe care aplicația dvs. web îl oferă.
    În timp ce Căutarea Google rulează JavaScript cu o versiune evergreen a Chromium, există câteva lucruri pe care le puteți optimiza.

    Acest ghid descrie cum procesează Căutarea Google JavaScript și cele mai bune practici pentru îmbunătățirea aplicațiilor web JavaScript pentru Căutarea Google.

    Cum procesează Google JavaScript

    Google procesează aplicațiile web JavaScript în trei faze principale:

    1. Răsfoire
    2. Redare
    3. Indexare

    Googlebot preia o adresă URL din coada de răsfoire,
    o răsfoiește, apoi o trece în etapa de procesare. Etapa de procesare extrage linkuri care
    se întorc în coada de răsfoire și pune pagina în coada de redare. Pagina trece din coada de redare
    la renderer care trimite -ul redat înapoi la procesare care indexează conținutul
    și extrage linkuri pentru a le pune în coada de răsfoire.

    Googlebot pune în coadă paginile atât pentru răsfoire, cât și pentru redare. Nu este imediat evident când o pagină așteaptă să fie răsfoită și când așteaptă să fie redată.
    Când Googlebot preia o adresă URL din coada de răsfoire prin efectuarea unei cereri HTTP, verifică mai întâi dacă permiteți răsfoirea. Googlebot citește fișierul robots.txt.
    Dacă marchează adresa URL ca nepermisă, atunci Googlebot omite efectuarea unei cereri HTTP către această adresă URL și o omite. Căutarea Google nu va reda JavaScript din fișierele blocate sau pe paginile blocate.

    Googlebot apoi analizează răspunsul pentru alte adrese URL în atributul href al linkurilor și adaugă adresele URL în coada de răsfoire. Pentru a preveni descoperirea linkurilor, utilizați mecanismul nofollow.

    Răsfoirea unei adrese URL și analizarea răspunsului funcționează bine pentru site-urile clasice sau paginile redare pe server unde -ul din răspunsul HTTP conține tot conținutul.
    Unele site-uri JavaScript pot utiliza modelul app shell unde -ul inițial nu conține conținutul real și Google trebuie să execute JavaScript înainte de a putea vedea conținutul real al paginii pe care JavaScript-ul îl generează.

    Googlebot pune în coadă toate paginile cu un cod de stare HTTP 200 pentru redare, cu excepția cazului în care un meta tag sau antet robots spune Google să nu indexeze pagina.
    Pagina poate rămâne în această coadă pentru câteva secunde, dar poate dura mai mult de atât. Odată ce resursele Google permit, un Chromium fără cap redă pagina și execută JavaScript-ul.
    Googlebot analizează din nou -ul redat pentru linkuri și pune în coadă adresele URL pe care le găsește pentru răsfoire. Google folosește, de asemenea, -ul redat pentru a indexa pagina.

    Rețineți că redarea pe server sau pre-redarea este încă o idee excelentă, deoarece face site-ul dvs. mai rapid pentru utilizatori și crawlere, și nu toate boturile pot rula JavaScript.

    Descrieți pagina dvs. cu titluri și fragmente unice

    <title> elemente unice și descriptive și meta descrieri ajută utilizatorii să identifice rapid cel mai bun rezultat pentru obiectivul lor.
    Puteți utiliza JavaScript pentru a seta sau schimba meta descrierea, precum și elementul <title>.

    rel="canonical" tag-ul de link ajută Google să găsească versiunea canonică a unei pagini.
    Puteți utiliza JavaScript pentru a seta URL-ul canonic, dar rețineți că nu ar trebui să utilizați JavaScript pentru a schimba URL-ul canonic în altceva decât URL-ul pe care l-ați specificat ca URL canonic în -ul original.
    Cel mai bun mod de a seta URL-ul canonic este să utilizați , dar dacă trebuie să utilizați JavaScript, asigurați-vă că setați întotdeauna URL-ul canonic la aceeași valoare ca -ul original.
    Dacă nu puteți seta URL-ul canonic în , atunci puteți utiliza JavaScript pentru a seta URL-ul canonic și să-l lăsați în afara -ului original.

    Scrieți cod compatibil

    Browserele oferă multe API-uri și JavaScript este un limbaj care evoluează rapid. Google are unele limitări în ceea ce privește care API-uri și caracteristici JavaScript le suportă. Pentru a vă asigura că codul dvs. este
    compatibil cu Google, urmați ghidurile noastre pentru depanarea problemelor JavaScript.

    Google recomandă utilizarea servirii diferențiale și a polyfill-urilor dacă detectați lipsa unui API de browser de care aveți nevoie.
    Deoarece unele caracteristici ale browserului nu pot fi polyfill-ate, Google recomandă să verificați documentația polyfill pentru eventualele limitări.

    Utilizați coduri de stare HTTP semnificative

    Googlebot folosește coduri de stare HTTP pentru a afla dacă ceva a mers prost atunci când răsfoiește pagina.

    Pentru a spune Googlebot dacă o pagină nu poate fi răsfoită sau indexată, utilizați un cod de stare semnificativ, cum ar fi un 404 pentru o pagină care nu a putut fi găsită sau un cod 401 pentru paginile din spatele unui login.
    Puteți utiliza coduri de stare HTTP pentru a spune Googlebot dacă o pagină a fost mutată la o nouă adresă URL, astfel încât indexul să poată fi actualizat corespunzător.

    Iată o listă de coduri de stare HTTP și cum afectează acestea Căutarea Google.

    Evitați erorile soft 404 în aplicațiile cu o singură pagină

    În aplicațiile cu o singură pagină redare pe partea clientului, rutarea este adesea implementată ca rutare pe partea clientului.
    În acest caz, utilizarea codurilor de stare HTTP semnificative poate fi imposibilă sau nepractică.
    Pentru a evita erorile soft 404 atunci când utilizați redarea și rutarea pe partea clientului, utilizați una dintre următoarele strategii:

    • Utilizați un redirect JavaScript către o adresă URL pentru care serverul răspunde cu un cod de stare HTTP 404 (de exemplu /not-found).
    • Adăugați un <meta name="robots" content="noindex"> la paginile de eroare folosind JavaScript.

    Iată un exemplu de cod pentru abordarea cu redirect:

    fetch(`/api/products/${productId}`)
    .then(response => response.json())
    .then(product => {
      if(product.exists) {
        showProductDetails(product); // afișează informațiile despre produs pe pagină
      } else {
        // acest produs nu există, deci aceasta este o pagină de eroare.
        window.location.href = '/not-found'; // redirecționează către pagina 404 pe server.
      }
    })

    Iată un exemplu de cod pentru abordarea cu tagul noindex:

    fetch(`/api/products/${productId}`)
    .then(response => response.json())
    .then(product => {
      if(product.exists) {
        showProductDetails(product); // afișează informațiile despre produs pe pagină
      } else {
        // acest produs nu există, deci aceasta este o pagină de eroare.
        // Notă: Acest exemplu presupune că nu există alt tag meta robots prezent în .
        const metaRobots = document.createElement('meta');
        metaRobots.name = 'robots';
        metaRobots.content = 'noindex';
        document.head.appendChild(metaRobots);
      }
    })

    Utilizați API-ul History în loc de fragmente

    Google poate descoperi linkurile dvs. doar dacă sunt <a> elemente cu un atribut href.

    Pentru aplicațiile cu o singură pagină cu rutare pe partea clientului, utilizați API-ul History pentru a implementa rutarea între diferitele vizualizări ale aplicației dvs. web.
    Pentru a vă asigura că Googlebot poate analiza și extrage adresele URL, nu utilizați fragmente pentru a încărca conținut diferit al paginii.
    Următorul exemplu este o practică proastă, deoarece Googlebot nu poate rezolva în mod fiabil adresele URL:

    <nav>
      <ul>
        <li><a href="#/products">Produsele noastre</a></li>
        <li><a href="#/services">Serviciile noastre</a></li>
      </ul>
    </nav>
    
    <h1>Bine ați venit la example.com!</h1>
    <div id="placeholder">
      <p>Aflați mai multe despre <a href="#/products">produsele noastre</a> și <a href="#/services">serviciile noastre</a></p>
    </div>
    <script>
    window.addEventListener('hashchange', function goToPage() {
      // această funcție încarcă conținut diferit pe baza fragmentului URL curent
      const pageToLoad = window.location.hash.slice(1); // fragment URL
      document.getElementById('placeholder').inner = load(pageToLoad);
    });
    </script>

    În schimb, puteți să vă asigurați că adresele URL sunt accesibile pentru Googlebot implementând API-ul History:

    <nav>
      <ul>
        <li><a href="/products">Produsele noastre</a></li>
        <li><a href="/services">Serviciile noastre</a></li>
      </ul>
    </nav>
    
    <h1>Bine ați venit la example.com!</h1>
    <div id="placeholder">
      <p>Aflați mai multe despre <a href="/products">produsele noastre</a> și <a href="/services">serviciile noastre</a></p>
    </div>
    <script>
    function goToPage(event) {
      event.preventDefault(); // oprește browserul să navigheze la adresa URL de destinație.
      const hrefUrl = event.target.getAttribute('href');
      const pageToLoad = hrefUrl.slice(1); // elimină bara de început
      document.getElementById('placeholder').inner = load(pageToLoad);
      window.history.pushState({}, window.title, hrefUrl) // Actualizează URL-ul și istoricul browserului.
    }
    
    // Activează rutarea pe partea clientului pentru toate linkurile de pe pagină
    document.querySelectorAll('a').forEach(link => link.addEventListener('click', goToPage));
    
    </script>

    Deși nu se recomandă utilizarea JavaScript pentru aceasta, este posibil să injectați un rel="canonical" tag de link cu JavaScript.
    Căutarea Google va prelua URL-ul canonic injectat atunci când redă pagina. Iată un exemplu pentru a injecta un tag de link rel="canonical" cu JavaScript:

    fetch('/api/cats/' + id)
      .then(function (response) { return response.json(); })
      .then(function (cat) {
        // creează un tag de link canonic și construiește dinamic URL-ul
        // de exemplu, https://example.com/cats/simba
        const linkTag = document.createElement('link');
        linkTag.setAttribute('rel', 'canonical');
        linkTag.href = 'https://example.com/cats/' + cat.urlFriendlyName;
        document.head.appendChild(linkTag);
      });

    Utilizați cu atenție tagurile robots meta

    Puteți împiedica Google să indexeze o pagină sau să urmeze linkuri prin intermediul tagului robots meta.
    De exemplu, adăugarea următorului tag meta în partea de sus a paginii dvs. blochează Google să indexeze pagina:

    <!-- Google nu va indexa această pagină sau nu va urma linkurile de pe această pagină -->
    <meta name="robots" content="noindex, nofollow">

    Puteți utiliza JavaScript pentru a adăuga un tag robots meta la o pagină sau pentru a-i schimba conținutul.
    Următorul exemplu de cod arată cum să schimbați tagul robots meta cu JavaScript pentru a preveni indexarea paginii curente dacă un apel API nu returnează conținut.

    fetch('/api/products/' + productId)
      .then(function (response) { return response.json(); })
      .then(function (apiResponse) {
        if (apiResponse.isError) {
          // obțineți tagul robots meta
          var metaRobots = document.querySelector('meta[name="robots"]');
          // dacă nu a existat niciun tag robots meta, adăugați unul
          if (!metaRobots) {
            metaRobots = document.createElement('meta');
            metaRobots.setAttribute('name', 'robots');
            document.head.appendChild(metaRobots);
          }
          // spuneți Google să excludă această pagină din index
          metaRobots.setAttribute('content', 'noindex');
          // afișați un mesaj de eroare utilizatorului
          errorMsg.textContent = 'Acest produs nu mai este disponibil';
          return;
        }
        // afișați informațiile despre produs
        // ...
      });

    Utilizați cache-ul pe termen lung

    Googlebot cachează agresiv pentru a reduce cererile de rețea și utilizarea resurselor. WRS poate ignora anteturile de cache. Acest lucru poate duce la utilizarea de către WRS a resurselor JavaScript sau CSS învechite.
    Amprentarea conținutului evită această problemă prin includerea unei amprente a conținutului în numele fișierului, cum ar fi main.2bb85551.js.
    Amprenta depinde de conținutul fișierului, astfel încât actualizările generează un nume de fișier diferit de fiecare dată.
    Consultați ghidul web.dev despre strategiile de cache pe termen lung pentru a afla mai multe.

    Utilizați date structurate

    Când utilizați date structurate pe paginile dvs., puteți utiliza JavaScript pentru a genera JSON-LD-ul necesar și a-l injecta în pagină. Asigurați-vă că testați implementarea pentru a evita problemele.

    Urmați cele mai bune practici pentru componente web

    Google suportă componentele web.
    Când Google redă o pagină, aplatizează conținutul shadow DOM și light DOM.
    Acest lucru înseamnă că Google poate vedea doar conținutul care este vizibil în -ul redat. Pentru a vă asigura că Google poate vedea în continuare conținutul dvs. după ce este redat, utilizați Testul pentru rezultate bogate sau Instrumentul de inspecție a URL-urilor și verificați -ul redat.

    Dacă conținutul nu este vizibil în -ul redat, Google nu va putea să-l indexeze.

    Următorul exemplu creează o componentă web care afișează conținutul său light DOM în interiorul shadow DOM.
    Un mod de a vă asigura că atât conținutul light DOM, cât și shadow DOM sunt afișate în -ul redat este să utilizați un element Slot.

    <script>
      class MyComponent extends Element {
        constructor() {
          super();
          this.attachShadow({ mode: 'open' });
        }
    
        connectedCallback() {
          let p = document.createElement('p');
          p.inner = 'Hello World, this is shadow DOM content. Here comes the light DOM: <slot></slot>';
          this.shadowRoot.appendChild(p);
        }
      }
    
      window.customElements.define('my-component', MyComponent);
    </script>
    
    <my-component>
      <p>Acesta este conținutul light DOM. Este proiectat în shadow DOM.</p>
      <p>WRS redă acest conținut, precum și conținutul shadow DOM.</p>
    </my-component>

    După redare, Google poate indexa acest conținut:

    <my-component>
      Hello World, this is shadow DOM content. Here comes the light DOM:
      <p>Acesta este conținutul light DOM. Este proiectat în shadow DOM<p>
      <p>WRS redă acest conținut, precum și conținutul shadow DOM.</p>
    </my-component>
    

    Remediați imaginile și conținutul încărcat la cerere

    Imaginile pot fi destul de costisitoare în ceea ce privește lățimea de bandă și performanța. O strategie bună este să utilizați încărcarea la cerere pentru a încărca imagini doar atunci când utilizatorul este pe cale să le vadă.
    Pentru a vă asigura că implementați încărcarea la cerere într-un mod prietenos cu căutarea, urmați ghidurile noastre de încărcare la cerere.


    Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.

  • Cum interpretează Google specificațiile robots.txt

    Cum interpretează Google specificațiile robots.txt

    Cum interpretează Google specificațiile robots.txt

    Roboții automatizați ai Google, cunoscuți sub numele de
    crawlers, suportă
    Protocolul de Excludere a Roboților (REP).
    Acest lucru înseamnă că, înainte de a accesa un site, roboții Google descarcă și analizează fișierul robots.txt al site-ului pentru a extrage informații despre care părți ale site-ului pot fi accesate. REP nu se aplică roboților Google care sunt controlați de utilizatori (de exemplu, abonamente la fluxuri) sau roboților care sunt utilizați pentru a crește siguranța utilizatorilor (de exemplu, analiza malware).

    Această pagină descrie interpretarea REP de către Google. Pentru standardul original, consultați
    RFC 9309.

    Ce este un fișier robots.txt

    Dacă nu doriți ca roboții să acceseze secțiuni ale site-ului dvs., puteți crea un fișier robots.txt cu reguli corespunzătoare. Un fișier robots.txt este un fișier text care conține reguli despre care roboți pot accesa care părți ale unui site. De exemplu, fișierul robots.txt pentru example.com poate arăta astfel:

    # Acest fișier robots.txt controlează accesarea URL-urilor sub https://example.com.
    # Toți roboții nu au permisiunea de a accesa fișierele din directorul "includes", cum ar fi .css, .js, dar Google are nevoie de ele pentru redare, așa că Googlebot are permisiunea de a le accesa.
    User-agent: *
    Disallow: /includes/
    
    User-agent: Googlebot
    Allow: /includes/
    
    Sitemap: https://example.com/sitemap.xml

    Dacă sunteți nou în utilizarea robots.txt, începeți cu
    introducerea în robots.txt. De asemenea, puteți găsi
    sfaturi pentru crearea unui fișier robots.txt.

    Locația fișierului și domeniul de valabilitate

    Trebuie să plasați fișierul robots.txt în directorul de nivel superior al unui site, pe un protocol suportat. URL-ul pentru fișierul robots.txt este (ca și alte URL-uri) sensibil la majuscule și minuscule. În cazul Google Search, protocoalele suportate sunt HTTP, HTTPS și FTP. Pe HTTP și HTTPS, roboții accesează fișierul robots.txt cu o cerere HTTP non-condițională GET; pe FTP, roboții folosesc o comandă standard RETR (RETRIEVE), folosind autentificare anonimă.

    Regulile listate în fișierul robots.txt se aplică doar gazdei, protocolului și numărului de port unde este găzduit fișierul robots.txt.

    Exemple de URL-uri robots.txt valide

    Tabelul următor conține exemple de URL-uri robots.txt și pentru ce căi URL sunt valabile. Prima coloană conține URL-ul unui fișier robots.txt, iar a doua coloană conține domeniile pentru care acel fișier robots.txt ar fi și nu ar fi valabil.

    Exemple de URL-uri robots.txt
    https://example.com/robots.txt

    Acesta este cazul general. Nu este valabil pentru alte subdomenii, protocoale sau numere de port. Este valabil pentru toate fișierele din toate subdirectoarele de pe aceeași gazdă, protocol și număr de port.

    Valabil pentru:

    • https://example.com/
    • https://example.com/folder/file

    Nu este valabil pentru:

    • https://other.example.com/
    • http://example.com/
    • https://example.com:8181/
    https://www.example.com/robots.txt

    Un fișier robots.txt pe un subdomeniu este valabil doar pentru acel subdomeniu.

    Valabil pentru:
    https://www.example.com/

    Nu este valabil pentru:

    • https://example.com/
    • https://shop.www.example.com/
    • https://www.shop.example.com/
    https://example.com/folder/robots.txt Nu este un fișier robots.txt valabil. Roboții nu verifică fișierele robots.txt în subdirectoare.
    https://www.exämple.com/robots.txt

    IDN-urile sunt echivalente cu versiunile lor punycode. Vezi și
    RFC 3492.

    Valabil pentru:

    • https://www.exämple.com/
    • https://xn--exmple-cua.com/

    Nu este valabil pentru:
    https://www.example.com/

    ftp://example.com/robots.txt

    Valabil pentru:
    ftp://example.com/

    Nu este valabil pentru:
    https://example.com/

    https://212.96.82.21/robots.txt

    Un fișier robots.txt cu o adresă IP ca nume de gazdă este valabil doar pentru accesarea acelei adrese IP ca nume de gazdă. Nu este automat valabil pentru toate site-urile găzduite pe acea adresă IP (deși este posibil ca fișierul robots.txt să fie partajat, caz în care ar fi disponibil și sub numele de gazdă partajat).

    Valabil pentru:
    https://212.96.82.21/

    Nu este valabil pentru:
    https://example.com/ (chiar dacă este găzduit pe 212.96.82.21)

    https://example.com:443/robots.txt

    Numerele de port standard (80 pentru HTTP, 443 pentru HTTPS, 21 pentru FTP) sunt echivalente cu numele de gazdă implicite.

    Valabil pentru:

    • https://example.com:443/
    • https://example.com/

    Nu este valabil pentru:
    https://example.com:444/

    https://example.com:8181/robots.txt

    Fișierele robots.txt pe numere de port non-standard sunt valabile doar pentru conținutul disponibil prin acele numere de port.

    Valabil pentru:
    https://example.com:8181/

    Nu este valabil pentru:
    https://example.com/

    Gestionarea erorilor și codurilor de stare HTTP

    Când se solicită un fișier robots.txt, codul de stare HTTP al răspunsului serverului afectează modul în care fișierul robots.txt va fi utilizat de roboții Google. Tabelul următor rezumă modul în care Googlebot tratează fișierele robots.txt pentru diferite coduri de stare HTTP.

    Gestionarea erorilor și codurilor de stare HTTP
    2xx (succes) Codurile de stare HTTP care semnalează succesul determină roboții Google să proceseze fișierul robots.txt așa cum este furnizat de server.
    3xx (redirecționare)

    Google urmează cel puțin cinci salturi de redirecționare, așa cum este definit de
    RFC 1945, și apoi se oprește și tratează ca un 404 pentru fișierul robots.txt. Acest lucru se aplică și oricăror URL-uri interzise în lanțul de redirecționare, deoarece robotul nu a putut prelua regulile din cauza redirecționărilor.

    Google nu urmează redirecționările logice în fișierele robots.txt (cadre, JavaScript sau redirecționări de tip meta refresh).

    4xx (erori client)

    Roboții Google tratează toate erorile 4xx, cu excepția 429, ca și cum un fișier robots.txt valabil nu ar exista. Acest lucru înseamnă că Google presupune că nu există restricții de accesare.

    5xx (erori server)

    Dacă Google găsește un fișier robots.txt, dar nu poate să-l preia, Google urmează acest comportament:

    1. Pentru primele 12 ore, Google oprește accesarea site-ului, dar continuă să încerce să preia fișierul robots.txt.
    2. Dacă Google nu poate prelua o versiune nouă, pentru următoarele 30 de zile Google va folosi ultima versiune bună, continuând să încerce să preia o versiune nouă. O eroare 503 (serviciu indisponibil) duce la încercări frecvente de reîncercare. Dacă nu există o versiune în cache disponibilă, Google presupune că nu există restricții de accesare.
    3. Dacă erorile nu sunt remediate după 30 de zile:
      • Dacă site-ul este în general disponibil pentru Google, Google va acționa ca și cum nu ar exista un fișier robots.txt (dar va continua să verifice pentru o versiune nouă).
      • Dacă site-ul are probleme generale de disponibilitate, Google va opri accesarea site-ului, continuând să solicite periodic un fișier robots.txt.
    Alte erori Un fișier robots.txt care nu poate fi preluat din cauza problemelor DNS sau de rețea, cum ar fi expirări de timp, răspunsuri invalide, conexiuni resetate sau întrerupte și erori de fragmentare HTTP, este tratat ca o eroare de server.

    Caching

    Google în general cachează conținutul fișierului robots.txt pentru până la 24 de ore, dar poate să-l cacheze mai mult în situații în care reîmprospătarea versiunii cache nu este posibilă (de exemplu, din cauza expirărilor de timp sau a erorilor 5xx). Răspunsul cache poate fi partajat de diferiți roboți. Google poate crește sau reduce durata de viață a cache-ului pe baza
    max-age Cache-Control
    din anteturile HTTP.

    Formatul fișierului

    Fișierul robots.txt trebuie să fie un fișier text simplu codificat
    UTF-8 și liniile trebuie să fie separate prin CR, CR/LF sau LF.

    Google ignoră liniile invalide din fișierele robots.txt, inclusiv
    Marca de Ordine a Bytelor Unicode (BOM) la începutul fișierului robots.txt, și folosește doar liniile valide. De exemplu, dacă conținutul descărcat este în loc de reguli robots.txt, Google va încerca să parseze conținutul și să extragă regulile, ignorând tot restul.

    În mod similar, dacă codificarea caracterelor fișierului robots.txt nu este UTF-8, Google poate ignora caracterele care nu fac parte din gama UTF-8, ceea ce poate face ca regulile robots.txt să fie invalide.

    Google impune o limită de dimensiune a fișierului robots.txt de 500
    kibibytes (KiB). Conținutul care depășește dimensiunea maximă a fișierului este ignorat. Puteți reduce dimensiunea fișierului robots.txt prin consolidarea regulilor care ar duce la un fișier robots.txt supradimensionat. De exemplu, plasați materialul exclus într-un director separat.

    Sintaxa

    Liniile valide din fișierul robots.txt constau dintr-un câmp, un colon și o valoare. Spațiile sunt opționale, dar recomandate pentru a îmbunătăți lizibilitatea. Spațiul de la începutul și sfârșitul liniei este ignorat. Pentru a include comentarii, precedați comentariul cu caracterul #. Rețineți că tot ce urmează după caracterul # va fi ignorat. Formatul general este <field>:<value><#optional-comment>.

    Google suportă următoarele câmpuri (alte câmpuri, cum ar fi crawl-delay, nu sunt suportate):

    • user-agent: identifică pentru care robot se aplică regulile.
    • allow: o cale URL care poate fi accesată.
    • disallow: o cale URL care nu poate fi accesată.
    • sitemap: URL-ul complet al unui sitemap.

    Câmpurile allow și disallow sunt, de asemenea, numite reguli (cunoscute și sub numele de directive). Aceste reguli sunt întotdeauna specificate sub forma rule: [path], unde [path] este opțional. În mod implicit, nu există restricții pentru accesarea de către roboții desemnați. Roboții ignoră regulile fără un [path].

    Valoarea [path], dacă este specificată, este relativă la rădăcina site-ului de unde a fost preluat fișierul robots.txt (folosind același protocol, număr de port, gazdă și nume de domeniu). Valoarea căii trebuie să înceapă cu / pentru a desemna rădăcina, iar valoarea este sensibilă la majuscule și minuscule. Aflați mai multe despre
    potrivirea URL-urilor pe baza valorilor căii.

    user-agent

    Linia user-agent identifică pentru care robot se aplică regulile. Consultați
    roboții Google și șirurile de user-agent
    pentru o listă cuprinzătoare de șiruri de user-agent pe care le puteți utiliza în fișierul dvs. robots.txt.

    Valoarea liniei user-agent nu este sensibilă la majuscule și minuscule.

    disallow

    Regula disallow specifică căile care nu trebuie accesate de roboții identificați de linia user-agent cu care este grupată regula disallow. Roboții ignoră regula fără o cale.

    Google nu poate indexa conținutul paginilor care sunt interzise pentru accesare, dar poate totuși să indexeze URL-ul și să-l afișeze în rezultatele căutării fără un fragment. Aflați cum să
    blocați indexarea.

    Valoarea regulii disallow este sensibilă la majuscule și minuscule.

    Utilizare:

    disallow: [path]
    

    allow

    Regula allow specifică căile care pot fi accesate de roboții desemnați. Când nu este specificată nicio cale, regula este ignorată.

    Valoarea regulii allow este sensibilă la majuscule și minuscule.

    Utilizare:

    allow: [path]
    

    sitemap

    Google, Bing și alte motoare de căutare majore suportă câmpul sitemap în robots.txt, așa cum este definit de
    sitemaps.org.

    Valoarea câmpului sitemap este sensibilă la majuscule și minuscule.

    Utilizare:

    sitemap: [absoluteURL]

    Linia [absoluteURL] indică locația unui fișier sitemap sau a unui index de sitemap. Trebuie să fie un URL complet calificat, incluzând protocolul și gazda, și nu trebuie să fie codificat URL. URL-ul nu trebuie să fie pe aceeași gazdă ca fișierul robots.txt. Puteți specifica mai multe câmpuri sitemap. Câmpul sitemap nu este legat de niciun agent utilizator specific și poate fi urmat de toți roboții, cu condiția să nu fie interzis pentru accesare.

    De exemplu:

    user-agent: otherbot
    disallow: /kale
    
    sitemap: https://example.com/sitemap.xml
    sitemap: https://cdn.example.org/other-sitemap.xml
    sitemap: https://ja.example.org/テスト-サイトマップ.xml

    Gruparea liniilor și regulilor

    Puteți grupa împreună regulile care se aplică mai multor agenți utilizatori prin repetarea liniilor user-agent pentru fiecare robot.

    De exemplu:

    user-agent: a
    disallow: /c
    
    user-agent: b
    disallow: /d
    
    user-agent: e
    user-agent: f
    disallow: /g
    
    user-agent: h
    

    În acest exemplu există patru grupuri distincte de reguli:

    • Un grup pentru agentul utilizator “a”.
    • Un grup pentru agentul utilizator “b”.
    • Un grup pentru ambii agenți utilizatori “e” și “f”.
    • Un grup pentru agentul utilizator “h”.

    Pentru descrierea tehnică a unui grup, consultați
    secțiunea 2.1 din REP.

    Ordinea de precedență pentru agenți utilizatori

    Doar un singur grup este valabil pentru un anumit robot. Roboții Google determină grupul corect de reguli găsind în fișierul robots.txt grupul cu cel mai specific agent utilizator care se potrivește cu agentul utilizator al robotului. Alte grupuri sunt ignorate. Tot textul care nu se potrivește este ignorat (de exemplu, atât googlebot/1.2 cât și googlebot* sunt echivalente cu googlebot). Ordinea grupurilor în fișierul robots.txt este irelevantă.

    Dacă există mai mult de un grup specific declarat pentru un agent utilizator, toate regulile din grupurile aplicabile agentului utilizator specific sunt combinate intern într-un singur grup. Grupurile specifice agentului utilizator și grupurile globale (*) nu sunt combinate.

    Exemple

    user-agent” tabindex=”-1″>Potrivirea câmpurilor user-agent

    user-agent: googlebot-news
    (group 1)
    
    user-agent: *
    (group 2)
    
    user-agent: googlebot
    (group 3)
    

    Așa ar alege roboții grupul relevant:

    Grup urmat de fiecare robot
    Googlebot News googlebot-news urmează grupul 1, deoarece grupul 1 este cel mai specific grup.
    Googlebot (web) googlebot urmează grupul 3.
    Googlebot Storebot Storebot-Google urmează grupul 2, deoarece nu există un grup specific
    Storebot-Google.
    Googlebot News (când accesează imagini) Când accesează imagini, googlebot-news urmează grupul 1.
    googlebot-news nu accesează imaginile pentru Google Images, așa că urmează doar grupul 1.
    Otherbot (web) Alți roboți Google urmează grupul 2.
    Otherbot (știri) Alți roboți Google care accesează conținut de știri, dar nu se identifică ca
    googlebot-news urmează grupul 2. Chiar dacă există o intrare pentru un robot similar, este valabilă doar dacă se potrivește specific.

    Gruparea regulilor

    Dacă există mai multe grupuri într-un fișier robots.txt care sunt relevante pentru un agent utilizator specific, roboții Google combină intern grupurile. De exemplu:

    user-agent: googlebot-news
    disallow: /fish
    
    user-agent: *
    disallow: /carrots
    
    user-agent: googlebot-news
    disallow: /shrimp
    

    Roboții grupează intern regulile pe baza agentului utilizator, de exemplu:

    user-agent: googlebot-news
    disallow: /fish
    disallow: /shrimp
    
    user-agent: *
    disallow: /carrots
    

    Regulile altele decât allow, disallow și user-agent sunt ignorate de parserul robots.txt. Acest lucru înseamnă că următorul fragment de robots.txt este tratat ca un singur grup, și astfel atât user-agent a cât și b sunt afectați de regula disallow: /:

    user-agent: a
    sitemap: https://example.com/sitemap.xml
    
    user-agent: b
    disallow: /

    Când roboții procesează regulile robots.txt, ei ignoră linia sitemap. De exemplu, așa ar înțelege roboții fragmentul anterior de robots.txt:

    user-agent: a
    user-agent: b
    disallow: /

    Potrivirea URL-urilor pe baza valorilor căilor

    Google folosește valoarea căii în regulile allow și disallow ca bază pentru a determina dacă o regulă se aplică unui URL specific pe un site. Acest lucru funcționează prin compararea regulii cu componenta căii URL-ului pe care robotul încearcă să-l acceseze. Caracterele non-ASCII de 7 biți dintr-o cale pot fi incluse ca caractere UTF-8 sau ca caractere codificate UTF-8 cu procent, conform
    RFC 3986.

    Google, Bing și alte motoare de căutare majore suportă o formă limitată de caractere wildcard pentru valorile căilor. Aceste caractere wildcard sunt:

    • * desemnează 0 sau mai multe instanțe ale oricărui caracter valid.
    • $ desemnează sfârșitul URL-ului.

    Tabelul următor arată cum afectează caracterele wildcard diferite parsarea:

    Exemple de potrivire a căilor
    / Se potrivește cu rădăcina și orice URL de nivel inferior.
    /* Echivalent cu /. Wildcard-ul final este ignorat.
    /$ Se potrivește doar cu rădăcina. Orice URL de nivel inferior este permis pentru accesare.
    /fish

    Se potrivește cu orice cale care începe cu /fish. Rețineți că potrivirea este sensibilă la majuscule și minuscule.

    Se potrivește:

    • /fish
    • /fish.
    • /fish/salmon.
    • /fishheads
    • /fishheads/yummy.
    • /fish.php?id=anything

    Nu se potrivește:

    • /Fish.asp
    • /catfish
    • /?id=fish
    • /desert/fish
    /fish*

    Echivalent cu /fish. Wildcard-ul final este ignorat.

    Se potrivește:

    • /fish
    • /fish.
    • /fish/salmon.
    • /fishheads
    • /fishheads/yummy.
    • /fish.php?id=anything

    Nu se potrivește:

    • /Fish.asp
    • /catfish
    • /?id=fish
    • /desert/fish
    /fish/

    Se potrivește cu orice în folderul /fish/.

    Se potrivește:

    • /fish/
    • /fish/?id=anything
    • /fish/salmon.htm

    Nu se potrivește:

    • /fish
    • /fish.
    • /animals/fish/
    • /Fish/Salmon.asp
    /*.php

    Se potrivește cu orice cale care conține .php.

    Se potrivește:

    • /index.php
    • /filename.php
    • /folder/filename.php
    • /folder/filename.php?parameters
    • /folder/any.php.file.
    • /filename.php/

    Nu se potrivește:

    • / (chiar dacă se mapează la /index.php)
    • /windows.PHP
    /*.php$

    Se potrivește cu orice cale care se termină cu .php.

    Se potrivește:

    • /filename.php
    • /folder/filename.php

    Nu se potrivește:

    • /filename.php?parameters
    • /filename.php/
    • /filename.php5
    • /windows.PHP
    /fish*.php

    Se potrivește cu orice cale care conține /fish și .php, în această ordine.

    Se potrivește:

    • /fish.php
    • /fishheads/catfish.php?parameters

    Nu se potrivește:

    /Fish.PHP

    Ordinea de precedență pentru reguli

    Când se potrivesc regulile robots.txt cu URL-urile, roboții folosesc cea mai specifică regulă pe baza lungimii căii regulii. În cazul regulilor conflictuale, inclusiv cele cu wildcard-uri, Google folosește regula cea mai puțin restrictivă.

    Următoarele exemple demonstrează ce regulă vor aplica roboții Google pe un URL dat.

    Situații exemplu
    https://example.com/page

    allow: /p
    disallow: /

    Regula aplicabilă: allow: /p, deoarece este mai specifică.

    https://example.com/folder/page

    allow: /folder
    disallow: /folder

    Regula aplicabilă: allow: /folder, deoarece în cazul regulilor conflictuale, Google folosește regula cea mai puțin restrictivă.

    https://example.com/page.htm

    allow: /page
    disallow: /*.htm

    Regula aplicabilă: disallow: /*.htm, deoarece calea regulii este mai lungă și se potrivește cu mai multe caractere din URL, deci este mai specifică.

    https://example.com/page.php5

    allow: /page
    disallow: /*.ph

    Regula aplicabilă: allow: /page, deoarece în cazul regulilor conflictuale, Google folosește regula cea mai puțin restrictivă.

    https://example.com/

    allow: /$
    disallow: /

    Regula aplicabilă: allow: /$, deoarece este mai specifică.

    https://example.com/page.htm

    allow: /$
    disallow: /

    Regula aplicabilă: disallow: /, deoarece regula allow se aplică doar pe URL-ul rădăcină.


    Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.

  • Cum afectează codurile de stare HTTP crawler-ele Google

    Cum afectează codurile de stare HTTP crawler-ele Google

    Coduri de stare HTTP

    Codurile de stare HTTP sunt generate de serverul care găzduiește site-ul atunci când răspunde la o cerere făcută de un client, de exemplu un browser sau un crawler. Fiecare cod de stare HTTP are o semnificație diferită, dar adesea rezultatul cererii este același. De exemplu, există mai multe coduri de stare care semnalează redirecționarea, dar rezultatul lor este același.

    Search Console generează mesaje de eroare pentru codurile de stare din intervalul 4xx—5xx, și pentru redirecționările eșuate (3xx). Dacă serverul a răspuns cu un cod de stare 2xx, conținutul primit în răspuns poate fi luat în considerare pentru indexare.

    Tabelul următor conține cele mai întâlnite coduri de stare HTTP de către Google și o explicație despre cum gestionează Google fiecare cod de stare.

    Coduri de stare HTTP

    2xx (success)

    Google ia în considerare conținutul pentru procesare (de exemplu, în cazul Google Search, pentru indexare). Dacă conținutul sugerează o eroare pentru Google Search, o pagină goală sau un mesaj de eroare, Search Console va afișa o eroare soft 404.

    200 (success)

    Google transmite mai departe ceea ce a primit către următorul pas de procesare (care este specific produsului). Pentru Google Search, următorul sistem este pipeline-ul de indexare. Sistemele de indexare pot indexa conținutul, dar acest lucru nu este garantat.

    201 (created)
    202 (accepted)

    Google așteaptă conținutul pentru o perioadă limitată de timp, apoi transmite mai departe ceea ce a primit către următorul pas de procesare (care este specific produsului). Timeout-ul depinde de agentul utilizatorului, de exemplu Googlebot Smartphone poate avea un timeout diferit față de Googlebot Image.

    204 (no content)

    Google nu a reușit să primească niciun conținut și, prin urmare, nu poate să-l proceseze.

    3xx (redirection)

    În mod implicit, crawler-ele Google urmează până la 10 salturi de redirecționare. Totuși, crawler-ele unor produse specifice pot avea limite diferite. De exemplu, Googlebot urmează în general 10 salturi de redirecționare atunci când scanează conținut web general, dar Instrumentele de Inspecție Google nu urmează redirecționările.

    Orice conținut pe care Google îl primește de la URL-ul de redirecționare este ignorat, iar conținutul URL-ului țintă final este procesat în schimb. Pentru fișierele robots.txt, învață cum Google gestionează un robots.txt care returnează un cod de stare 3xx.

    301 (moved permanently)

    Google urmează redirecționarea, iar sistemele Google folosesc redirecționarea ca un semnal puternic că ținta redirecționării ar trebui procesată.

    302 (found)

    În mod implicit, crawler-ele Google urmează redirecționarea, iar sistemele Google folosesc redirecționarea ca un semnal slab că ținta redirecționării ar trebui procesată. Alte produse pot gestiona redirecționarea diferit.

    303 (see other)
    304 (not modified)

    Crawler-ele Google semnalează următorului sistem de procesare că conținutul este același ca ultima dată când a fost scanat. În cazul Google Search, pipeline-ul de indexare poate recalcula semnalele pentru URL, dar altfel codul de stare nu are efect asupra indexării.

    307 (temporary redirect) Echivalent cu 302.
    308 (moved permanently) Echivalent cu 301.

    4xx (client errors)

    Google nu folosește conținutul de la URL-urile care returnează coduri de stare 4xx. Dacă un URL a fost utilizat anterior, dar acum returnează un cod de stare 4xx, sistemele Google vor înceta să folosească URL-ul în timp. În cazul Google Search, Google nu indexează URL-urile care returnează un cod de stare 4xx, iar URL-urile care sunt deja indexate și returnează un cod de stare 4xx sunt eliminate din index.

    Orice conținut pe care Google îl primește de la URL-urile care returnează un cod de stare 4xx este ignorat.

    400 (bad request)

    Toate erorile 4xx, cu excepția 429, sunt tratate la fel: crawler-ele Google informează următorul sistem de procesare că conținutul nu există.

    În cazul Google Search, pipeline-ul de indexare elimină URL-ul din index dacă a fost indexat anterior. Paginile 404 nou întâlnite nu sunt procesate. Frecvența de scanare scade treptat.

    401 (unauthorized)
    403 (forbidden)
    404 (not found)
    410 (gone)
    411 (length required)
    429 (too many requests)

    Crawler-ele Google tratează codul de stare 429 ca un semnal că serverul este supraîncărcat și este considerat o eroare de server.

    5xx (server errors)

    Erorile de server 5xx și 429 determină crawler-ele Google să încetinească temporar scanarea. Pentru Google Search, URL-urile deja indexate sunt păstrate în index, dar în cele din urmă sunt eliminate.

    Orice conținut pe care Google îl primește de la URL-urile care returnează un cod de stare 5xx este ignorat. Pentru fișierele robots.txt, învață cum Google gestionează un robots.txt care returnează un cod de stare 5xx.

    Odată ce serverul începe să răspundă cu un cod de stare 2xx, Google crește treptat rata de scanare pentru site.

    500 (internal server error)

    Google reduce rata de scanare pentru site. Reducerea ratei de scanare este proporțională cu numărul de URL-uri individuale care returnează o eroare de server. Pentru Google Search, pipeline-ul de indexare Google elimină din index URL-urile care returnează persistent o eroare de server.

    502 (bad gateway)
    503 (service unavailable)

    Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.

  • Prezentare generală a crawlerelor și fetcherelor Google (user agents)

    Prezentare generală a crawlerelor și fetcherelor Google (user agents)

    Prezentare generală a crawlerelor și fetcherelor Google (user agents)

    Google utilizează crawlere și fetchere pentru a efectua acțiuni pentru produsele sale, fie automat, fie declanșate de cererea utilizatorului. Crawlerul (uneori numit și “robot” sau “spider”) este un termen generic pentru orice program utilizat pentru a
    descoperi și scana automat site-uri web.
    Fetcherele acționează ca un program similar cu
    wget, care de obicei face o singură cerere în numele unui utilizator. Clienții Google se încadrează în trei categorii:

    Crawlere comune Crawlerele comune utilizate pentru produsele Google (cum ar fi
    Googlebot). Acestea respectă întotdeauna regulile robots.txt pentru crawl-urile automate.
    Crawlere pentru cazuri speciale Crawlerele pentru cazuri speciale sunt similare cu crawlerele comune, dar sunt utilizate de produse specifice unde există un acord între site-ul scanat și produsul Google despre procesul de crawl. De exemplu, AdsBot ignoră agentul utilizator global din robots.txt (*) cu permisiunea editorului de anunțuri.
    Fetchere declanșate de utilizator Fetcherele declanșate de utilizator fac parte din instrumente și funcții de produs unde utilizatorul final declanșează o cerere de fetch. De exemplu,
    Google Site Verifier
    acționează la cererea unui utilizator.

    Proprietăți tehnice ale crawlerelor și fetcherelor Google

    Crawlerele și fetcherele Google sunt proiectate să ruleze simultan pe mii de mașini pentru a îmbunătăți performanța și a se adapta la creșterea web-ului. Pentru a optimiza utilizarea lățimii de bandă, aceste clienți sunt distribuiți în mai multe centre de date din întreaga lume, astfel încât să fie localizați aproape de site-urile pe care le-ar putea accesa. Prin urmare, jurnalele dvs. pot arăta vizite de la mai multe adrese IP. Google egresează în principal de la adrese IP din Statele Unite. În cazul în care Google detectează că un site blochează cererile din Statele Unite, poate încerca să scaneze de la adrese IP situate în alte țări.

    Protocoale de transfer suportate

    Crawlerele și fetcherele Google suportă HTTP/1.1 și
    HTTP/2. Crawlerele vor utiliza versiunea de protocol care oferă cea mai bună performanță de crawl și pot schimba protocoalele între sesiunile de crawl în funcție de statisticile anterioare de crawl. Versiunea de protocol implicită utilizată de crawlerele Google este HTTP/1.1; crawl-ul prin HTTP/2 poate economisi resurse de calcul (de exemplu, CPU, RAM) pentru site-ul dvs. și Googlebot, dar altfel nu există niciun beneficiu specific produsului Google pentru site (de exemplu, niciun impuls de clasare în Căutarea Google). Pentru a renunța la crawl-ul prin HTTP/2, instruiți serverul care găzduiește site-ul dvs. să răspundă cu un cod de stare HTTP 421 atunci când Google încearcă să acceseze site-ul dvs. prin HTTP/2. Dacă acest lucru nu este fezabil, puteți
    trimite un mesaj echipei de Crawl
    (totuși această soluție este temporară).

    Infrastructura de crawl a Google suportă, de asemenea, crawl-ul prin FTP (așa cum este definit de
    RFC959 și actualizările sale) și FTPS (așa cum este definit de
    RFC4217 și actualizările sale), totuși crawl-ul prin aceste protocoale este rar.

    Codificări de conținut suportate

    Crawlerele și fetcherele Google suportă următoarele codificări de conținut (compresii):
    gzip,
    deflate și
    Brotli (br). Codificările de conținut suportate de fiecare agent utilizator Google sunt anunțate în antetul
    Accept-Encoding al fiecărei cereri pe care o fac. De exemplu,
    Accept-Encoding: gzip, deflate, br.

    Limite de dimensiune a fișierelor

    În mod implicit, crawlerele și fetcherele Google scanează doar primele 15MB ale unui fișier, iar orice conținut dincolo de această limită este ignorat. Totuși, proiectele individuale pot stabili limite diferite pentru crawlerele și fetcherele lor, și de asemenea pentru diferite tipuri de fișiere. De exemplu, un crawler Google
    precum Googlebot poate avea o limită de dimensiune mai mică (de exemplu, 2MB) sau poate specifica o limită de dimensiune mai mare pentru un PDF decât pentru .

    Rata de crawl și încărcarea gazdei

    Obiectivul nostru este să scanăm cât mai multe pagini de pe site-ul dvs. la fiecare vizită fără a suprasolicita serverul dvs. Dacă site-ul dvs. întâmpină dificultăți în a ține pasul cu cererile de crawl ale Google, puteți
    reduce rata de crawl. Rețineți că trimiterea unui cod de răspuns HTTP
    inadecvat
    către crawlerele Google poate afecta modul în care site-ul dvs. apare în produsele Google.

    Caching HTTP

    Infrastructura de crawl a Google suportă caching-ul HTTP euristic așa cum este definit de
    standardul de caching HTTP,
    în special prin antetul de răspuns ETag și antetul de cerere If-None-Match,
    și antetul de răspuns Last-Modified și antetul de cerere If-Modified-Since.

    Dacă atât câmpurile de antet de răspuns ETag cât și Last-Modified sunt prezente în răspunsul HTTP, crawlerele Google utilizează valoarea ETag așa cum este
    cerut de standardul HTTP.
    Pentru crawlerele Google în mod specific, Google recomandă utilizarea
    ETag
    în locul antetului Last-Modified pentru a indica preferința de caching, deoarece
    ETag nu are probleme de formatare a datelor.

    Alte directive de caching HTTP nu sunt suportate.

    Crawlerele și fetcherele Google individuale pot sau nu să utilizeze caching-ul, în funcție de nevoile produsului cu care sunt asociate. De exemplu, Googlebot suportă caching-ul atunci când re-scanăm URL-uri pentru Căutarea Google, iar Storebot-Google suportă caching-ul doar în anumite condiții.

    Pentru a implementa caching HTTP pentru site-ul dvs., contactați furnizorul dvs. de găzduire sau sistem de management al conținutului.

    ETag și If-None-Match

    Infrastructura de crawl a Google suportă ETag și If-None-Match așa cum sunt definite de
    standardul de caching HTTP.
    Aflați mai multe despre
    ETag
    și antetul său de cerere corespondent,
    If-None-Match.

    Last-Modified și If-Modified-Since

    Infrastructura de crawl a Google suportă Last-Modified și
    If-Modified-Since așa cum sunt definite de
    standardul de caching HTTP
    cu următoarele avertismente:

    • Data din antetul Last-Modified trebuie să fie formatată conform
      standardului HTTP.
      Pentru a evita problemele de analiză, Google recomandă utilizarea următorului format de dată:
      “Ziua săptămânii, DD Mon YYYY HH:MM:SS Fus orar”. De exemplu,
      Fri, 4 Sep 1998 19:15:56 GMT“.
    • Deși nu este necesar, luați în considerare și setarea câmpului
      max-age al antetului de răspuns Cache-Control
      pentru a ajuta crawlerele să determine când să re-scanăm URL-ul specific. Setați valoarea câmpului
      max-age la numărul de secunde în care conținutul va rămâne neschimbat. De
      exemplu, Cache-Control: max-age=94043.

    Aflați mai multe despre
    Last-Modified
    și antetul său de cerere corespondent, If-Modified-Since.

    Verificarea crawlerelor și fetcherelor Google

    Crawlerele Google se identifică în trei moduri:

    1. Antetul de cerere HTTP user-agent.
    2. Adresa IP sursă a cererii.
    3. Numele de gazdă DNS invers al adresei IP sursă.

    Aflați cum să utilizați aceste detalii pentru a
    verifica cererile Google.


    Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.

  • Googlebot

    Googlebot

    Googlebot

    Googlebot este denumirea generică pentru două tipuri de
    crawlere web utilizate de Căutarea Google:

    Poți identifica subtipul de Googlebot analizând
    antetul cererii HTTP user-agent
    din cerere. Totuși, ambele tipuri de crawlere respectă același token de produs (token user agent) în
    robots.txt, astfel încât nu poți viza selectiv fie Googlebot Smartphone, fie Googlebot Desktop folosind robots.txt.

    Pentru majoritatea site-urilor, Căutarea Google
    indexează în principal versiunea mobilă
    a conținutului. Astfel, majoritatea cererilor de crawling ale Googlebot vor fi efectuate folosind crawlerul mobil, iar o minoritate folosind crawlerul desktop.

    Cum accesează Googlebot site-ul tău

    Pentru majoritatea site-urilor, Googlebot nu ar trebui să acceseze site-ul tău mai des de o dată la câteva secunde, în medie. Totuși, din cauza întârzierilor, este posibil ca rata să pară ușor mai mare pe perioade scurte. Dacă site-ul tău întâmpină dificultăți în a ține pasul cu cererile de crawling ale Google, poți
    reduce rata de crawling.

    Când efectuează crawling pentru Căutarea Google, Googlebot accesează primii 2MB dintr-un
    tip de fișier suportat, și primii 64MB dintr-un fișier PDF. Dintr-o perspectivă de redare, fiecare resursă referențiată în (cum ar fi CSS și JavaScript) este preluată separat, iar fiecare preluare de resurse este limitată de aceeași limită de dimensiune a fișierului care se aplică altor fișiere (cu excepția fișierelor PDF).
    Odată ce limita de tăiere este atinsă, Googlebot oprește preluarea și trimite doar partea deja descărcată a fișierului pentru considerare la indexare. Limita de dimensiune a fișierului se aplică datelor necomprimate.
    Alte crawlere Google, de exemplu Googlebot Video și Googlebot Image, pot avea
    limite diferite.

    Când efectuează crawling de la adrese IP din SUA, fusul orar al Googlebot este
    Ora Pacificului.

    Alte
    proprietăți tehnice ale Googlebot
    sunt descrise în prezentarea generală a crawlerelor Google.

    Blocarea Googlebot de la vizitarea site-ului tău

    Googlebot descoperă noi URL-uri de crawling în principal din linkuri încorporate în paginile deja crawl-uite. Este aproape imposibil să păstrezi un site secret prin nepublicarea linkurilor către acesta. De exemplu, de îndată ce cineva face clic pe un link de pe site-ul tău “secret” către un alt site, URL-ul site-ului tău “secret” poate apărea în eticheta referrer și poate fi stocat și publicat de celălalt site în jurnalul său de referințe.

    Dacă dorești să împiedici Googlebot să facă crawling pe conținutul site-ului tău, ai la dispoziție
    mai multe opțiuni. Amintește-ți că există o diferență între crawling și indexare; blocarea Googlebot de la crawling pe o pagină nu împiedică URL-ul paginii să apară în rezultatele căutării:

    Blocarea Googlebot afectează Căutarea Google (inclusiv Discover și toate funcțiile Căutării Google), precum și alte produse cum ar fi Google Images, Google Video și Google News.

    Verificarea Googlebot

    Înainte de a decide să blochezi Googlebot, fii conștient că antetul cererii HTTP user-agent utilizat de Googlebot este adesea falsificat de alte crawlere. Este important să verifici că o cerere problematică provine într-adevăr de la Google. Cea mai bună modalitate de a verifica dacă o cerere provine într-adevăr de la Googlebot este să
    folosești o căutare DNS inversă
    pe IP-ul sursă al cererii sau să compari IP-ul sursă cu
    intervalele de IP Googlebot.


    Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.

  • Marcajul de date structurate pe care Google Search îl suportă

    Marcajul de date structurate pe care Google Search îl suportă

    Introducere în datele structurate

    Google utilizează date structurate pentru a înțelege conținutul de pe pagină și pentru a afișa acel conținut într-un mod mai bogat în rezultatele căutării, ceea ce se numește un rezultat bogat. Pentru a face site-ul dvs. eligibil pentru a apărea ca unul dintre aceste rezultate bogate, urmați ghidul pentru a învăța cum să implementați date structurate pe site-ul dvs. Dacă sunteți la început, vizitați Înțelegeți cum funcționează datele structurate.

    Categorii de site-uri și caracteristici de date structurate




    Caracteristici de date structurate

    Articol

    Un articol de știri, sport sau blog afișat în diverse caracteristici de rezultate bogate, cum ar fi titlul articolului și imagini mai mari decât miniaturile.

    Începeți

    exemplu de articol în rezultatele căutării

    Breadcrumb

    Navigare care indică poziția paginii în ierarhia site-ului.

    Începeți

    exemplu de breadcrumb în rezultatele căutării

    Carousel

    Rezultate bogate care se afișează într-o listă secvențială sau galerie de pe un singur site. Această caracteristică trebuie combinată cu una dintre următoarele caracteristici: Rețetă, Listă de cursuri, Restaurant, Film.

    Începeți

    O ilustrație a modului în care un carusel de rețete poate apărea în Google Search. Arată 3 rețete diferite de pe același site într-un format de carusel pe care utilizatorii îl pot explora și selecta o rețetă specifică

    Listă de cursuri

    O listă de cursuri educaționale de la același furnizor de cursuri. Cursurile pot include titlul cursului, furnizorul și o scurtă descriere.

    Începeți

    rezultat bogat al listei de cursuri în rezultatele căutării

    Set de date

    Seturi mari de date care apar în Google Dataset Search.

    Începeți

    exemplu de set de date în rezultatele căutării

    Forum de discuții

    Conținut generat de utilizatori (în mod tradițional de formă scurtă comparativ cu Articol), urmat de o discuție cu fir sau fără fir despre acel subiect.

    Începeți

    O ilustrație a rezultatului bogat pentru discuții și forumuri

    Întrebări și răspunsuri educaționale

    Întrebări și răspunsuri legate de educație care ajută studenții să descopere fișe de studiu pe Google Search.

    Începeți

    Carusel de Întrebări și Răspunsuri educaționale în rezultatele căutării

    Evaluare agregată a angajatorului

    O evaluare a unei organizații de angajare compilată de la mulți utilizatori, afișată în experiența de căutare a locurilor de muncă pe Google.

    Începeți

    exemplu de evaluare agregată a angajatorului în rezultatele căutării

    Eveniment

    Un rezultat bogat interactiv care arată o listă de evenimente organizate, cum ar fi concerte sau festivaluri de artă, la care oamenii pot participa la un anumit moment și loc.

    Începeți

    Cum arată experiența evenimentului în Google Search

    Întrebări frecvente

    O pagină de Întrebări frecvente (FAQ) conține o listă de întrebări și răspunsuri referitoare la un anumit subiect.

    Începeți

    exemplu de FAQ în rezultatele căutării

    Metadate imagine

    Când specificați metadate pentru imagini, Google Images poate afișa mai multe detalii despre imagine, cum ar fi cine este creatorul, cum pot oamenii folosi o imagine și informații de credit.

    Începeți

    Un exemplu de Metadate Imagine în Google Images

    Anunț de locuri de muncă

    Un rezultat bogat interactiv care permite căutătorilor de locuri de muncă să găsească un loc de muncă. Experiența de căutare a locurilor de muncă pe Google poate include logo-ul dvs., recenzii, evaluări și detalii despre locul de muncă.

    Începeți

    exemplu de anunț de locuri de muncă în rezultatele căutării

    Afacere locală

    Detalii despre afacere afișate în panoul de cunoștințe Google, inclusiv orele de deschidere, evaluări, direcții și acțiuni pentru a face programări sau a comanda articole.

    Începeți

    exemplu de afacere locală în rezultatele căutării

    Solver matematic

    Ajutați studenții, profesorii și alții cu probleme matematice adăugând date structurate pentru a indica tipul de probleme matematice și pașii de rezolvare pentru probleme matematice specifice.

    Începeți

    soluții matematice în rezultatele căutării

    Film

    Caruselul de filme ajută utilizatorii să exploreze liste de filme pe Google Search (de exemplu, “cele mai bune filme din 2023”). Puteți oferi detalii despre filme, cum ar fi titlul fiecărui film, informații despre regizor și imagini.

    Începeți

    O ilustrație a modului în care un rezultat bogat de film poate apărea în Google Search. Arată 3 filme diferite de pe același site într-un format de carusel pe care utilizatorii îl pot explora și selecta un film specific

    Organizație

    Informații despre organizația dvs., cum ar fi logo-ul, numele legal al organizației, adresa, informațiile de contact și identificatorii companiei. Aceste informații pot apărea în panourile de cunoștințe și alte elemente vizuale (cum ar fi atribuirea).

    Începeți

    exemplu de organizație în rezultatele căutării

    Produs

    Informații despre un produs, inclusiv prețul, disponibilitatea și evaluările recenziilor.

    Începeți

    exemplu de produs în rezultatele căutării

    Pagină de profil

    O pagină care se concentrează în principal pe informații despre o singură persoană sau organizație care este cumva afiliată cu site-ul general.

    Începeți

    O ilustrație a filtrului de Perspective în rezultatele căutării

    Întrebări și răspunsuri

    Paginile de Întrebări și Răspunsuri sunt pagini web care conțin date într-un format de întrebare și răspuns, care este o întrebare urmată de răspunsurile sale.

    Începeți

    exemplu de pagină de întrebări și răspunsuri în rezultatele căutării

    Rețetă

    Rețete care se afișează ca un rezultat bogat individual sau parte a unui carusel gazdă.

    Începeți

    O ilustrație a modului în care un carusel de rețete gazdă poate apărea în Google Search. Arată 3 rețete diferite de pe același site într-un format de carusel pe care utilizatorii îl pot explora și selecta o rețetă specifică

    Fragment de recenzie

    Un scurt extras dintr-o recenzie sau o evaluare de pe un site de recenzii, de obicei o medie a scorurilor de evaluare combinate de la recenzori. Un fragment de recenzie poate fi despre Carte, Rețetă, Film, Produs, Aplicație software și Afacere locală.

    Începeți

    exemplu de fragment de recenzie în rezultatele căutării

    Aplicație software

    Informații despre o aplicație software, inclusiv informații de evaluare, o descriere a aplicației și un link către aplicație.

    Începeți

    exemplu de aplicație software în rezultatele căutării

    Vorbibil

    Permiteți motoarelor de căutare și altor aplicații să identifice conținutul de știri pentru a fi citit cu voce tare pe dispozitivele compatibile cu Google Assistant folosind text-to-speech (TTS).

    Începeți

    exemplu de vorbibil care arată o conversație cu Google Home. O persoană întreabă Google Home care sunt ultimele știri despre Nasa. Google Home răspunde cu o listă de trei articole de știri.

    Conținut cu abonament și cu plată

    Indicați conținutul cu plată de pe site-ul dvs. pentru a ajuta Google să diferențieze conținutul cu plată de practica de cloaking, care încalcă politicile noastre de spam.

    Începeți

    Un exemplu de paywall de la New York Times care arată că un cititor a atins limita de articole

    Închiriere de vacanță

    Informații despre o proprietate de vacanță, cum ar fi numele, descrierea, imaginile, locația, evaluarea și recenziile.

    Începeți

    ilustrație a unui rezultat bogat pentru închiriere de vacanță

    Video

    Informații video în rezultatele căutării, cu opțiunea de a reda videoclipul, de a specifica segmente video și de a transmite conținut în direct.

    Începeți

    exemplu de video în rezultatele căutării


    Notă de Transparență E-E-A-T: Acest material reprezintă o analiză aprofundată, adaptare și traducere tehnică a documentației oficiale Google Search Central. Conținutul original este oferit de Google sub licența Creative Commons Attribution 4.0 (CC-BY 4.0). AdvancedSystems operează ca o agenție premium independentă de consultanță și audit SEO, aducând valoare adăugată prin explicarea conceptelor arhitecturale pentru piața B2B din România.