I motori di ricerca non leggono per intero tutte le pagine web. Leggenda metropolitana o verità?googlebot97KB1
Personalmente sono come “San Tommaso” : credo solo se tocco con mano.

Oggi siamo in grado di controllare personalmente la veridicità di questa affermazione con un test velocissimo e di trarre le opportune regole di ottimizzazione SEO. Ecco quali sono i passi da seguire:

  1. Reperire un file di testo di dimensione superiore a 100KB e posizionarlo nel nostro spazio web
  2. Accedere con il proprio account a Google – Strumenti per webmaster e selezionare il sito web dove abbiamo caricato il file di testo
  3. Selezionare in sequenza Funzioni sperimentali e Visualizza come Googlebot, digitare l’url del file di testo, cliccare su Recupera e attendere 10/20 secondi. Durante questa attesa, Google ci
    segnalerà che lo stato di analisi dell’url è “In attesa”
  4. Appena lo stato dell’url passa da “In attesa” a “Riuscita”, clicchiamo su “Riuscita” e vedremo un textbox contenente
    il codice estratto dal file di testo. Google tronca il file una volta raggiunto il limite. A questo punto, non rimarrà che fare un copia e incolla del testo estratto su un buon editor di testo (esempio PSPad) e cercare qualche opzione interna all’editor per il conteggio dei caratteri.

Se tutto è andato per il verso giusto, il conteggio dei caratteri ci darà come risultato 100.000 caratteri ≈ 97 KB.
Chiaramente nel “conteggio” dobbiamo includere (in fase di copia e incolla) anche le intestazioni (restituite dal server)
del protocollo HTTP associate al file di testo.

Dunque l’esperimento fornisce una tesi empirica:

Googlebot accede solo ai primi 97Kb dei file (html, txt, pdf, …)

Le regole di ottimizzazione che ne derivano sono immediate :

  • Evitare di costruire pagine web di dimensione superiore a 97KB. Se questo non è possibile, inserire gli accorgimenti SEO e le keyword nei primi 97KB dei file. E’ difficile che una pagina html raggiunga i 97KB di codice ma se ciò accadesse, conviene spezzare gli argomenti in più pagine e ottimizzarle singolarmente
  • Per ridurre la dimensione dei file, è necessario inserire script lato client e regole css su file esterni.
    Evitare l’uso dell’attributo style e ridurre al minimo spazi, tabulazioni, e ritorni a capo