Robots.txt e meta tag Noindex Nofollow: qual รจ la differenza?

Condividi questo articolo

Vediamo insieme cosa sono il file robots.txt e i meta tag Noindex Nofollow

I motori di ricerca usano degli spider per scansionare i siti web. Per sfruttare al meglio le potenzialitร  offerte dai motori di ricerca รจ fondamentale saper comunicare con gli spider. A volte infatti puรฒ essere necessario impedirgli di indicizzare alcune pagine.

L’utilizzo del fileย robots.txtย e dei meta tagsย Noindex Nofollowย ci aiutano aย questo.

Bisogna tuttavia fare attenzione a come li si utilizza poichรจ sono strumenti molti diversi che hanno scopo differenti.

Il file robots.txt รจ quello che ci consente di gestire le indicazioni da dare agli spider dei motori di ricerca che eseguono la scansione del sito. Attraverso il comandoย Disallow robots.txt comunichiamo agli spider di bloccare la scansione suย unaย pagina o sull’intero sito.

I metatgsย Noindex Nofollowย invece, agiscono sulle singole pagine edย impediscono l’indicizzazione della pagina scansionata (noindex) e dei link (nofollow).

In estrema sintesi dunque possiamoย dire che il file robots.txt agisce a livello di scansione mentre i meta tags Noindex Nofollow agiscono a livello di indicizzazione.ย 

Il comandoย Disallow robots.txt agisce sulla scansione

Il comando Disallow da inserire nel Robots.txt da direttive precise agli spider dei motori di ricerca e va utilizzato con molto criterio anche perchรจ รจ uno dei passaggi piรน importanti per l’indicizzazione SEO di un sito web.

Infatti, il file robots.txt, restringendo lโ€™accesso in determinate aree del sito, alleggerisce il processo di scansione. In un sito web con una grande mole di contenuti scansionare tutte le cartelle e sottocartelle ecc. puรฒ essereย per gli spider un’operazione molto gravosa che penalizza la performance del portale. Il file robots.txt entra in funzione per evitare questo inconveniente.

Attenzione perรฒ alle pagine a cui si applica il comando disallow. L’operazione dev’essere molto oculata avendo cura di selezionare solo quelle pagine che non sono importanti ai fini della SEO. In questo modo si riduce il carico sul server e si accelera il processo di indicizzazione.

Il file robots.txt รจ composto da due campi:ย il campo “User-agent” ed uno o piรน campi “Disallow”.

  • User-agent serve ad indicare a quale spider sono rivolte le direttive
  • Disallow serve a indicare a quali file e/o directory lo spider precedentemente indicatoย nonย puรฒ accedere.
Parte di codice da utilizzare nel robots.txt per gli User-Agent

Parte di codice da utilizzare nel robots.txt per gli User-Agent

I meta tags Noindex Nofollow agiscono sullโ€™indicizzazione

Il meta tag Noindex agisce a livello di indicizzazione. Quandoย gli spider scansionano la pagina e trovano il meta tag Noindex la rimuovono dal loro indice e la pagina non potrร  apparirร  nei risultati di ricerca.

Ma perchรจ potrebbe essere utile deindicizzare alcune pagine del nostro sito internet? Il noindex SEO in un’ottica di ottimizzazione รจ da applicare a tutte quelle pagine che potrebbe essere poco interessanti per i motori di ricerca come ad esempio le pagine duplicate, le pagine off topic o anche le pagine dei tag, quelle che illustrano la policy del sito, o le pagine contenenti brevi informazioni di servizio. I motori di ricerca considerano queste pagine come spam engineย e se il loro numero รจ alto, l’intero sito web puรฒ essere penalizzato o declassato.

Anche il meta tag Nofollow agisce sull’indicizzazione ma รจ specifico per i link. In questo caso gli spider non indicizzano i link marcati con l’attributo nofollow e, sempre nell”ottica di un buon posizionamento, il Nofollow si usa per evitare di passare parte del proprio ranking al sito esterno linkato.

Esempio in HTML di noindex nofollow

Esempio in HTML di noindex nofollow

Anche nel caso di link a pagamento รจ sempre preferibile inserireย un Nofollow, perchรฉ i motori di ricerca non gradiscono quando veniamo pagati per linkare un sito.ย Stessa cosa per i banner pubblicitari che rimandano ad altri siti.

Attraverso i meta tags Noindex Nofollow pagine e link cessano di esistere soltanto per i motori di ricerca mentre restano a disposizione della consultazione degli utenti.

Disallow e noindex: mai usarli insieme

Il file robots.txt e i meta tag Noindex Nofollow sono strumenti molto utili perย creareย unย sito web efficace. Comprendere a fondo la differenza tra questi comandi puรฒ aiutarci ad evitare errori molto diffusi.

Quando si applica la direttiva Disallow la pagina non viene scansionata. Se alla stessa pagina si aggiunge anche il meta tag Noindex gli spider non potranno leggerlo poichรจ non hanno accesso alla scansione della pagina.ย Usarli insieme รจ un grave errore.

In casi come questi infatti ci si imbatte nella situazione per cuiย una pagina non scansionata puรฒ comunque essere indicizzata, perchรจ gli spider non hanno accesso alla lettura del comando Noindex.

E’ utile quindi ripetere che quando si vuole bloccare esplicitamente l’indicizzazione di una pagina si utilizza il meta tag Noindex e si deve consentire la scansione per far sรฌ che il tag venga riconosciuto ed eseguito.ย 

Puรฒ anche succedere una situazione analoga quando una pagina di cui abbiamo vietato l’accesso per la scansione viene linkata da altri siti web o condivisa sui social network. Infattiย se un URL รจ bloccato dal robots.txt ma una pagina contiene un link verso quest’URL, si puรฒ creare una situazione per cui nella SERP viene fuori un risultato senza titolo e senza snippet, provocando una cattiva esperienza d’uso per l’utente.

Usare questi comandi con criterio e avendo ben chiaro l’obiettivo per cui si stanno applicando consentirร  di non essere penalizzati e dai motori di ricerca e dai nostri utenti!

Adesso che hai compreso la funzione del robots.txt e del Noindex Nofollow programma quanto prima le modifiche al tuo sito web cosรฌ da poter dare ulteriore slancio alla sua ottimizzazione. Se hai dubbi riguardo a situazioni specifiche che ti trovi ad affrontare sul tuo portale scrivi nei commenti.

Condividi questo articolo

Rispondi

Gianluca Gentile