Ogni motore di ricerca utilizza alcuni programmi chiamati
"spiders" (ragni) il cui unico compito è quello di visitare
continuamente una grande quantità di siti web, leggere il testo contenuto
nelle pagine ed estrarre quelle parole/termini che rappresentano al meglio
i contenuti del sito.
Per ogni pagina letta, lo spider cerca al suo interno e memorizza ogni
link (collegamento) ad altri siti, aggiungendoli ad una lista di siti da
visitare. In questo modo, attraverso un processo a catena, lo spider
è in grado di ottenere una quantità enorme di indirizzi di
siti e pagine web, riuscendo ad incrementare il numero di siti conosciuti
molto più di quanto possa essere fatto dalle
directory, che si basano su un lento
meccanismo di iscrizione e valutazione dei siti, operato da esseri
umani.
Via libera allo spider
Per consentire ad uno spider di trovare agevolmente tutte le pagine che
compongono un sito web bisogna fare in modo che da qualunque pagina del
sito sia possibile risalire, direttamente o indirettamente, a tutte le
altre pagine.
Un buon sistema per ottenere questo risultato è inserire in ogni pagina
del sito un link alla homepage; in questo modo, qualunque pagina del sito
lo spider dovesse casualmente trovare (magari seguendo un link trovato su
un altro sito) consentirà allo stesso di risalire alla pagina principale
e, da lì, trovare le altre seguendo tutti i link incontrati.
Le informazioni analizzate
Gli spider non fanno caso alla grafica delle pagine ma focalizzano il loro
lavoro di analisi esclusivamente sul testo. Questo significa che ogni
immagine o animazione grafica viene semplicemente ignorata e che gli unici
contenuti su cui lo spider si basa per valutare il sito sono quelli
testuali.
Resta dunque inteso che qualunque immagine (gif, jpeg o altro formato)
raffigurante del testo verrà ignorata e che l'unico testo che lo spider
potrà leggere sarà quello ASCII, contenuto nei tag del codice
HTML.
Quanto appena detto ci porta a fare una prima importante considerazione:
i siti web acquistano "corposità" agli occhi dei motori di
ricerca solo se contengono buone quantità di testo, ovviamente in tema
con gli argomenti trattati dal sito. In seguito ad una ricerca effettuata
con un motore di ricerca, all'utente verranno proposti sopratutto i
siti più ricchi di testo.
Nel prossimo capitolo vedremo come i contenuti dei testi di una pagina
influiscono sulla sua posizione nelle
classifiche delle ricerche degli utenti.