La Google Dance (o "GoogleDance", tutto unito)
è quel processo mensile per mezzo del quale Google aggiorna i propri archivi di
pagine, ricalcolando il numero dei link che ogni pagina riceve
dalle altre (chiamati "backlink") nonché il valore di
PageRank di ciascuna di esse.
La Google Dance dura alcuni giorni. Per un lungo periodo è
avvenuta sempre al termine di ogni mese ma la sua attivazione non
segue ritmi ben precisi e dunque può subire anticipazioni o
ritardi (anche corposi); alcune volte è successo che sia saltata
del tutto.
Febbre da Dance
Tra i webmaster che seguono attentamente le posizioni delle pagine
dei propri siti web, è usuale monitorare la Google Dance durante
il suo svolgimento, attendendo pazientemente che termini per
controllare se le posizioni delle pagine di proprio interesse sono
migliorate o peggiorate.
Il ricalcolo dei backlink e del PageRank di ogni pagina, infatti,
comporta modifiche anche sostanziali alle posizioni delle pagine,
il che si può tradurre per i siti web in considerevoli quantità di
visitatori in più o in meno, a seconda dei risultati.
Per tale ragione diversi webmaster ed anche molti SEO
professionisti vivono la Google Dance addirittura con apprensione,
sperando che i risultati non siano negativi.
A rendere tale attesa più "febbrile" contribuisce anche il fatto
che le posizioni osservate durante la Dance, ovvero prima che essa
termini, possono essere estremamente diverse rispetto alle
posizioni finali.
I webmaster particolarmente "masochisti" seguono tali evoluzioni,
preoccupandosi per i risultati temporanei negativi o sperando che i
risultati temporanei positivi reggano fino all'ultimo,
confermandosi come risultati definitivi della Dance.
Gli utenti più cauti, invece, preferiscono semplicemente attendere
che la Dance termini e prendere atto dei risultati finali.
Ovviamente anche in costoro vive la speranza di vedere il valore di
PageRank delle proprie pagine aumentato, ma l'approccio con i
risultati finali è meno "passionale" e più distaccato.
Certamente il comportamento di molti webmaster cambierebbe se la
Google Dance fosse un processo immediato oppure se i suoi risultati
temporanei non presentassero indicazioni incerte. Tuttavia, almeno
per il momento, la Dance non può fare a meno di comportarsi così
come è stato descritto, per le ragioni che stiamo per spiegare.
Come funziona la Dance
La Google Dance fa parte di un ciclo di operazioni che Google
ripete incessamentemente, mese dopo mese. A questo ciclo di
operazioni appartiene, oltre alla Dance, anche un altro processo:
la scansione completa di tutte le pagine conosciute dal motore di
ricerca, chiamata "Deep Crawl". Ecco spiegato, di seguito, cosa
avviene ogni mese.
Durante buona parte del mese, Google è in modalità "Deep Crawl":
visita ogni pagina web conosciuta e ne memorizza i contenuti nei
propri archivi. Questa memorizzazione non significa che le pagine
con i nuovi contenuti appaiano subito nelle ricerche degli utenti
ma vuol dire solo che le pagine vengono "immagazzinate" per un uso
successivo.
Quando, dopo diversi giorni (due o tre settimane, di solito) il
Deep Crawl è terminato e Google ha (ri)archiviato tutte le pagine
che conosceva nonché quelle nuove che è riuscito ad individuare,
ha inizio la Google Dance, che calcola il PageRank e il numero di
backlink di ogni pagina e mette finalmente a disposizione le nuove
pagine per le ricerche degli utenti.
Dato che Google possiede molti "datacenter" (centri-dati) sparsi
sul pianeta, tra i quali vengono smistate le ricerche degli utenti,
è necessario aggiornare poco a poco ciascuno di tali centri con il
nuovo archivio di pagine. Essendo tale procedimento abbastanza
lento, è normale, durante la Google Dance, notare che alcuni
datacenter possiedono già i risultati aggiornati, mentre altri
presentano ancora dei risultati che si basano su vecchie versioni
delle pagine.
Da quanto appena affermato si evincono le seguenti due cose:
i risultati delle ricerche successive alla Google Dance si basano
principalmente sulle pagine archiviate alcune settimane prima
durante il Deep Crawl e quindi sui contenuti che quelle pagine
avevano durante il Deep Crawl e non su contenuti recenti. Abbiamo
evidenziato "principalmente" in quanto, in realtà, i risultati
delle ricerche possono essere influenzati anche da contenuti più
recenti, individuati da uno spider apposito di Google
(soprannominato Freshbot), che perlustra continuamente il web e in
particolare le pagine considerate più importanti o quelle i cui
contenuti vengono aggiornati molto spesso;
tenuto conto che il numero dei backlink di ogni pagina viene
calcolato durante la Dance e che i datacenter non vengono
aggiornati tutti nello stesso momento, per capire se una Google
Dance è in corso è sufficiente controllare se i vari datacenter
presentano risultati differenti sul numero di backlink delle
pagine.
Capire se la Dance è in corso
Effettuare il controllo di cui sopra è alquanto semplice, visto
che ogni datacenter possiede un suo nome di dominio attraverso il
quale è possibile effettuare tutte le normali ricerche
effettuabili sul classico www.google.com.
Per conoscere il numero di link che puntano ad una pagina è dunque
sufficiente recarsi all'indirizzo www.google.com e usare l'apposito
comando di Google:
link:www.yahoo.com
, che restituisce il numero dei backlink di Yahoo (è consigliato
controllare il numero di backlink di un sito molto grande). È
importante chiarire che il dato che ci interessa estrapolare è
solo la
quantità dei link e non la lista delle pagine restituite
dalla ricerca. Tale quantità è chiaramente indicata in alto a
destra, nella barra orizzontale blu sita sopra i risultati delle
ricerche, preceduta dalla dicitura "Risultati 1-10 di circa...".
Preso nota di questo numero ed effettuando la medesima ricerca in
altri datacenter di Google (di cui forniremo tra poco gli
indirizzi), sarà possibile osservare se anch'essi presentano lo
stesso risultato oppure se uno o più datacenter restituiscono un
numero di backlink differente.
In presenza di un numero differente di backlink, è possibile
affermare con buona sicurezza che alcuni datacenter possiedono
ancora un archivio meno aggiornato rispetto ad altri,
caratteristica che denota chiaramente che è in corso un
aggiornamento (ovvero una Google Dance) e che non tutti i
datacenter sono stati aggiornati con i dati definitivi.
Di fronte a questa situazione, la Google Dance potrà considerarsi
terminata quando tutti i datacenter verranno aggiornati con i nuovi
archivi e tutti presentaranno gli stessi risultati per le ricerche
dei backlink.
Ecco, infine, gli indirizzi dei principali datacenter di Google, su
cui è possibile effettuare le ricerche sui backlink. Notate che
Google "gioca" spesso con i datacenter, con i loro nomi di host
e con i relativi indirizzi IP. Non è dunque raro osservare che uno o
più datacenter risultano non accessibili:
64.233.161.104
64.233.167.104
64.233.171.104
64.233.183.104
66.233.187.104
66.102.7.104
66.102.9.104
66.102.11.104
216.239.37.104
216.239.39.104
216.239.53.104
216.239.57.104
216.239.59.104
216.239.63.104
Infine, per facilitare l'attività di consultazione di più datacenter,
abbiamo realizzato un semplice tool
per il controllo della Google Dance, che interroga tre diversi datacenter
per mostrare quanti link Google attribuisce ad un grosso sito (abbiamo scelto
Yahoo).
L'estinzione della Google Dance
Nel momento in cui scriviamo questo articolo (maggio 2003), le
tecniche usate da Google per aggiornare i propri archivi stanno
subendo pesanti modifiche.
Da quello che è stato osservato, è possibile dedurre che
l'obiettivo finale di Google sia quello di ottenere un
aggiornamento continuo e costante dei propri archivi, senza che sia
necessario passare attraverso un procedimento complesso e lento
come la Google Dance.
In poche parole, questo implica che nei prossimi mesi sarà
possibile notare significativi cambiamenti in tal senso e prima o
poi è probabile che il concetto di Google Dance scomparirà del
tutto, almeno per come è conosciuto adesso.
Uno degli scenari più probabili sarà quello di datacenter in
continuo aggiornamento, con i calcoli dei backlink e del PageRank
che vengono effettuati senza sosta sulle pagine appena archiviate
dal motore di ricerca. Se ciò dovesse effettivamente avvenire, il
sistema sopra illustrato per individuare la Google Dance attraverso
le differenze tra i datacenter perderebbe efficacia (oltre che
ragion d'esistere), in quanto tali differenze sarebbero
perennemente presenti e in continua mutazione.
Una variazione così massiccia della metodologia di aggiornamento
di Google porterebbe vantaggi sopratutto agli utenti, che sarebbero
in grado di individuare più facilmente attraverso il motore di
ricerca pagina nuove e aggiornate di recente.
Altri vantaggi piuttosto consistenti verrebbero ottenuti dai
webmaster e dai SEO: i primi beneficerebbero degli aggiornamenti
continui per rendere visibili in tempi brevi nuove pagine messe on-
line da poco tempo. I SEO, invece, sarebbero in grado di misurare
in pochi giorni la reazione di Google a nuove modifiche
all'ottimizzazione delle pagine.
Fino a quando Google non renderà definitivi questi cambiamenti
nelle tecniche di aggiornamento dei propri archivi, la Google Dance
rimarrà un importante evento mensile, atteso da molti webmaster
per comprendere se gli sforzi di ottimizzazione profusi sulle
pagine web dei propri siti sono stati premiati dal motore di
ricerca.
<< Torna alla pagina principale