A prescindere da alcuni dubbi personali circa i documenti duplicati che la seguente ricerca può aver incluso nei propri dati,
The Indexable Web is More than 11.5 billion pages [PDF] illustra una interessante tecnica usata dai ricercatori
Antonio Gulli e
Alessio Signorini per calcolare una stima della grandezza del Web, partendo da informazioni quali la grandezza degli indici di quattro principali motori di ricerca (Google, Yahoo!, MSN e Teoma) e la percentuale di sovrapposizione degli indici stessi. Il risultato è stato che il Web, secondo la stima, misura oltre 11,9 miliardi di documenti.
Questa pagina riassume bene lo studio e illustra le metodologie utilizzate dai due ricercatori.
Nota: i due autori hanno presentato anche una "paper" al recente WWW2005: Building an Open Source Meta-Search Engine [PDF]