Chi si avvicina per la prima volta al posizionamento e
all'ottimizzazione dei siti non immagina che una buona riuscita in questa
attività è il frutto di decine, centinaia di fattori
diversi. Uno dei fattori strettamente indispensabili per ottenere un buon
posizionamento è quello della scelta di un ottimo fornitore di
spazio web, ovvero del servizio di hosting.
Una scelta affrettata e poco oculata può infatti produrre nel
medio e lungo termine problemi tecnici non indifferenti
ed è dunque importante evitare a monte tali grattacapi individuando
una società di hosting in grado di fornire uno spazio web con
specifiche caratteristiche tecniche, che questo articolo
illustrerà.
Si potrebbe erroneamente credere che scegliere un host qualsiasi o
economico sia un buon modo per iniziare, decidendo di prenderne uno
migliore solo al presentarsi di eventuali problemi tecnici. Tuttavia
cambiare società di host è anch'esso un tipo di evento che potrebbe
influre negativamente sul posizionamento del sito.
La soluzione definitiva è dunque quella di evitare a monte ogni
risparmio sullo spazio web, puntando solo sulla qualità e prevenendo in
questo modo ogni sorta di potenziale problema.
Il web server
Di seguito verranno elencate le principali caratteristiche tecniche che
un web host dovrebbe fornire al cliente per evitargli problemi con il
posizionamento dei siti nei motori di ricerca.
La prima caratteristica tecnica che illustreremo, tuttavia, non
è strettamente indispensabile ma un semplice consiglio che ci
sentiamo di dare a tutti i webmaster: preferite il web server Apache ad
altre soluzioni.
Apache è il software che si occupa del "dialogo" tra il
server in cui risiede il sito e i client che effettuano gli accessi
(browser degli utenti, spider dei motori, ecc.). Esistono diversi altri
software di questo genere, ma Apache è il web server più diffuso e quello
che consigliamo vivamente. Se deciderete di seguire tale nostro consiglio,
accertatevi che il server su cui verrà ospitato il vostro sito faccia uso
di Apache.
Caratteristiche dello spazio web
Header HTTP corretti
Quando un client, sia esso un browser o uno spider, richiede ad un web
server il contenuto di una pagina web o di un generico file, il web server
spedisce il file richiesto anteponendo ad esso un'intestazione (header),
contenente alcune indispensabili ed importanti informazioni sul file
spedito.
Tale intestazione non può essere omessa dal web server, nemmeno
se il file richiesto dall'utente o dallo spider del motore risultasse
inesistente. Di fronte alla richiesta di un file inesistente, un buon web
server deve spedire a chi ha effettuato la richiesta del file
un'intestazione contenente un apposito codice di errore (o codice di
status), il 404, che indica per l'appunto l'impossibilità di
individuare e spedire il file richiesto.
Purtroppo esistono web server di scarsa qualità o configurati male dai
tecnici della società di hosting, che non restituiscono correttamente
l'intestazione, come previsto dal protocollo HTTP, che regola i
trasferimenti sul web.
Tale errore costituisce una prova palese della bassa qualità del
servizio di hosting e influisce negativamente sull'indicizzazione del
sito. Gli spider dei motori di ricerca, infatti, richiedono sempre un file
di nome robots.txt prima di iniziare la scansione di un sito web. Se tale
file non esiste, gli spider si ritengono liberi di perlustrare il sito, ma
se il web server non fosse in grado di comunicare (attraverso
un'intestazione con codice 404) l'inesistenza del file robots.txt, gli
spider rischierebbero di confondersi, decidendo di non prelevare le pagine
del sito.
Tale fenomeno è stato osservato diverse volte, fortunatamente
poche, ma abbastanza da spingerci a consigliare di controllare
personalmente che il web server che si utilizzerà sia configurato a
dovere, restituendo correttamente un'intestazione con codice 404
(accompagnato dalla dicitura "Not found") in seguito alla una
richiesta di file inesistente.
Per ottenere ciò, è sufficiente utilizzare uno dei tanti
appositi tool che esistono sul web (eccone
uno), individuare un dominio già ospitato dal web server che si
intende utilizzare per il proprio sito, fornire al tool l'URL di una
pagina inesistente sotto quel dominio e leggere il codice restituito dal
tool nella riga chiamata "Status:". Se il codice è il
404, allora il server è configurato correttamente per quanto
riguarda questa caratteristica.
Con il "www" e senza il "www".
Un nome di dominio di secondo livello non include il prefisso
"www", ma tale particella è diventata ormai una
convenzione di uso comune e i webmaster possono decidere di indicare l'URL
di un sito includendo o meno tale prefisso.
È dunque importante che il web server su cui il sito
risiederà sia configurato in modo da permettere al sito stesso di
essere raggiungibile sia attraverso l'indirizzo
http://www.nomedominio.it/ sia attraverso l'indirizzo
http://nomedominio.it/.
Questa caratteristica risulterà importante anche per la link
popularity del sito. La maggior parte dei motori di ricerca, infatti,
è in grado di comprendere che gli URL con e senza "www"
conducono alla stessa risorsa, assegnando ad essa tutti i link che sul web
puntano indistintamente all'una o all'altra versione del nome di dominio.
Redirect lato server
Il servizio di hosting scelto deve poter dare al cliente la
possibilità di creare redirect automatici "lato server",
ovvero prodotti dal web server stesso.
Tali redirect, chiamati solitamente "redirect 301", dal
numero del codice HTTP che identifica questo genere di risposta del
server, risultano estremamente utili in molteplici occasioni e in
particolar modo possono evitare consistenti problemi al posizionamento del
sito.
L'esempio più classico da fare è quello del cambio di
nome di un file o di una directory usati da un sito web. Al cambiare
dell'indirizzo di una pagina, infatti, è importante comunicare ad
utenti e motori di ricerca che il vecchio indirizzo non risulta più
esistente e che il contenuto che vi era pubblicato è stato spostato
ad un nuovo indirizzo.
Un redirect 301 è la soluzione migliore a questa
necessità: gli utenti che accederanno al vecchio indirizzo verranno
dirottari automaticamente al nuovo, e gli spider si comporteranno allo
stesso modo, col vantaggio che la link popularity (e altri simili fattori
di posizionamento) assegnata dai motori al vecchio URL verrà subito
riassegnata a quello nuovo. Questo non avviene sempre, o avviene con tempi
molto lunghi, nel caso in cui il webmaster utilizzi redirect
"casalinghi" come quello ottenibile attraverso il meta tag
REFRESH.
Un altro classico uso dei redirect lato server avviene quando Google
individua nel web dei link che puntano ad entrambe le versioni di un nome
di dominio: quella con il "www" e quella senza. In tali casi,
Google calcola e assegna un diverso valore di PageRank a ciascuno dei due
URL, quando invece sarebbe utile far confluire e accumulare il PageRank ad
un unico indirizzo. Un redirect lato server dalla versione non-www a
quella con il www (o viceversa) indicherà a Google che i due
indirizzi puntano alla medesima risorsa e spingerà il motore di
ricerca ad assegnare il valore di PageRank ad un unico indirizzo.
I redirect lato server possono essere creati attraverso un pannello di
controllo fornito dal servizio di hosting oppure agendo direttamente sul
file .htaccess di Apache, se l'host concede ai webmaster l'utilizzo di
tale file (vedi sotto). A prescindere dalla modalità, è bene
assicurarsi che il servizio di hosting che si intende scegliere fornisca
al cliente un facile modo per creare tali redirect.
Linguaggi lato server
È importante che lo spazio web che si sceglierà supporti
almeno uno dei principali linguaggi di programmazione dedicati al web,
come PHP, ASP, ASPX, e simili. Va da sé che più saranno i
linguaggi supportati dall'host e maggiore sarà la possibilita di
far girare sul proprio sito web i tanti script pronti all'uso che si
trovano sul web, prodotti in molteplici linguaggi.
È anche il caso di informarsi se i linguaggi supportati sono
configurati in modo da poter accedere in scrittura alle directory
assegnate al sito. Capita sovente che diversi script abbiano
necessità di creare e aggiornare file, e un linguaggio di
programmazione privo dei permessi per poter scrivere sul disco
rappresenterebbe un grosso handicap.
File .htaccess e moduli Apache
Il file ".htaccess" è un file di testo, che può
contenere alcune istruzioni per sfruttare al meglio alcune caratteristiche
avanzate del web server Apache. Se pensate dunque di seguire il consiglio
iniziale datovi da questo articolo, preferendo un servizio di host basato
su web server Apache, sappiate che è importante chiedere se il
servizio consente agli utenti di creare e gestire autonomamente i file di
configurazione .htaccess.
Uno degli utilizzi di tale file di configurazione che più
risulta utile ai SEO e al posizionamento dei siti consiste nella
possibilità di rendere statici gli URL delle pagine dinamiche,
ovvero quelle create al volo con un linguaggio di programmazione e i
parametri passati attraverso l'URL della pagina da generare. Staticizzare
gli URL è a volte un'operazione in grado di migliorare il grado di
indicizzazione di un sito web, in quanto gli spider di alcuni motori sono
più propensi a seguire i link verso gli URL statici rispetto ai
link che puntano a URL dinamici.
Va specificato che per effettuare la staticizzazione degli URL è
necessario, oltre all'accesso ai file .htaccess, anche che Apache sia
dotato di un modulo aggiuntivo, chiamato "mod_rewrite".
Header HTTP "If-Modified-Since"
Un buon web server dovrebbe supportare l'intestazione HTTP "If-Modified-Since".
Gli spider dei motori di ricerca più avanzati utilizzano tale
intestazione per farsi inviare dal web server solo i file che sono stati
modificati dopo una data indicata dallo spider. Tutti i file non
modificati di recente (e già archiviati dal motore in precedenza)
non verranno invece inviati allo spider, con il risparmio di banda che si
può immaginare e che può raggiungere quantità
considerevoli nel caso in cui il sito fosse composto da molte pagine.
L'intestazione If-Modified-Since viene usata anche dai normali browser
per gli utenti. Quindi il supporto di tale header da parte del server
torna estremanente utile anche al di fuori dei vantaggi ottenibili con i
motori di ricerca.
If-Modified-Since è stato introdotto con la versione 1.1 del protocollo
HTTP, quindi qualunque web server con pieno supporto di tale versione del
protocollo dovrebbe gestire senza problemi la suddetta intestazione.
Velocità di risposta del server
Un web server in grado di rispondere velocemente alle richieste degli
utenti non solo garantisce un'esperienza di navigazione migliore ai
visitatori del sito ma evita che gli spider dei motori di ricerca
rinuncino ad indicizzare le pagine a causa di una lentezza eccessiva nella
risposta del server.
A questa necessità strettamente tecnica si aggiunge anche il
fatto che la velocità di risposta di un sito web può essere
inclusa da alcuni motori di ricerca tra le caratteristiche analizzate per
calcolare un indice globale della qualità di un sito web.
Un motore di ricerca potrebbe teoricamente ritenere che, a
parità di altre caratteristiche, sia logico consigliare a chi
effettua le ricerche un sito web in grado di essere navigato più
agilmente, senza tempi eccessivamente lunghi da attendere prima che il
server inizi a spedire le pagine richieste dagli utenti.
È stato osservato che siti particolarmente lenti tendono a
scendere di posizioni nei risultati di alcuni motori, tra i quali Google.
Errori personalizzabili
Una caratteristica alquanto utile per migliorare il grado di
usabilità del proprio sito consiste nella possibilità per il
webmaster di personalizzare la pagina inviata all'utente nel caso in cui
quest'ultimo abbia fatto richiesta di una pagina inesistente.
Dal punto di vista dell'usabilità, infatti, una delle migliori
soluzioni per mettere l'utente a proprio agio consiste nell'avvisarlo
dell'inesistenza della pagina richiesta ma fornirgli anche una mappa del
sito, in modo che il visitatore sia in grado di tornare a visitare il sito
dal punto che più preferisce.
Anche gli spider di alcuni motori potranno beneficiare della presenza
di una pagina di errore personalizzata, e in particolare di una mappa del
sito spedita loro in caso di pagina non trovata. Oltre alla corretta
spedizione di un codice HTTP 404 (pagina non trovata, per l'appunto), lo
spider si ritroverebbe di fronte un ottimo punto di partenza, una mappa
del sito, per iniziare o continuare la sua perlustrazione del sito.
La personalizzazione delle pagine di errore può essere ottenuta
dal webmaster configurando opportunamente il web server attraverso il file
.htaccess (vedi sopra) o, in alternativa, attraverso appositi pannelli di
controllo forniti dal servizio di hosting.
Sottodomini
A volte è utile al posizionamento di un sito suddividere i suoi
contenuti tra sottodomini diversi. Tale esigenza può nascere per
semplici ragioni di organizzazione e per dividere tra loro argomenti
abbastanza diversi, e tale suddivisione produce indirettamente un
vantaggio nei motori di ricerca, perché un sottodominio utilizzato
per un solo e specifico tema o argomento permetterà di fornire al
motore dei contenuti fortemente tematizzati e separati dagli altri anche
dal nome di dominio.
Per tale ragione, è bene che il piano di hosting scelto dal
webmaster preveda la possibilità di creare una certa
quantità di sottodomini, pagando uno somma aggiuntiva al canone o,
meglio ancora, compresi già nel piano di hosting acquistato.
File di log
I file di log sono dei normali file di testo in cui il web server
registra ogni accesso ricevuto dai client, fornendo per ciascuno accesso
una lista di informazioni estremamente utili per estrapolare statistiche
sulle richieste ricevute.
Le statistiche più precise sugli accessi ad un sito web sono per
l'appunto quelle ottenibili elaborando i file di log prodotti dal web
server ed un buon servizio di hosting dovrebbe fornire al webmaster
l'accesso a tali file. Tra l'altro, anche nel caso in cui tali file non
venissero usati per estrapolarne statistiche sulle visite al sito, possono
essere semplicemente letti dal webmaster per individuare velocemente la
presenza di un accesso specifico, ad esempio la visita di uno spider che
si attendeva e quante e quali pagine il medesimo ha prelevato.
Assegnazione di un IP dedicato
Generalmente l'indirizzo IP assegnato ad un dominio viene condiviso
anche da altri domini. Esistono occasioni in cui può essere
necessario ottenere un indirizzo IP dedicato, ovvero assegnato
esclusivamente al dominio e mai soggetto a cambiamenti, ad esempio nel
caso in cui si decidesse di utilizzare il protocollo HTTPS (sicuro) sul
sito oppure nel caso in cui si volesse fornire un server FTP ad accesso
anonimo.
Ma un indirizzo IP dedicato è a volte utile anche al
posizionamento, ad esempio per eliminare definitivamente ogni teorico
collegamento con gli altri siti web che usufruiscono del medesimo
indirizzo IP. In rare occasioni un motore di ricerca può decidere
di bandire dai propri archivi non uno o più siti bensì
direttamente un intero indirizzo IP e conseguentemente tutti i siti che ne
fanno uso. È vero che tali eventi sono più unici che rari,
tuttavia far assegnare un indirizzo IP univoco al proprio nome di dominio
rimuove ogni rischio in proposito.
Un indirizzo IP dedicato non è strettamente necessario, ma nel
caso in cui il webmaster decidesse in futuro di far assegnare un indirizzo
IP univoco al proprio sito, la società che offre il servizio di
hosting dovrebbe comunque essere in grado di procedere in tal senso senza
problemi, ovviamente dietro pagamento del costo dell'operazione.
Riepilogo delle caratteristiche
Ecco un riepilogo delle caratteristiche che un servizio di hosting
dovrebbe fornire ad un SEO. È bene, prima di scegliere la
società di hosting, informarsi su tutte le caratteristiche
elencate:
- Correttezza delle intestazioni HTTP (usate il tool)
- Sito accessibile con "www" e senza
- Possibilità di creare redirect lato server (301)
- Presenza di uno o più linguaggi (PHP, ASP, ecc.)
- Supporto dell'intestazione If-Modified-Since
- Buona velocità di risposta del server
- Pagine di errore personalizzabili
- Possibilità di creare sottodomini (magari gratuitamente)
- Accesso ai file di log del server
- Possibilità di assegnare un IP dedicato al dominio
Conclusioni
In questa carrellata di caratteristiche, abbiamo indicato quelle utili
in maniera specifica ai SEO e ai loro lavori di posizionamento, non quelle
generiche. Ma anche quelle generiche sono importanti nello scegliere la
società di hosting alla quale affidare il proprio sito web; una
discreta quantità di caselle e-mail, spazio web e traffico massimo
mensile va considerata una caratteristica strettamente indispensabile per
poter lavorare serenamente, ed anche un buon servizio di assistenza
clienti rientra tra i parametri da prendere in considerazione.
<< Torna alla pagina principale