Homepage | Contatti

Cosa blocca i motori di ricerca

Avete mai provato a visualizzare delle pagine Web con un browser di prima generazione, ad esempio Netscape 1.0? Se lo aveste fatto avreste avuto la stessa visione che hanno i robot dei motori di ricerca

di Salvatore Romagnolo

Avreste anche gli stessi problemi: mancata interpretazione delle pagine con frame, illegibilità del codice Flash, blocco vero e proprio di fronte ai link contenenti javascript.

I robot incaricati di estrarre il contenuto delle pagine Web di un sito, per indicizzarle in un motore di ricerca, per la verità, sono ancora più sensibili perché, oltre ai problemi già elencati, fanno fatica anche a leggere le immagini cliccabili (MAP) e si bloccano davanti alle pagine dinamiche (ASP, CGI, ecc.). A eccezione delle pagine tradizionali, in HTML statico, questi robot sono piuttosto schizzinosi sul contenuto da accettare.

Molti Webmaster pensano che non si tratti di un problema particolarmente grave e ritengono che con i tag TITLE, DESCRIPTION e KEYWORDS, i robot abbiano materiale a sufficienza per indicizzare una pagina. Errore! In realtà, molti robot di ricerca non sanno interpretare i tag META e devono recuperare il contenuto testuale visibile nella pagina. Inoltre, la presenza di link “leggibili” è di fondamentale importanza se si vuole che il robot percorra l’intera ramificazione di un sito, indicizzandolo in modo completo. Infine, è stato scoperto che i motori di ricerca riservano un ranking migliore a quelle pagine che hanno link esterni, verso altri siti. E avere link javascript, per un robot di ricerca, equivale a non avere link.

I frame

Molto in voga fino a un paio di anni fa, i frame stanno lentamente scomparendo dal Web. Uno dei motivi dell’estinzione – non ancora completa – sta nel fatto che i siti concepiti con più finestre nella stessa pagina hanno difficoltà enormi a farsi indicizzare dai motori di ricerca. Comportandosi come i browser di prima generazione, i robot non sono, infatti, in grado di interpretare il tag FRAMESET e non riescono a decifrare i link che vi sono all’interno. Rimangono così bloccati sulla pagina con il frame, spesso l’homepage, e segnalano al motore di ricerca che non c’è nient’altro da visitare.

Esiste, comunque, un sistema per indicizzare – e in modo efficace – un sito con frame. Bisogna, innanzi tutto, soffermarsi su quali sono i centri d’interesse di un motore di ricerca (parole chiave, link) e sul fatto che esiste il tag NOFRAMES, che consente di offrire un contenuto alternativo ai browser che non riconoscono i frame. La soluzione è semplice: piazzare tra i tag NOFRAMES gli elementi che cercano i robot: il tag TITLE, l’intero contenuto del metatag DESCRIPTION e i link verso le pagine interne del sito, in modo che il robot possa indicizzare anche quelle. Il contenuto di questa zona NOFRAMES non sarà visibile ai visitatori, a meno che non usino ancora Netscape 1.0.

Javascript, Flash ed effetti speciali

I robot hanno bisogno di link che, dall’homepage, li conducano alle varie pagine del sito per indicizzarlo in modo completo. Questi software sono in grado di interpretare solo link, testo e immagini. Le immagini cliccabili (MAP), i link con javascript e le animazioni Flash che incorporano dei link, non vengono riconosciuti. Ma molti Webmaster non vogliono rinunciare all’appeal grafico dei loro siti. Un’ambizione legittima, che però può comportare una severa penalizzazione nell’indicizzazione. È comunque possibile risolvere il problema seguendo alcuni semplici accorgimenti:

  • Mettere dei link tradizionali nella parte bassa della pagina da indicizzare. Si può utilizzare un corpo molto piccolo  per il testo, che non è destinato alla lettura da parte dell’utente.
  • Realizzare un pagina intermedia contenente il tag FRAMESET, con il solo scopo di richiamare la pagina da indicizzare. La prima conterrà link e testo descrittivo e sarà, quindi, facilmente indicizzata dai robot dei motori di ricerca. Inoltre, consentirà la visualizzazione della seconda, che contiene gli effetti speciali o le animazioni desiderate.

12 luglio 2002

Copyright © Salvatore Romagnolo - Tutti i diritti riservati

Iscriviti alla Newsletter gratuita
iscriviti cancellati

Canali

Costruire siti Web
Giornalismo Online
E-book
E-Business
Personaggi
Tecnologia e società
Frontiere della lettura
Guerre di mercato
E-mail marketing
Nomadismo Hi-Tech
Sito della settimana
Storia dell'informatica

Tutti gli articoli

Chi è Salvatore
Romagnolo