a) Les méta-balises (et aussi un bon titre !)
La préparation du référencement consiste à
ajouter dans l'en-tête de votre page quelques méta-balises afin
de faciliter le travail du moteur. En effet le moteur, en l'absence
de méta-balises, se contente de prendre comme description du
site les 1ères lignes de votre page html et référence tous les
mots-clé de la page sans leur accorder de priorité. Ainsi la méta-balise
de description indique en une phrase quel est le sujet du site et
la méta-balise de mots-clé indique quels sont les mots-clé qui
caractérisent vraiment la page. Ainsi si un internaute cherche
avec le moteur des mots-clé que vous avez indiquez en méta-balise,
il a de fortes chance de trouver votre page bien placée dans la
liste des résultats. Vous trouverez donc sur cette page une
liste des méta-balises utilisées par les moteurs de recherche
pour classer et caractériser votre page html. A noter qu'il est
préférable d'effectuer un "méta-balisage" sur
chacune de vos pages de votre site. N'oubliez pas aussi de donner
un titre à votre page (délimité par les balises <TITLE>
et </TITLE> dans le "head" de la page) car sinon
gare aux "untitled page" des moteurs ; bien entendu le
titre doit être parlant car c'est véritablement lui qui
conditionne le référencement. Il doit refléter le plus
possible le contenu de la page car le titre est encore plus
important que les méta-balises de description ou de mots-clé
car il sera traité en priorité pour l'indexation (et sera
visible dans la barre de titre du navigateur du visiteur).
-> Les méta-balises doivent être incluses en début de page
entre <HEAD> et </HEAD>, elles ne peuvent êtres vues
que si l'on consulte le source de la page. La casse (majuscules/minuscules)
n'a pas d'importance dans les balises elles-même mais bien
entendu le contenu des méta-balises (après content=")est
sensible à la casse.
Note : la jurisprudence américaine interdit l'usage de marques
de concurrents dans les méta-balises (ainsi Microsoft n'a pas le
droit d'utiliser le mot-clé Netscape et vice-versa). De même
les moteurs condamnent le spam à la méta-balise qui consite à
écrire une liste impressionnante de mots-clé pour essayer d'apparaître
le plus souvent en tête des recherches.
A propos des frames (cadres)...
Attention presque tous les moteurs de recherche ne supportent pas
les frames. En ce qui concerne les pages contenant des frames, n'oubliez
pas d'aménager un contenu entre les balises <NOFRAMES> et
</NOFRAMES> qui sera pris en compte par les moteurs (et
sera utile pour les vieux navigateurs). Le mieux est encore d'éviter
d'utiliser les frames...
Liste des méta-balises prises en
compte par les araignées des moteurs
-> Elles sont indispensables !
| <meta
name="DESCRIPTION" content="Plein de choses intéressantes..."> |
La méta-balise de description est utilisée par les moteurs de recherche pour afficher dans leurs pages-résultat une courte description. Si le moteur ne trouve pas cette méta-balise, il utilisera le contenu du début de votre page par défaut d'où la nécessité de cette méta-balise. Pour votre description, contentez vous d'une courte phrase décrivant votre page avec objectivité (évitez les descriptions du genre "Venez visiter le meilleur site du monde sur les chimpanzés"). C'est cette description qui pourra convaincre les internautes de cliquez sur le lien pour faire une visite. Sachez cependant que certains moteurs peuvent ignorer la méta-balise Description, c'est pourquoi, il est toujours utile de commencer votre page par une description de celle-ci. |
| <meta
name="KEYWORDS" content="chimpanzé, chimpanzés, singe, singes..."> |
Les mots-clé sont utilisés par le moteur pour classer votre site dans son index. Sachez user de cette méta-balise qui, utilisée sagement, peut vous permettre d'être placé en bonne position dans les pages de résultats. Vous pouvez y mettre jusqu'à 500 mots-clés (au-dela certains moteurs n'apprécient pas), n'hésitez pas à les décliner au singulier, au pluriel, avec ou sans accents, en différentes cases, en différentes langues. Mais surtout pas de spam aux mots-clé ! N'utilisez que des mots en rapport avec votre page et séparez-les par des virgules. |
| <META NAME="ROBOTS" CONTENT="index,nofollow,noarchive"> | La méta-balise robots fournit aux
araignées (robots) des moteurs de recherche vos
directives en terme de référencement. Ainsi le contenu
de cette méta-balise se compose de index ou no index
suivi d'une virgule puis de follow ou nofollow. Si vous
mettez index alors le moteur de recherche réferencera
votre page, si vous utilisez noindex il ne la référencera
pas. Quant à follow ou nofollow, ils renseignent le
moteur de recherche sur le sort à donner aux hyperliens
: si vous utilisez follow alors le moteur essaiera de référencer
tous les hyperliens de votre page, sinon avec nofollow,
il ne suivra pas les hyperliens. La méta-balise robots est ainsi utile si vous ne souhaitez pas référencer certaines pages (noindex). Par défaut les pages sont considérées comme index et follow. Si vous souhaitez exclure des répertoires entiers, le fichier robots.txt peut se montrer plus souple. Note : Bien entendu si vous indiquez une page noindex, vous n'avez pas à vous préoccuper des méta-balises de mots-clé, de description et compagnie. Enfin ajouté à la méta-balise robots, le mot noarchive indique aux araignées de ne pas archiver le contenu de votre page. Sans la présence de noarchive, certains robots archiveront systématiquement le contenu de vos pages (Google par exemple). |
| <META NAME="revisit-after" CONTENT="30 days"> | Cette méta-balise définit le temps que vous souhaitez voir passer entre deux indexations par l'araignée. Si vous tapez "30 days" alors le moteur reviendra faire une visite dans 30 jours. Mais attention, l'araignée ne va pas forcément suivre vos recommendations, surtout si elle est surchargée. Et puis soyez réaliste : si vous indiquez "1 day" il est évident que l'araignée ne viendra pas faire une inspection quotidienne de votre site...non mais ! |
Autres méta-balises jouant un rôle très
secondaire dans le référencement
-> A utiliser si vous avez le temps...
| <meta
name="Author" content="Michel Chilowicz"> <meta name="Publisher" content="ChiloPublishing"> <meta name="Copyright" content="Michel Chilowicz"> |
Les méta-balises d'auteurs, d'hébergeur et de copyright sont généralement peu utilisées par les moteurs de recherches. Pour cette raison, il est très rare de voir des pages avec ce genre de balises. Mais vous pouvez toujours les indiquer, mais bien entendu les balises d'auteurs ou de copyright n'ont aucune valeur légale . N'importe qui peut y mettre n'importe quel nom ; si vous souhaitez protéger votre page html en tant qu'oeuvre numérique, ces simples méta-balises ne suffisent pas, adressez-vous pour cela à l'IDDN capable de vous fournir des certificats électroniques de copyright irréfutables. |
| <meta name="Identifier-Url" content="http://www.netastuces.org" "> |
Vous utiliserez cette balise pour indiquer l'URL de votre site. Généralement inutile. |
| <meta name="Reply-To" content="webmaster@netastuces.org"> |
Là, vous indiquez l'adresse e-mail du
responsable du site Web (c-à-d le webmestre). Là encore
peu de moteurs utilisent cette information. Bien entendu l'adresse du webmestre doit aussi être indiquée en clair sur la page car peu de visiteurs s'amuseront à consulter le source d'une page pour écrire au webmestre. |
| <META NAME="Category" CONTENT="Internet"> | La méta-balise de catégorie facilite le classement dans des annuaires de sites. Mais pour l'instant je n'ai jamais encore vu un moteur ou annuaire l'utilisant. Il est vrai qu'elle ne répond à aucune norme et que chaque annuaire utilise son propre classement. |
| <META NAME="Generator" CONTENT="Notepad, Paint"> | Cette méta-balise est sans doute la plus optionnelle de toutes. En fait elle ne sert qu'à indiquer le(s) logiciel(s) ayant servi à écrire la page Web. Certains logiciels d'édition HTML pas très polis l'indiquent automatiquement sans rien demander. En fait cette balise relève d'une petite publicité pour les logiciels indiqués, sans plus. |
Il existe encore des balises méta mais qui n'ont
rien à voir avec le référencement, elles sont de type système
et débutent toujours par <META HTTP-EQUIV
Parmi elles ont peut citer la balise <META HTTP-EQUIV="refresh"
CONTENT="30;URL=http://www.netastuces.org> qui sert à
effectuer une redirection automatique vers la page désirée avec
un certain délai (ici 30 secondes). En n'indiquant que le délai,
c'est la page affichée qui sera réactualisée. D'autres balises
telles que <META HTTP-EQUIV="expires" CONTENT="Wed,
30 Sept 1998 12:00:00 GMT"> permettent de définir une
expiration du cache à la date souhaitée (passé cette date le
butineur ira automatiquement retélécharger la page sur le Web)
; enfin la balise <META HTTP-EQUIV="pragma" CONTENT="no-cache">
quant à elle interdit l'enregistrement de la page dans le cache
du butineur.
| Cliquez ici pour acceder au générateur de méta-balises |
b) Le fichier robots.txt
Le fichier robots.txt permet de guider les
moteurs de recherche dans leur référencement. En effet les
moteurs vont de lien en lien pour référencer des pages et vous
souhaitez peut-être que certaines pages (privées) de votre site
ne soient pas référencées, voire même des répertoires
entiers. C'est possible grâce au fichier robots.txt reconnu par
la quasi-totalité des moteurs qui permet de définir les
fichiers à référencer et ceux à exclure. Le fichier robots.txt
ne peut être placé qu'à la racine du serveur (ex : http://www.votre-domaine.com/robots.txt). Si vous êtes hébergé en répertoire, vous ne
pourrez pas utiliser robots.txt (dans ce cas vous devrez vous résigner
à utiliser la méta-balise robots), par contre en sous-domaine c'est
possible. Ceci s'explique par le fait que les araignée
indexatrices ne cherchent jamais le fichier robots.txt dans des répertoires).
Le fichier robots.txt est un simple fichier texte dans lequel
vous indiquez les répertoires à ne pas référencer. Voici des
exemples de contenu de fichier robots.txt :
| User-agent:
* Disallow: /cgi-bin/ Disallow: /tmp/ Disallow: /~michel/ |
Dans ce cas là tous les fichiers des
répertoires cgi-bin, temp et ~michel ne seront pas référencés. |
| Vous pouvez aussi étendre l'interdiction de référencement à tout le domaine : | User-agent:
* Disallow: / |
| De même il est possible de
restreindre l'accès à certains robots et de l'autoriser
à d'autres. Par exemple ici seul l'araignée d'AltaVista (nommée Scooter) peut référencer les pages du serveur : |
User-agent:
Scooter Disallow: User-agent: * Disallow: / |
Bref, vous l'avez compris le fichier robots.txt
permet de contrôler le comportement des robots et d'empêcher d'aller
fouiller dans certains répertoires. Sachez cependant que la
meilleure protection pour empêcher la venue de robots dans
certains répertoires est l'absence d'hyperliens vers ceux-ci (le
moteur ne pourra alors jamais deviner leur existence).
Pour en savoir plus sur ce fameux fichier robots.txt, vous pouvez
consulter les excellentes pages que WebCrawler consacre à ce sujet.
Si vous avez réalisé votre fichier robots.txt, vous pouvez le tester grâce à l'outil de vérification ci-dessous. Il faut mieux en effet vérifier les fichiers robots.txt avant d'entreprendre une indexation du site.
c) Les pages satellites
Il faut bien comprendre que les méta-balises ne sont pas un
remède miracle pour le référencement. Ainsi si vous introduisez des mots-clé
qui n'existent pas dans le corps de votre page, les moteurs de recherche les
ignoreront tout bonnement. C'est pourquoi il convient de mettre dans le corps
de la page les mots-clé déjà utilisées dans les méta-balises.
La solution la plus facile est de faire des pages satellites, c'est-à-dire des
pages qui ne servent que pour le référencement et à rien d'autre.
Alors comment fonctionne un page satellite et à quoi ça sert ? En fait la page
satellite contient des méta-balises avec une description et des mots-clé évocateurs,
mais surtout un corps constitué également de mots-clé répétés par exemple 3
fois de suite.
Ensuite on référence cette page aux moteurs de recherche et c'est bon. Ainsi
la page satellite risque d'avoir un bon positionnment sur les mots-clé qu'elle
contient.
Bien entendu, certaines personnes seront intéressées et cliqueront ; ils risquent
alors d'obtenir une page de mots-clé ce qui risque probablement de les rébuter.
L'astuce est alors d'écrire les mots-clé avec la même couleur que le fond pour
qu'ils soient invisible à l'affichage de la page (il est préférable de mettre
un fond image de la couleur du texte pour éviter que les moteurs ne décèlent
la tricherie). Parallèlement on place un lien qui redirige le visiteur vers
la vraie page d'accueil du site. On peut même installer un JavaScript qui charge
automatiquement la page d'accueil (évitez les méta-balises refresh).
Attention toutefois : maintenant les robots d'indexation utilisent certaines techniques pour déceler ces pages satellites et ainsi ne pas les indexer ; par exemple une abondance de mots de petite taille portant la même couleur que le fond pourra mettre la puce à l'oreille du robot. De plus les pages avec un metatag de rafraichissement assez rapide ne sont pas indexées.
d) Augmenter son taux de popularité
Actuellement, les moteurs de recherche prennent de plus en plus
en compte le taux de popularité d'une page pour la classer plus ou moins
bien dans une liste de réponses et ainsi éviter le spamdexing
et pouvoir fournir des résultats pertinents aux internautes. Google a
ainsi été le premier moteur à prendre en compte le taux
de popularité.
Le taux de popularité se calcule en fait à partir du nombre de
pages possédant un lien hypertexte vers la votre, quelquefois selon les
algorithmes développés par les moteurs, les liens hypertextes
peuvent avoir un poids différent selon qu'ils sont intégrés
eux-même à une page avec un fort ou faible taux de popularité.
Pour augmenter votre taux de popularité, il n'y a pas 36 solutions :
il faut développer des échanges de liens hypertextes entre différents
sites. Ce système de classement sur taux de popularité privilégie
en fait surtout les sites de forte notoriété installés
depuis longtemps et ne laisse que peu de chances aux sites récents encore
peu connus.
|
Accueil
- Nouveautés - Vos
remarques - Forum
- Liste de diffusion - Livre d'Or |