Net@stuces -- http://www.netastuces.org
Préparation du référencement
Navigation rapide : Page précédente

a) Les méta-balises (et aussi un bon titre !)

La préparation du référencement consiste à ajouter dans l'en-tête de votre page quelques méta-balises afin de faciliter le travail du moteur. En effet le moteur, en l'absence de méta-balises, se contente de prendre comme description du site les 1ères lignes de votre page html et référence tous les mots-clé de la page sans leur accorder de priorité. Ainsi la méta-balise de description indique en une phrase quel est le sujet du site et la méta-balise de mots-clé indique quels sont les mots-clé qui caractérisent vraiment la page. Ainsi si un internaute cherche avec le moteur des mots-clé que vous avez indiquez en méta-balise, il a de fortes chance de trouver votre page bien placée dans la liste des résultats. Vous trouverez donc sur cette page une liste des méta-balises utilisées par les moteurs de recherche pour classer et caractériser votre page html. A noter qu'il est préférable d'effectuer un "méta-balisage" sur chacune de vos pages de votre site. N'oubliez pas aussi de donner un titre à votre page (délimité par les balises <TITLE> et </TITLE> dans le "head" de la page) car sinon gare aux "untitled page" des moteurs ; bien entendu le titre doit être parlant car c'est véritablement lui qui conditionne le référencement. Il doit refléter le plus possible le contenu de la page car le titre est encore plus important que les méta-balises de description ou de mots-clé car il sera traité en priorité pour l'indexation (et sera visible dans la barre de titre du navigateur du visiteur).
-> Les méta-balises doivent être incluses en début de page entre <HEAD> et </HEAD>, elles ne peuvent êtres vues que si l'on consulte le source de la page. La casse (majuscules/minuscules) n'a pas d'importance dans les balises elles-même mais bien entendu le contenu des méta-balises (après content=")est sensible à la casse.
Note : la jurisprudence américaine interdit l'usage de marques de concurrents dans les méta-balises (ainsi Microsoft n'a pas le droit d'utiliser le mot-clé Netscape et vice-versa). De même les moteurs condamnent le spam à la méta-balise qui consite à écrire une liste impressionnante de mots-clé pour essayer d'apparaître le plus souvent en tête des recherches.

A propos des frames (cadres)...
Attention presque tous les moteurs de recherche ne supportent pas les frames. En ce qui concerne les pages contenant des frames, n'oubliez pas d'aménager un contenu entre les balises <NOFRAMES> et </NOFRAMES> qui sera pris en compte par les moteurs (et sera utile pour les vieux navigateurs). Le mieux est encore d'éviter d'utiliser les frames...

Liste des méta-balises prises en compte par les araignées des moteurs
-> Elles sont indispensables !

<meta name="DESCRIPTION"
content="Plein de choses intéressantes...">
La méta-balise de description est utilisée par les moteurs de recherche pour afficher dans leurs pages-résultat une courte description. Si le moteur ne trouve pas cette méta-balise, il utilisera le contenu du début de votre page par défaut d'où la nécessité de cette méta-balise. Pour votre description, contentez vous d'une courte phrase décrivant votre page avec objectivité (évitez les descriptions du genre "Venez visiter le meilleur site du monde sur les chimpanzés"). C'est cette description qui pourra convaincre les internautes de cliquez sur le lien pour faire une visite. Sachez cependant que certains moteurs peuvent ignorer la méta-balise Description, c'est pourquoi, il est toujours utile de commencer votre page par une description de celle-ci.
<meta name="KEYWORDS"
content="chimpanzé, chimpanzés, singe, singes...">
Les mots-clé sont utilisés par le moteur pour classer votre site dans son index. Sachez user de cette méta-balise qui, utilisée sagement, peut vous permettre d'être placé en bonne position dans les pages de résultats. Vous pouvez y mettre jusqu'à 500 mots-clés (au-dela certains moteurs n'apprécient pas), n'hésitez pas à les décliner au singulier, au pluriel, avec ou sans accents, en différentes cases, en différentes langues. Mais surtout pas de spam aux mots-clé ! N'utilisez que des mots en rapport avec votre page et séparez-les par des virgules.
<META NAME="ROBOTS" CONTENT="index,nofollow,noarchive"> La méta-balise robots fournit aux araignées (robots) des moteurs de recherche vos directives en terme de référencement. Ainsi le contenu de cette méta-balise se compose de index ou no index suivi d'une virgule puis de follow ou nofollow. Si vous mettez index alors le moteur de recherche réferencera votre page, si vous utilisez noindex il ne la référencera pas. Quant à follow ou nofollow, ils renseignent le moteur de recherche sur le sort à donner aux hyperliens : si vous utilisez follow alors le moteur essaiera de référencer tous les hyperliens de votre page, sinon avec nofollow, il ne suivra pas les hyperliens.
La méta-balise robots est ainsi utile si vous ne souhaitez pas référencer certaines pages (noindex). Par défaut les pages sont considérées comme index et follow. Si vous souhaitez exclure des répertoires entiers, le fichier robots.txt peut se montrer plus souple.
Note : Bien entendu si vous indiquez une page noindex, vous n'avez pas à vous préoccuper des méta-balises de mots-clé, de description et compagnie.
Enfin ajouté à la méta-balise robots, le mot noarchive indique aux araignées de ne pas archiver le contenu de votre page. Sans la présence de noarchive, certains robots archiveront systématiquement le contenu de vos pages (Google par exemple).
<META NAME="revisit-after" CONTENT="30 days"> Cette méta-balise définit le temps que vous souhaitez voir passer entre deux indexations par l'araignée. Si vous tapez "30 days" alors le moteur reviendra faire une visite dans 30 jours. Mais attention, l'araignée ne va pas forcément suivre vos recommendations, surtout si elle est surchargée. Et puis soyez réaliste : si vous indiquez "1 day" il est évident que l'araignée ne viendra pas faire une inspection quotidienne de votre site...non mais !

Autres méta-balises jouant un rôle très secondaire dans le référencement
-> A utiliser si vous avez le temps...

<meta name="Author"
content="Michel Chilowicz">
<meta name="Publisher"
content="ChiloPublishing">
<meta name="Copyright"
content="Michel Chilowicz">
Les méta-balises d'auteurs, d'hébergeur et de copyright sont généralement peu utilisées par les moteurs de recherches. Pour cette raison, il est très rare de voir des pages avec ce genre de balises. Mais vous pouvez toujours les indiquer, mais bien entendu les balises d'auteurs ou de copyright n'ont aucune valeur légale . N'importe qui peut y mettre n'importe quel nom ; si vous souhaitez protéger votre page html en tant qu'oeuvre numérique, ces simples méta-balises ne suffisent pas, adressez-vous pour cela à l'IDDN capable de vous fournir des certificats électroniques de copyright irréfutables.
<meta name="Identifier-Url"
content="http://www.netastuces.org" ">
Vous utiliserez cette balise pour indiquer l'URL de votre site. Généralement inutile.
<meta name="Reply-To"
content="webmaster@netastuces.org">
Là, vous indiquez l'adresse e-mail du responsable du site Web (c-à-d le webmestre). Là encore peu de moteurs utilisent cette information.
Bien entendu l'adresse du webmestre doit aussi être indiquée en clair sur la page car peu de visiteurs s'amuseront à consulter le source d'une page pour écrire au webmestre.
<META NAME="Category" CONTENT="Internet"> La méta-balise de catégorie facilite le classement dans des annuaires de sites. Mais pour l'instant je n'ai jamais encore vu un moteur ou annuaire l'utilisant. Il est vrai qu'elle ne répond à aucune norme et que chaque annuaire utilise son propre classement.
<META NAME="Generator" CONTENT="Notepad, Paint"> Cette méta-balise est sans doute la plus optionnelle de toutes. En fait elle ne sert qu'à indiquer le(s) logiciel(s) ayant servi à écrire la page Web. Certains logiciels d'édition HTML pas très polis l'indiquent automatiquement sans rien demander. En fait cette balise relève d'une petite publicité pour les logiciels indiqués, sans plus.

Il existe encore des balises méta mais qui n'ont rien à voir avec le référencement, elles sont de type système et débutent toujours par <META HTTP-EQUIV
Parmi elles ont peut citer la balise <META HTTP-EQUIV="refresh" CONTENT="30;URL=http://www.netastuces.org> qui sert à effectuer une redirection automatique vers la page désirée avec un certain délai (ici 30 secondes). En n'indiquant que le délai, c'est la page affichée qui sera réactualisée. D'autres balises telles que <META HTTP-EQUIV="expires" CONTENT="Wed, 30 Sept 1998 12:00:00 GMT"> permettent de définir une expiration du cache à la date souhaitée (passé cette date le butineur ira automatiquement retélécharger la page sur le Web) ; enfin la balise <META HTTP-EQUIV="pragma" CONTENT="no-cache"> quant à elle interdit l'enregistrement de la page dans le cache du butineur.

Cliquez ici pour acceder au générateur de méta-balises

b) Le fichier robots.txt

Le fichier robots.txt permet de guider les moteurs de recherche dans leur référencement. En effet les moteurs vont de lien en lien pour référencer des pages et vous souhaitez peut-être que certaines pages (privées) de votre site ne soient pas référencées, voire même des répertoires entiers. C'est possible grâce au fichier robots.txt reconnu par la quasi-totalité des moteurs qui permet de définir les fichiers à référencer et ceux à exclure. Le fichier robots.txt ne peut être placé qu'à la racine du serveur (ex : http://www.votre-domaine.com/robots.txt). Si vous êtes hébergé en répertoire, vous ne pourrez pas utiliser robots.txt (dans ce cas vous devrez vous résigner à utiliser la méta-balise robots), par contre en sous-domaine c'est possible. Ceci s'explique par le fait que les araignée indexatrices ne cherchent jamais le fichier robots.txt dans des répertoires).
Le fichier robots.txt est un simple fichier texte dans lequel vous indiquez les répertoires à ne pas référencer. Voici des exemples de contenu de fichier robots.txt :

User-agent: *
Disallow: /cgi-bin/
Disallow: /tmp/
Disallow: /~michel/
Dans ce cas là tous les fichiers des répertoires cgi-bin, temp et ~michel ne seront pas référencés.
Vous pouvez aussi étendre l'interdiction de référencement à tout le domaine : User-agent: *
Disallow: /
De même il est possible de restreindre l'accès à certains robots et de l'autoriser à d'autres.
Par exemple ici seul l'araignée d'AltaVista (nommée Scooter) peut référencer les pages du serveur :
User-agent: Scooter
Disallow:

User-agent: *
Disallow: /

Bref, vous l'avez compris le fichier robots.txt permet de contrôler le comportement des robots et d'empêcher d'aller fouiller dans certains répertoires. Sachez cependant que la meilleure protection pour empêcher la venue de robots dans certains répertoires est l'absence d'hyperliens vers ceux-ci (le moteur ne pourra alors jamais deviner leur existence).
Pour en savoir plus sur ce fameux fichier robots.txt, vous pouvez consulter
les excellentes pages que WebCrawler consacre à ce sujet.

Si vous avez réalisé votre fichier robots.txt, vous pouvez le tester grâce à l'outil de vérification ci-dessous. Il faut mieux en effet vérifier les fichiers robots.txt avant d'entreprendre une indexation du site.

Site à vérifier :

 

c) Les pages satellites

Il faut bien comprendre que les méta-balises ne sont pas un remède miracle pour le référencement. Ainsi si vous introduisez des mots-clé qui n'existent pas dans le corps de votre page, les moteurs de recherche les ignoreront tout bonnement. C'est pourquoi il convient de mettre dans le corps de la page les mots-clé déjà utilisées dans les méta-balises.
La solution la plus facile est de faire des pages satellites, c'est-à-dire des pages qui ne servent que pour le référencement et à rien d'autre.
Alors comment fonctionne un page satellite et à quoi ça sert ? En fait la page satellite contient des méta-balises avec une description et des mots-clé évocateurs, mais surtout un corps constitué également de mots-clé répétés par exemple 3 fois de suite.
Ensuite on référence cette page aux moteurs de recherche et c'est bon. Ainsi la page satellite risque d'avoir un bon positionnment sur les mots-clé qu'elle contient.
Bien entendu, certaines personnes seront intéressées et cliqueront ; ils risquent alors d'obtenir une page de mots-clé ce qui risque probablement de les rébuter. L'astuce est alors d'écrire les mots-clé avec la même couleur que le fond pour qu'ils soient invisible à l'affichage de la page (il est préférable de mettre un fond image de la couleur du texte pour éviter que les moteurs ne décèlent la tricherie). Parallèlement on place un lien qui redirige le visiteur vers la vraie page d'accueil du site. On peut même installer un JavaScript qui charge automatiquement la page d'accueil (évitez les méta-balises refresh).

Attention toutefois : maintenant les robots d'indexation utilisent certaines techniques pour déceler ces pages satellites et ainsi ne pas les indexer ; par exemple une abondance de mots de petite taille portant la même couleur que le fond pourra mettre la puce à l'oreille du robot. De plus les pages avec un metatag de rafraichissement assez rapide ne sont pas indexées.

d) Augmenter son taux de popularité

Actuellement, les moteurs de recherche prennent de plus en plus en compte le taux de popularité d'une page pour la classer plus ou moins bien dans une liste de réponses et ainsi éviter le spamdexing et pouvoir fournir des résultats pertinents aux internautes. Google a ainsi été le premier moteur à prendre en compte le taux de popularité.
Le taux de popularité se calcule en fait à partir du nombre de pages possédant un lien hypertexte vers la votre, quelquefois selon les algorithmes développés par les moteurs, les liens hypertextes peuvent avoir un poids différent selon qu'ils sont intégrés eux-même à une page avec un fort ou faible taux de popularité.
Pour augmenter votre taux de popularité, il n'y a pas 36 solutions : il faut développer des échanges de liens hypertextes entre différents sites. Ce système de classement sur taux de popularité privilégie en fait surtout les sites de forte notoriété installés depuis longtemps et ne laisse que peu de chances aux sites récents encore peu connus.


Accueil - Nouveautés - Vos remarques - Forum - Liste de diffusion - Livre d'Or
© Copyright Net@stuces, tous droits réservés - Conditions d'utilisation

Page précédenteRemonter en haut de la page