Cinquante conseils SEO-bio en vrac
Au chapitre des truismes et suivant le principe “Mieux vaut taper une fois de trop sur le clou qu’une fois trop peu”, voici une nouvelle mouture de mon indispensable “kit de survie”.
Il y a à boire et à manger, et des points discutables (discutez, discutons, la discussion engendre la solution).
Ne perdez pas de vue que mon propos général est d’obtenir un Web propre et libéré du spam.
Ce qui ne m’empêche pas de tirer mon chapeau à ceux qui réussissent à optimiser sur le fil du rasoir.
Mais pour les trucs et astuces destinés à tromper les moteurs, voyez autre part.
1. Votre site doit être unique et cohérent, il doit concerner un sujet particulier bien maîtrisé.
2. Soyez sévère avec votre contenu.
Pour chaque page de contenu, posez-vous la question : est-ce un contenu essentiel (unique, dont l’univers ne peut se passer), utile (cette page a de la concurrence mais elle est complète et/ou fait autorité) ou bien est-elle simplement pertinente (sans être complète sur le sujet, elle contient un ou plusieurs éléments utiles).
Ou alors … c’est une page hors-sujet ou inutile (même si elle renvoie à des pages essentielles, utiles ou pertinentes).
Prenez garde à ne pas attirer l’internaute sur une page de ce dernier type.
Ne dites pas Oui mais tel site est bourré de ce type de pages, il ne contient même que ça, et il cartonne.
Des cas particuliers, il y en aura toujours, ce ne sont pas des modèles mais des exceptions.
3. Pré-référencez.
Si le site est en construction, évitez de le signaler par une page d’attente illustrée par un gif animé “Men at work”, offrez au moins une page d’intro générale et une page par chapitre, avec du vrai contenu définitif (ou presque).
Ce squelette est indexable et peut faire l’objet de BL faciles, au moins sur les annuaires.
Ne faites pas durer le plaisir de l’attente : un mois max avant de commencer à développer les chapitres.
Si vous n’avez pas d’idée précise quant à la structure définitive, mieux vaut ne rien mettre en ligne ou écarter les robots, le temps de la préparation, d’un petit coup de robots.txt :
User-agent: *
Disallow: /
Pour chasser les robots d’une page, il faut éviter
meta name=”robots” content=”noindex”
dont l’efficacité est douteuse ou en tout cas discutée.
Le mieux reste un .htaccess ou un paramétrage du fichier httpd.conf de l’Apache du serveur (si le serveur utilise Apache et si on a le droit de l’administrer).
4. Laissez les bots des moteurs découvrir le site.
Ces worms (techniquement, un bot est un worm, oui) suivent les liens : posez des liens sur le Web, les possibilités ne manquent pas.
Impliquez-vous judicieusement dans les sites communautaires de la thématique adéquate.
5. Le texte de l’ancre qui pointe vers une page importe en terme d’impact pour les mots-clés.
Ce n’est pas douteux : le texte de l’ancre qui pointe vers un document peut même remplacer son title dans la page des résultats.
Tenez-en compte or die.
6. Répartissez les BL pour que chaque page importante soit liée de l’extérieur.
Pour les pages utilitaires de type “formulaire de contact” : empêchez leur indexation.
N’encombrez pas les index des moteurs avec des pages inutiles.
7. Question tuyauterie interne, respectez la règle “n’importe quelle page doit être accessible en deux clics max”.
Densifiez le maillage interne.
Tissez un fil d’Ariane en menu horizontal court et purement textuel (”[lien]Home > [lien]Chapitre > [lien]Ss-chapitre > ici”).
Ce fil vient en plus du menu généraliste omniprésent à réaliser en CSS (exemples : Menu à 2 niveaux, Menu multi-niveaux, voyez aussi chez Alsacréations).
Si ces menus utilisent un script dont l’internaute peut désactiver le moteur, le fil d’Ariane en liens bruts s’impose (évitez les menus en images et le Flash, ça complique les choses).
Si votre menu exige plus de quatre niveaux, c’est que votre structure est mal fichue.
Le maillage interne compte pour peu de chose par rapport aux BL venus de l’extérieur du site.
8. Installez un moteur de recherches interne.
Il est parfois plus facile d’adapter un CMS (qui dispose d’une fonction de recherche au départ de l’usine) que de greffer un moteur à un site.
9. Faites un plan du site pour l’internaute.
Ce plan devra être accessible d’un seul clic à partir de n’importe quelle page.
10. Faites un plan du site pour chaque grand moteur qui le permet.
Tenez-les à jour et paramétrez-les correctement (il ne sert à rien de dire au moteur que telle page est mise à jour quotidiennement si elle ne change jamais).
11. Facilitez la vie aux robots (robots.txt, support du “If-Modified-Since” par le serveur …)
12. Structure physique des répertoires : on s’en fiche, avec l’URL-rewriting on peut faire comme si toutes les ressources étaient au root.
14. Oubliez les satellites (pages et sites) : un satellite, ça finit toujours par retomber.
15. Utilisez le texte plutôt que les images.
Si votre contenu est fait d’images, ajoutez des descriptions et structurez de manière à aider les robots à comprendre quel texte accompagne telle image.
<div>
<img … alt=”description” />
<p>
[légende]
</p>
</div>
16. Le contenu du “alt” doit correspondre à la réalité de l’image.
Le alt aide vraiment au positionnement de la page et de l’image.
17. Utilisez des liens en texte brut (liens en dur).
Tous les liens chipotés ou redirigés sont suspects, ils indiquent une possibilité de triche quelque part.
N’utilisez pas l’attribut “rel=nofollow” : si vous voulez stériliser le lien, ne l’ancrez pas, contentez-vous de l’écrire et que l’Internaute se débrouille.
18. Le <title> devrait avoir entre 60 et 80 caractères, disons 65.
19. Un <title> différent par page.
20. Une META “description” différente par page.
21. 25 mots par META “description” (max 200 caractères).
Une description trop courte ennuie les moteurs, ça les oblige à scanner la page pour trouver de quoi remplir le snippet descriptif.
22. Utilisez seulement des mots-clés légitimes.
23. Placez les mots-clés pertinents en bonne place dans les “alt”, <title> et “description”.
24. Un mot-clé dans l’URL ne dérange personne. Deux non plus.
Au-delà, ça commence à friser l’abus.
25. META “keywords” : limitez-vous aux mots-clés qui caractérisent réellement la page.
J’ai lu récemment “15-20 mots maximum”, haha, comme si une page pouvait concerner avec pertinence autant de mots différents.
Disons LE mot-clé qui caractérise la page plus des synonymes ad-hoc (Même absents de la page ? Voui, surtout si une ancre de BL comporte le mot.)
26. Une page généraliste peut être un point de chute pour une requête large (”salle de bain”), une page spécialisée correspondra à une requête spécifique (”lavabo Bouszchez 224-y”).
Ne mélangez pas tout, ne ratissez pas trop large.
27. Ne vous prenez pas les pieds dans la longue traîne.
Votre site traite d’un sujet particulier, inutile d’y ramener du monde pour autre chose.
On peut facilement abuser (cherches les berszerkers sur la page).
Désolée, c’était un test et le résultat reste pertinent (mais non vital, et pas utile : catégorie 3).
28. Cessez de calculer le “bon” ratio entre le nombre de mots de la page et le nombre d’occurrence de tel mot-clé.
Le bon ratio, c’est celui qui se justifie, pas celui qui est toléré.
Vous ne le trouverez pas en optimisant votre key stuff.
Vous pouvez utiliser cet outil pour vérifier que vous ne radotez pas trop.
Et d’accord, le discours commercial n’est pas de la littérature, il impose la répétition des mots (taper sur le clou, à nouveau) mais respectez l’internaute : il comprend les synonymes … et le robot aussi.
29. Ne lésinez pas sur le volume du contenu.
Une bonne page n’est pas maigrichonne : il y a de la viande autour de l’os, et plus d’un lien dedans.
30. Structurez le contenu avec les balises standards.
Un seul H1 par page.
Pas de H2 sauf si au moins deux se justifient.
Et ainsi de suite.
Les Hn doivent contenir les mots-clés utiles.
Entre les Hn, le contenu va dans des <p> qui sont conçus exactement à cet effet (la nature est bien faite, tout de même).
Prenez exemple sur Victor Hugo pour apprendre comment structurer à la hache.
31. Passez vos feuilles de style et vos pages aux valideurs du W3C.
Le but est moins de pouvoir afficher un logo que de repérer des erreurs.
Corrigez le plus d’erreurs possible.
32. Veillez à l’orthographe.
33. Si vous avez une conscience et un budget, ou alors du temps, n’hésitez pas à rendre votre site accessible.
Quelqu’un vous en saura gré. Peut-être pas les moteurs mais le Web, c’est aussi des internautes.
Pareil si vous pensez uniquement en termes d’optimisation.
Un site accessible est susceptible de toucher 100% des clients potentiels.
34. Checkez vos pages avec un navigateur-texte (Lynx) pour visualiser ce que va percevoir le robot.
Ne vous étonnez pas de constater que certaines balises ne sont pas prises en compte, ni les liens qui s’y trouvent.
Tirez-en les conclusions qui s’imposent.
Vous pouvez aussi utiliser un simulateur de robot.
35. Checkez vos pages dans différents navigateurs, au moins dans IE et dans FF mais aussi sur un écran de téléphone.
Le futur du Web passe par les petits écrans.
36. N’entrez pas dans les guéguerres entre les tenants des <table> et les ayatollahs des CSS.
Bon, c’est clair tout de même : un tableau est fait pour présenter des données, pas pour organiser un visuel.
Les choses sont simples: dans le <body>, un nombre max de 250 caractères (allez, disons 300) est toléré par les moteurs avant d’attaquer le contenu.
On y est très vite avec le code des <table> imbriquées.
Utiliser les CSS s’impose donc.
37. Procurez-vous un détecteur de liens brisés (voyez Xenu).
Rien ne fait plus négligé qu’un lien qui ne conduit nulle part.
Dites-vous que les moteurs évaluent peut-être la qualité des liens autant que celle des pages
38. Utilisez l’URL-rewriting pour raccourcir vos URL et les rendre explicites.
Short is beautiful et il y a des boxers pas mal non plus (mais je m’égare).
39. Evitez d’entasser plus de 50 liens sur une page.
Débrouillez-vous pour que les liens vers d’autres sites ne totalisent pas plus de 5% du nombre de caractères de la page.
40. Ne forcez pas les robots à s’inscrire pour visiter les pages que vous voulez leur montrer.
41. Offrez la même chose aux robots qu’aux internautes.
Laissez tomber les gamineries et jusqu’au text-indent négatif pour les menus en images (même si on vous affirme que c’est toléré).
C’est effectivement toléré mais l’évaluation de la légitimité du procédé est humaine.
42. Ne faites aucun lien vers une page suspecte.
Le mauvais voisinage peut vraiment vous pourrir la vie.
C’est l’émetteur qui subit la pénalité, pas le récepteur.
43. Ne faites pas de pages illégales.
Elles vous apporteront du trafic mais aussi des ennuis.
44. Evitez les échanges massifs de liens en bas de page.
Lier un logo “Valid W3C” en bas de chaque page ne pénalise personne : le W3C ne vous renvoie rien, ce n’est pas un échange.
Entre un site A et un site B, évitez les échanges A > B > A.
Préférez les liaisons triangulaires (ou plus) : A > B > C > A.
Et bon sang, ne renvoyez pas un lien à la page qui vous en fait un.
Ne dramatisons pas : “massif”, ça veut dire “nombreux et systématique”, ça ne concerne pas dix petits liens de sympathie ou entre sites du même propriétaire.
45. Ne lésinez pas sur les liens externes pertinents (qui prolongent ou précisent votre contenu).
Un vrai bon lien fait partie du corps du texte et doit se justifier par le contexte.
Mais ne limitez pas votre contenu à de pareils liens, laissez ça aux portails et aux agrégateurs.
46. Si vous signez avec un prestataire SEO, n’oubliez pas qu’il a seulement une obligation de moyens, rien à voir avec des résultats.
Avec la mise en oeuvre complète des seules techniques autorisées, ce que vous obtiendrez des moteurs correspondra à ce que votre site mérite.
Sinon, il faut stigmatiser les moteurs, pas le prestataire.
47. Si vous voulez du trafic qualifié, achetez de la publicité.
Il n’y a pas seulement les sous pour “payer” la pub : faites bosser votre imagination en fonction de la spécificité de votre site.
48. Oubliez la vente et/ou l’achat de liens : c’est du poison.
49. Méfiez-vous des cas spécifiques cités en exemple d’une “technologie gagnante” : chaque cas est particulier et les moteurs sont encore bien distraits dans leur chasse aux techniques too much borderline … mais ils s’améliorent (quoique ça ne se remarque pas trop).
50. Ce dernier point est l’Article 15 (voir au “Glossaire” dans le menu de droite, en haut).
—
Ainsi parla Szaratoustra, on me l’a déjà faite, merci.
11 août 2008 à 12:40
Ca c’est du kit de survie ! Merci, un bon récap ne fait jamais de mal.
Par contre de quoi parles tu en mettant en doute l’efficacité du meta noindex ?
Merci beaucoup
11 août 2008 à 13:04
Bonjour SZarah,
concernant le “alt” des images, je pensais que les moteurs n’en tenaient guère compte suite aux abus, ce qui ne m’empêchait pas de les remplir à tout hasard.
J’ai été surpris de me retrouver positionner sur une expression contenue uniquement dans un “alt”, rien de méchamment concurrentiel mais quand même, ce n’est pas négligeable.
11 août 2008 à 13:11
Je dirais pas ainsi “parla…”, une question “Szara”, c’est fille ou garçon et aussi, si fille est-elle célibataire ? ;o)
Trève de plaisanterie, c’est toujours un plaisir de lire du bon texte sur le référencement avec de l’humour !
11 août 2008 à 13:14
Cinquante conseils SEO-bio en vrac…
Voici les conseils Bio en référencement par Szarah, et c’est toujours un plaisir de lire sa prose ! De l’humour ! Qui donne un véritable plus aux conseils prodigués. Clap Clap Clap !…
11 août 2008 à 15:05
Il me semble que l’attribut alt est utile aux moteurs seulement si la balise IMG est entourée d’un A href mais je peux me tromper.
11 août 2008 à 19:07
@ Rankmyday
En février, Matt Cutts s’interrogeait sur le rôle du noindex : What should NOINDEX do? (”Que devrait faire NOINDEX ?”.
Il répondait bien que GG ne montrait pas une page équipée d’un NOINDEX mais en même temps il se demandait s’il fallait liquider complètement la page de l’index, laisser une référence ou trouver un moyen terme :
Un sondage accompagnait son billet.
Après 1396 votes, le résultat de la consultation populaire a été écrasant : une page avec un NOINDEX devait disparaître.
Pour moi, le questionnement signifie que GG indexe bel et bien malgré le NOINDEX et que s’il ne le montre pas, il en fait pourtant quelque chose, ou il peut le faire.
Donc, le NOINDEX ne suffit pas à écarter un moteur …
@ Athama
“Szarah”, c’est féminin, état civil secret defense
@ post punk
J’ai lu la même chose : question positionnement, le “alt” compterait seulement pour les images liées.
En même temps, des images non liées sont référencées avec le contenu de leur “alt”. Quoi qu’il en soit, le contenu du “alt” mérite attention pour l’internaute, peu importe ce qu’en fait le robot.
@ pligg.com
Merci !
12 août 2008 à 0:36
@ SZarah
@ Post punk
rhalala, si je dis que le “alt” compte, c’est que j’ai testé la chose, non mais
Il n’y a pas besoin que le “alt” soit un lien, un bête alt tout court compte.
En gros j’ai une page sur un lieu touristique dans laquelle il y a une photo d’un dindon roux d’ardenne.
J’ai donc mis en ‘alt’ dindon roux d’ardennes, le mot dindon n’existe nulle part dans le texte, la page est nouvelle donc pas de lien ancré “dindon”.
La page est en première position google sur la requête ” dindon” + “lieu en question”
Je vous accorde volontiers que ce n’est pas une requête concurrentielle et qu’il n’y a que 739 résultats, mais quand même, c’est bien une preuve que ça compte.
12 août 2008 à 0:42
Edit :
je me classe même en deuxième page sur la requête ” dindon roux d’ardenne” avec 2060 résultats.
12 août 2008 à 5:59
@ un_blogger
Le cas que tu cites est d’autant plus intéressant que le mot apparaît seulement dans le “alt”, ça devrait en convaincre quelques-uns. J’en connais d’autres, des images traitées de cette manière : ce n’est pas une exception et c’est pour ça que j’ai sobrement écrit :
12 août 2008 à 10:26
Szara : “Donc, le NOINDEX ne suffit pas à écarter un moteur …”
Ok, si l’on parle d’accès à la page… Effectivement, le crawler doit passer sur la page et la stocker (du moins temporairement) avant de savoir s’il doit ou pas l’indexer. Si l’on veut complètement interdire l’accès a un ou plusieurs robots il vaut mieux utiliser le htaccess.
Merci pour la précision
12 août 2008 à 22:16
Et si on reprenait à zero (du temps d’altavista sur le sweetshirt pour paraphraser un de tes posts).
Oublier les h1, hn, …. mettre juste un titre cohérent, pas mettre de description, pas mettre des liens répéitifs, …
retomber comme les petits sites d’amateurs … riuen connaître et mettre quelques pages en lligne … mal foutues peut-être mais faites avec le coeur
13 août 2008 à 5:59
@ Ybet
Je n’ai pas le courage de faire un site naïf à ce point mais l’expérience serait intéressante. Ma page de test sur les METAS va toujours bien, mais elle est structurée à la H tout de même.
Faire moins, je ne pourrais pas
Et il me semble que même le plus amateur des candidats-webmasters va aller au plus facile : un petit CMS.
13 août 2008 à 11:55
Bon résumé cet article
Une question au passage : connaissez-vous un outil en ligne de “détection de liens brisés” ? (l’outil xenu étant un logiciel)
17 août 2008 à 0:40
Le CMS c’est déjà deux niveaux au dessus. On commence par un truc en HTML avec un truc acheté (on espère) de type FrontPage et un petit logiciel FTP gratuit … Le niveau inférieur, c’est le Skynetblog (ou autre). Ca a l’odeur d’un site, l’apparence d’un site mais ca n’a pas le gout d’un site …. (cherchez la pub).
Le CMS, ca nécessite déjà des codes pour initialiser le site (genre serveur, nom de la base de donnée, ….).
Mais moi dans mes petites découvertes de sites sans importances sur ma région, elle aussi (peut-être) sans importance mais c’est la mienne, la majorité” des petits sont des HTML maison, … Par contre, les clubs sportif (club de foot pour la plupart) sont basés sur des CMS. Probablement qu’un webmaster a expliqué aux autres … et c’est encore pire (parle référencement mais aussi intégration).
J’avoue, jamais rien compris aux CMS, préfère l’HTML, voire développer en PHP et bricoler ce que j’ai besoin
30 septembre 2008 à 17:06
[…] - 50 conseils de Sarah, référenceur http://www.berszerkers.szarah.net/..cinquante-conseils-seo-bio-en-vrac/ […]
6 octobre 2008 à 0:37
[…] * Cinquante conseils SEO - berszerkers.szarah.net […]