Stroboscopie des états lacunaires : mots-clés, thématiques et contextes.
Texte du contenu, texte alternatif de l’image, texte des liens, texte de la description de la page, texte des URL et jusqu’au texte du NDD, le texte est au coeur du référencement.
Trouver les mots pour le dire est le souci constant du référenceur.
Les littéraires pourraient s’en réjouir qui créent de manière naturelle des contenus riches et cohérents s’il s’avérait que les moteurs soient capables ou aient la volonté de mettre en oeuvre les algorithmes sémantiques depuis longtemps mis au point.
Malheureusement, il n’en est rien et les algos, qui passent pourtant pour complexes et qui le sont peut-être mais à mauvais escient, apparaissent comme aussi frustes que les résultats qu’ils livrent, résultats qui satisfont certes la plupart des consommateurs mais qui brident l’espérance des plus exigeants.
Pour les chercheurs comme pour les observateurs initiés, il est extrêmement frustrant de constater que même les techniques les plus évidentes d’efficacité semblent être évincées au profit de celles qui privilégient les résultats commerciaux.
Régulièrement, la foi en l’intelligence des moteurs fait espérer que tel épiphénomène pourrait donner à croire que telle technique a enfin été mise en oeuvre.
Par exemple, quand on constate qu’une page-fiche du percolateur de tel modèle de telle marque se porte mieux dans les SERPs quand elle est liée à une page traitant des autres percolateurs de cette marque, à une page générique traitant du percolateur et à la page du constructeur, on se prend à rêver : le moteur analyserait-il la sémantique latente ?
C’est oublier
- que tout le monde organise (devrait organiser) ainsi ses catalogues (et d’une manière générale ses produits) parce qu’il n’existe qu’une seule manière efficace de structurer : celle qui convient aux habitudes de l’internaute;
- que l’unité documentaire est la page.
On observe que :
- la structure des sites est de plus en plus standardisée;
- l’internaute est éduqué à ce standard, tous les internautes ont le même état initial.
La puissance de la LSA (qui tend à lever les incertitudes quant à la signification) est donc inutile dès lors que :
- la page traite d’un seul sujet;
- les mots-clés sont choisis avec soin dans une thématique précise;
- les liens entrants et sortants confortent les mots-clés.
A ces conditions, le moteur n’a nul besoin d’être intelligent pour classer la page.
Et il ne l’est pas, ainsi qu’on peut le constater quand il se laisse berner par la répétition mesurée avec soin d’un même mot ou par un nuage de mots.
Un moteur qui ferait usage de la LSA serait capable d’associer des ensembles de mots différents, par exemple une chignole pourrie sur une page et une voiture rouillée sur une autre page.
Par l’analyse du contexte, il saurait que cette chignole est une automobile ou bien une perceuse manuelle.
Il saurait aussi que réferen cement (avec un espace erroné) n’a rien à voir avec cement (ciment en anglais) et donc avec une quelconque entreprise du bâtiment ou portant ce nom (vu dans les annonces contextuelles).
Les moteurs disposent de lexiques et de thésaurus mais pour une ontologie satisfaisante il faudra attendre encore.
Quant au choix des mots …
Il y a longtemps qu’il n’est plus libre mais qu’il dépend directement des mots introduits en requête par l’internaute.
Le citoyen moyen utilise moins de 3000 mots au quotidien, un dictionnaire courant en comporte environ 50.000, la langue en compte presque dix fois plus (toutes spécialisations confondues).
Ces 3000 mots basiques sont incontournables et il s’agit de les utiliser même si à leur côtés sur la page on en écrit d’autres plus précis.
Les algos sont bien plus simples qu’on le croit, ils obligent à formater le contenu à la mesure de leurs faibles compétences mais il n’en reste pas moins vrai qu’il reste possible de faire un travail qui soit à la fois performant dans les SERPs et qualitativement honorable au niveau de l’écriture.
Certains outils aident grandement à choisir les mots utiles.
- Pour trouver des synonymes et des liens analogiques : l’atlas sémantique du CNRS.
- Visualisation de l’espace sémantique des synonymes : le dictionnaire du laboratoire CRISCO.
—
La stroboscopie sert notamment à figer un instant du mouvement périodique, oscillatoire ou répétitif d’un objet.
Dans le spectacle, la stroboscopie sert à gérer l’emission de trains d’éclairs (de génie ?).
12 décembre 2006 à 11:31
Les moteurs de recherche sémantiques arrivent, il ne faut pas s’inquieter, genre du type “Excalibur”, vivement que ca devienne grand public
13 décembre 2006 à 16:07
Merci pour ces dictionnaires. Très utiles. A propos, une page denotre jeune site s’est
trouvé indexé par GG et MSN, respectivement en P.2 et P.1, sur le couple de mots “peinture représentative” ce qui n’est ni dans l’URL, ni dans le
titre, ni dans la description, ni dans les mots clés et figure une fois dans le texte. Que peut-on en conclure? Les moteurs privilégient certain mots?
:)
13 décembre 2006 à 23:32
Le moteur prend son texte descriptif un peu où il le juge bon. Une phrase courte et bien construite placée juste après la balise body a toutes les chances d’être adoptée si le reste du contenu est concordant (ou même s’il ne l’est pas : ici par exemple cette petite phrase est reprise systématiquement malgré la régulière non-pertinence de ce que j’ajoute derrière “Le kit de survie du référenceur”).
J’aime à croire que GG est le seul des moteurs à avoir de l’humour, parce que les autres moteurs me gâchent cette accroche
Sinon, le moteur cherche vraisemblablement (j’insiste) une phrase courte qui contient le mot qui a fait l’objet de la plus grande insistance (répetition).