Construire et référencer les sites en full-Flash.

S’il est un type de fichier réputé difficile voire impossible à référencer, c’est bien le .swf.

Et c’est vrai que le format .swf n’est pas proposé dans la Recherche avancée de Google alors qu’on y trouve la possibilité de limiter la requête au .pdf (Adobe Acrobat), .ps (Adobe Postscript), .doc (Microsoft Word), .xls (Microsoft Excel), .ppt (Microsoft PowerPoint) et .rtf (rich text format, un standard).

Il est vrai que cette option particulière sert à limiter le champ des recherches, comme chez Yahoo! qui propose cette limite pour les formats .htm et le .html, .xls, .xml, .ppt, .doc et .txt.

Live Search ne propose pas ce type de filtre.

Et on a dit, du bout des lèvres, que les moteurs pouvaient lire le contenu des fichiers .swf.

En ajoutant immédiatement qu’il n’en reste pas moins vrai que si le Flash devient explorable par les moteurs et qu’il produit les sites les plus beaux, il va à l’encontre d’un des principes les plus solidement établis sur le Web.

Ce principe fondamental exige que l’on sépare nettement les données, leur mise en forme et le comportement du produit.
C’est à ce prix que le contenu peut être communiqué à tous les internautes, peu importe la plateforme qu’ils utilisent.

Or, le Flash est considéré comme une application certes compacte et rapide mais qui ne peut être exploitée selon le choix de l’internaute.

Cette idée est obsolète.
Elle concerne les flashes monolithiques, ceux qui incluent toutes les données dans le fichier .swf : textes et images et sons.
C’est l’ancienne manière de construire du Flash.

La solution est évidemment d’exposer hors du .swf les données nécessaires au référencement.

Ceci peut être opéré de deux manières, l’une ou l’autre :

1. soit doubler le site en Flash avec un site classiquement référençable;
2. soit externaliser les données du Flash dans des fichiers exploitables par les moteurs.

La première solution est la plus facile mais c’est aussi celle qui demande le plus de travail, notamment au niveau de la maintenance.
Quand le site nécessite des modifications, il faut les opérer non seulement dans le Flash mais aussi dans les pages standards.
On renonce alors au référencement du fichier Flash et pour bien faire il vaut mieux en interdire l’accès aux robots dans le robots.txt.
Je passe sur les facéties de la balise <noembed>, c’est du raccommodage pour tout petit site (cette balise n’existe pas, tout simplement).

L’autre solution est la bonne.
Mais elle nécessite une maîtrise de l’externalisation des données.
En cette fin 2006, les pros sont en principe devenus routinés avec le XML et les autres fichiers externes.

Dès 2002, de simples amateurs (devenus pros depuis) réalisaient un FlashPlayer de fichiers .mp3 piloté par un fichier XML pour envoyer au .swf la liste des titres, leur description et l’URL des morceaux.

Aujourd’hui que les moteurs exploitent ce type de fichiers externes (.xml, RDF, RSS, …), l’excuse ne tient plus de considérer le Flash
comme un fichier tout compris.
Et toutes les données peuvent effectivement être externes au Flash qui les exploite, y compris par la mise en oeuvre de BDD.

Les formulaires, les logins, toute la petite cuisine habituelle des sites peut passer par le Flash.

Je ne conseille plus à personne d’embedder quelque ressource que ce soit dans un Flash mais de les externaliser et de les déclarer aux moteurs dans des fichiers qui ont une double utilité : ils servent de listes de ressources pour l’application Flash comme pour les moteurs de recherche.

Mais ce ne sont pas seulement les données externes qui peuvent être connues et référencées par les moteurs.
Les moteurs peuvent bel et bien entrer dans un Flash et en retirer l’essentiel : le texte et les liens.
Encore faut-il qu’ils y trouvent de quoi se nourrir.

Enfin, pour lever les doutes quant aux compétences des moteurs à explorer le Flash :

Comment savoir ce qu’un robot peut extraire d’un .swf ?

La question me paraissait d’importance en février 2006, quand des bruits ont couru quant aux capacités de GG à entrer dans les .swf.
La solution n’était pas loin : chez Adobe.

Tout d’abord, il faut avoir une licence d’utilisateur Adobe Player.
C’est gratuit ici.

Un mail vous est envoyé avec l’URL de DL du
Flash Search Engine SDK.

Le DL terminé (< 500 ko, une fraction de seconde), dézippez-le.

Dans le SDK, la partie qui nous intéresse est un exécutable nommé swf2html.

Il va nous livrer le texte et les liens contenus dans le .swf.

Ce programme est dépourvu d'interface, il est à exécuter en ligne de commande.

Sous XP : Démarrer > Programmes > Accessoires > Ligne de commande
(sous Linux : faites comme pour lancer un exécutable sans GUI).

Un exemple de .swf est fourni : stiletto-sample.swf.

Dans la boîte de commande ex-DOS, ouvrez le répertoire où vous avez placé l’exécutable swf2html et l’exemple stiletto-sample.swf puis tapez :

swf2html stiletto-sample.SWF -o fichiertest.html

Le fichier fichiertest.html est généré en une fraction de seconde.
Il contient les liens et les textes du fichier .swf.

Précisons que ce html résultant est pour la démonstration à l’attention des humains : le robot n’en a évidemment pas besoin :)

Répétez l’opération sur différents .swf et vous serez convaincus : depuis février 2006 au moins, les moteurs disposent
de l’outil nécessaire pour explorer le Flash.

La FAQ du SDK dit clairement :

The Macromedia Flash Search Engine SDK is designed for search engine application engineering teams. Users of the SDK can add Flash file decompression, parsing, and indexing features to their server-based search applications.

Ce n’est pas un scoop : de nombreux blogs en ont parlé dès mars 2006 et les SEOs sont au courant.

Comment expliquer alors que tant de webmasters paraissent ignorer cette possibilité ?

On peut avancer que pour certains, c’est souvent un prétexte pour refuser une technologie qu’ils ne maîtrisent pas.

On voit même des agences de webmastering déconseiller à leurs clients de réaliser un site complètement en Flash, arguant du fait que les .swf sont imperméables aux robots.

Cette requête magique permet de voir comment les .swf sont référencés :
motcle filetype:swf

Exemple :

edwardes filetype:swf
.

Voyez la liste : certaines descriptions sont correctes et parlantes, d’autres ne le sont pas … mais ces dernières proviennent de .swf pauvres en texte :)

Un autre frein aux sites complètement en Flash pourrait provenir du fait qu’il n’y aurait bien moins de travail pour les SEOs :)
Puisque moins de pages à référencer :)

Mais il ne faut pas rêver : pour un bon référencement d’un site full-Flash, il faut continuer à référencer le plus de pages possibles.

Et reste la question du netlinking
Les liens entrants viendront tous atterrir sur la page qui contient le Flash …

La solution consiste à faire une série de .swf : un Flash par section (chapitre) du site.
Ces .swf seront liés entre eux par un module menu commun présent dans chaque .swf.
La rapidité du chargement du site en sera améliorée, que l’internaute y accède par la home ou par l’un des chapitres référencés.

Construire et référencer des chapitres et non plus des pages : le .swf force à élargir l’unité documentaire du Web :)

Les moteurs ne s’en plaindront pas : si cette option était généralisée, le nombre d’objets à référencer diminuerait d’un facteur 10.
Mais aussi : nouveaux soucis, par exemple pour les encarts publicitaires :)
Et rien que cela pourrait expliquer à la fois la réticence des moteurs (qui peuvent mais ne le crient pas) et le dédain des webmasters comme celui des SEOs :)

Conclusion : il n’existe plus vraiment de raisons pour s’abstenir d’utiliser les performances du Flash pour faire un site complet.
La difficulté du référencement des fichiers Flash est tombée.

Il y aura encore des critiques mais elles s’évanouiront à mesure que le gros de la troupe des webmasters accroîtra sa maîtrise dans l’externalisation des données. Ou quand une autre génération viendra (c’est cinq ans, une génération sur le Web) qui sera moins coincée dans le conformisme et apte à plus de créativité.

Le chemin est encore long - songez que tout le monde ne s’est pas encore fait aux CSS ! - mais quand des sites en full-Flash cartonneront au niveau du référencement ET au niveau de la fréquentation (parce qu’ils sont plus beaux et d’utilisation plus moderne et ludique que les sites faits de pages), tout le monde dira :

Le Flash EST SEO-friendly.

Il l’est déjà !

Et comme disait SIC, au moins les artistes présents sur le Web ne devraient pas hésiter à dire dès aujourd’hui

Flashito, ergo sum !

10 réponses à “Construire et référencer les sites en full-Flash.”

  1. chiendent dit :

    Un problème: Flash n’est pas gratuit! Donc une fois de plus
    séparation par l’argent et les sites marchands auront la vie
    plus belle.
    Mais on ne peut pas non plus se passer de Photoshop,
    aussi un peu plus…..

  2. SZarah dit :

    Je m’attendais à cet argument :)
    Le format .swf n’est pas propriétaire.
    Il existe des outils de différentes marques pour en produire. Swish, par exemple.
    Mais le bâtisseur de .swf le plus évolué est celui de Adobe, l’inventeur de Flash.
    S’il n’a pas de concurrent en Open … c’est une fois encore de la faute de l’Open, qui ne cesse de se tromper de cible :)

  3. tuf dit :

    Un seul exemple et j’envisagerais de repenser mon opinion sur le sujet.

    Sinon personnelement le flash me rebute car son accéssibilité (et donc son ergonomie ) demande beaucoup plus de travail.

  4. SZarah dit :

    Tuf

    Un seul exemple et j’envisagerais de repenser mon opinion sur le sujet.

    Sinon personnelement le flash me rebute car son accéssibilité (et donc son ergonomie ) demande beaucoup plus de travail.

    Je précise que mon billet ne tend pas à promouvoir Flash mais à liquider le mensonge qui prétend que les robots ne peuvent explorer les .swf.

    - Du côté de l’accessibilité, Macromedia a fait des efforts puisque Jakob Nielsen a été consulté avant la sortie de Flash MX. Voir ici.

    - Le tour rapide de la question Flash et accessibilité en deux liens :

    Creating Accessible Macromedia Flash Content et Accessibility Resource Center chez Adobe.

    - Résumé : au prix de certains efforts, une accessibilité raisonnable est possible.

    - La solution facile et radicale à l’accessibilité est de doubler le Flash avec un site en html full-accessible.
    Soyons clairs : la même solution devrait être appliquée aux 98% des sites en html qui ne respectent pas les normes d’accessibilité :)
    Je veux dire que ceux qui se fichent de l’accessibilité s’en fichent avec ou sans Flash, et qu’ils sont nombreux.
    Et que si un auteur produit un Flash accessible, il a beaucoup plus de mérites que celui qui produit un site html accessible.
    Des exemples ?
    Voir ici : Blogmarks.net.

    - Contre le Flash, il n’y a pas seulement l’argument d’une difficile accessibilité.
    Les critiques et les commentaires les plus pertinents que je connaisse sont rassemblés ici (il y en a quatre pages) :


    Flash Usability Challenge: Aftermath
    .

    Flash ou pas, c’est une question de choix.
    Mais la référençabilité de l’objet .swf ne devrait plus entrer en ligne de compte pour choisir.

  5. Taranis dit :

    L’avantage du flash, disait-on, c’était aussi un surcroît de sécurité pour les sites. Est-ce que le fait d’externaliser les données pour les robots n’est pas une brèche dans cette sécurité ?

  6. SZarah dit :

    Taranis

    L’avantage du flash, disait-on, c’était aussi un surcroît de sécurité pour les sites. Est-ce que le fait d’externaliser les données pour les robots n’est pas une brèche dans cette sécurité ?

    Un des premiers soins de la joyeuse communauté des farceurs du Web a été de fabriquer un décompileur pour le .swf … l’argument de la sécurité a tenu un an, peut-être moins :)
    Les données en BDD sont bien mieux sécurisables qu’intégrées dans un objet mal fermé.
    D’autre part, l’obfuscation concerne seulement l’ActionScript et le Javascript embarqués, pas les datas.

  7. tuf dit :

    et la dernière fois sous IE j’ajoutais mes flash en javascript pour ne pas avoir le “Cliquez pour activer et utilisez ce contrôle” donc c’est hermétique aux moteurs de toute façon, non ?

  8. SZarah dit :

    Tuf

    et la dernière fois sous IE j’ajoutais mes flash en javascript pour ne pas avoir le “Cliquez pour activer et utilisez ce contrôle” donc c’est hermétique aux moteurs de toute façon, non ?

    Du moment qu’aucun lien ne conduit directement au .swf, je dirais que oui.

  9. Un joli tutoriel pour référencer les sites en flash « Le Référencement dit :

    […] mai 23rd, 2007 by referenceur Je viens de découvrir un autre tutoriel qui résume les techniques de référencement d’un site en Flash. SEO berszerkers vient de le publier en 2006 mais ce qui lui caractérise c’est qu’il nous montre une idée utilisant les outils d’Adobe “The Macromedia Flash Search Engine SDK”. Je vous invite alors à lire l’intégrité du tutoriel […]

  10. Vince dit :

    Excellent comme d’habitude !
    Exactement ce que je cherchais. Je suis content de lire que tu tords le cou aux idées reçus. Même 1 an et 2 mois après !

Laisser un commentaire

Vous devez être connecté pour laisser un commentaire.