France.fr : audit référencement

Site clinic SEO gratuit pour France.fr : ya du boulot !

Publié le 16/08/2010 à 13:16 par - Mis à jour le 20/09/2016 à 15:16

 

Le site France.fr, dont l’objectif est de promouvoir l’image de la France à l’étranger vient d’être relancé aujourd’hui après un mois sans son ni image. Polémique et les railleries ont salué son plantage lancement, et il semble que cela ne soit pas très différent un mois après, en France comme aux USA. On critique beaucoup son design. Qu’en est-il sur le plan du SEO ? Pas franchement mieux… L’analyse ne porte que sur la homepage, mais il y a déjà beaucoup à dire.

 

Les balises meta

France.fr : les méta données

Seule la balise title est renseignée sur la homepage. Et encore…

 

La règle : toutes les pages doivent disposer d’une balise<title> et d’une balise meta description unique. En aucun cas on ne pourra trouver une balise title identique sur deux pages ou plus.

La balise title ne doit pas faire plus de 60 à 70 caractères. Elle doit comporter des mots clés descriptifs du contenu de la page. La balise meta description doit faire 150 caractères environ. Elle doit décrire plus précisément le contenu de la page.

Dans les deux cas il faut éviter de l’écrire à l’identique d’un fil d’Ariane car elle doit être « user friendly » : $nomrubrique | $nomsousrubrique | $nomarticle | $nomsite.

Les mots clés importants doivent se trouver en début de balise.

Ce qui a été réalisé : rien…

 

Le balisage sémantique

France.fr : le balisage sémantique

Mettre des balises , c’est bien. En mettre partout, heu… comment dire ?

 

La règle : Les contenus doivent être correctement hiérarchisés grâce aux balises <H1>…<Hn>

– Le titre doit être en <h1>

– Les sous titre en <H2>

– Les chapô  en <H3>

L’ordre des <hn> doit être celui du code : une balise <h1> ne pourra pas se trouver dans le code en dessous d’une balise <h2>

Pas plus d’une balise <h1> par page. Ne pas baliser les éléments de menu général présents sur toutes les pages. Attention au balisage sur les blocs de contenu présents à de multiples endroits (risques de « fausser » le balisage dans certains cas)

En général : 4 à 8 balises <h2>, 8 à 15 balises <h3> en moyenne par page

Ce qui a été réalisé :

– Tout le méga menu est balisé en H2. On en arrive à 40 <H2> et 128 <H3> sur la home. Un record ! Sans compter que la balise la plus importante (la <H1>) est vide…

 

Le Flash

La règle : cette technologie est incompatible avec d’indexation dans les moteurs de recherche.

Elles ne devra donc pas être utilisée pour l’affichage de contenus éditoriaux intéressants pour le positionnement. On pourra en revanche les utiliser pour les parties liées à la personnalisation ou à  l’affichage graphique.

Ce qui a été réalisé : un carrousel Full Flash en homepage empêchant aux moteurs de voir le contenu frais correspondant à ce qui est le plus mis en avant pour l’internaute.

 

Le nombre de liens par page

France.fr : link report

La devise de France. fr : beaucoup de liens, peu de texte

 

La règle : Google recommande un maximum de 100 liens par page (interne + externe). On recommande en général un maximum de 5 liens externes par page de manière à ce que ceux-ci conservent un minimum de « pouvoir de vote » (20% par lien, donc).

Il doit y avoir partout une bonne quantité de texte non cliquable sur chacune des pages d’un site. Si une page comporte plus de liens que de texte, les moteurs considèreront qu’il s’agit d’une page de circulation, par définition moins importante. Ils pourront également estimer qu’il s’agit là d’une sur optimisation visant à augmenter artificiellement les classements.

Ce qui a été réalisé : 223 liens, dont 7 externes, avec un ratio texte non clicables/liens très en défaveur du texte non clicable. La homepage de France.fr comporte beaucoup plus de liens qu’un page de liste…

 

Les ancres de lien

France.fr : anchor text

On l’a pourtant dit 100 fois, « Lire la suite » c’est le MAL ABSOLU !

 

La règle :

– Ils ne doivent jamais être fait sur tout le texte, tout un paragraphe mais uniquement sur des mots clés précis

– Ils doivent être explicites : proscrire partout et à tout jamais les « cliquez ici » ou les « lire la suite ».

– Chaque article doit être consultable à travers au moins un lien textuel dans le site

– Prévoir un maximum de liens en texte et non en image. Lorsque des liens en image sont nécessaire, remplir l’attribut alt de l’image avec le texte correspondant. Idéalement, remplir également l’attribut title pour afficher une info bulle aux utilisateurs de Firefox (ergonomie, expérience utilisateur).

Ce qui a été réalisé :

– Des liens « Lire la suite » pour les actualités

-attributs alt et title vides ou inexistants

 

Le fichier Robots.txt

France.fr : le fichier robots.txt

Merci merci pour toutes ces infos !

 

La règle : le fichier Robots.txt est un fichier destiné uniquement aux moteurs de recherche et placé à la racine du site. Il ne doit contenir ni lignes vides ni commentaires.

Il a deux usages :

– Indiquer aux moteurs de recherche l’url d’accès au sitemap XML du site

– Indiquer aux moteurs les parties et/ou pages du site qui ne doivent pas être indexées

– Eviter d’y lister (pour des questions de sécurité) les pages d’accès aux interfaces d’admin et les fichiers de configuration. Préférer une interdiction d’accès via htaccess par exemple.

Ce qui a été réalisé :

– Pas de sitemap déclaré (d’ailleurs il n’y a pas de sitemap sur France.fr)

– Présence de nombreux sauts de ligne et commentaire

– Y sont listées un bon nombre de pages et répertoires qui intéresseront nombre de hackers.

 

Bilan de l’optimisation SEO de France.fr

Énormément de travail encore à réaliser pour arriver à un résultat performant. De bonnes intentions (balisage sémantique) mais bien peu d’expertise.

Mon conseil : engager un référenceur professionnel ASAP.

Partager sur les réseaux

 

37 Commentaire (s)

Marie

Jusqu’au bout ils auront été mauvais dans la conception de ce site. T’es sympa de leur faire un audit gratos sachant combien la conception du site a coûté, ils doivent avoir un budget SEO conséquent? Enfin.. j’espère!

Si je n’ai pas bien d’avis sur la charte graphique (car j’estime ne pas avoir trop de goût), je déteste les menus utilisés et malgré toute ma bonne volonté, je n’ai pas réussi à enchainer la lecture de plus de 3 pages d’affilé… il y a encore du travail!

Karles

Encore un projet qu’est pas sortie des ronces avec une bande de traine latte pareil.

Julien Ringard

Salut, sympa l’article

Néanmoins, je pense que le site france.fr est pour un large public donc le « Lire la suite » sur la page d’accueil, est bien adapté pour ce type de trafic.

En plus le premier lien sur le titre « les montagnes françaises » pointe vers le même lien que le « lire la suite » donc ce dernier ne sera pas pris en compte pour le positionnement de la page de destination…

A bientôt.

Renaud P.

Il y a 6 H1 sur la Home et non 0.
La France ne risque pas d’être visible…

    Virginie Clève

    @Renaud : ah oui tiens, bizarre, webdeveloper ne les a pas vus… Bon, enfin, 6 ou 0 c’est mal dans les deux cas 🙂

Ramenos

@Référenceur : les internautes sont fainéants mais ne sont plus stupides depuis des années. Le mythe du « Lire la suite » est conservé sur de nombreux sites par peur alors qu’on sait très bien qu’un internaute sait cliquer sur un titre ou une image 😉

Sinon, c’est sympa de leur avoir fait un audit gratuit comme ça ^^

Dernier point non seo : j’adore la façon de naviguer entre les grandes catégories des menus… Plus lourdingue tu meurs 🙂

Agence horizon

Hello,

ce sont là des travers assez courants, que l’on rencontre sur de nombreux sites encore aujourd’hui. Cela dit un site tel que celui-ci se devrait d’être exemplaire à tous les niveaux, y compris le SEO…

Petit bémol toutefois, pour ne pas raser gratis : le robots.txt est celui « brut de décoffrage » de Drupal, il n’y a donc pas forcément de quoi tendre la perche à d’éventuels hackerz 😉

    Virginie Clève

    @Agence Horizon : param par défaut ou pas, ce n’est jamais une bonne idée de révéler les rep. admin et paramétrage. Pas plus que de donner direct l’info et la version du CMS utilisé…

Mickael B.

Pour les liens, je ne leur jeterais pas de pierre… Tu trouves que 200 c’est beaucoup ?
En comparant avec d’autres sites de contenus cela n’est pas si énorme que ça… Pour ne citer qu’eux : rdc 137 internes, ouest-france 299 internes + 51 doublons, liberation 232 ext ! (sous-domaines + réseau) + 315 liens internes (sans compter les doublons), etc..

Sur France.fr j’en ai compté plus que toi :
Ext liens : 8 (si on compte celui d’adobe)
Int liens : 202
Liens sur ancre : 1
Doublons liens internes : 175
(soit plus de 370 liens internes, si je n’ai pas fait d’erreur ^^)

Hors sujet : Tu déconseilles de mettre plus de 100 liens internes ou c’est juste par rapport aux guidelines Gg ?

    Virginie Clève

    @Mickaël B : tout est une question de proportion : cette home n’est pas très longue. Il me semble que 100 liens, c’est déjà pas mal.
    Les méga menu, c’est bien, mais cela demande réflexion SEO quant à la manière de l’implémenter. Et là, de réflexion il n’y en a point.

    Sur une page très longue, ça ne me gêne pas d’aller jusqu’à 150/160 liens à condition que ce soit justifié par le contenu présenté et par la quantité de texte non clicable.

Mickael B.

Ok, je suis d’accord avec toi alors, même si mon chiffre de prédilection serait plus proche de 200 🙂 (« prédilection » puisque je ne suis sur de rien concernant un nombre maximum de liens « tolérable », sans parler du côté qualitatif). A voir donc en fonction de chaque cas, je suppose que dans l’idéal il faudrait que la proportion texte (sans lien) et lien soit « bonne » pour que ça reste bénéfique pour les pages internes.

b@x

Joli audit rapide 🙂 J’espère qu’aucune agence de Seo n’était mandatée sur le projet autrement au revoir son e-reputation.
J’ajouterai qu’une extension aux url’s ca mange pas de pain, même si ca n’a pas d’incidence directe sur le seo.

@+, b@

Mohamed Semeunacte

Punaise c’est quand meme le carton quand on y reflechit deux secondes. C’est le site qui est sense etre vu par des millions de touristes et le site est a peu pres aussi optimise qu’un blog over-blog (c’est ce que j’en ressens apres la lecture de ton article Virginie). Bon je pense bien qu’il y a des gens bien intentionnes la-derriere mais comme tu finis en leur conseillant d’engager un pro, cela veut bien dire que pro ne rime pas forcement avec bien intentionne…

Merci pour cette etude de cas, elle apprend beaucoup au newbie que je suis 🙂

Mohamed Semeunacte

Loic

Je pense surtout qu’ils s’en foutent du référencement, déjà coté développement et hébergement ils ont eu du mal, alors le SEO… olala faut pas trop leur en demander.

Juste un point :

je vous trouve dur avec le flash. OK il faut un autre moyen pour les titres / contenus importants, mais ce petite carrousel est assez sympathique pour les utilisateurs et ca serait finalement dommage de s’en passer, même si c’est une abérration du coté SEO, il n’y a pas que le SEO dans la vie ! ^_^

    Virginie Clève

    @Loïc : en l’occurrence, il était possible de faire exactement la même chose fonctionnellement et graphiquement parlant en DHTML, et donc compatible moteurs de recherche 🙂

Antoine

Pour les liens, je suis tout à fait d’accord avec Julien Ringard. Là dessus c’est du chipotage à mon avis.

Par contre, pour les H1, il y en a effectivement plusieurs mais web-developer ne les a pas détecté pour la simple raison qu’ils se trouvent dans un NoScript et là ça mérite d’être relevé.

Enfin, là c’est moi qui chipote, mais le fait de ne pas déclarer de sitemap dans le robots.txt et l’absence d’un fichier /sitemap.xml à la racine ne signifie pas qu’il n’y en a pas du tout: Il peut tout à fait porter un tout autre nom afin d’être juste signalé aux moteurs via leurs outils pour webmaster (GG, Y! et Bing).

Ah si, un dernier point: les fameuses pages d’envoi par mail /printmail/ et d’impressions /print/ qui sont indexables 😀

Refschool

en tout cas voyez le beau spike de backlinks sur Majestic:

http://www.majesticseo.com/search.php?folder=&q=france.fr
les gov et edu.
Le genre de site qui a pas besoin de faire de seo pour avoir du trafic, mais l’opportunity cost est énorme pour eux s’ils continuent sur cette voie là, mais bon c’est l’argent du contribuable 🙂

LaurentB

Tiens, si vous voulez connaître l’origine des 100 liens par page
http://googleguy-fr.blogspot.com/2004/08/quelles-restrictions-sur-les-100-liens.html
Ou comment une légende urbaine devient « vérité ».

    Virginie Clève

    @LaurentB : ce n’est pas une légende urbaine. J’ai lu un post de Cutts sur le sujet. Bad luck je n’arrive pas à remettre la main dessus. Ceci dit, la dépendance longueur de la page/nombre de liens reste juste du bon sens : si ta page est courte et que tu as 200 liens, ya un truc qui ne va pas…

Ehumeurs

Définitivement, ce site est un échec…
Finalement, il reflète bien (malheureusement) la réputation des français !

LaurentB

Pour compléter ton audit, je dirais :

– Anciennes pages laissées en 404.
– Liens relatifs plutôt qu’absolus.
– Répétition de l’anchor text dans title pour les href.
– Externaliser les JS et passer en mode asynchrone.
– Définir les extensions de noms de fichier et fermer les répertoires (même si c’est la mode de laisser des URLs sans extension).
– Contenu unique de la page trop loin dans le code source
– Indexation du moteur de recherche interne
– Liens partenaires pub en dofollow
– Attention au réseau de sites en footer 😀

LaurentB

Allez un petit dernier pour critiquer aussi le noscript massif!
Ça serait rigolo qu’il chope un filtre à cause de ça.
En bonus, il faudrait aussi leur conseiller de nofollowiser les feeds.

RaphSEO

Bonjour Virginie, déjà trop sympa de leur faire ce pré-audit à l’oeil.
Ensuite concernant ta dernière intervention, je tenais justement un discours similaire avec un client hier.
C’est clair que plus que le nombre à proprement parlé, c’est le ration lien texte non cliquable qu’il faut prendre pour l’analyse.
Mais bon, limiter les liens aux strict minimum nécessaire est toujours la solution vers laquelle il faut tendre pour que ces derniers gardent suffisamment de valeur

Maxime (Wype)

@Renaud : La France risque de ne pas être visible, tu en es sûr ? Tape donc France sur google…

Question optimisation interne, c’est vrai que france.fr est très mauvais. En fait, c’est très mauvais un peu partout niveau ergonomie, usabilité, optimisation des performances… Mais s’il est mauvais partout, le point sur lequel on devrait le moins se soucier, c’est bien le seo on-site ; le site a tellement de backlinks ! Le contenu n’est pas roi comme on dit souvent. Une tripotée de backlink enverra n’importe site horriblement conçu en première page des requêtes concurrentielles.

Vincent

Et si tout cela était fait consciemment ?

Imaginez que l’objectif du site soit de ne pas faire de l’ombre aux différents sites officiels ?

Le site france.fr va bientôt avoir des liens de tous les sites gouvernementaux de France et sûrement d’ailleurs ce qui suffira à le placer en tête de classement sur le mot clé « France » dans peu de temps (il est déjà 3è, ce n’est qu’une question de semaines amha).

Maintenant, imaginons le site d’un musée ou d’un territoire bien particulier qui n’a pas tous ces liens, il est fort possible que ce site à la réputation monstrueuse se place très facilement s’il est bien structuré, voire même qu’il vole les premières places aux sites dont il est censé faire la promotion…

Si l’objectif est donc de contrer cette progression, je pense au contraire que les choses sont bien faites. Le site sera présent sans toutefois cannibaliser le trafic des autres sites.

Pour le reste je pense que le soucis évident de ce site repose sur son ergonomie et le contenu. Après avoir visité une dizaine de pages, on ne trouve rien d’intéressant à part des liens vers d’autres sites. La priorité est peut être donc de rendre ce site plus intéressant dans le fond et la forme 🙂

Kaelig

Très bon article mais il faut arrêter avec la recommandation du « pas plus d’un h1 par page » ! Quelle est la documentation qui dit que l’on doit procéder ainsi ?

2 à 3 h1 ne sont pas judiciables au crawling du site, au contraire.
Matt cutts en a d’ailleurs parlé dans cette vidéo : http://www.youtube.com/watch?v=GIn5qJKU8VM

Personnellement je milite pour l’utilisation du double h1 :

Dans le header :
Nom du site

Puis dans le contenu :
Titre de la page

PS : en html5, chaque section peut disposer de son propre h1, on peut donc construire des pages avec une multitude de h1 : http://bit.ly/html5outline

    Virginie Clève

    @Kaelig : je n’ai pas dit que c’était préjudiciable au crawling, j’ai dit que ce n’était pas correct sur le plan sémantique. La H1 est le titre de plus haut niveau, il ne peut pas définition pas en avoir plus d’un : un livre, du document, une émission de télé, une dissertation, cela n’a qu’un titre.

    Il serait une erreur de croire aveuglément tout ce que dit Matt Cutts, il vaut mieux s’en fier à ce qui est rationnel pour éviter de se faire balader. Bien sûr 2 ou 3 H1 ça ne fait pas de mal, mais ça ne fait pas de bien non plus (c’est ma position mais effectivement pas celle de tous les référenceurs).
    De plus, il existe tout de même au moins un cas où le fait d’avoir plus d’une h1 est problématique : les pages article sur lesquelles on veut se positionner pour Google Actualités.

    Ce sujet mérite un post à lui seul, je m’y attelle très vite 🙂

Notre France

A titre de comparaison, http://notre-france.fr créé en réaction à ce ratage international, a coûté 36 euros et quelques jours de travail.

Il dispose d’un espace ( http://jaime.notre-france.fr ) ou chacun peut donner (gratuitement) une belle image de ce qu’il aime.

rog

Je voudrais bien savoir comment s’est passé l’appel d’offre. Je crois qu’une enquête devrait être menée. Soit les décideurs sont des incompétents, soit les vendeurs sont des escrocs, soit hélas les deux. Avec un CMS open source, on ne doit payer que les man/days nécessaires à l’intégration du contenu, et l’herbergement.10000€ boules à tout cassé

YvanDupuy

Ces techniques ne sont pourtant que du whitehat que tout référenceur de base connait.

On dirait que tout à été fait pour saccager ce site, c’est vraiment dommage. Mauvais seo, sans parler du pseudo problème chez l’hébergeur (problème de cluster ?)

En même temps, Drupal n’est pas vraiment le « top » pour faire simple et efficace

Affaire à suivre…

Blackat

Salutation.

Il me semble tout d’abord qu’ils font pas mal de changement sur « france.fr » … mais bon, il y a encore énormément de travail pour faire de l’optimisation référencement sur ce site … hu hu

si non , question (je ne suis pas sur(e) ) quel logiciel as tu utilisé pour avoir le résultat « Le balisage sémantique » ?

J’utilise une de mes moulinettes persos pour ca.

    Virginie Clève

    @Blackat : j’ai utilisé la toolbar webdeveloper, tout simplement.

Olivier

C’est incroyable… ils se sont fait avoir comme des bleus 🙂

Sinon très belle analyse

naima

Peut-être en ont-ils engagé un et qu’il est juste très mauvais ou peut-être qu’ils n’ont pas suivi ces recommandations. Allez savoir comment se passe l’attribution de postes au gouvernement ou la chaîne de décision..

En tout cas chouette cas d’étude qui change du flinguage gratuit.
Et tout ça sans débourser un rond pour eux.

Régis

J’ai rencontré le directeur du SIG en 2010 à 2 reprises pour le référencement de France.fr. Ils estiment globalement être bons, car ils jugent au rang alexa :)))

Concernant leurs statistiques, ils ne savent pas ce qu’est un taux de rebond ou un taux de retours, il est donc difficile de communiquer. Et la communication entre les étages est pour ainsi dire inexistante. Les uns assurent qu’un travail de SEO est engagé, les autres se demandent où est le référenceur.

Après plusieurs échanges, voici ce que j’ai reçu :

Bonjour Monsieur,

Nous avons actuellement un marché en cours pour les prestations que vous proposez et nous avons des engagements contractuels avec l’agence concernée pendant la durée dudit marché.

Nous avons également un devoir de confidentialité au regard des statistiques des sites relevant du Premier ministre et nous ne pouvons à ce stade vous les communiquer.

En revanche, à l’expiration de ce marché, nous serons à même de vous inviter à nous faire une proposition de même nature dans le cadre de la consultation que nous lancerons et à laquelle votre participation sera la bienvenue.

Merci en tous les cas de cette offre et très cordialement.

Délégation interministérielle à la Communication

————–

Selon eux, ils ont donc déjà un référenceur. On leur a pourtant démontré par A + B qu’aucun travail de SEO n’a été réalisé et que leurs résultats sont piteux, nous avons comparé avec nos propres sites, ils ont oralement acquiescé. La mentalité de fonctionnaires fait que le résultat n’importe pas. Depuis, notre interlocuteur a du quitter son poste. France.fr ne fait plus aucun trafic et les comptes sont « crispés » à l’approche de la campagne présidentielle pour tout ce qui est concerne la communication gouvernementale. On s’est permis pour rire de lancer paysdemerde.com qui renvoyait vers france.fr, on a juste reçu une menace de poursuites pour sédition. Ne perdons pas trop de temps avec ces « clients », l’argent public est vraiment destiné au gaspillage.

C.BENOIT

Le site est hébergé à l’étranger ?
http://whois.domaintools.com/france.fr

Régis

Aux États-Unis :))) ils sont vraiment forts au SIG !