Etablir une charte de balisage semantique

Publié le 29/11/2010 à 14:43 par - Mis à jour le 14/04/2016 à 09:06

On l’a vu, disposer d’un balisage sémantique correct est une bonne chose, à la fois en terme de référencement mais aussi d’accessibilité. Il n’existe cependant pas de consensus sur cette question, et il y a (presque) autant de balisages que de référenceurs. En effet, il y a la règle et l’esprit de la règle, c’est à dire l’interprétation que l’on en fait. Comment établir des règles de balisage au sein d’une équipé SEO ?

 

De grands principes sur lesquels il faut se mettre d’accord

Avant toute chose, il est bon de rappeler quelques règles et d’être tous d’accord sur le fonctionnement :

1. L’ordre des balises Hn doit être celui du code : une balise H1 ne pourra pas se trouver en dessous d’une balise H2. On aura en premier lieu une H1, puis une ou plusieurs H2, puis des H3 dans cet ordre, en organigramme hiérarchique.

2. On ne peut pas avoir de « trous » dans le balisage : on ne pourra pas avoir de H3 s’il n’y a pas de H2.

3. Définir les emplacements : j’aurais tendance à placer les H3 prioritairement sur des textes qui ne changent pas d’un jour à l’autre (c’est à dire des textes en dur), mais c’est à chaque équipe SEO d’en décider.

4. Tous les champs non codés en dur portant des balises Hn doivent être requis dans le BackOffice du site, sinon le balisage pourrait se révéler incorrect à l’usage.

5. Les Hn peuvent se placer sur des liens. C’est le choix de chaque équipe de définir si sur tel ou tel site ce sera le cas.

6. Définir un balisage normé pour tous les blocs de remontée : bloc commentaire, sondage, articles les plus lus, articles similaires, etc. Le balisage de tous ces blocs doit être normé car en général ces contenus sont affichés sous forme d’include, il n’est donc pas possible de modifier leur balisage page par page. Il faut donc décider d’une balise une fois pour toutes et vérifier que cela fonctionnera dans tous les cas.

 

Définir des limites d’utilisation

Il est bon de définir combien de niveaux sémantiques on veut utiliser et en quelle proportion.
Personnellement, je recommande, par page :
– une seul H1
– de 2 à 4 H2
– 8 à 10 H3 maximum
– pas de H4 ou + : leur poids sémantique est faible et, comme le balisage n’est pas gratuit en temps de développement (surtout sur un site à 40 templates ou plus), il vaut mieux se concentrer sur l’essentiel.

Cela fait un total de 15 balises Hn en tout par page.

 

Un modèle par template

Lorsqu’on travaille à plusieurs sur les mêmes sites ou sur un réseau de sites, il faut définir des règles communes afin que tous les sites fonctionnent de la même manière et que les modifications demandées par l’un et par l’autre aillent dans le même sens.

Ensuite, on va définir un balisage standard pour la sidebar puis un balisage par template. Quelques exemples de balisage standard :

– La Homepage, les homes de rubriques
Ces pages doivent disposer d’une balise H1 dédiée. Celle-ci doit être prévue dès le stade du wireframing.
Les titres des contenus issus d’un carrousel ou du bloc situé en haut de page seront balisés en H2.
Les titres des blocs secondaires seront balisés en H2, les titres des contenus remontés à l’intérieur de ces blocs seront balisés en H2

– Une page article à deux niveaux de titre
Le titre sera en H1, le sous-titre en H2, le chapô en H3 (ou non balisé)

– Une page article à trois niveaux de titre
Le surtitre sera en H1, le titre en H2, le sous-titre en H3

 

Des choix effectués en équipe

Le plus important c’est de décider tous ensemble des solutions à adopter, de trouver le plus petit dénominateur commun et surtout de standardiser. S’il est possible de faire le « haute couture » lorsqu’on a un ou deux sites, cela n’est plus possible si l’on en a 5, 10, 200.
Définir une charte, l’écrire et la diffuser, c’est s’assurer d’un fonctionnement unifié, facile à maintenir mais c’est également faciliter la vie des développeur web pour qui les modifications de balisage sont un travail fastidieux et peu valorisant.

La charte de balisage sémantique : les développeurs lui disent merci 🙂

Partager sur les réseaux

 

7 Commentaire (s)

Gwaradenn

Si je comprends bien ton billet, tu balises aussi les éléments statiques?
C’est donc volontaire de donner du poids au bloc « Commenter » sur ce blog?

    Virginie Clève

    @Gwaradenn : le balisage ce n’est pas que pour le SEO, c’est aussi pour l’accessibilité. Donc, oui, c’est fait exprès de baliser le bloc de commentaires.
    Tu sais bien que je suis très white 😎
    Ceci dit, ça aide google a voir ce qui est du coeur d’article et ce qui ne l’est pas. Google News a notamment besoin de ces indicateurs qui lui permettent d’extraire l’article du reste de la page.

Gwaradenn

L’inclusion et le positionnement dans Google Actu ne dépend pas d’un h2 sur « Commentaire », mais je comprends ton point de vue. 😉

    Virginie Clève

    @Gwaradenn : ce n’est effectivement pas pour le positionnement mais si, ça peut jouer sur l’inclusion. Le moteur de Google News n’est pas exempt d’erreurs et de nombreux rejets sont dus en fait à des erreurs techniques du robot Google. C’est à chaque site de faire en sorte (techniquement) de limiter les bounces (moins il y a de contenus indexés moins on a de chances de générer du trafic). Le balisage aide le moteur à discerner les différentes parties de page, puisque Google News extraie uniquement le contenu de l’article et rien d’autre. S’il n’y arrive pas, il rejette l’url en question.

Xavier

Ah très bon article, j’aime lorsque l’on donne un exemple de ce que l’on fait sur ses différents sites, la partie « Définir les limites d’utilisation » et vos recommandations vont être de mon coté mis en pratique.

yvandupuy

Bonjour Virginie,

Aticle intéressant, et peu abordé d’une manière général. Peu-tu me précier ce que tu veut dire quand tu dis que le balisage n’a pas d’influence sur positionnement, mais sur l’inclusion ? le sujet m’intéresse…

Merci

    Virginie Clève

    @yvandupuis : et bien, il me semblait que mon commentaire était déjà détaillé. Le balisage sémantique aide Google News à identifier les différentes zones de l’article : titre, chapô, corps de texte, commentaires, blocs de remontée,…
    Je rappelle que Google fait une extraction : il extrait de la page uniquement le contenu article titre + chapo + corps de texte. Il effectue également une troncature de la balise title pour ne conserver que le titre de l’article rt supprimer le nom de catégorie ou le nom du site.

    Parfois, il n’y arrive pas. Dans ce cas, il rejette l’article. Le premier objectif est donc de lui faciliter la tâche pour qu’il aie le moins de difficultés possibles. Moins de bounces = plus de trafic potentiel. CQFD !