Un balisage sémantique ideal existe t’il ?

Publié le 29/10/2010 à 12:51 par - Mis à jour le 14/04/2016 à 09:06

Voilà une question qui divise les référenceurs ! Il y a les pro du plus blanc que blanc qui prônent un usage sémantique pur et ceux qui pensent d’abord à se rapprocher les limites de l’optimisation SEO.
A l’usage, je me suis rendu compte que dans une même équipe référencement même franchement white, il pouvait y avoir des manières différentes de penser ce balisage. Chez Prisma, @CarlotaLovesSEO, @Daravy_SEO et moi-même avons finalement du nous mettre autour d’une table et élaborer ensemble notre propre charte car nous ne produisions pas les mêmes reco.

Alors, un balisage sémantique idéal, est-ce une réalité ou une chimère ? La balise H1 doit-elle être unique ? Peut-on avoir autant de H2 et H3 qu’on le souhaite ?

 

Qu’est ce que le balisage sémantique ?

Cela consiste à indiquer au moyen de balises HTML spécifiques la hiérarchisation sémantique du contenu d’une page (son sens du point de vue logique). C’est en fait exactement la même chose que lorsque, dans Word ® on applique des styles 1, 2,… pour générer automatiquement un sommaire.

Un balisage sémantique correctement implémenté permet aux moteurs de comprendre rapidement et sans erreur comment est construite une page. Les textes contenus dans ces balises auront également un poids plus important que les autres textes de la page.

Cela implique que toutes les pages doivent disposer d’un titre, même la homepage et les homes de rubriques : il faut donc que la maquette du site inclue cet élément, qui est très souvent oublié sur la majorité des sites.

 

Les règles de base

Elles sont finalement assez simple, il faut respecter la même règle d’héritage que dans une arborescence.
– Le titre de chaque page sera inclus dans une balise H1
– les sous-titres seront inclus dans des balises H2
– etc.

Il y a 6 niveaux de titre possibles, de H1 à H6 mais seuls les trois premiers niveaux bénéficient réellement d’un poids sémantique utile pour le positionnement. Cela ne veut donc pas dire qu’il est inutile d’aller au delà du H3 : les synthétiseurs vocaux (pour les non voyants) par exemple utilisent les niveaux de titre pour le rendu du contenu de la page.

Il y a cependant quelques règles à respecter :

– L’ordre de ces balises doit être celui du code : une balise H1 ne pourra pas se trouver en dessous d’une balise H2 : un titre ne peut pas être placé sous un sous-titre.
– Ne pas utiliser plus d’une balise H1 par page : une page n’a qu’un seul titre.

On conseille en général de 3 à 4 balises H2 et de 8 à 10 balises H3 en moyenne par page

 

La balise H1 doit-elle être unique ?

C’est là que ça commence à coincer : pour beaucoup de référenceurs, 3 à 4 balises H1 ne font pas de mal et sont tolérées par les moteurs.
La question à se poser est la suivante : doit-on tout sacrifier au SEO ? Un bouquin a t’il plusieurs titres ? Une marque a t’elle plusieurs noms ? Évidemment non.
Eh bien plusieurs balises H1 sur une même page, pour moi, c’est tout aussi incohérent !

Sur la question de la performance en elle-même, je reste très réservée. 25 balises H1, cela reste spammant. Je doute fortement que Google s’y laisse encore prendre. Évidemment il les tolère. Mais prend t-il vraiment en compte le poids de chacune de manière identique ? On peut fortement en douter, pour le présent comme pour l’avenir.

Pour moi, même si cette technique fonctionne aujourd’hui (ce dont je doute ++ vous l’avez compris), elle ne fonctionnera plus demain. Sur un site de taille moyenne, ce n’est pas grave de mettre en place des optimisations non pérennes car elles pourront être retirées facilement et rapidement. En revanche, si vous avez un ou plusieurs gros sites dans un grosse entreprise et si vous lancez des campagnes d’optimisation aujourd’hui, je ne saurais trop vous conseiller de vous limiter à une H1 par page.

 

Un balisage sémantique type pour une page article

Sur un site à visée éditoriale et sur une page article, un balisage sous cette forme fonctionnera correctement :

– Titre en H1
– Surtitre en H2
– Chapô court en H3

 

Les limites liées au templating du balisage sémantique

Le problème sur les sites, c’est essentiellement les blocs de remontée de contenu, principalement ceux de la sidebar mais pas seulement. A la création du site, on décide de leur emplacement et on pense souvent (à tort) que celui-ci ne changera pas. On a donc un balisage cohérent sur toutes les pages.
Mais au bout de quelques mois, au gré des besoins éditoriaux, marketing ou autre, on décide de déplacer les blocs, on les passe de la sidebar au coeur de page ou l’inverse et on bouscule toute la structure.

Et paf, d’un coup, on peut se retrouver avec un balisage incorrect sur tous les templates. La conséquence : elle se paie cash, le référenceur doit refaire une reco pour l’ensemble du site et l’intégrateur doit remettre l’ouvrage sur le métier. Beaucoup de bruit pour rien

Cela m’a conduit à ne plus baliser les remontées de contenu de la sidebar sur aucun site dont je m’occupe.
C’est évidemment moyen sur le plan sémantique car une partie du contenu n’est pas balisé, mais au moins ce qui l’est le reste.

Dans un prochain article, je vous parlerai élaboration de charte de balisage sémantique.

Il s’agit évidemment de ma vision des choses et, si elle n’est pas stalinienne, elle est plutôt white.
N’hésitez pas à vous approprier les commentaires pour partager vote vision du balisage sémantique.

Partager sur les réseaux

 

15 Commentaire (s)

Sébastien Billard

Pour moi il n’existe pas de balisage idéal, mais des balisages qui font sens dans le contexte de la page (d’où justement le terme de sémantique).

Je tends à penser qu’il faut mieux le plus souvent utiliser un H1 unique, toutefois utiliser plusieurs est tout à fait correct du point de vue des specs, et je n’ai jamais constaté de problèmes au niveau SEO (tant que le nombre de reste limité).

Le chapô, lui je préfère le baliser avec strong car il constitue à mon sens plus une emphase qu’un titre.

Une question que je me suis posée à un moment est celle des titres des éléments de navigation : il s’agit de titres qui devraient donc être balisés en mais en même temps il s’agit de contenus génériques qu’on ne souhaite pas forcément valoriser du point de vue SEO. J’ai posé la questions à des « standardistas » qui m’ont conseillé de ne pas être plus royalistes que le roi 😉 Désormais je balises les titres dans les menus plutôt avec du .

Emmanuel C.

> Un bouquin a t’il plusieurs titres ? (…) Évidemment non.
Eh bien plusieurs balises H1 sur une même page, pour moi, c’est tout aussi incohérent !

Pour ma part je considère que le titre (effectivement unique) du livre se réfère plutôt à l’url du site ou à la balise title dans les meta-tags.
Ensuite les h1 peuvent par exemple représenter les titres de chapitres.
Dans la pratique j’étais autrefois adepte du h1 unique, aujourd’hui non. Plusieurs h1 ne sont ni choquant ni hors norme w3c.

Ce qui serait intéressant serait de savoir si les moteurs de recherche font la différence entre plusieurs h1 mis à la suite (spam éventuel ?) ou s’ils sont attentifs à des séries ordonnées (même nombreuses) de h1>h6, sous-entendu que les nombreux h1 sont alors justifiés dans ce cas normal d’utilisation.

Arnaud

Très intéressant pour alimenter sa réflexion, notamment l’option de non balisage des remontées en sidebar.
Je suivrai avec intérêt la charte de balisage qui sera proposée.

Jice

Hum… oui et non, là c’est plutôt du « balisage hiérarchique ». Le sémantique donne un « sens » au texte. Là, avec h1.. et tu lui donnes une hiérarchie.

François-Olivier

Bonjour,

Article intéressant mais je ne suis pas d’accord avec l’analyse du H1 aussi bien sur l’aspect SEO que sémantique.
Pour la sémantique, tu parles du titre d’un livre. Sur internet, un site n’a pas de titre. ce sont les pages qui en ont un et le nom d’une page est défini par , là où le H1 est « juste » un titre de premier niveau.
Au niveau SEO, comme toujours, tant que ce n’est pas spammy, aucun souci.
Voir à ce sujet http://www.nicemedia.fr/blog/articles-referencement/6-conseils-seo-de-matt-cutts-expliques-en-francais#h1

Si une balise header unique devait exister, elle s’appellerait

:o)

walidgabteni

Salut à tous,

si on s’en tient à la logique hiérarchique, on peut tirer deux conclusions opposées qui tiennent la route.

Conclusion 1 :

H1 = Titre de 1er niveau donc H1 unique par page

Si on opte pour cette conclusion et qu’on cherche à être 100 % Google friendly il serait alors logique que le contenu de votre H1 unique ait une forte ressemblance avec la balise méta title.

Conclusion 2 :

Il n’est pas logique que H1 fasse double emploi avec la balise méta title, c’est un titre de moindre niveau, le seul titre principal de la page c’est title, H1 est un titre de moindre niveau, on peut donc en mettre plusieurs.

Qu’on opte pour la première ou la deuxième à peu d’importance, les seules choses vraies sont celles qui fonctionnent.

Foenix

La question du h1 unique est trés interessante et ca fait un moment que je me la pose aussi ! Sémantiquement, c’set clair que c’est pas logique plusieurs h1, mais au niveau SEO les avis paraissent assez divergeant, dommage 🙁

Sébastien Billard

Correction à mon premier commentaire : Il faut lire « Désormais je balises les titres dans les menus plutôt avec du strong »

le Juge SEO

je serais plutot du meme avis que sebastien meme si je suis un peu plus drastique sur le H1 – pour moi il est incohérent d’en mettre plusieurs sur une page.

je n’y mets point de liens non plus car encore un fois cela me semble illogique – (si c’est un titre ca ne linke pas ailleurs)

Peut etre que l’arrivé d’HTML5 fera un peu bouger les choses … on verra

caslantienne

Bonjour, juste un rappel de la spécification du W3C concernant le H1 : « A heading element briefly describes the topic of the section it introduces. Heading information may be used by user agents, for example, to construct a table of contents for a document automatically ».

Je dirais donc qu’à mon sens il ne faut pas donner au H1 le même rôle que la balise : « Every HTML document must have a TITLE element in the HEAD section. Authors should use the TITLE element to identify the contents of a document. »

La balise H1 peut être retrouvée dans une même page, à autant d’endroits que nécessaire, à savoir de sections éditoriales. Cela dépend en fait du volume de la page. Souvent par concision on ne met sur une page web qu’une seule grande section sinon les pages seraient « à rallonge ». Cela explique pourquoi l’usage est plutôt de ne laisser qu’un H1 par page.

Ce qui ne change rien à l’argumentation ci-dessus, et qui s’appuie sur le post de Laurent Denis.

Jonathan

Débat intéressant. Cela remet en cause ma vision qui était jusqu’alors assez tranchée : un seul H1 par page.

Au sens W3C, il y aurait un H1 par section de premier niveau. Donc potentiellement plusieurs par page. En s’appuyant sur les infos que l’on a concernant le link juice, on peut légitimement pensez que le principe est semblable : le fait de mettre plusieurs H1 va diluer leur apport en termes de SEO d’une page sur un terme donné. Sur ce postulat, si on veut optimiser les différents points d’une page vers un seul et même terme, alors il vaut mieux limiter le nombre de H1.

La vraie question serait plus sur l’optimisation des H2. J’aurai tendance à dire qu’il est souhaitable d’en mettre plusieurs, afin de montrer la diversité éditoriale autour du thème parent défini par le H1.

Lionel

Bonjour,

Personnellement, j’utilise 1 balise H1 sur chaque page d’un site internet parce qu’elle représente le titre principal d’une page et non le titre d’un site Web. L’exemple du titre du livre n’est pas adapté.

amicalement

le Juge SEO

@caslantienne

merci pour cet argumentation et l’article de Laurent denis qui sont EXCELLENT!

Perso je ne parles pas de norme mais plutot de logique … mais bon c’et une vision personelle

Stéphane Deschamps

Bonjour,

Deux petites précisions :

1. les titres de rang 1, 2, 3, etc. sont exactement ça : des titres. Les utiliser en tant que chapô n’a pas de « sens » en termes de sémantique ni d’usage. Je travaille avec des mal/non-voyants, et il est assez aisé de naviguer de titre en titre. Les utiliser pour autre chose que des titres est une maladresse et est perçu par mes camarades comme (je cite) « un site mal foutu ».

2. un référenceur avec qui j’ai travaillé a isolé les 3 ou 4 éléments réellement pertinents en termes d’indexation dans la page, puis a demandé qu’on *retire* purement et simplement les autres titres de la page. Là encore, SURTOUT PAS ! C’est une erreur de croire que seuls les robots utilisent les balises sémantiques, elles ont un rôle énorme à jouer dans l’accessibilité *réelle* de la page, elles servent à des vrais gens. (je sais que ce n’est pas dit dans cet article mais je préfère prévenir que guérir :)).

Capseo

J’avoue que je prône l’utilisation d’un seul h1. Plusieurs h1 dilueraient à mes yeux, le poids même de cette balise pour la page.
Dans un texte, je ne vois pas l’utilité de mettre plusieurs h1 (à part faire du spam) vu que les autres balises sont faites pour ça.
h1 = titre du contenu
h2 = titre des parties
h3 = titres des sous parties des parties
etc etc