Référencement Google Actualités : le guide complet
Comment référencer son site dans Google Actu, comment optimiser son template article ? Toutes les réponses.
Publié le 15/12/2010
Mis à jour le 04/10/2021
L'indexation d'un site dans Google Actualités offre des perspectives de trafic gratuit extrêmement intéressantes, en particulier pour les sites proposant de l'actualité fraîche et variée. Sur les sites de news majeurs, le pourcentage du trafic moteur en provenance de Google Actualités peut aller jusqu'à 70% du trafic moteur global ! Il est donc stratégique pour un site de news d'y être présent, et idéalement en bonne place.
Pour y parvenir, il faut réunir un certain nombre de critères techniques mais aussi éditoriaux. Cela demande des compétences rares, et donc chères. Dans ce premier article, je traiterai des critères techniques.
Respecter ces critères est particulièrement stratégique pour les contenus dont l'attrait à une durée de vie inférieure ou égale à 30 jours (ou contenu chaud). Mais d'expérience, on se rend compte que Google Actualités indexe parfois aussi du contenu plus froid. Il peut donc être intéressant de respecter ces critères de manière plus générale dans un site et pas seulement pour la/les sections actu.
Etre référencé dans Google Actualités
Pour être référencé sur Google Actualités, il faut simplement en faire la demande à Google via un formulaire dédié. Mais avant de faire cette demande, il faut vérifier que le site/blog a soumettre est éditorialement et techniquement conforme au cahier des charges de Google Actualités : un site qui ne le serait pas pourra être accepté (si la qualité de son contenu le justifie) mais ne sera pas ou peu crawlé ; ne générant ainsi pas de trafic.
MAJ 21/12/2010
Il faut aussi que le site dispose d'une équipe éditoriale (c'est à dire au moins 2 ou 3 personnes, listées sur une page du site et clairement identifiables), que l'adresse postale et l'ensemble des coordonnées du possesseur du site soient accessibles au moteur via une page dédiée.
En clair, un site avec un seul rédacteur ne pourra pas être listé dans Google Actualités. Cela élimine un bon nombre de petits sites et de blogs. Google a, ces dernières années beaucoup durcies les règles d'inclusion dans Google Actualités et même fait le ménage dans les sources récemment. Il faut dire que l'on ne trouve pas que des sources de qualité indexées, loin s'en faut. A commencer par les sites de communiqués de presse...
Dernière contrainte, fort logique, il faut être le propriétaire du contenu posté pour être publié dans Google Actualités. Cela semble logique et simple, amis cela ne l'est pas tant que ça à réaliser dans les faits pour beaucoup de sites. En effet, nombreux sont els sites à publier des contenus tiers qu'ils achètent à l'AFP ou à Relaxnews. Même si l'on indique à Google les rubriques à crawler, dans la pratique le spider de Google News passe un peu ou il veut, et à moins que les contenus en marque blanche soient disposés dans une ou des rubriques clairement identifiables (interdiction du crawl à Googlebot-News via une instruction dans le fichier Robots.txt par exemple), il n'est en réalité par possible facilement de se conformer à cette règle.
Chaque article doit disposer de sa page web dediée
Proscrire les pages listant plusieurs "brèves", les listes d'articles ne pointant pas vers la page dédiée à chaque news et les pages contenant le contenu intégral de plusieurs articles. Ces types d'articles seront systématiquement refusés par Google Actualités.
Chaque article doit disposer d'un identifiant unique présent dans son url
L'url doit contenir un ID unique composé d'au moins trois chiffres (Attention : le nombre ne doit pas être composé d'un ID à quatre chiffres ressemblant à une année). Il n'est pas obligatoire que cet ID soit présent en fin d'url, mais il doit être présent. Les urls ne contenant pas d'ID ne sont tout simplement pas crawlées.
Exemples d'urls à id conformes pour Google Actualités
www.monsite.com/actu/1234/titre-article.html
www.monsite.com.actu/titre-article-1234.html
MAJ 2016
Google avait communiqué sur le fait que ce critère n'était plus obligatoire.
Au vu de la complexité du changement d'urling, j'aurais tendance à conseiller de conserver l'id sur les sites existants mais de ne plus prévoir l'id dans les motifs d'url sur les sites à lancer à partir de maintenant.
L'article doit être en ligne au moins 30 jours
C'est la durée d'indexation des articles dans Google Actualités. La commande "site:" dans Google Actualités permet de savoir combien d'articles d'un site sont indexés. Au-delà de 30 jours, les articles ne remontent plus dans les pages de résultat.
L'optimisation des images
Les images (et en particulier l'image d'illustration principale de l'article) doivent être non cliquables. Il existe cependant des techniques de contournement pour disposer d'un zoom sur les images sans passer par un lien classique ;-)
Pour disposer d'une vignette à coté de son article dans les pages de Google Actualités, il faut respecter un format qui permette à Google de la générer sans recadrage. Pour cette raison, il faut afficher un visuel d'illustration principal de l'article dont la taille correspond à un facteur multiplicateur de 60x80 en mode portrait, ou 80x60 en mode paysage.
Les images doivent être en gif ou jpeg uniquement et les attributs height et width de la balise img doivent être remplis dans le code (au moins la largeur OU la hauteur). Il en est de même pour l'attribut alt (ou description courte de l'image).
Les articles illustrés d'une image en PNG ne permettront pas la génération d'une vignette dans les pages de résultat de Google Actualités.
Le non respect des guidelines images n'entraînera pas une non indexation des articles. En revanche, il sera alors impossible que les articles soient illustrés d'une vignette. Or, on sait bien que les articles illustrés ont un taux de clic plus fort...
Si la créa impose un format d'image non compatible avec le format demandé par Google, il existe là encore des astuces pour contourner. Je vous laisse y réfléchir...
Le balisage sémantique
Un balisage sémantique correct est beaucoup plus important pour le positionnement dans Google Actualités que pour Google "classique".
Le titre doit être contenu dans une balise H1, le chapô (optionnel) dans une balise H2.
Vous pouvez utiliser des balises H3 et suivantes si souhaité, mais cela ne vous aidera pas pour le classement ni pour l'indexation.
A mon avis, l'absence de H1 est particulièrement pénalisante pour le positionnement dans Google Actualités.
Le contenu textuel de l'article
S'il n'existe pas de longueur idéale pour être bien positionné sur Google Actualités, il existe en revanche une longueur minimale pour être indexé.
Les articles dont le texte n'atteint pas 1200 caractères (espace et chapô compris) seront la plupart du temps rejetés (mais parfois indexés, sans qu'il semble y avoir une raison pour que l'indexation soit effective dans un cas et pas dans un autre…). Il est possible que Google Actualités soit plus souple sur ce critère avec les sources disposant d'un fort ranking score (j'y reviendrai).
Attention, il s'agit du texte de l'article "nu", sans prise en compte du reste du contenu textuel de la page, des blocs de rebond, de confort, de bookmarking social, etc.
En général, Google se réfère à la balise /h2 (ou, à défaut /H1) pour identifier le début de l'article et à la date ou à la signature de l'article pour en identifier la fin.
La présence d'un chapô n'est pas obligatoire mais cependant recommandée par Google. S'il est présent, il ne doit pas être cliquable.
Google Actualités recommande également :
- d'afficher la date et l'heure de publication de l'article (ceux-ci ne doivent pas être cliquables)
- d'afficher le nom de la rubrique initiale de publication de l'article, ou les thèmes associés (ceux-ci ne doivent pas être cliquables)
Le titre de l'article
Il doit être court, plus court que la longueur max. autorisée pour Google "classique" : 60 caractères max. Dans la pratique, un titre "passe" souvent jusqu'à 70 caractères espaces compris. En cas de dépassement, le titre sera tronqué dans les pages de Google Actualités, mais cela n'entrainera pas la non indexation de l'article.
Comme pour Google classique, le titre est un élément très important pour le positionnement. Sur Google Actualités, il a même un poids encore plus important. L'équation a résoudre pour bien choisir son titre est celle de la part de l'optimisation "SEO" versus celle du teasing purement éditorial. En effet, du CTR est dépendant le classement de l'article, et donc sa remontée éventuelle en homepage. Pour trouver le bon mix, il faut, selon son site/blog et sa cible tester, tester, tester, et encore tester…
La densité de mots clés
Celle-ci ne semble avoir aucune incidence ni sur l'indexation, ni sur le positionnement.
Google donne un certain nombre d'informations sur les contraintes techniques liées à Google Actualités sur son aide en ligne dédiée
Le Sitemap News
L'expérience montre qu'il améliore grandement le taux d'inclusion des articles : Google n'a plus à trouver lui-même sur le site quels sont les nouveaux contenus d'actualités à indexer : ils lui sont fournis directement à la publication.
Il est possible de soumettre le Sitemap news comme n'importe quel Sitemap "classique" via le Google Webmaster Tools. Il est souhaitable également d'ajouter son url dans le Sitemap index du site.
Ne doivent être incluses dans le Sitemap que des urls d'articles de type "actu", dont la date de publication est inférieure à 30 jours.
MAJ 04/01/2011 :
les nouvelles guidelines Google indiquent que seules des urls de moins de 2 jours doivent être présentes dans ce sitemap. Pour autant, cela n'est pas pénalisant de continuer à lister 390 jours d'articles dans le sitemap, cela peut même se révéler utile (voir plus bas les commentaires pour plus d'infos)
On peut éventuellement y adjoindre des pages de listes d'actu. La mise à jour du fichier doit se faire si possible en temps réel, à la création d'un nouvel article. Le Sitemap ne doit pas contenir plus de 1 000 urls (si besoin, il faudra créer plusieurs Sitemaps news).
L'urlset diffère de celui du Sitemap "classique" :
Voici le détail des balises renseignables :
J'aurai tendance à penser que le fait de remplir la meta keywords a un petit impact positif en terme de ranking, mais cela reste plus à l'état de ressenti qu'à l'état de preuve.
L'ensemble des recommandations Google relatives aux Sitemap news sont disponibles en ligne sur l'aide aux éditeurs
En savoir plus sur l'ensemble des contraintes techniques liées à Google Actualités
Commentaires
commentaire
Sont devenus quand même vachement sévère pour accepter un site. Bon courage pour soumettre un blog aujourd'hui, alors qu'au début c'était du beurre. Paraît qu'ils ont aussi écrémé récemment sur les sources incluses. Y en a qui doivent pleurer de ne plus recevoir cette manne de trafic extraordinaire. Certains de mes clients ne pourraient pas vivre sans GG News.
Je l'ai beaucoup travaillé a une époque ou j'avais un blog sur la photo numérique, c'est amusant. Sur les communiqués de presse des marques (Nikon, Canon, Olympus...) le jeu était de réécrire et de publier le plus rapidement possible afin de ne pas être clusterisé. - réactivité - casser le copier / coller mais pas trop, afin de remonter avec la news - enrichir le vocabulaire afin d'être mis en exergue - image non clicable, avec légende - le trust et la spécialisation du site - bluffé par la rapidité d'indexation (avant même les sitemaps)
Même en France, l'identifiant n'est plus obligatoire dans l'URL, tant qu'on fournit un fichier Sitemap spécifique à Google News. Sur Zorgloob il n'y a pas d'identifiant, par exemple.
@TomHTML : peux-tu me dire depuis quand ? Ca ne doit pas faire plus de 6 mois alors ?
Merci pour cette première partie du guide SEO pour les actus Google. Si comme tu le dis, le CTR jour un rôle dans le positionnement des SERPS actus, il est évident que la META description n'y soit pas étrangère ;-)
De mon côté, j'ai testé sans l'identifiant et avec seulement le sitemap news ça a fonctionné depuis septembre. Mais ces derniers jours, ça bug sans aucun retour dans GWT... j'me demande si je vais pas reconsidérer ce critère
pour info : il y a également une longueur maximale pour l'article. j'ai déjà vu passé dans mon GWT - article too long. par contre je n'ai toujours pas compris pourquoi et ne pourrai te donner un nombre de signes max. D'une manière générale - GWT est ton ami :) Pour l'identifiant unique - il n est effectivement plus nécessaire - je n'ai personnellement jamais compris pourquoi cette contrainte avait été mise en place : une source parmi d'autres : http://s.billard.free.fr/referencement/?2009/03/20/541-google-actualites-numero-unique-dans-les-urls-plus-necessaire
@Nico : c'est un type d'erreur que je connais mais que je n'ai jamais rencontré. C'est plus fréquent d'être rejeté pour fragmentation :-). Je reviendrai sur les causes de refus dans le prochain post...
Merci Virginie pour cet article, j'ai eu la confirmation que Google Actu n'aime pas le PNG, ce que je trouve totalement débile. Je suis étonné de lire le conseil de mettre le chapo dans une balise h2 : le chapo n'est pas un titre, il devrait logiquement être dans une balise P. Je confirme comme les autres qu'avec un sitemaps Google News, il n'est plus nécessaire d'avoir des horribles ID dans l'URL. Petite remarque supplémentaire : il n'était pas nécessaire d'avoir un ID unique, seulement 3 chiffres minimum. Sur WRI j'ai été des années indexé ds GG News comme ça. On attend l'article suivant ;-)
@Olivier : la reco officielle de Google était bien un id unique. Après, dans certains cas un chiffre sur 3 positions ça marche, dans d'autres non. Je me demande si cela ne dépend pas de la personne chez Google qui a validé l'inscription au départ. Beaucoup de choses dans la config de départ sont manuelles ou semi auto sur Google Actualités. J'y reviendrai d'ailleurs en détail. Pour le chapô, il est difficile de trancher entre titre et texte. Très souvent c'est un résumé ou un sous-titre long de l'article. Le fait de le mettre dans une h2 lui donne un poids sémantique qui est logique par rapport à son contenu, mais qui l'est effectivement moins dans le sens ou le chapô est unique dans un article alors qu'on doit avoir au moins deux H2 par page. Google a besoin de balises repère pour parser le contenu. Le fait que le chapô soit dans une H2 lui facilite le travail pour déterminer ce qui, dans le texte qui lui est fourni, est le chapô et ce qui ne l'est pas.
Je n'étais pas au courant non plus du fait que l'identifiant ne soit plus obligatoire dans l'URL des News. C'est vrai que je n'ai jamais trop compris pourquoi google imposait ce critère là. Cependant, s'il n'est plus nécessaire pour être indexé, il en est de même pour le positionnement de ma news ?
Article très complet sur le référencement sur Google Actualités. Tu as rappelé les bases essentielles, notamment celles du code à respecter. J'ai vu qu'il y avait un plugin Wordpress qui permettait de soumettre son site à Google Actualités, qu'en pensez vous?
@Maximilien : de quel plugin parles-tu ?
L'identifiant n'est plus obligatoire, le flux d'un magzine que je gère est intégré à google news depuis plus d'un an sans identifiant. ++
Concernant nos images, elles sont maintenant prises en compte par Google News après deux modifications : image désormais non cliquable et ajout (uniquement) de l'attribut "width". Je confirme pour le facteur "80×60" (soit 1,33) : toutes nos images sont en 300X225 (1:33) et sont maintenant intégrées à Google News.
@pleneau : merci pour ce feedback.
Merci pour ces conseils très utiles; j'avais essayer de m'inscrire mais avait été refusé sans chercher à comprendre, maintenant je comprends bien mieux.
Vous dites: "Ne doivent être incluses dans le Sitemap que des urls [...] dont la date de publication est inférieure à 30 jours." tandis que sur l'aide de Google dédiée à Google Actualité est écrit: " Votre sitemap pour Google Actualités doit uniquement contenir les URL des articles publiés au cours des deux jours précédents ". (http://goo.gl/eXPyM) Qui a raison? :-)
@Alexandre : vous savez bien, Google a toujours raison :-) En réalité il s'agit d'un changement de guidelines que je n'avais pas vu passer (merci pour cette info). J'imagine que l'objectif pour Google est de gagner encore plus de temps de crawl et donc de bande passante puisque les articles de plus de 3 jours sont systématiquement refusés à l'indexation dans Google Actualités. Toutefois, ne pas respecter cette consigne peut être une bonne chose étant donné qu'il n'y a aucun problème à conserver dans le sitemap des articles de moisn de 30 jours : cela permettra de voir apparaitre dans la liste des refus les articles qui ont tenté d'être indexé plus de 3 jours après leur publication. Cette erreur est signe d'un problème d'architecture de l'information très souvent, ou de bug au niveau du fichier sitemap. Une alerte plutôt utile, donc...
@Virginie Clève. Merci pour votre réponse rapide. :-) J'aurai une autre question. Y a-t-il un moyen pour 1. mettre automatiquement à jour le sitemap.xml pour Google Actualités 2. soumettre automatiquement ce sitemap.xml En d'autres termes doit-on actualiser et soumettre le sitemap tous les jours manuellement ce qui doit être fastidieux vu le nombre de nouveaux articles publiés tous les jours ou peut-on passer par un outil qui ferait ça pour nous ? Merci d'avance :-)
@Alexandre : la maj auto du sitemap, normalement, cela devrait avoir été mis en place par votre équipe technique. Même sur un blog Wordpress comme celui-ci il y a une routine qui met à jour le sitemap automatiquement dès qu'un nouvel article est posté. Ensuite, il faut déclarer l'url du sitemap dans le fichier robots.txt placé à la racine du site et idéalement aussi le soumettre à Google via l'outil gratuit en ligne Google Webmaster Tools. Si besoin, vous trouverez toute la documentation nécessaire pour en savoir plus en faisant quelques requêtes dans votre moteur de recherche préféré :-)
@Virginie. J'ai trouvé le générateur de sitemap Google News. Il s'agit d'un module pour Drupal. Je souhaite en revanche poser une autre question. Combien de caractères il ne faut pas qu'un article dépasse pour être indexé par Google News ? Nos articles font environ 5 000 caractères (espace compris) et je me demande s'ils peuvent être indexés. Merci d'avance :-)
@Alexandre : Google ne communique pas sur la longueur maximum mais un article peut effectivement être refusé car il est trop long. Je donne une astuce pour ce cas dans le second article sur l'optimisation du taux de refus pour Google Actualités Une solution si cela ne marche pas c'est de scinder l'article en plusieurs.
Virginie, j'ai encore une petite question concernant les images. Vous dites que le visuel d’illustration principal de l’article doit être de 60×80px en mode portrait ou 80×60px en mode paysage. Pourtant dans cet article publié sur Figaro http://goo.gl/Bys6M le visuel principal est beaucoup plus grand. Pourquoi la vignette apparaît dans Google Actualités en face de l'article?
@Alexandre : attention, j'ai dit que l'image doit être un FACTEUR de ces dimensions, pas qu'elle doit être à ces dimensions. Une image de 120x160 ou de 240x320 est parfaite pour Google News
Salut je suis pas calé donc soyez indulgents. Mon problème est que pour m'inscrire à google actualités il faut un url à 3 chiffres pour mes articles (si, si, en France encore). Or je n'ai pas ça dans ceux de mes articles (voir mon site). Bref, quelle est la manière la plus simple d'automatiser de nouveaux url à 3 chiffres pour mes articles . Et pas besoin de me dire le sitemap etc car j'ai lu que le site map pour ggogle news c'était une fois qu'on était inscrit à google actualités ce qui n'est pas mon cas. A moins que je me trompe et c'est fort possible. De toute façon je ne pige rien aux sitemap :-) bref comment changer mes url et leur ajouter 3 chiffres ? Merci à tous pour votre aide
@Vincent : selon les infos fournies par plusieurs référenceurs, il n'est plus nécessaire d'avoir les id dans l'url. Votre site est sous blogger. Je ne conais pas cette plateforme mais il est possible que cela ne soit tout simplement pas possible, à moins de migrer vers une autre solution, comme Wordpress par exemple (pas la version en ligne, la version hébergée sur votre propre hébergement avec votre propre nom de domaine). Je vous conseille de rechercher sur les forums dédiés à blogger.
@virgine et @alexandre: Sous drupal je ne sais pas mais sous Wordpress nous avons mis à jour un plugin dédié au sitemap Google news: http://www.wecho.com/blog/plugins-wordpress/google-news-sitemap-pour-wordpress/
Article passionnant. Merci pour le partage d'expériences et la mise en jour des contenus en fonction des nouvelles guidelines Google.
Une petite mise à jour concernant le ratio de 1.33 pour les vignettes google news, ce n'est plus le cas, je ne sais pas exactement depuis quand mais j'ai fais le test pour un client. Par exemple en tapant :"qu'est ce que la démence vasculaire" sur google news, on voit bien que l'image d'origine est carré et la vignette aussi. Biensur cet exemple est à durée limitée.
@Serge : ce n'est pas parce que l'image a été indexée que les guidelines changent : parfois Google arrive quand même à les afficher, parfois pas. Mais pour que l'image s'affiche à tous les coups, il faut respecter ce ratio.
Merci Virginie, Tu as une trace de cette guideline dans le centre d'aide de google? J'ai cherché une source officielle mais j'ai pas trouvé! Car franchement quand je regarde les vignettes de google news, j'en vois pratiquement aucun qui respecte ce ratio et ca a l'air de jamais posé problème! En plus ce que dit l'article, c'est que les vignettes google ont un format de 80x60 ou 60x80, ce qui explique le besoin d'avoir une taille d'image correspondant à un facteur multiplicateur de ce format de vignette google news.Or, les vignettes google news n'ont pas forcément ce format, on retrouve du 80x80, du 80x45, du 80x60(effectivement),etc... J'ai l'impression que cette guideline n'est plus d'actualité, pour faire un jeu de mot, mais que ca l'était peut etre à un moment donné.
Il faut que je fasse un peu de recherche et de test et en ce moment, je n'ai pas le temps, mais je me pencherai sur la question dès que possible. Effectivement on semble voir apparaitre des formats différents dans les résultats. Ce serait logique que Google soit un peu moins strict : il a besoin des images pour faire cliquer. En tout cas, merci pour le partage.