Comment optimiser mon site pour Google News ?

Nous allons utiliser cet article « Demandez à SISTRIX » pour vous apporter un point de vue holistique sur la meilleure façon d’optimiser un site et son contenu pour qu’ils soient acceptés dans Google Actualités mais également pour obtenir un bon classement dans la verticale Google Actualités.

Google Actualités : qu’est-ce que c’est ?

Google décrit sa recherche verticale « Google Actualités » de la manière suivante :

Google Actualités est un service d’information automatisé qui compile les articles publiés par plus de 50 000 sources d’actualités dans le monde, les regroupe par thème et les affiche en fonction des centres d’intérêt de chaque lecteur. […] Nos articles et notre contenu multimédia sont sélectionnés et classés par des systèmes informatiques qui évaluent, entre autres, la fréquence à laquelle une information apparaît en ligne, mais aussi sur quels sites elle apparaît. Notre classement prend également en compte plusieurs critères propres au contenu des actualités (date de publication, site d’origine, pertinence, diversité, etc.).

À propos de Google Actualités

Est-ce que les articles Google Actualités sont affichés dans une recherche normale ?

Oui. La plupart du temps, il y a trois résultats supplémentaires sur la page de résultats de recherche organiques. En plus de cela, nous avons accès à la recherche verticale « Google Actualités » en cliquant sur l’onglet « Actualités » ou en ouvrant la page news.google.fr.

Image de gauche : résultats de recherche organiques pour le mot-clé [olympics 2016], avec le résultat des actualités Universal Search en rouge. Image de droite : onglet Google Actualités sélectionné. Affiche uniquement les résultats Google Actualités
Image de gauche : résultats de recherche organiques pour le mot-clé [olympics 2016], avec le résultat des actualités Universal Search en rouge. Image de droite : Onglet Google Actualités sélectionné. Affiche uniquement les résultats Google Actualités

Les résultats pour les verticales d’actualités dans la recherche organique sont automatiquement calculés par Google grâce à son algorithme de classement Google.

Quand est-ce que mon site Web sera-t-il inclus dans les sources de Google News ?

Un employé de Google va faire une évaluation manuelle de votre site avant que celui-ci ne soit incorporé à Google Actualités. Il regardera en détail si votre site respecte les consignes générales et technologiques ainsi que les consignes de contenu.

Nous allons vous montrer quelles sont les conditions de technologies et de contenu qui doivent être respectées par un site pour qu’il soit inclus dans les Google Actualités. Nous vous expliquerons leur optimisation en détail ci-après.

Conditions technologiques pour être inclus dans Google Actualités

  • Le site Web doit être optimisé pour les moteurs de recherche et il doit avoir des barrières d’accessibilité basses. Cela veut dire qu’il doit être facile d’accès pour Google-Bot et pour les utilisateurs
  • Un Google Actualités-sitemap spécial doit être disponible et mis à jour automatiquement
  • Le format de date européen doit être utilisé
  • L’adresse URL de chaque article doit contenir un ID continu avec au moins trois chiffres. À noter que ceci n’est plus obligatoire, mais ça ne fera pas de mal de toute façon
  • Il n’y a pas de redirections 301
  • Si possible, vous devez utiliser un thème spécial de magazine ou d’actualités pour le SGC (WordPress par exemple). La plupart du temps, ce genre de modèles est déjà optimisé en termes technologiquement parlant
  • Faites attention à la langue dans laquelle l’inscription à Google Actualités est envoyée et, si nécessaire, traduisez le thème utilisé. En effet, Google a 70 versions régionales différentes de Google Actualités dans de nombreuses langues
  • Dans l’idéal, le code source HTML d’un article d’actualité devrait être ininterrompu et dans l’ordre suivant : titre > image > date > texte. Une grande pub entre le titre et le texte, par exemple, pourrait embrouiller le Google-Bot. Trop de modules complémentaires de réseaux sociaux peuvent également empirer les choses
  • Surveillez la vitesse de chargement des pages/adresses URL uniques. Si possible, restez sous la barre des 200ms par adresse URL/page.
  • Cela serait encore mieux si la taille du document ne dépassait pas 10 KB

Conditions de contenu pour être inclus dans les Google Actualités

  • Vous aurez besoin de mentions légales (imprimées) avec toutes les coordonnées possibles
  • Tous les auteurs/éditeurs doivent être mentionnés, soit dans la page éditoriale soit dans les mentions légales
  • Tout le site doit avoir été écrit et mis à jour par une organisation avec plusieurs auteurs et éditeurs
  • Il doit être évident que le contenu de l’article a fait l’objet d’une supervision éditoriale. Les forums, les posts de blog personnel et d’autres sources du même genre ne sont pas inclus dans les Google Actualités. Le caractère journalistique de l’article doit être évident
  • Ne surchargez pas le site et les articles avec des publicités
  • Créez régulièrement des articles (nouveaux et actuels)
  • Le contenu doit avoir été créé pour votre site, dans l’idéal sous supervision éditoriale
  • On doit écrire des articles et d’autres contenus qui ont une haut degré de fraîcheur sur un sujet en particulier
  • Essayez de ne pas publier de contenu qui n’a rien à voir avec ce que vous faites d’habitude
  • Vous ne devriez pas publier des articles promotionnels sur vos propres activités
  • Il devrait déjà y avoir un bon nombre d’articles disponibles avant que vous vous inscriviez sur Google Actualités

Avant d’accepter un site Web comme source Google Actualités, un employé de Google va regarder votre site Web de plus près et analyser les différents points ci-dessus.

Pages d’aide de Google pour les maisons d’éditions et les éditeurs web :

Comment optimiser encore plus un site et les articles pour Google Actualités ?

Si les conditions technologiques et de contenus mentionnés ci-dessus ont été respectés et si le site optimisé a déjà été accepté comme source Google Actualités, il y a alors un certain nombre d’options pour optimiser encore plus votre contenu et votre site.

La mise en page du site

La mise en page du site dans son intégralité et celle de chaque article est importante. Moins il y a d’éléments à côté ou entre les contenus d’actualités, mieux c’est. Pour rappel, dans l’idéal, le code source HTML d’un article d’actualité devrait être ininterrompu et dans l’ordre suivant : titre > image > date > texte.

Optimisation de contenu, niveau de fraîcheur et vitesse de publication

Pour les classements d’articles d’actualité, le niveau de fraîcheur est crucial. Si on publie un article d’actualité en premier, avant ses concurrents, alors cet article aura un avantage dans les classements. Garder un flux d’articles constant et continu est aussi un plus. Il est fort probable que des algorithmes comme QDF (Quality Deserves Freshness), qui fait partie des Google Freshness Updates, entrent en ligne de compte.

Un sujet d’actualité devra toujours être publié, ou faire partie d’une discussion sur plusieurs sites Web, pour être affiché comme Universal Search dans les résultats de recherche organiques. Si un sujet n’est publié que sur un seul site Web, il est probable qu’il ne soit pas assez important pour que le site soit l’un des trois résultats principaux dans les résultats de recherche organiques.

Google Actualités-sitemap

Il ne suffit pas de créer un simple XML-sitemap pour être sur Google Actualités. Vous avez besoin d’un news-sitemap spécifique, basé sur le protocole XML et avec la date de publication de chaque article. Ce Google News XML-sitemap doit être mis à jour automatiquement sans retard, dès qu’une nouvelle adresse URL avec un article est publiée. Il faut garder à l’esprit que seules les adresses URL d’articles publiés dans les dernières 48 h doivent faire partie de ce sitemap, puisque Google n’accepte que les deux derniers jours pour le cycle d’actualité.

On peut utiliser le Sitemap Generator de XML-Sitemaps.com illimité, qui est payant, pour la création automatique d’un Google News XML-sitemap, par exemple. Ce générateur de sitemap peut être intégré avec presque tous les systèmes et, avec un news XML-sitemap dédié, on peut aussi générer des XML-sitemap vidéo et audio.

Utiliser l’élément meta (meta-tag) « keywords »

Google Actualités utilise l’élement meta (meta-tag) « keywords » pour classer les articles. Mais cela ne veut pas dire qu’on devrait en faire trop : n’utilisez qu’une douzaine de mots-clés au maximum par article. Google a également une liste de tous les mots-clés possibles pour des articles.

Assurez-vous aussi de bien utiliser l’élément meta « news_keywords », qui est spécifique à Google.

<meta name="news_keywords" content="Jeux Olympiques, Brésil 2016, équipe australienne d’aviron">

Tous les mots-clés sont traités de la même façon. La première expression est aussi importante que la dernière. Essayez de ne pas utiliser les mêmes expressions ou mots dans les news keywords que ceux que vous utilisez déjà dans l’élément de titre, le titre H1, ou un ALT-attribute pour l’une des images de l’article.

Optimisation de l’image

L’image de cet article, qui fait partie de l’ordre titre > image > date > et texte, est en partie responsable du taux de clics, aussi appelé CTR (Click-Through-Rate), d’un résultats de recherche. Elle va être affichée en image d’aperçu du contenu de l’article dans les résultats de recherche organiques, ainsi que sur news.google.com.

Pour que l’image soit affichée en tant qu’aperçu sur Google Actualités, on doit être l’hôte de cette image sur le même hébergeur web que tous les autres fichiers de son domaine. Il est très important d’avoir une légende sous l’image de l’article. Assurez-vous donc d’utiliser un attribut ALT qui va avec l’image. L’image doit être au format JPG et le fichier doit être de petite taille. L’image elle-même ne devrait pas faire partie d’un lien.

Optimisation du texte

La fraîcheur, l’actualité, le lien avec le sujet et la vitesse de couverture du sujet sont des facteurs cruciaux de classement pour Google Actualités.

Techniquement, un article n’a besoin que de 80 mots pour être considéré comme un article de presse. Néanmoins, nous vous conseillons d’utiliser au moins 125 mots pour un article à la une, et un minimum de 250 mots pour tous les autres types d’articles.

Pour cette recommandation d’au moins 125 ou 250 mots, il est important que ces mots ne soient pas liés en interne ou en externe. De plus, on devrait écrire les 250 mots de l’article en une seule fois, sans qu’il n’y ait de plugins de réseaux sociaux ou de publicités au milieu du texte.

Optimisation du titre et du sous-titre H1

Il faut qu’il soit court et précis. Utilisez des titres et des sous-titres concis qui encourageront les utilisateurs à cliquer dessus pour en savoir plus. Si possible, positionnez le mot-clé au tout début. Rappelez-vous aussi que le CTR (Click-Through-Rate), aussi appelé taux de clics, est un facteur de classement et qu’il a une influence sur le nombre de fois où les résultats d’une source de presse en particulier seront affichés dans l’intégration Universal Search dans les résultats de recherche organiques.

Éviter les commentaires de lecteurs ou les charger avec AJAX

Si on donne à ses lecteurs la possibilité de faire des commentaires sur ses articles, cela peut parfois supposer un problème pour le classement d’articles uniques. Un article peut même être supprimé des classements.

Ce contenu généré par les utilisateurs, aussi connu sous le nom de UGC, peut devenir la raison pour laquelle on reçoit des erreurs Google Actualités « article fragmenté » ou « article trop court ».

Cela peut arriver si les utilisateurs peuvent laisser des commentaires sur un article et que ces commentaires peuvent être vus par le Google Bot depuis le code source HTML de l’article. Sans le vouloir, cela peut interrompre ou nuire à l’évaluation ou au traitement de l’article par Google. Une façon d’empêcher cela est d’interdire complètement les commentaires de l’article. Si on veut toujours laisser les commentaires, Google recommande de charger ces commentaires, ou n’importe quel genre de contenu généré par les utilisateurs, comme AJAX l’appelle, qui « cache » le contenu du Googlebot, ou qui empêche Google de le lire.

Utiliser des données structurées avec le marquage schema.org

Pour le moment, on ne sait pas si des données structurées sont un facteur de classement (actuellement). Mais ça ne fera pas de mal d’utiliser des données structurées selon schema.org. Les moteurs de recherche en profitent de toute manière. C’est pour cela que vous devriez vous assurer d’utiliser la bonne syntaxe schema.org pour vos articles Google News.

Si on a intégré une vidéo après les 250 mots, comme nous le disions dans la section « Optimisation du texte », alors on peut utiliser le générateur de vidéo Rich Snippet pour le marquage schema.org pour être sûr que le marquage soit bien fait.

Diminuer le temps de chargement des articles / optimise PageSpeed

En plus d’un haut niveau de fraîcheur et d’une rapidité de publication d’articles (soyez les premiers !), la vitesse de chargement d’une adresse URL est, elle aussi, un facteur de classement. Le résultat optimal serait qu’un article soit chargé et envoyé sur le navigateur du lecteur en 200 millisecondes maximum. On devrait donc regarder et optimiser la PageSpeed de son site, ou plutôt de chaque adresse URL.

Le SISTRIX Optimizer offre une aide intéressante. Grâce à l’analyse automatique d’un site, il permet d’identifier toutes les erreurs SEO. Vous pouvez aussi l’utiliser pour déterminer la vitesse de chargement exacte de chaque adresse URL.

L’Optimizer SISTRIX mesure la vitesse de chargement correspondant à chaque adresse URL, on peut donc savoir précisément ce qu'on doit optimiser
L’Optimizer SISTRIX mesure la vitesse de chargement correspondant à chaque adresse URL. On peut donc savoir précisément ce qu’on doit optimiser.

En plus des possibilités d’optimisation dont nous avons parlé, on devrait aussi penser à une migration de son paquet d’hébergement ou du serveur (virtuel/dédié) qu’on utilise en ce moment. Utiliser des solutions de temps de fonctionnement ou un Content Delivery Network (CDN) peut avoir d’énormes avantages pour son PageSpeed. Les solutions recommandées sont Google’s App Engine ainsi qu’Amazon’s CloudFront.

Explication en vidéo par Matt Cutts / Google à ce sujet

Si je traite le même sujet que quelqu’un d’autre, est-ce du contenu dupliqué ?

J’ai un site de presse. J’ai entendu dire que Google n’aime pas le contenu en double, mais je ne peux pas créer des sujets d’actualité ! Qu’est-ce que je peux faire pour m’attirer les bonnes grâces de Google ?

Plus d’informations à ce sujet :

Google: