Contenu dupliqué

Le contenu dupliqué ou « en double » est un contenu identique et accessible à partir de plusieurs adresses URL. Ce contenu en double devrait être évité à tout prix. Chaque contenu de site Internet ne devrait être accessible qu’à partir d’une seule adresse URL. Sinon, Google se retrouve à devoir choisir quelle adresse URL mettre dans ses classements et quels signaux de classement positifs il va donner à quelle adresse URL.

Qu’est-ce que du contenu en double ?

Le contenu en double, ou Duplicate Content (DC) en anglais, est la présence d’un contenu identique sur plusieurs sites Internet. Il y a une distinction entre le contenu en double interne et le contenu en double externe.

Le contenu dupliqué interne peut être créé simplement en ayant un même contenu accessible à partir de plusieurs adresses URL sur le même site.

Le contenu dupliqué externe peut se produire lorsqu’un site Internet est disponible en plusieurs langues mais qu’il apparaît en plus d’une langue dans les résultats de recherche pour un marché de recherche particulier (par exemple en Allemagne sur google.de).

Vous pouvez consulter sur ce sujet notre article : « Peut-on identifier du contenu en double grâce à l’historique de l’Indice de Visibilité ? »

Contenu dupliqué interne et externe

Le contenu en double peut être soit interne soit externe. Le contenu en double interne est limité à votre domaine/nom d’hôte, alors que le contenu en double externe est présent sur deux domaines ou plus.

Exemple de contenu dupliqué interne

Souvent, les magasins en ligne doivent gérer du contenu en double. Voici un cas qui arrive très souvent où la page détaillée du produit est aussi accessible sans la catégorie correspondante ou sans la page du produit dans l’adresse :

  • http://www.onlineshop-domain.com/category/productpage/productdetailpage
  • http://www.onlineshop-domain.com/productdetailpage

Ces pages sont souvent indexées par les moteurs de recherche, quand les deux adresses URL sont aussi liées en externe par exemple. Une autre raison peut être une stratégie de liens internes incohérente.

Exemple de contenu dupliqué externe

De nombreux sites Internet peuvent être accessibles à partir de plusieurs noms de domaines. Il n’y a pas de problème avec ça, tant que les autres versions du domaine redirigent vers le domaine principal correspondant avec une redirection 301.

Si ce n’est pas le cas, Google est confronté à différents domaines qui ont tous le même contenu. À cause de cela, il est difficile pour Google-Bot de trouver la pertinence de chaque page et cela peut créer des problèmes de classement pour le site.


Historiques de visibilité pour 4 domaines offrant le même contenu. Il y a des moments où Google choisit d’afficher un autre domaine dans les résultats. Trois des courbes de visibilité alternent ainsi.

Évidemment, le domaine principal souhaité est radio-sws.de. Cependant, le même contenu est présent sur trois autres domaines, ce qui entraîne une duplication du contenu. En raison de ces multiples noms de domaine pour un seul site, Google ne peut pas toujours déterminer lequel est le plus pertinent, ce qui entraîne une alternance dans leur classement.

Ce que le contenu dupliqué n’est pas

Si du contenu est disponible en plusieurs langues, par exemple en allemand et en anglais, ce n’est pas du contenu en double. Des citations ou des paragraphes cités ne sont pas non plus du contenu en double.

Si on cite d’autres contenus, n’oubliez pas qu’il faut utiliser les bonnes balises sémantiques dans le code source :

Le texte cité va ici –

Le nom de l’auteur cité ou la source va ici

Pourquoi est-ce que le contenu dupliqué est un problème ?

Pour Google, le contenu en double peut être comparé à une tentative de fraude et ça empêche Google de trouver les meilleurs résultats possibles pour l’utilisateur.

Google essaie d’indexer et de montrer les pages qui ont des informations particulières. […] Mais dans certains cas, le contenu est délibérément dupliqué sur plusieurs domaines pour manipuler les classements des moteurs de recherche ou pour avoir davantage de trafic. Des pratiques de déception comme celle-là peuvent donner une mauvaise expérience aux utilisateurs lorsqu’ils voient le même contenu plusieurs fois dans les résultats de recherche.- Console d’aide de recherche Google

À cause de cela, la présence de contenu en double peut amener Google à pénaliser le domaine et les webmasters devraient prendre cela très au sérieux.

Même si le contenu en double ne donnera pas toujours lieu, et surtout pas au début, à une punition de Google, un problème de DC peut provoquer des problèmes durables sur un site. Cela est dû au fait que les DC amènent à des pénalités après un certain temps ou à des problèmes d’indexation du site. De plus, le contenu en double peut, entre autres choses, être responsable de fluctuations dans les classements des SERP, puisque Google n’est pas sûr de quelle page dispose du contenu le plus pertinent pour la recherche en cours. Google va alors changer les adresses URL pour essayer de trouver la meilleure page.

Google essaie de régler le problème des contenus dupliqués tout seul

Quand il y a un problème de DC, Google essaie d’identifier quel contenu est le plus pertinent pour la recherche en cours de l’utilisateur et met le résultat dans les SERP. Pendant la phase d’indexation du contenu, Google essaie aussi d’identifier la meilleure version possible (adresse URL) du contenu et n’indexe que celle-là si possible.

Si les classements et le trafic d’un site sont cohérents alors que le site n’a pas de problème de DC, et qu’il montre peut-être des changements dans le nombre de pages indexées, le problème de contenu en double n’a pas à être la première chose qui viens à l’esprit pour le moment.

Vérifier si un site a du contenu en double

Les projets SISTRIX Optimizer offrent une analyse sur-site automatisée d’un site Internet et montrent toutes les erreurs pertinentes de SEO. Chaque type d’erreur a sa propre explication et des recommandations pratiques pour y remédier. Cela va aider à connaître l’Optimisation OnPage de votre site. Les erreurs de contenu en double (contenu en double trouvé) seront affichées en détail pour chaque adresse URL.

Onpage-optimisation: website analysis with the SISTRIX Optimizer
Optimisation OnPage : analyse de site avec le SISTRIX Optimizer

Explication vidéo à ce sujet

Plus d’informations à ce sujet

Google