Directive européenne sur le droit d’auteur : le contenu journalistique est presque sans pertinence pour Google.

Les filtres de téléchargement (ou aussi appelé UploadFilters) ont été au cœur du débat de la directive européenne sur le droit d’auteur dans le marché unique numérique. Cela a conduit beaucoup de personnes à presque oublier une autre disposition: la loi sur le droit d’auteur “voisin” pour les éditeurs de presse dans l’UE. Dans cet article, nous montrons jusqu’à quel point le contenu journalistique est pertinent pour les pages de résultats sur Google. Les résultats montrent que la très grande majorité des activités de Google sont réalisées sans le contenu des éditeurs de presse.

Le sujet du copyright Law for Press Publishers est aussi arrivé en Europe en raison de la nouvelle directive sur les droits d’auteurs. L’une des questions clés est de savoir si la diffusion d’extraits de contenu (en Snippet) qui dépend d’un contenu issu d’un journal sera couverte par des royalties ou une sorte de redevance. Ce qui obligerait Google à payer les éditeurs.

Afin d’évaluer l’importance du contenu journalistique pour Google, nous avons utilisé nos bases de données et analysé à la fois la taille et la pertinence de cette section des résultats de recherche pour Google.

Notre relevé de donnée

Dans un premier temps, nous avons défini quels seront les résultats affectés par cette directive. Voyant qu’il n’existait aucune liste publique faisant autorité, nous avons décidé d’inclure tout domaine ayant publié au moins cinq articles sur Google Actualités au cours de la semaine dernière. Ensuite, nous avons éliminé les domaines pour lesquels le contenu journalistique n’était évidemment pas la principale activité. Pour la France, cela a abouti à une liste de 1 217 domaines sur lesquels nous avons basé notre évaluation.

Seulement 0,73% des requêtes pour des recherches commerciales peuvent être qualifiés de journalistiques

Tout d’abord, nous voulions savoir dans quelle mesure le contenu journalistique est pertinent pour les mots clés que Google utilise pour gagner de l’argent avec sa barre de recherche. (Google News ne contient pas d’annonces).

Pour cela, nous avons mesuré le nombre de requêtes dans lesquelles les 1 217 domaines de notre liste occupaient au moins cinq des dix résultats de recherche organiques habituels sur la première page. En tant qu’indicateur supplémentaire de l’importance d’une recherche pour Google, ces requêtes de recherche devaient également afficher des publicités (annonces Google ou Google Shopping).

Le résultat était étonnamment faible: sur les quelque 10 millions de requêtes que nous avons mesuré (10 008 378 pour être exact), seules 73 061 requêtes avaient un caractère journalistique et comprenaient des annonces. Cela signifie que seulement 0,73% des requêtes à caractère journalistique présentent également un intérêt commercial pour Google.

Contenu de journal dans Google

5,85% des termes de recherche peuvent être qualifiés de journalistiques

Dans l’analyse suivante, nous voulions savoir combien de termes de recherche pourraient être qualifiés de contenus journalistiques par Google. Pour y parvenir, nous avons mesuré le nombre de mots-clés pour lesquels les domaines de la liste ont au moins cinq des dix résultats habituels de la première page.

Pour environ 10 millions de mot-clefs, cela s’appliquait à 585 589. Cela signifie que 5,85% des requêtes sur Google peuvent être qualifiées de journalistiques. Après examen nous pouvons évaluer que les termes de recherche montraient sept des dix résultats avec les domaines de notre liste. Parmi celles-là, nous avons trouvé que 2,09% des requêtes de recherche peuvent être qualifiées de fortement journalistiques.

14,27% du total des résultats proviennent des secteurs journalistiques

Enfin, nous voulions savoir combien de résultats provenaient des domaines journalistiques, en général.

 Pour cela, nous avons évalué environ 170 million de résultats Google (170 883 102 pour être précis). Ces résultats de Google dressent un tableau représentatif du comportement de recherche en France sur Google.fr.

24 millions de résultats (24 379 337 pour être précis) de ces 170 millions de résultats provenaient de la liste de départ. Cela signifie que, selon notre analyse de données, 14,27% des résultats de Google seraient actuellement affectés par la nouvelle directive de l’UE.

Fait intéressant, si nous considérons uniquement les 50 domaines journalistiques les plus performants sur Google, nous aurions à eux seuls 7,16% des résultats Google. Ce qui les rend responsables d’une grande partie des résultats affectés par la directive.

Conclusion

Depuis 2013, il existe en Allemagne la loi sur le droit d’auteur pour les éditeurs de presse. Cela n’a pas amené Google à payer des droits d’auteur aux éditeurs. En Espagne, une directive similaire a entraîné la suspension de Google News et de nombreux services similaires. Cela a entraîné une perte de trafic pour un pourcentage important de petits éditeurs (étude) et pour des grands journaux comme El País d’adopter une position publique contre cette législation.

Actuellement, un contrôle approfondi de l’indexation et de la visualisation des résultats de recherche dans les SERP de Google est possible. Chaque propriétaire de site peut totalement interdire l’indexation (robots.txt) ou contrôler considérablement l’affichage d’extraits de chaque document individuellement (méta-robots).

Cependant, personne n’a encore réussi la quadrature du cercle : être dans les résultats de Google avec leur snippet tout en profitant à la fois du trafic et des droits d’auteurs en plus.

D’après notre évaluation, il est clair que le contenu journalistique n’est pas suffisamment pertinent du point de vue commercial pour Google. En réalité, Google peut vivre sans ces résultats dans ses listes de résultats.

Articles similaires