Le contenu dupliqué (duplicate content) : filtres, pénalités, vérités et idées reçues

Samy Berkani, Le 13-09-11

Partager sur facebook Partager sur twitter Ajouter aux favoris Google
Le contenu dupliqué (duplicate content) : filtres, pénalités, vérités et idées reçues

Une hantise pour les e-commerçants, un cauchemar pour les webmasters, un blasphème pour les rédacteurs web (je commence fort aujourd’hui) … Le contenu dupliqué est une pratique à éviter, et ça, tout le monde l’a compris ! (enfin presque …)

Le contenu dupliqué, ou duplicate content pour les « inglish » est une pratique qui consiste à :

  1. Publier sur son site Internet un contenu déjà présent sur un autre site
  2. Publier un même contenu sur différentes pages de son site Internet

Mais il est important de dissocier les deux cas, car les raisons, tout comme les conséquences, sont différentes.

Cet article, je l’ai voulu car il y a trop d’idées reçues et d’erreurs d’analyse de la part de passionnés du SEO comme des professionnels. La paranoïa est telle qu’on se met à supprimer des contenus que l’on a créés et publiés sur son site Internet pour l’unique raison qu’ils ont été dupliqués ailleurs. Ce qui suit va vous aider à comprendre.

Publier sur son site Internet un contenu déjà présent sur un autre site

Certains appellent ça du vol, d’autres un emprunt, d’autres encore le web 2.0 … Quoi qu’il en soit, copier un contenu rédactionnel d’un site Internet et le publier sur son propre site est qualifié de « duplication de contenus ». Google détecte ce duplicata et le dévalorise. Pire encore, depuis le déploiement de la mise à Google Panda, un site peut être pénalisé dans son intégralité pour un contenu dupliqué. Pour éviter ce problème, il faut donc se restreindre à publier uniquement ses propres contenus.

Mais qui dit contenu dupliqué dit contenu original. Autrement dit lorsque Google attribue à une page le statut de « duplicate content », il attribut en parallèle le statut de « original content » à la page source. La première est dévalorisée tandis que le traitement de la seconde est neutre (ou habituel). Une fois que ce filtre est appliqué, on ne peut plus revenir en arrière, car le seul paramètre différenciant le contenu original du contenu dupliqué est la « date d’indexation » (à ne pas confondre avec la date de publication qui là, ne nous intéresse absolument pas).

Pour résumer : Si un contenu présent sur votre site Internet est dupliqué, la seule question à vous poser est : Mon article a-t-il été indexé le premier ? Si la réponse est oui, alors la pénalité concerne les autres sites mais pas le vôtre. Dans le cas contraire, supprimez vite ce contenu !

Aujourd’hui, les bons annuaires web et sites de communiqués de presse n’acceptent que le contenu original et refusent systématiquement le contenu dupliqué. Ce qui est une très bonne chose. Mais leurs efforts ne s’arrêtent pas là, certains vérifient le plus souvent possible que les contenus publiés sur leur site n’ont pas été « ultérieurement » publiés ailleurs. Dans ce cas, ils n’hésitent pas à supprimer ces contenus. Ce qui est une erreur pour eux, et une bonne nouvelle pour le site qui a dupliqué le contenu. Car ils suppriment un contenu qui avait le statut de « contenu original », et permettent à celui qui a dupliqué de récupérer ce statut. En d’autres termes, « le copieur devient auteur ».

Publier un même contenu sur différentes pages de son site Internet

Cette pratique est notamment présente dans le secteur du e-commerce. Les marchands qui peinent à rédiger du texte pour leurs fiches produits reprennent les mêmes descriptions pour les produits similaires. Dans ces cas de duplication de contenu en interne, le risque est de voir toutes les pages où est « majoritairement » présent un contenu dupliqué être dévalorisées par Google. Celui-ci nous invite même à l’informer sur les pages originales et les pages copiées à travers des balises comme la balise canonical.

Ce cas est moins grave que le premier, mais on y perd tout de même en visibilité sur Google. Et là encore, pas de remède miracle, tout passe par une rédaction web de qualité.

A noter que seul le contenu réel de la page compte. Les parties fixes (header, menu, footer …) sont détectées par Google et leur présence sur toutes les pages d’un site est normale (manquerait plus que ça …).

Filtres et pénalités pour contenu dupliqué

Les conséquences du duplicate content peuvent varier d’un cas à l’autre. Pour plusieurs pages dupliquées au sein d’un même site, généralement, le filtre s’applique uniquement à ces pages. On ne parle pas alors de pénalité. C’est également le cas des sites avec une majorité de contenu original et quelques pages dupliquées. Du moins, c’était le cas jusque là, Google Panda nous fera mentir ou nous donnera raison.

On parle de pénalité pour contenu dupliqué lorsque tout un site est touché, y compris les pages à contenu original. Cette pénalité n’est levée que si le contenu dupliqué est supprimé. On peut garder les mêmes urls, en changeant le contenu pour ne pas perdre en popularité.
Une fois que le site respecte à nouveau les recommandations de Google, la levée de la pénalité peut prendre jusqu’à un mois.

Conclusion

La meilleure façon de lutter contre le contenu dupliqué est d’accélérer l’indexation de ses pages Web. On peut par exemple inscrire son site Internet sur Google Actualité, de sorte à ce que les pages apparaissent dans l’index de Google quelques minutes après leur publication. L’utilisation de la solution Wordpress est également recommandée pour la rapidité d’indexation.

Vérifiez vos contenus avant l’indexation, pas après !

N’hésitez pas à demander un devis référencement gratuit pour votre projet de référencement naturel, netlinking ou rédaction web.

devis gratuit référencement

Réseaux sociaux

Inside Créations sur Facebook

Flux RSS

Abonnez-vous à notre flux RSS et restez au contact de l'actualité référencement et Webmarketing et des offres de l'Agence Web Inside Créations.

Flux Rss Référencement

L'agence de référencement

Inside création est une agence Web à Lyon. Notre service de référencement travaille sans cesse à améliorer les techniques de référencement et à informer les utilisateurs sur l’évolution des moteurs de recherche. Ce blog dédié au référencement vous tient au courant des nouveautés les plus importantes et des offres d’Inside Créations.

Catégories

- Actualité référencement
- Communication Web
- Entre pros
- Google Maps
- Projets référencement
- Rédaction web
- Référencement Bing
- Référencement naturel
- Réseaux sociaux
- Stratégie d'échange de liens
- Webmarketing