Le duplicate content (ou contenu dupliqué) est un cauchemar pour la plupart des gérants de sites ecommerce. On parle de duplicate content lorsque deux contenus identiques ou très similaires sont présents sur deux pages web différentes. Que ces pages appartiennent au même site ou à deux sites différents, cela ne change rien.
Le duplicate content doit être évité (ou corrigé) pour deux raisons principales :
- Il est pénalisé par Google et peut entraîner une dégradation de votre référencement, voire la désindexation complète de certaines de vos pages. Depuis que Google Panda sévit, il est impossible de passer au travers du filet ! (Impact SEO)
- Il nuit à la qualité de l’expérience de vos utilisateurs. Il n’est pas agréable pour un internaute de constater des copier-coller sur votre site. Cela est pour lui l’indice de la mauvaise qualité de votre site. (Impact en termes d’image et de notoriété)
La lutte contre le duplicate content peut s’avérer fastidieuse, surtout si vous n’avez pas appliqué les bonnes pratiques dès le départ. Mais clairement, c’est un travail qu’il faut prendre le temps de faire. Voici quelques conseils pour identifier et lutter efficacement contre le duplicate content sur votre site ecommerce.
Les différents types du duplicate content
Il existe deux grands types de contenus dupliqués ou duplicate contents :
- Le duplicate content interne (ou intrasite) : deux contenus éditoriaux identiques sont présents sur un seul et même site internet. Il y a duplicate content interne lorsque vous copiez-collez des contenus entre les différentes pages de votre site (volontairement ou involontairement) ou bien lorsque deux URL différentes de votre site renvoient à la même page de votre site. Le duplicate content interne est très fréquent sur les sites de ecommerce. Le contenu dupliqué interne est – ou devrait être – la bête noire de tous les ecommerçants.
- Le duplicate content externe (ou intersite) : deux contenus identiques sont présents sur deux sites différents. Le duplicate content externe s’assimile la plupart du temps à du vol pur et simple de contenus (plagiat). Le duplicate content externe, pour les sites ecommerce, concerne surtout la partie description-produit. Exemple : lorsque vous reprenez la description du fournisseur et que des concurrents ont eu la même idée…
Deux questions se posent concernant le duplicate content :
Question 1 : Dans un cas de duplicate content externe, comment Google fait-il pour savoir qui a copié sur qui (qui est le voleur et qui est la victime) ? Bien sûr, le critère de l’ancienneté est déterminant : le contenu original (on parle de contenu canonique) a forcément été publié en premier. Mais attention, ce n’est pas le seul critère pris en compte par Google bizarrement. La popularité des pages (mesurée via les backlinks notamment) entre en ligne de compte.
Question 2 : à partir de quand peut-on parler de duplicate content ? La question est bien plus complexe qu’il n’y paraît. La réponse est loin d’être évidente. Du duplicate content, il y en a forcément. Par exemple, vous trouverez sur des millions de pages des expressions ou des tournures de phrase comme « Il est vrai que » ou bien « Dans la mesure du possible ». Il ne s’agit d’ailleurs même pas de duplicate content, évidemment. Se pose donc la question du seuil de tolérance. Cette question est très discutée au sein de la communauté des experts-SEO. Selon Olivier Andrieu par exemple, le seuil est de 70%. Autrement dit, Google ne pénaliserait les pages pour duplicate content qu’à partir du moment où 70% de leur contenu est identique à celui d’une autre page. Ce seuil est particulièrement élevé. Pour d’autres, il s’établirait plutôt autour de 40%, voire moins.
Pour finir, il est important de bien se rappeler que le duplicate content ne concerne pas uniquement le contenu texte de vos pages, c’est-à-dire le contenu « sémantique ». Le fait d’utiliser des balises Title ou Meta Description identiques ou similaires est également une forme de duplicate content. Nous reviendrons sur ce point.
1. Créer des descriptions produits originales
Dans le cadre d’un site ecommerce, qui dit duplicate content dit fiche-produit. C’est d’abord au niveau de vos fiches produits que le duplicate content doit être surveillé. Pour éviter le duplicate content, vous devez commencer par travailler sur vos descriptions. La description produit est un des éléments centraux de la fiche produit. Nous avons déjà donné quelques conseils pour construire des fiches produits de qualité.
Vos descriptions doivent être originales, au sens où on ne doit les retrouver nulle part ailleurs sur internet. Typiquement et comme nous le disions plus haut, vous devez à tout prix éviter de réutiliser les descriptions de vos fournisseurs. Au départ, ce copier-coller peut sembler pertinent. Après tout, les descriptions fournisseurs sont généralement bien optimisées pour le web car elles comportent les mots clés essentiels. Le problème, c’est que vous n’êtes sans doute pas le seul à vendre ce produit et que vos concurrents risquent d’avoir la même idée que vous. Résultat : il y a un risque fort de duplicate content.
De même, les descriptions de tous vos produits doivent être différentes. Il est possible que vous vendiez des produits très similaires et que vous soyez tenté par le duplicate partiel de la description. Reprendre des éléments de description d’une fiche à l’autre est un procédé très fréquent. Pourtant il faut évité cela autant que possible, car c’est prendre le risque du duplicate content interne. Conseil : si vous vendez plusieurs variantes d’un même produit (des produits identiques dont seule la couleur change par exemple), ne créez pas plusieurs pages. Regroupez ces variantes sur une seule et même page.
Un autre conseil à propos des descriptions : il peut être intéressant d’utiliser des market places qui ont pignon sur rue (ou plutôt sur internet…) pour étendre sa visibilité et développer son activité d’e-commerce. Par exemple, vous avez un petit site ecommerce qui vend des produits faits maison et souhaitez vendre vos produits sur Amazon ou LeBonCoin. Dans l’absolu, cette solution est très pertinente. Mais attention : la description doit être différente sur chaque page (celle de votre site, celle d’Amazon, de LeBonCoin, etc.). Sans compter que si vous copiez-collez votre description sur Amazon, il y a des chances que ce soit votre site ecommerce qui soit pénalisé pour duplicate content et non Amazon (alors même que vous êtes l’auteur du contenu et peut-être même le fabriquant du produit…). Comme on l’a dit, la popularité du site est un critère pris en compte dans l’attribution des pénalités Google pour duplicate content. La page « canonique » peut être pénalisée si elle est moins populaire que la page qui a repris son contenu.
Boulanger propose des descriptions complètes de ses produits…mais qui sont des copiés-collés des descriptions fournisseurs :
Ecrire une description unique pour chaque page produit est un travail de longue haleine, surtout si vous avez plusieurs centaines de pages produits. Le jeu en vaut-il la chandelle, une fois dit le coût de réécriture de toutes vos descriptions ? La réponse est oui, clairement. Les retours d’expérience sont unanimes : la réécriture des descriptions contribue à un meilleur référencement des fiches produits et, de ce fait, à une augmentation du trafic parfois spectaculaire (+ 100%, voire plus).
Faites appel à des rédacteurs web qualifiés et surveillez leur travail pour bien vous assurer qu’ils ne font pas de copier-coller. Pensez à organiser la rédaction de votre contenu pour gagner du temps. Ensuite, si vous avez des centaines de fiches produits, priorisez les fiches et traitez en premier les fiches correspondant à vos produits phares ou aux nouveautés. Si vous décidez de recourir à une market place et que vous devez écrire deux descriptions pour un même produit, soignez la description qui figure sur votre site à vous.
Exemple à ne pas suivre : Yoox.com (photo ci-dessous). La partie description, en bas à droite, est très faible, c’est le moins qu’on puisse dire. Certains experts estiment qu’une description, pour avoir un poids SEO, doit comporter plus de mots que l’ensemble des autres mots présents sur la page. Clairement, ce n’est pas le cas ici. En revanche, il faut noter que la présence d’une option zoom sur la photo est bienvenue. Les photos sont d’ailleurs en HD (ce qui est préférable lorsqu’on utilise une option zoom, bien sûr).
2. Créer des balises Title et des Meta descriptions uniques
Comme on l’a dit rapidement plus haut, la question du duplicate content ne se limite pas uniquement au copier-coller de contenus éditoriaux (des descriptions produits dans le cas d’un site ecommerce). Les autres éléments de vos pages doivent eux aussi être uniques et originaux. Parmi ces éléments, deux d’entre eux doivent retenir votre attention. Il s’agit d’une part des balises Title (<title>) et d’autre part des balises Meta Description (<meta name= “description”>). Le contenu de ces balises doit être à chaque fois unique.
La balise Title tout d’abord. Il s’agit du titre de votre page, qui ne doit pas être confondu avec le titre de votre fiche produit ou le titre de votre article de blog. Pour ces derniers, on utilise une balise H1. Le titre renseigné dans la balise Title apparaît à deux endroits : dans les pages de résultats de Google (et autres) et sur l’onglet du navigateur. Toutes les pages doivent avoir un Title unique. Tandis que la balise Title a une influence directe sur le référencement de votre page, la balise Meta Description a surtout pour but de permettre à l’internaute d’accéder à un résumé très court de votre page sans avoir à cliquer dessus. Malgré l’incidence moins forte de la Meta sur le référencement, l’utilisation de Meta Description identiques équivaut à du duplicate content passible de sanctions de la part de Google.
Le duplicate content sur les balises <title> et <meta name= “description”> doit être banni à la fois pour éviter les sanctions de Google, mais aussi, et tout autant, pour des raisons de pertinences vis-à-vis des internautes. Les internautes qui font une recherche dans Google et tombe sur votre site dans les SERP doivent avoir envie de cliquer sur le lien de votre page. Pour cela, ils doivent savoir à quoi s’attendre. Votre lisibilité dans les pages de résultats des moteurs de recherche sera très amoindrie si vous utilisez des Title et des Meta identiques.
3. Soigner l’excerpt dans la liste produits
Les listes de produits constituent également un haut lieu de duplicate content interne. Voici quelques conseils pour éviter les contenus dupliqués au niveau de vos listes produits.
Avec la plupart des CMS, un excerpt (un « extrait ») est utilisé dans les listes produits afin de donner quelques indications sur les produits. Si c’est le cas avec votre CMS, faites attention à une chose : l’excerpt par défaut correspondra aux premières lignes de la description de votre produit qui se trouve dans la fiche produit. Pour éviter que du duplicate content interne soit généré entre d’une part les listes produits et d’autre part les fiches produits, vous devez à tout prix rédiger un excerpt unique pour chaque produit et un excerpt qui ne reprenne pas un élément de votre fiche-produit.
Le site Boulanger ne respecte pas cette règle. Les excerpts proposés sont tirés des fiches produits. Il n’est pas certain pourtant que cela génère du duplicate content et des pénalités Google, étant donné la brièveté des excerpts. Mais mieux aurait valu utiliser des excerpts plus longs et uniques.
De manière générale, plus le contenu de vos pages est personnalisé, plus le risque de duplicate content est faible. Pour personnaliser vos listes produits, il peut être intéressant d’intégrer une description de la catégorie dans le listing produit, dans un sidebar par exemple :
4. Créer des URLs canoniques et ne pas indexer toutes les pages de votre site ecommerce
Le duplicate content est, dans certains cas, difficile à éviter. A deux niveaux notamment :
- Au niveau des fiches produits : vous vendez par exemple un produit disponible en six couleurs et vous avez créé une fiche pour chaque couleur. Ou, bien plus inévitable : le pull en laine rouge que vous vendez sur votre site ecommerce est accessible depuis la catégorie « pull » et la catégorie « soldes d’hiver ». Autrement dit, deux chemins mènent à la même fiche produit, ce qui aboutit en règle générale à la création de deux URL différentes.
- Au niveau des listes produits : avec le jeu des filtres et des classements (par prix par exemple), il est très fréquent et quasiment inévitable que surgisse du contenu dupliqué entre vos listes produits.
Heureusement, il existe une solution (qui n’est pas la seule) pour résoudre ce problème : mettre en place des URL canoniques. L’idée va consister à demander à Google de n’indexer qu’une des pages (= qu’une des URL). Par exemple, la liste produits qui présente les produits par pertinence. Les URL des listes de produits qui présentent les produits classés par prix ou par couleur ne seront pas indexées (même si elles resteront bien sûr accessibles depuis le site !).
Pour indiquer l’URL canonique à Google, il suffit d’ajouter une balise dans l’entête HTML de vos pages secondaires. Une fois l’URL canonique définie, Google ne prendra en compte que la page canonique dans ses pages de résultats. Seule l’URL canonique sera indexée dans Google, ce qui évite évidemment le duplicate content.
La balise doit être placée dans le <head> des pages secondaires, de cette manière :
<head>
…
<link rel = « canonical » href= « URL de la page canonique » />
…
</head>
Pour permettre une prise en compte rapide et efficace de vos URL canoniques par Google, il est conseillé de créer en parallèle un sitemap dans lequel vous listerez manuellement toutes vos URL canoniques. Cela permet de faciliter le travail des Google bots.
Autre solution : utiliser les valeurs « noindex » dans le robots.txt ou la balise « nofollow ».
5. Faire des redirections 301 en cas de refonte du site
En cas de refonte ou de restructuration de votre site ecommerce, il est vivement conseillé de faire des redirections permanentes 301. Les redirections 301 permettront de rediriger les URL de votre ancien site vers les URL de votre nouveau site. Ces redirections sont souvent longues à mettre en place, car difficilement automatisables. Elles sont pourtant nécessaires pour éviter le duplicate content entre le contenu de vos anciennes et nouvelles URL. Les redirections 301 vous permettront en plus théoriquement de conserver les bonus SEO accumulés sur vos anciennes pages.
Soyez méthodique et commencez en premier par rediriger manuellement les pages les plus importantes de votre site e-commerce. A savoir : les pages qui ont des backlinks, les pages bien positionnées ou à fort trafic organique, les pages clés (page d’accueil, etc.). Pour en savoir plus sur le rôle et le fonctionnement des redirections 301, nous vous invitons à lire notre article qui explique comment conserver ses positions SEO suite à la refonte de son site.
6. Utiliser des outils de mesure du duplicate content
Avant de supprimer le duplicate content, il faut pouvoir le repérer et l’identifier. Vérité de Lapalisse. Pour identifier les contenus dupliqués, plusieurs outils sont à votre disposition. Voici une liste des principaux outils pour gérer le duplicate content :
- PlagSpotter, pour repérer les pages en ligne qui copient votre contenu. Vous pouvez aussi utiliser Copyscape, outil de référence.
- Webconfs, qui détermine le taux de similarité entre deux contenus déjà en ligne. Vous pouvez aussi utiliser pour cela l’outil Duplicatecontent.
- Web SEO Analytics, qui calcule un taux de duplication entre le contenu de deux URL.
- Positeo, qui permet entre autres de vérifier le taux de duplicate d’un contenu hors-ligne (qui n’a pas encore été publié sur internet). Plagiarisma permet la chose.
- DupeCop, qui permet de comparer le duplicate entre plusieurs textes hors ligne.
- Siteliner, qui permet de connaître le taux de duplicate interne sur votre site.
- La barre de recherche de Google. Vous vérifiez manuellement si un site copie votre contenu en copiant-collant des bouts de textes issus de vos contenus dans la barre de recherche.
Pour savoir si vous êtes victime d’une pénalité de Google suite à du duplicate content, rendez-vous sur Google Search Console. Si vous avez été pénalisé, Google vous envoie un message sur votre compte. Si à l’inverse vous remarquez qu’un site copie votre contenu, vous pouvez avertir Google en suivant la procédure prévue à cet effet.
Si le sujet du plagiat et du duplicate content vous inétresse, je vous invite fortement à parcourir ces articles :
Yushing a écrit
le :
Merci pour cet article « étude de cas » très concret, ça va beaucoup m’aider à bien construire mon site dès le début !
Hub-Grade a écrit
le :
Bonjour,
Merci de vos lumières sur ces sujets.
J’avais une petite question, justement en relation avec les fiches produit.
Aujourd’hui, mon site (qui n’est pas vraiment e-commerce) possède près de 1500 annonces de location de bureaux. Les pages sont toutes construites de la même manière, à la manière de fiches produit et possèdent les mêmes libellés pour séparer les éléments des annonces. Ces libellés sont en H2 à H3 des pages en questions.
Pour des raisons inconnues, SEMRush (et peut-être même Google) semble voir cela comme du contenu dupliqué. Plus précisément, l’outil classe quelques unes
Pour quelles raisons ? Que faire contre cela justement ?
Merci
La Fabrique du net a écrit
le :
Je ne suis pas du tout expert du sujet, mais j’imagine que SEM Rush se base sur le ratio texte unique / texte (voire code HTML unique / code HTML, ce qui ne doit pas aider pour des sites lourds comme le tien). Le fait que ton site soit une webapp JS ne doit pas aider le crawler SEM Rush à bosser, mais le crawler de Google est autrement plus puissant.
Sandrine a écrit
le :
Bonjour,
Merci pour cet article très éclairant! Je suis actuellement une formation en communication digitale et votre site est une véritable mine d’or.
Sébastien a écrit
le :
Très intéressant, le duplicate content sur les fiches produits est en effet une vraie problématique, qui nécessite un réel effort rédactionnel.
Souvent, créer des milliers de pages est tentant mais quand il s’agit de créer des milliers de descriptions, c’est pas la même…
X2i a écrit
le :
Article extrêmement complet sur le sujet,et les visuels sont pertinents pour bien comprendre les exemples et contre-exemples donnés. Lorsque l’on recherche un produit sur Google, on remarque souvent que les méta-descriptions des sites e-commerce n’ont pas été remplies correctement et il est alors particulièrement difficile pour le client de savoir si le produit correspond à sa recherche ou non. Cela donne une mauvaise impression du site avant même d’y avoir accédé – quand les clients ne décident pas tout simplement de cliquer sur le résultat suivant.
D’une manière générale, nous constatons régulièrement que nos clients négligent l’importance d’un contenu original et de qualité. Il est pourtant essentiel à un référencement optimisé…
La Fabrique du net a écrit
le :
Merci pour ce retour d’expérience ! C’est toujours intéressant d’avoir le point de vue d’une agence web sur le sujet.
La question des meta descriptions reflète bien le problème. Les clients ont du mal à se rendre compte de l’importance de rédiger des meta descriptions vraiment uniques et pertinentes, mais c’est aussi à l’agence web d’expliquer clairement les enjeux et de proposer des techniques simples pour aider le client. Si vous demandez à une micro entreprise qui se lance dans le web de rédiger 5000 descriptions uniques, même si le dirigeant est convaincu de l’utilité de la tâche, cela risque de ralentir le projet. Pour aller plus vite, a minima, l’agence web doit proposer de générer une meta description minimaliste, mais unique, en combinant par exemple le titre du produit, avec des données structurées comme la taille, le prix, etc.