Nous sommes nombreux à publier du contenu sur nos sites, celui-ci
est utile à notre référencement SEO mais aussi pour répondre aux besoins et questions
des utilisateurs.
Que ce soit pour des articles, pour des fiches produits ou
encore notre description en page d’accueil nous rédigeons du texte, inspiré par
d’autres ou non, tout notre contenu est passé à la loupe par les fameux robots
des moteurs de recherche.
Qu’est ce que le duplicate content et pourquoi?
Le moteur de recherche se charge d’inspecter votre page et
la comparera avec les milliards d’autres pages indexées par lui-même afin de
vérifier si votre page n’est pas coupable de ce que l’on appelle le «duplicate
content», autrement dit le contenu dupliqué.
C’est-à-dire que le célèbre moteur de recherche vérifiera
que votre texte est authentique et non pas un simple texte paraphrasé depuis un
autre site.
La raison? C’est simple, un moteur de recherche a pour
mission d’offrir les meilleurs résultats pour une requête donnée, mais si le
premier résultat n’intéresse par l’internaute, il n’a aucun intérêt à obtenir
dans les 5 résultats suivants des articles identiques ou quasiment identiques,
cela forcera uniquement le visiteur à parcourir plus longtemps la page de
résultats pour trouver ce qu’il cherche et c’est un risque de le lasser, c’est
pour cette raison qu’ils font la guerre au contenu dupliqué.
La conséquence du duplicate content?
Dans un premier temps, votre contenu considéré comme
duplicate content sera tout simplement masqué de la page des résultats puisqu’il
existe déjà un contenu similaire indexé à une date antérieure.
Oui, la première page indexée sera considérée comme l’originale
et toutes les autres seront considérées comme plagiat par les moteurs de
recherche.
Attention, on insiste sur le fait que c’est la première page
indexée qui sera considérée comme l’originale et non pas la première page
postée!
Cela se produit pour une raison: plus le site est
connu et populaire, plus les robots des moteurs de recherches iront «crawler»
régulièrement leurs pages pour les indexer, ce qui signifie que si vous publiez
une fiche produit sur votre tout nouveau e-commerce, cela peut prendre des
semaines, même des mois avant que le produit soit indexé.
Tandis que si vous publiez votre produit avec une description
identique sur un site comme Amazon, même deux semaines après l’avoir mise sur votre
boutique e-commerce, il a de grande chances d’être indexé en premier et la page
de votre boutique e-commerce sera considéré comme un duplicate content de la
page Amazon.
Malheureusement, le résultat serait qu’aux yeux du moteur de
recherche votre site n’est pas si pertinent que cela puisqu’il a un contenu
identique ou quasi identique à celui d’un autre site, les pages de votre site
seront donc encore moins souvent «crawlées» ce qui fera que vos
pages seront indexées plus lentement, ce qui aura pour cause de ralentir votre
progression dans le référencement.
De plus lorsqu’un site perd en pertinence, son placement
général dans les résultats de recherche se voit réduit.
Dupliquer du contenu accidentellement
Il faut également rester sur ses gardes puisqu’en dehors de
la rédaction, il est possible de dupliquer le contenu de son propre site…
- C’est le cas des sites qui ont décidé de
sécuriser leurs pages en passant des liens http à https sans rediriger les
liens http, leurs pages étaient disponibles donc avec des adresses à la fois en
http et à la fois en https, donc tout le contenu du site fini dupliqué.
- Une double url pour la page d’accueil est
également considéré comme un duplicate content, si votre page d’accueil est
accessible par l’url monsite.com/ et monsite.com/index.php cela sera néfaste
pour celle-ci.
- Tout comme pour le http et le https, si vous
oubliez de faire une redirection de votre url avec www vers la version sans www
ou inversement, votre site verra également ses pages doublées.
Eviter le duplicate content
Vous l’aurez compris, il est très facilement de faire du
duplicate content volontairement ou involontairement.
Afin de prévenir plutôt que guérir, il existe de nombreux
outils permettant de vérifier si la page que vous allez publier n’est pas
considérée comme un duplicate content ou également vérifier si elle n’a pas été
plagiée.
Le premier outil à
cet effet est Positeo, il vous suffira de copier votre texte ou le lien de
votre page afin qu’il la parcourt et la compare aux pages indexées pour
élaborer un pourcentage du contenu dupliqué, autant dire que s’il y a des
résultats supérieurs à 50% c’est très mauvais signe, il est conseillé d’être en
dessous de la barre des 30%.
Le second de notre liste est Quetext, il est toutefois
limité à un texte sans compte, et à 500 mots pour un compte gratuit.
Pour finir, la search console de Google, elle permet avant
tout de parer les duplicate content accidentels dont nous avons parlé plus tôt.
Vous l’aurez compris, il est impératif d’être vigilant sur
le duplicate content puisqu’il peut rapidement ruiner le fruit de vos efforts
en termes de référencement que ce soit accidentel, un duplicate content
involontaire de votre part ou encore une personne qui vous a plagié mais
indexée avant vous, ne vous faites plus avoir en utilisant les outils adéquats
pour éviter cette situation.