2 astuces pour éviter le duplicate content

Ce n’est pas nouveau, les moteurs de recherche n’aiment pas le duplicate content. C’est-à -dire les pages sensiblement identiques du point de vue du contenu, mais possédant des url différentes. Il y a quelques temps la création de duplicate contents était parfois volontaire; en effet les « sites miroir » ont longtemps permis de booster son référencement sans beaucoup d’efforts. C’est certainement partant de ce constat que les moteurs de recherche ont commencé à  pénaliser fortement dans les classements tous les sites ou groupe de sites au contenu identique ou presque. Actuellement il vaut donc mieux éviter d’en avoir sur ses sites, mais il peut arriver d’en créer de faà§on involontaire.

Eviter les URL multiples

La plupart des sites Internet sont accessibles via deux url, l’une avec les www, l’autre sans. Par exemple : http://www.spirion.fr et http://spirion.fr
Si la présente d’une url avec des www et l’autre sans, n’est à  priori pas pénalisant au niveau du classement, il est tout de même intéressant d’aider les moteurs à  utiliser la bonne URL (celle que vous trouvez la plus représentative).

Une astuce pour rediriger une des deux adresses vers l’autre, consiste à  utiliser l’urlrewriting (réécriture d’url), soit ajouter les lignes suivantes dans un fichier .htaccess placé à  la racine de son site :

Options +FollowSymLinks
RewriteEngine on
RewriteCond %{HTTP_HOST} !^www\.domaine\.com [NC]
RewriteRule (.*) http://www.domaine.com$1 [QSA,R=301,L]

Une solution plus simple, mais ne concernant que Google consiste à  utiliser l’outil fourni par Google : Webmaster Tools

Cela se passe dans la rubrique « Paramètres » au niveau du « Choix du domaine favori ». Ci dessous une copie de la petite explication fournie par Google :

Le domaine favori est celui que vous souhaitez utiliser pour l’indexation des pages de votre site. Si vous avez indiqué http://www.exemple.fr comme domaine favori et que nous trouvons un lien vers votre site dont le format est http://exemple.fr, nous traitons ce lien comme s’il s’agissait de http://www.exemple.fr. En outre, nous tenons compte de vos préférences lors de l’affichage des URL dans nos résultats de recherche. Il peut s’écouler un certain temps avant que ces modifications apparaissent dans notre index.

Utiliser les balises « URL canonique », notamment pour les pages générées dynamiquement

Certainement pages générées dynamiquement affichent un contenu identique via différentes URL.

Par exemple, pour une page affichant la liste des produits d’une catégorie, classée ou non par ordre de prix, éventuellement du plus cher au moins cher :

www.domaine.com/produits.php?categorie=5
www.domaine.com/produits.php?categorie=5&tri=prix
www.domaine.com/produits.php?categorie=5&tri=prix&ordre=desc

Pire, certaines pages générées dynamiquement peuvent facilement générer du duplicate content. C’est le cas sur pas mal de systèmes de blogs, lorsque le contenu complet des articles est repris sur les pages d’archives journalières. On accède alors au contenu d’un article via son URL normale et également via les pages archives, et parfois catégorie et page d’accueil.

Afin de remédier à  cela, Google, Yahoo et MSN ont anoncé il y a quelques mois, qu’ils supportaient tous les balises « URL canoniques », permettant de déclarer quelle est l’url principale sur chaque page.

L’utilisation est très simple :


Par contre « domaine.com » est obligatoirement le nom de domaine courant; la balise ne marche pas entre deux sites.

Vous pouvez en apprendre plus sur le sujet sur le site de Google et MSN.