janv. 09 31

SEO pour Drupal

Sortie de boite, Drupal est construit de manière à assurrer un bon référencement naturel. Il est nénamoins nécessaire d'utiliser un template bien structuré (via des zones de scrawl ordonnées) et d'appliquer quelques configurations et autre modules adaptés.

Je vais présenter ici quelques optimisations à déployer sur votre site Drupal :

  1. Activation des URL simplifiées
  2. Réécriture automatique des URL
  3. Génération du Sitemap XML
  4. Ajout de meta données
  5. Eviter le contenu dupliqué (duplicate content)

1. Activation des URL simplifiées

Il s'agit d'une option native de Drupal, basée sur la réécriture d'URL. Cette fonctionalité permet de transformer les URL contenant des paramètres de type GET en une URL unique.
Par exemple "/?q=node/1" sera remplacée par "/node/1".

Note : votre hébergement doit supporter l'URL rewrting (mod_rewrite d'Apache)

2. Réécriture automatique des URL

Quand les URL simplifiées sont active, il est possible de déterminer manuellement le chemin d'URL de chacun de ses noeuds, afin d'utiliser un nom compréhensible lorsque l'on créé un nouveau contenu.
Par exemple "/node/1" devient "/mon-article-interessant".

Néanmoins, il n'est pas très pratique de devoir systèmétiquement saisir ce nom manuellement.

Pour remédier à cela, on pourra utiliser le module Pathautho. Ce module est très complet et permet d'automatiser la création des chemins d'URL selon des règles simple. Il existe même un fichier permettant de définir la correspondance des caractères spéciaux (tels que les caractères accentués en français).

Note : si vous appliquez ce module sur un site existant, prenez garde à ne pas rennomer des pages existante et déjà référencées par les moteurs de recherche.

3. Génération du Sitemap XML

Maintenant que nous avons des URL "propre", il serait judicieux d'en informer les moteurs de recherche via un sitemap XML bien construit.

L'intérêt du sitemap XML est de permettre aux moteurs de recherche d'avoir une liste exhaustive des contenus de votre site, via une liste d'URL et d'en connaitre les changements. Ainsi chaque URL sera asosciée à une date de modification.
L'objectif est de rendre les moteurs de recherche plus réctifs sur le référencement de vos pages.

Voici donc le module que j'ai retenu : XML Sitemap.

4. Ajout de meta données

Même s'il on considère aujourd'hui que les mots clefs sont négligés par les moteurs de recherche, il n'en reste pas moins que la description est importante : c'est elle qui sera visible sur les pages de résultats de Google, entre le titre de la page et l'URL.

Encore une fois, pour simplifier la génération des méta tags, je conseil l'utilisation du module Meta tags.
Ce dernier permet d'insérer automatiquement le "teaser", du contenu de votre page, dans la balise de description de la page (entyre autre).

5. Eviter le contenu dupliqué (duplicate content)

Un dernier point important, ne risquez pas de vous faire bannir de Google à cause de contenus dupliqués ! En effet, Google considère celà comme une pratique douteuse de référencement.
Je m'explique : une page de contenu ne doit être accessible que par une seule et unique URL.

Mise à jour :
La problématique du duplicate content n'est pas le risque (inexistant sur un domaine unique) de se faire bannir de Google, mais plutôt de faciliter le travail des robots d'indexation de Google. En effet, les duplicatas de page de votre site seront également crawlés par les robots, même si le contenu est strictement identique à la page dupliquée. De ce fait, les robots de Google dépensent de l'énergie inutilement.
Il n'y aurait pas de problème si le temps de passé par les robots que votre site était illimité. Ce n'est aps le cas : tout le temps passé à sacnner et à indexer des pages inutiles c'est; mécaniquement, du temps en moins pour d'autrets pages et par conséquence une moins bonne indexation de votre site.

Si vous avez déployé le module Pathauto et que vous l'avez appliqué sur l'ensemble de votre site, plus aucun de vos contenus référençable ne devrait être accessible via l'URL "/node/xxxx". Et pourtant, par défaut c'est le cas avec Drupal.
Pour remédier à cela, il est conseillé de modifier le fichier robots.txt afin d'y ajouter une rêgle d'exclusion adéquate : Disallow: /node/

De même pour l'accès à une page de contenu via votre nom de domaine, il est important que l'URL soit unique. Ce qui arrive très souvent, c'est que l'on puisse accédé à une même page avec ou sans les "www". Par exemple : "http://www.narno.com/mon-article" et "http://narno.com/mon-article". Google interprète celà comme une duplication de contenu.

La solution est de décommenter l'un des 2 blocs suivant dans le fichier ".htaccess" (situé à la racine de votre site) :

#RewriteCond %{HTTP_HOST} ^example\.com$ [NC]
#RewriteRule .* http://www.example.com/ [L,R=301]
#
#RewriteCond %{HTTP_HOST} ^www\.example\.com$ [NC]
#RewriteRule .* http://example.com/ [L,R=301] 

Si vous décommentez le 1er, l'URL sera toujours "http://www.example.com", si vous décommentez le 2nd, l'URL sera toujours "http://example.com"

De plus, Drupal adopte le même comportement que votre URL contienne un "/" ou pas : il affiche le contenu tel quel. On se retrouve à nouveau dans un cas de contenu dupliqué, puisque 2 URL différentes pour accédé à la même page.

La solution est d'ajouter la règle suivante dans le fichier ".htaccess" juste après la ligne "RewriteBase" :

RewriteCond %{HTTP_HOST} ^(www.)?narno\.com$ [NC]
RewriteRule ^(.+)/$ http://%{HTTP_HOST}/$1 [R=301,L]

Portrait de Tuf

Mouais, c'est pas ce que j'appel du SEO mais le minimum vital :)


Portrait de Narno

Oui, je pense aussi qu'en 2009 c'est le minimum. Ce billet date d'environ 2 ans (de mon ancien blog) et j'ai voulu le rendre de nouveau disponible, et à l'améliorer au fil de mes expériences en SEO.

Si tu as des idées complémentaires (et je sais que tu en as), n'hésite pas ! ;-)


Portrait de Vizor

Bonjour et merci pour ton article.

Je n'avais pas vraiment perçu l'importance des duplicate contents et je vais donc m'y atteler ^^. Il faut vraiment que je me mette à jour niveau référencement ;)

Sinon pour ceux qui rencontrent des difficultés à installer les Urls Simplifiées, j'ai écrit un petit tuto à cet effet, peut-être que ça aidera certains d'entres vous...

C'est ici: http://www.vizor-online.com/drupal-urls-simplifiees


Portrait de Anonyme

merci pour ton article, et belle mise en page, dommage que tu l'aies truffé de fautes ;)


Portrait de Narno

J'en ai corrigé un maximum ! :-)


Portrait de Guillaume "Bès" Bec

Je me permet d'intervenir sur le point 5, car il faut démistifier cette histoire de Duplicate content.

Vous ne risquez pas de vous faire bannir ou de subir une quelconque pénalité. D'ailleurs garder l'affichage par node/xxx permet de se passer d'url shortener ce qui est un plus pour votre site.

Le Duplicate content est un problème quand il s'agit de domaines différents essentiellement.

Voir : http://googlewebmastercentral.blogspot.com/2008/09/demystifying-duplicat...


Portrait de Narno

En effet, j'ai ajusté le paragraphe 5 en conséquence.

Merci Guillaume !


Portrait de Tronix

Merci pour toutes ces infos très intéressantes.

Sinon, il existe un module très pratique pour Drupal qui s'appelle Global Redirect.

Il cherche automatiquement si un node a un alias et fait la redirection automatiquement, ce qui évite d'annuler le référencement des nodes qui n'ont pas d'alias mais empêche les moteurs de recherche de référencer en double les nodes qui en ont un.

De plus ce module enlève aussi automatiquement le "/" final et donc annule là encore le double référencement.


Portrait de Anonyme

Commet configurer Global redirect car je l'ai activé et mes url http://monsite.com/nodexx s'affiche toujours, aucune redirection...


share