[Guide] Comment connaitre et supprimer les mauvais Backlinks

Pour sortir d’une pénalité manuelle ou Google Penguin, il est nécéssaire d’identifier les mauvais liens entrants (backlinks) qui pointent vers votre site afin de les supprimer. En fait, il faut même réaliser cette analyse de backlinks dans toute mission de référencement afin de prévenir toute pénalité, qu’elle soit algorithmique ou manuelle. C’est d’autant plus vrai depuis que Google Penguin est directement inscrit dans l’algorithme de Google, car il est plus difficile de savoir si un site est pénalisé ou pas vu qu’on ne peut plus faire de corrélations entre la date d’une mise à jour et une baisse de trafic.
Edit 05/10/5026: De plus, Penguin 4 tend à dévaluer le lien toxique plutôt que pénaliser un site en entier, ce qui rend aussi plus complexe l’analyse d’une baisse de trafic qui serait plus granulaire. Toutefois, une pénalité manuelle est toujours possible et dans tous les cas la dévaluation d’un lien touche toujours une portion de site ou un site globalement, suite à l’effet boule de neige sur la transmission du pagerank. Sans parler de l’effet néfaste sur d’autres critères algorithmiques et la pertinence globale du site qu’implique un mauvais voisinage de liens.

C’est une analyse qui peut être longue, car on peut vite se retrouver avec plusieurs milliers de backlinks sur de petits ou moyens sites, jusqu’à plusieurs millions sur de gros sites. Je vais donc vous donner mes astuces pour connaitre assez rapidement et facilement les mauvais backlinks. Il restera plus qu’à les supprimer.

C’est quoi un lien de mauvaise qualité ?

Avant de rentrer directement dans l’opérationnel pour connaître et supprimer les mauvais backlinks, c’est bon de rappeler ce qu’est un lien de mauvaise qualité. De nombreux sites ont abusé et continuent encore d’abuser de l’algorithme de Google avec des liens factices. Car les liens entrants et le pagerank qu’ils apportent au site sont un facteur de classement en référencement, la quantité de liens entrants vers un site l’emportaient sur leur qualité.

Mais cette époque est révolue, il vaut mieux avoir peu de liens de qualité que beaucoup de mauvaise qualité. Plus concrètement, Les mauvais backlinks sont des liens:

  • Trop nombreux et sur des mots clés concurrentiels (souvent avec des textes de liens suroptimisés)
  • Provenant de sites de mauvaise qualité ou même déjà pénalisés
  • Des liens hors thématiques, non contextualisés
  • Et tout ce qui peut créer un trop grand déséquilibre dans le profil de liens du site (je parle plus loin de la notion de profil de liens)

En gros, c’est souvent des annuaires, des fermes de liens, des liens partenaires mal placés (en footer par exemple), des sites étrangers dont le thème n’a rien à voir, etc…

D’où viennent ces mauvais liens entrants ?

Et bien, ça vient souvent de la création de liens (linkbuilding) par des agences SEO peu scrupuleuses qui utilisent des méthodes black hat ou juste incompétentes. Pour les vieux liens, c’est compréhensible car il y a quelques années, Google était moins regardant et moins efficace pour détecter les liens factices. Ceci dit, ça faisait déjà parti des mauvaises pratiques, et personnellement ça fait plus de 10 ans que je déconseille cette facilité car j’ai toujours inscrit le SEO sur le long terme.

Mais ce n’est visiblement pas le cas de tout le monde, surtout que beaucoup de référenceurs continuent encore d’essayer de déjouer Google avec ces stratégies court termes.

Les liens factices peuvent venir de tentatives de negative SEO, c’est à dire des personnes mal intentionnés qui inscrivent délibérément votre site sur des sites de mauvaise qualité afin que le site soit pénalisé. C’est de plus en plus courant d’ailleurs, certains se spécialisent la dedans et si il y a une offre, c’est qu’il y a une demande: Les sites concurrents.

Ça peut venir aussi plus simplement de sites qui agrègent automatiquement du contenu depuis d’autres sites, entraînant ce type d’effets de bord.

1 / Lister les backlinks avec des outils

liste-de-backlinks

Extrait de tableau excel avec liste des backlinks

Première étape, il faut établir une liste de tous les backlinks du site. Pour cela, on peut utiliser un ou plusieurs outils. Personnellement, je mixe search console et majestic SEO (payant). Les données seuls de search console ne sont pas suffisantes car il ne permet pas d’extraire tous les backlinks et il manque beaucoup de données intéressantes comme le texte de lien par exemple.

D’autres outils existent comme ahrefs, opensite explorer ou searchmetrics mais dans tous les cas il faudra passer par un outil payant pour avoir un maximum de backlinks et d’informations comme la date du lien, un indice de qualité du lien, la correspondance entre page liante et page liée, etc.. Je préfère Majectic SEO car d’après mes tests ça semble être la plus grosse base de backlinks et j’aime bien ses scores de qualité: TrustFlow, Topical Trustflow et CitationFlow pour la popularité.

Une fois la liste de liens entrants exporté sur excel, j’ajoute une colonne « domaine liant » afin d’extraire le domaine de chaque backlink. L’objectif est de pouvoir facilement filtrer et faire des tableaux croisés dynamiques sur les domaines. Et voici une formule excel pour extraire le domaine d’une URL:
=GAUCHE(E2;TROUVE("/";E2;9))
E2 étant la case où se trouve l'url dont on veut extraire le domaine

C’est plus simple d’analyser des domaines que chaque backlink un par un.

2/ Analyser les nouveaux liens

evolution-nouveaux-backlinks

Evolution de nouveaux backlinks vers un site (on remarque un pic de backlinks mi-juin)

Analyser l’évolution des nouveaux liens entrants est une très bonne piste pour déjà identifier de mauvais liens. L’afflux massif de nouveaux liens sur une période courte sera considéré comme suspect par Google, et à coup sûr ce sera forcément des liens de mauvaise qualité.

Enfin, peut-être pas tous, j’ai vu par exemple un blog de qualité faisant un lien vers un site sur un article thématique, ce qui est très bien mais ce même blog a eu la mauvaise idée d’ajouter en même temps ce même lien sur un bloc « partenaires » sur l’ensemble des pages du site. Dans ce cas l’article Oui, mais le bloc partenaires Non. C’est pour ça que dans tous les cas, il sera toujours nécessaire de réaliser une vérification manuelle avant de vouloir supprimer complètement un domaine liant.

Attention à ne pas être trop prompt à supprimer des liens, sous peine de perdre en popularité et en référencement.

3/ Connaitre la répartition des domaines entrants

domaines-liants

Exemple d’analyse client sur les domaines liants

Connaitre la répartition des domaines liant le votre, c’est la base et avec la fameuse colonne « domaine liant », ça devrait pas être trop compliqué pour un utilisateur d’excel. Ici la méthode est simplement d’aller jeter un oeil sur les premiers domaines liants et avec un peu de bon sens, on se rend compte tout de suite si il s’agit d’un site de mauvaise qualité ou pas.

Dans le même esprit, c’est bien de regarder la répartiton des TLD, c’est à dire l’extension du nom de domaine. Si votre site en .fr reçoit des liens en .ru, faut se méfier.

4/ Identifier la répartition des Ips

repartition-des-ips

Répartition des ips uniques en fonction du nombre de domaines sur chaque IP

Cette fois, c’est une méthode moins classique. Il s’agit d’extraire l’IP de chaque domaine liant et faire un tableau croisé dynamique pour voir la répartition des IP qui font des liens. Pour récupérer les IPs, vous avez le choix: netpeak checker, seo tools, ..

Le but de cette analyse c’est de voir les IPs avec beaucoup de sites liants. C’est normal d’avoir plusieurs sites sur la même IP dans certains cas, lorsqu’il s’agit de sites hébéergés sur des serveurs mutualisés et on reconnaitra facilement des ips de type OVH.

Mais si vous voyez par exemple 10 sites différents sur la même IP, c’est peu probable que ce soit 10 sites de qualité sauf si votre site est très connu. Il y a de fortes chances que ce soit de mauvais liens provenant de sites générés automatiquement sur le même CMS.

Et hop, encore des domaines à ajouter dans votre liste de domaines à désavouer. Pas la peine de contacter les webmasters dans ce genre de cas, au contraire même, car si il s’agit de negative SEO, vous les préviendrez que vous les avez identifié et ils s’empresseront de supprimer les domaines pour en créer d’autres.

5/ Profil de liens et textes de liens

profil-de-liens

Exemple de facteurs influençant le profil de liens d’un site

Avoir un bon profil de liens consiste à avoir une répartition et une diversité de liens entrants qui semblent naturels et dont le ratio se rapproche de la moyenne des sites de votre secteur d’activité. Par exemple, un site reçoit souvent plus de 50% de liens entrants sur sa marque et si votre site reçoit au contraire plus de la moitié de ses liens sur un ou quelques mots clés génériques, ce sera considéré comme suspect.

Un des éléments essentiels pris en compte par Google Penguin qui est à présent en temps réel, c’est le Texte de Lien (ou ancre de lien). Il faut donc réaliser un petit tableau croisé dynamique sur excel et regarder la répartition des textes de liens  reçus sur le site. Puis de regarder les domaines qui font beaucoup de liens avec les mêmes ancres.

Là aussi, il faut vérifier manuellement chaque domaine dans cette situation, il y en a pas forcément beaucoup mais il faut le faire car la solution ne sera pas toujours de supprimer complètement tous les liens entrants du domaine mais seulement certains. Dans ce genre de cas, il faut contacter le webmaster afin qu’il supprime par exemple les liens du footer mais pas les liens depuis certains articles.

Il y a aussi d’autres critères à vérifier pour avoir un profil de liens naturels comme le ratio entre liens follow et nofollow, la part des liens entre page d’accueil et pages profondes, la part des sites thématiques et géolocalisés,… D’ailleurs, au delà du nettoyage de backlinks, dans l’élaboration d’une stratégie de netlinking, il est essentiel de garder un profil de liens équilibré et naturel.

6/ Mesurer les liens de mauvaise qualité

evolution-liens-spammy

Evolution des liens identifiés comme spammy (graphe excel)

Une des principaux atouts d’outils comme Majestic SEO c’est qu’ils donnent des indices sur la confiance qu’on peut porter à chaque backlink. Le trustflow de majestic SEO par exemple est basé sur une liste de sites de confiance et une liste de sites suspects. Des liens proches avec ces sites dépendra ce score de confiance, élevé si un site est proche de sites de confiance, faible si il est proche de sites suspects et/ou n’est pas proche de sites de confiance.

Le CitationFlow, quant à lui, est un critère plus quantitatif, représentatif du nombre de liens que reçoit un site, soit sa popularité.

Biensûr, ce n’est pas parfait, compliqué d’être exhaustif sur l’ensemble des sites du web mondial. De plus, de jeunes sites ont souvent un trustflow très faible voire nul, ce qui est normal et on ne va pas les supprimer pour autant.

Néanmoins, sous réserve de les vérifier manuellement, Les sites avec un trustflow de 0 permet de dégrossir et d’identifier rapidement certains mauvais liens entrants avant de les nettoyer.

Ce que je fais aussi c’est d’ajouter une nouvelle colonne au fichier excel que je nomme « TF/CF », soit le ratio entre le TrustFlow (qualité) et le CitationFlow (popularité). L’intérêt est d’identifier des sites qui ont beaucoup de popularité mais provenant de sites de faible qualité. Filtrer des domaines avec ratio TF/CF inférieur à 0,3 permet souvent de connaitre des sites qui ont recours à des stratégies abusives de linking. Et vaut mieux éviter de recevoir des liens de ce type de site.

Un autre ratio sympa à faire est le nombre de backlinks/nombre de pages indéxées par le domaine liant. Ca permet de réveler facilement les sites qui font anormalement des liens vers votre site. Sur Majestic SEO, cela correspond au ratio sur les critères « IndexedURLs / ExtBackLinks ».

7/ Supprimer les mauvais liens

Une fois qu’on connait tous les liens factices et les domaines spammy, il est temps de les supprimer. Pour cela, il y a principalement deux méthodes:

  • Contacter le webmaster: On l’a vu, dans certains cas, il est préférable de le contacter et même d’autres où il faut éviter. Pour connaitre le webmaster d’un site web, rubrique contact ou encore passez par un Whois.
  • Désavouer les liens: (Oui c’est toujours nécéssaire dixit Gary Illyes pour éviter des pénalités manuelles). Méthode qui consiste à dire Google de ne pas prendre en compte les liens de mauvaise qualité qu’on aura préalablement listé. Pour cela il suffit de se rendre sur la page de désaveu de liens de Google. Il suffit d’envoyer un simple fichier texte avec une URL par ligne. Et pour supprimer tous les liens d’un même domaine, il suffit d’ajouter « domain:exemple.fr ». Plus de détails sur l’aide de Google 

Conclusion

Même si cette méthodologie permet d’accélérer le processus de découverte des liens spammy, il faut souvent passer par une vérification manuelle pour lever les doutes sur des liens suspects. Et si la suppression des mauvais backlinks permettra au site de récupérer des positions dans les pages de résultats des moteurs de recherche, attention de ne pas aller trop loin pour ne pas en perdre…Il est nécéssaire aussi de faire une surveillance régulière des nouveaux backlinks afin de les corriger en temps réel.

Une solution complémentaire et même indispensable pour rééquilibrer un profil de liens bancal est de compenser par une stratégie de liens de qualité et du linkbaiting

< Audit de site ecommerceAudit technique SEO et crawl javascript >

    A propos de Serge Esteves

    Consultant SEO / Webmarketing : Techniques avancées en référencement combinées aux leviers du marketing entrant (SMO, content marketing, UX, ereputation, ..).
    Vous souhaitez vous joindre à la discussion ?