maillage interne

Le Maillage interne ou Comment faire du Multi PageRank Sculpting

SEO avancé

Le maillage interne est surement le levier le plus important en SEO et souvent négligé ou peu maîtrisé sur les sites web. Je constate régulièrement sur mes sites clients l’efficacité de l’optimisation des liens internes, d’autant plus sur de gros sites.

Google utilise plusieurs types de PageRank, algorithmes servant au classement des pages web sur le moteur de recherche, qui se basent justement sur les liens internes et externes. Dans cet article, on va s’intéresser au maillage de liens internes au site, c’est à dire au sein du même domaine et à ce que j’appelle le « Multi Pagerank sculping » soit la manière d’optimiser (sculpter) son maillage de liens en fonction de ses différents PageRanks.

C’est quoi le maillage interne ?

Le maillage interne c’est la manière d’interconnecter les pages entre elles par des liens dans le but d’optimiser la visibilité SEO. Ça consiste à dire à dire à Google, voici mes pages les plus importantes. Voila pour une définition simple et pour aller plus loin, je dirais que construire un maillage de liens internes efficace consiste à déséquilibrer la structure du site afin de répondre à plusieurs objectifs:

  • Améliorer l’exploration de Googlebot et le niveau d’indexation de son site
  • Améliorer son positionnement top tail (expressions concurrentielles) et longue traîne
  • Améliorer les positions des mots clés saisonniers
  • Améliorer l’expérience utilisateur afin qu’il reste sur le site et qu’il convertisse

Le maillage SEO comme je le conçois englobe l’optimisation de la structure du site, le maillage sémantique et l’architecture du site pour convertir l’utilisateur. Réduire le maillage interne à l’un ou l’autre de ces aspects est forcément réducteur et incomplet. L’idée c’est de combiner ces objectifs de la meilleure manière qui soit.

Les types de PageRank

Pour bien comprendre les principes et les stratégies de maillage interne, il est bon de comprendre le fonctionnement des PageRanks qui influencent la manière de bien mailler ces pages internes. Le Pagerank historique est à la base de la construction du moteur de recherche Google. C’est une mesure quantitative de la popularité d’une page se basant essentiellement sur le nombre de liens qu’elle reçoit. Mais depuis plusieurs années maintenant, Google utilise plusieurs types de PageRank, plus qualitatifs, afin d’améliorer la pertinence de ses résultats.

Le PageRank traditionnel

Transmission du pagerank via le modèle du surfeur aléatoire et celui du surfeur raisonnable – Sources des images: brevets Google.

Le PageRank correspond à la probabilité d’un internaute de cliquer sur un lien. Historiquement, cette probabilité se base sur le modèle du surfeur aléatoire qui signifie que chaque lien à la même probabilité d’être cliqué sur une page. Par conséquent, tous les liens d’une même page liante transmettent la même part de jus à toutes les pages liées. Un autre point important de la formule « PR(A) = (1-d) + d (PR(T1)/C(T1) + … + PR(Tn)/C(Tn)) », est que chaque page a son propre pagerank (0,15) en dehors des liens qu’elle reçoit (faible mais non négligeable sur un gros volume de pages). Ce modèle « simple et facile » à calculer a fait le succès de Google et de ses fondateurs Larry Page et Sergei Brin, mais il n’est plus suffisant.

On peut facilement comprendre que ce modèle n’est pas assez pertinent car tous les liens sur une même page n’ont pas la même probabilité d’être cliqué. Des stratégies de netlinking abusives ont tenté et tentent toujours d’exploiter cette défaillance de l’algorithme, ce qui a contraint Google à affiner ses algorithmes avec différents filtres comme Penguin qui « pénalise » la suroptimisation.

Cette transmission uniforme du pagerank ou du jus de lien n’est pas réaliste. En 2004, Google a déposé un brevet sur un nouveau modèle dit du surfeur raisonnable. Ce modèle explique que certains liens ont plus de chances d’êtes cliqués que d’autres, chaque lien n’a pas la même probabilité d’être suivi, ce qui est plus réaliste et plus proche du comportement d’un internaute. Le brevet explique les méthodes de calcul de cette probabilité et il parle aussi d’un nouveau PageRank basé sur le comportement utilisateur.

Le PageRank utilisateur

C’est donc ce même brevet qui parle de la première fois de ce nouveau « rank » basé sur le comportement utilisateur. Aucun nom ne lui a été donné, et je l’ai donc simplement baptisé « PageRank Utilisateur ». En 2015, je l’avais même nommé « behavior rank » dans cet article du JDN , mais vu que tout le monde n’est pas bilingue ;), j’ai opté pour plus de simplicité.

Ce Pagerank utilisateur se base sur 2 critères principaux:

  • Les caractéristiques d’un lien : positions du lien, contexte sémantique, nombre de mots de l’ancre du lien, …
  • Les critères d’usage : à quelle fréquence un lien est cliqué, l’intérêt de l’utilisateur sur la page liée,..

Plusieurs données analytics permettent de mesurer l’expérience utilisateur comme le temps passé sur une page, le taux de rebond, le CTR (taux de clics) et la manière de construire ses liens internes contribue à améliorer le comportement de l’internaute. D’autres brevets ont suivi sur la prise en compte de l’expérience utilisateur comme celui-ci. Ce qu’il faut retenir c’est qu’une page doit être utilisé par les visiteurs et faire en sorte qu’ils passent du temps sur le site.

Le FreshRank

Chaque requête a un différent besoin de fraîcheur dans les résultats retournés par Google. Amit Singhal, un des responsables de Google, décrit 3 types de requêtes qui demandent souvent du contenu frais:

  • Les événements récents : « Macron président » (ah, pas encore)
  • Les événement récurrents:  « soldes d’hiver »
  • les requêtes souvent mises à jour: « Le meilleur smartphone »

On peut aller plus loin car chaque requête a un différent besoin de fraîcheur comme le confirme ce brevet Google, pouvant aller de quelques jours à plusieurs années. Les critères de fraîcheur ne sont pas seulement liés au changement de contenu dans la page puisque ce même brevet explique que les liens depuis les contenus frais ont plus de poids que d’autres liens. Sur ce brevet, Les parties sur le linking sont d’ailleurs importantes puisque le terme « link » y apparaît 54 fois.

Un autre brevet nommé « time based ranking »  énonce l’utilisation du taux de clic pour déterminer le besoin en fraîcheur des résultats. Pour résumer, lorsque Google détecte un changement brusque des taux de clics sur une requête, c’est un signal pour apporter davantage de contenu frais.

Le Pagerank Sémantique

La pertinence sémantique est sans doute le point sur lequel Google a le plus progressé. Je parlais déjà des différents algorithmes permettant de calculer les pageranks thématiques dans le guide sur l’audit sémantique. Pour résumer, il y a deux algorithmes à connaitre pour bien comprendre le maillage sémantique:

  • Le topic senstive pagerank: Très proche du pagerank traditionnel mais avec une bonne dose de contextualisation sémantique des liens. Une même page possède plusieurs pagerank thématiques qui permettent de calculer la proximité sémantique avec une thématique. Pour faire simple, cet algorithme attache une importance au fait que liens entre les pages soient proches sémantiquement.
  • LSI – Indexation Sémantique latente: Il mesure la pertinence d’une page sur une requête, sur son utilisation des termes souvent associés et plus rarement associés dans le corpus sémantique de la requête. C’est ce qui va nous permettre de construire de la contextualisation autour du lien interne, soit le voisinage de mots clés autour du lien.

C’est en 2013, lors de la sortie de la mise à jour « colibri » (hummingbird) qu’un grand pas dans la recherche sémantique a été fait. Cette mise à jour, sorti en même temps que la recherche vocale sur google, tente de répondre de manière plus fine et plus précise aux requêtes des internautes. Google ne se contente pas de renvoyer des résultats contenant les mots clés de la requête mais essaye d’identifier l’intention de recherche. Par exemple, Lorsqu’on cherche « quel est le meilleur endroit pour une pizza », Google renvoie des adresses de pizzeria.

Le Pagerank Sculpting

Tout d’abord, lorsque je parle de PageRank Sculpting qu’on appelle aussi PR sculpting ou PR modeling, je ne fais pas référence aux pratiques qui consistaient à mettre en nofollow des liens vers des pages inutiles afin de récupérer du jus vers les autres pages. Ça fait plusieurs années que ça ne fonctionne pas, pas avec du nofollow en tout cas.

Le PageRank sculpting ou le multi Pagerank Sculpting consiste à relier les pages entre elles afin que LES PageRanks transitent dans la structure du site vers les pages stratégiques. Il s’agit d’apporter plus de poids ou plus de jus aux pages qui en ont besoin. C’est en cela que je parle de déséquilibre, notion fondamental du pagerank sculpting, car il ne s’agit pas de lier toutes les pages entre elles de manière uniforme, ça n’aurait pas de sens car toutes les pages ne sont pas porteuses du même potentiel de trafic.

Mais il ne s’agit pas que de trafic en réalité, je préfère parler de pages stratégiques qui englobent:

  • Les pages servant à l’exploration d’autres pages: Même si l’objectif principal est de déséquilibrer la structure, il faut en même temps faire en sorte qu’un maximum de pages soient explorées et indexées
  • Les pages génératrices de trafic: Les pages porteuses principalement d’expressions concurrentielles ont besoin de plus de liens que des pages porteuses principalement d’expressions longues traînes, sachant qu’une même page peut répondre à de la top et longue traîne d’où le « principalement ».
  • Les pages génératrices de conversions: C’est un point qui n’est pas toujours pris en compte mais qui peut se révéler essentiel sur un site e-commerce par exemple.

Le Multi PageRank Sculpting doit donc servir ces 3 types de pages en se servant du maillage structurel (agir sur le pagerank traditionnel), du maillage sémantique (agir sur le pagerank sémantique) et d’une architecture pensé utilisateur (pagerank utilisateur). La tâche n’est pas facile, et parfois certaines actions qu’on verra par la suite agiront surtout sur un aspect et moins sur l’autre, mais il faut garder ce principe en tête et dans ces calculs. Ce qu’il ne fait pas faire, c’est par exemple penser uniquement sémantique et pas du tout structurel, ou vice versa.

Maillage structurel

Dans un but pédagogique, je découpe les différents types de maillage interne par objectifs mais en réalité et idéalement un bon maillage doit être à la fois structurel, sémantique et pour l’utilisateur.

Le maillage structurel a pour objectif principal l’exploration des pages et le déséquilibre de la structure vers les pages importantes.

Il y a plusieurs indicateurs à connaitre pour optimiser sa structure:

  • La profondeur
  • le nombre de liens entrants par url
  • Le pagerank interne
  • L’efficacité des pages via des ratios comme crawl / visites ou Pri / visites
  • Les pages inutiles

On peut extraire ces données grâce à un crawler (ex: botify), outil qui explore les pages accessibles sur un site et calcule ce type de données, outil indispensable lorsqu’on audite le maillage interne d’un site.

Profondeur

C’est le nombre de clics pour atteindre une page depuis la page d’accueil. La page d’accueil commence à 0 et chaque clic correspond à une profondeur. Plus une page est profonde et plus elle sera considérée comme peu importante par Google. C’est assez logique, pourquoi Google donnerait de l’importance à une page cachée au fond du placard. L’autre explication est plus mécanique, une page plus profonde recevra moins de jus de lien et aura moins de chance de remonter dans les pages de résultats sur des expressions concurrentielles.

Le nombre de liens entrants par url

Ça permet notamment d’identifier où se concentre les liens et d’apporter des solutions correctives le cas échéant.

Le pagerank interne

Visualisation du pagerank interne en camenbert VS gephi

C’est une donnée calculée par certains crawlers qui simule le pagerank traditionnel transmis à chaque page ou groupe de page. Le pagerank interne est calculé en fonction du nombre de liens entrants et sortants de chaque page, de leur profondeur et permet d’avoir une bonne idée du poids d’une page ou d’une catégorie de pages dans une structure. On peut par exemple se rendre compte que beaucoup de pagerank est transmis à des pages peu stratégiques.

Le pagerank interne envoyé à chaque page sera aussi responsable du volume de crawl par googlebot. Une page qui reçoit beaucoup de jus aura tendance à être plus crawlé que les autres. C’est là qu’intervient la notion de budget de crawl, car Google a un temps limité pour explorer un site et il est donc important d’optimiser ce temps vers les bonnes pages.

Sur le graphe au dessus, je me suis amusé à mettre en parallèle la visualisation du pagerank interne avec un camembert et de l’autre côté, avec un outil de visualisation Gephi. Juste pour dire qu’un bon graphe sur excel, c’est peut être moins impressionnant mais quand même plus lisible qu’un joli graphe très peu exploitable opérationnellement.

L’efficacité des pages via les ratios crawl / visites ou Pri / visites

Là, c’est plus compliqué, en plus du crawl, cela nécessite l’analyses des logs serveur afin d’extraire les données de crawl de GoogleBot. En croisant les données de crawl du crawler et les données de crawl de Googlebot, on peut extraire des indicateurs comme « PageRank Interne (Pri) / visites ». Tous les crawlers ne font pas d’analyses de logs et il y en encore moins qui croisent les données de logs et données de crawl. De plus, aucun outil du marché (pour l’instant)  ne donne directement ce type de données qu’il faut simplement extraire via un petit traitement sur excel par exemple.

C’est pourtant essentiel de comprendre la relation entre le pagerank interne reçu par une page et sa capacité à générer des visites. Si par exemple, une page ou un groupe de pages est très favorisé dans la structure mais qu’il génère que très peu de visites, c’est certainement que cette page a un problème: manque de contenu, mauvais ciblage sémantique, duplication, cannibalisation, problème technique (noindex, canonical ?)

Sur ce graphe ci-dessous, l’intérêt est de visualiser les pages efficaces mais avec un taux de crawl faible:

Les « pages-région » sont efficaces car elles font des visites pour un faible volume de crawl, mais elles ont un taux de crawl faible (40%), ce qui signifie que Google que voit que 40% de ces pages. En optimisant le maillage vers ces pages, on va pouvoir les pousser et les faire remonter dans les pages de résultats assez facilement.

Les pages inutiles

Les pages inutiles sont des pages sans objectifs de référencement qui gaspillent inutilement du précieux jus de lien au détriment d’autres pages et du budget de crawl aussi. Les pages inutiles ne sont pas forcément inutiles à l’utilisateur, il peut s’agir de pages formulaires par exemple mais les gens ne cherchent pas directement sur Google des formulaires en général.

Comment éviter de gaspiller du jus vers ces pages inutiles ? On l’a vu, le nofollow ne fonctionne pas. Le plus simple et le plus propre, c’est de supprimer les liens, possible lorsqu’il s’agit d’alléger un footer trop chargé par exemple. Dans d’autres cas, il faudra réaliser de l’obfuscation de liens (cacher les liens) via des techniques de cryptage (liens visibles pour l’utilisateur mais pas pour Google) ou d’autres méthodes comme les iframes. Concernant la technique d’obfuscation, c’est une méthode « grey hat » mais qui est utilisé sur tous les gros sites (allociné, cdiscount,..)

 

Maillage sémantique

Dans le cadre du maillage sémantique, il y a 3 principales actions:

  1. Réaliser une analyse sémantique ciblée sur l’intention de recherche
  2. Faire un maillage en silo (liens vers des pages proches sémantiquement)
  3. Faire du cloisonnement sémantique

1/ L’analyse sémantique

Avant de lier les pages entre elles, il faut déjà savoir de quoi on parle. L’analyse sémantique va permettre de définir en amont un planning éditorial et/ou une catégorisation optimale pour un menu de navigation et l’arborescence d’un site. Lors de cette analyse, on se rendra compte que certianes pages existantes ont déjà du potentiel pour remonter sur certaines requêtes, il faudra les optimiser avec un maillage adaptée et/ou en enrichissant leur contenu. Dans d’autres cas, l’analyse sémantique révélera aussi des univers manquants sur lequel le site n’est pas présent et pour lequel il faudra créer des pages.

2/ Le maillage en silo

La proximité sémantique signifie que des concepts sont souvent rencontrés ensemble au sein d’un corpus sémantique. Certains calculs comme la similarité cosinus permettent de quantifier cette proximité en analysant le nombre d’occurences des mots clés autour d’un sujet et pondérés par le TF-IDF. Ca c’est pour la théorie, mais bien souvent il faudra passer par une classification manuelle pour faire un travail propre, avec l’aide d’outils (je donne quelques outils en bas de l’article). Pour faire ce travail manuelle, on peut se servir d’un outil de mindmapping afin de créer un arbre de concepts.

Une structure en silo permet justement de lier entre elles des pages qui traitent d’un même univers sémantique en partant du sujet le plus large au plus précis (pas trop précis non plus, ça dépend du niveau de compétition du sujet). On le verra sur quelques exemples concrets de maillage un peu plus tard, mais dans un site e-commerce il est important de bien découper ses différentes catégories , sous catégories et sous-sous catégories au niveau de l’intention de l’utilisateur et pas simplement avec une vision métier. L’idée c’est de montrer à Google qu’on est expert sur un sujet et qu’on le traite en profondeur.

3/ Le cloisonnement sémantique

Toujours dans l’esprit de la stratégie en silo, il faut éviter que des pages qui traitent d’un sujet A fassent trop de liens vers un sujet B éloigné. Là aussi, comme pour la maillage structurel et éviter de faire des liens vers des pages inutiles, on peut avoir recours à de l’obfuscation ou opter pour des systèmes dynamiques intelligents qui permettront de lier naturellement et proprement les pages de la même thématique.

C’est utile aussi pour l’utilisateur lorsque c’est bien fait. Malgré tout, toujours pour des questions d’expérience utilisateur et aussi pour d’autres points structurels vus plus haut, on se permettra de mettre en place quelques passerelles vers d’autres univers. Il faut aussi se rappeler que tous les liens n’ont pas le même poids au sein d’une page, conformément au modèle du surfeur raisonnable.

Le cocon sémantique

Je reviens sur la notion de cocon sémantique qui est une forme de maillage sémantique inventé par Laurent Bourelly. Pour faire simple, le cocon sémantique c’est un maillage en silo avec une bonne dose de contextualisation et d’étancheité (cloisonnement sémantique c’est pareil), ce qu’on vient de voir plus haut. La contextualisation consiste à faire des liens entre une page cible et une page fille qui élargit la thématique de la première. L’étanchéité consiste à faire en sorte que les pages d’un même silo thématique ne fassent pas de lien vers un autre silo.

Jusque là, c’est dans le même esprit de ce qu’on vient de voir. Les différences résident dans certaines règles plus strictes entre pages mères, pages intermédiaires et pages filles.

Le positif de la méthode:

  • c’est la réflexion sur le sujet
  • le fait de mettre en avant l’intention de l’internaute plutôt que simplement la requête ou le mot clé
  • d’avoir popularisé ou repopularisé le siloing sous une différente forme
  • d’avoir formalisé une méthode (un peu stricte cependant)
  • d’avoir remis en lumière un aspect fondamental du SEO, soit le maillage interne
  • et d’avoir permis une discussion poussée sur la sémantique en SEO, suivi par d’autres référenceurs comme Chritian Méline.

Les inconvénients et ce que je reproche:

  • Le fait que c’est rarement applicable à fond sur un site, d’autant plus sur de gros sites.
  • Surtout adaptables pour du blogging
  • Le côté un peu trop commercial de l’affaire pour vendre des formations, des outils et qui se fait forcément au détriment d’une certaine objectivité.
  • Le côté trop stricte et d’affirmer que c’est la seule façon pour que ça marche
  • Le fait d’avoir repris de vieux concepts en leur redonnant un coup de fraîcheur avec de nouveaux termes pour dire la même chose.
  • Le fait de rendre compliqué des choses assez simples finalement et une certaine tendance à faire du « mot scientifique » dropping.
  • Avec cette méthode, on a tendance à oublier qu’une même page peut se positionner sur plusieurs mots clés. A certains égards on est pas loin des pages satellites (technique pénalisable) si c’est industrialisé et si ce n’est pas correctement appliqué.
  • Le fait que le cocon sémantique fonctionne en vase clos, souvent en dehors de la structure « normal » du site, c’est à dire sans les autres facteurs composant globalement l’optimisation du maillage interne comme l’expérience utilisateur ou l’aspect structurel

Le fait est qu’il y a un manque de recul aujourd’hui sur la méthode. Certains résultats soit disant obtenus grâce au cocon sémantique sont difficilement vérifiables. Est-ce que ce n’est pas uniquement grâce à l’étanchéité des liens que certaines positions sont obtenus ? Pour appliquer régulièrement cette méthode de cloisonnement sur mes sites client depuis plus de 10 ans, c’est évident que ça apporte rapidement des résultats. Est ce que le maillage strict proposé entre page cible, page intermédiaire, page fille est vraiment nécessaire ? Est-ce que ce n’est pas simplement la technique du silo qui fonctionne car le cocon n’est qu’une sous-forme du siloing amélioré ?

Architecture Utilisateur (UX)

Un bon maillage de liens peut largement contribuer à offrir une bonne expérience utilisateur. D’ailleurs le fonctionnement des algorithmes de Google s’inspirent largement des principes de l’expérience utilisateur. Plusieurs notions s’appliquent comme l’ UX design pour bien positionner et mettre en forme les liens de façon à que leur finalité soient compréhensibles pour l’utilisateur. On peut aussi appliquer une certaine forme de sérendipité contrôlée dans la construction de certains blocs de liens. Par exemple, sur Amazon, les rubriques du type « Les clients ayant acheté cet article ont également acheté » propose des liens vers des produits basés sur le comportement d’achats des internautes, même si en réalité ce système se base aussi sur des produits de thématiques proches.

La visibilité des liens internes par l’utilisateur va jouer sur le pagerank utilisateur et les critères d’usage. Les liens internes vers les pages importantes doivent être cliqués par les internautes.

Exemples de maillage interne

Je vais essayer de donner quelques exemples de bonnes pratiques de maillage interne, même si bien souvent les meilleures méthodes sont personnalisées en fonction du site, de sa volumétrie, de sa ou ses thématiques, de ses objectifs.

Le fil d’ariane

Le fil d’ariane a un rôle indispensable de navigation remontante car il permet d’apporter autant de jus aux pages supérieures que de pages profondes. Attention à ce que le fil d’ariane ne soit pas généré par des cookies et uniquement en fonction de la navigation de l’internaute, car dans ce cas Google ne sera pas capable de voir le fil d’ariane vu qu’il n’aime pas les cookies. Le fil d’ariane, idéalement, détaillera tous les chemins de navigation (ou les principaux) vers une page produit. Si c’est n’est pas possible pour des questions de design ou autres, on peut très bien le substituer par d’autres blocs de navigation remontante

Les paginations

Les paginations sont très peu efficaces dans le cadre d’un bon maillage car elles sont peu utilisées par les visiteurs. Elles sont très peu crawlées par Googlebot. L’objectif sera justement de s’en passer le plus possible :

  • En créant une catégorisation suffisamment fine pour permettre l’exploration de l’ensemble de ces pages.
  • En augmentant le nombre de produits listés par page (en allant pas trop loin non plus pour des questions de temps de chargement et de dilution du pagerank)
  • Et pour celles qui restent, passez par une pagination optimisée afin de limiter la perte de jus et optimiser les niveaux de profondeur.

Schéma de pagination optimisée

Navigations transversal

La navigation transversale ou cross linking consistent à lier les pages d’un même niveau entre elles. On ajoute à cela un peu de déséquilibre structurel et des liens thématiques, et on obtient un puissant bloc de liens internes. Quelques exemples:

  • Meilleures ventes d’une catégorie (pour un site e-commerce)
  • Top destinations d’une région (pour un site de voyage)
  • Produits avec les meilleurs avis
  • Articles en relation

Liens vers du contenu frais

Ajouter régulièrement du contenu frais sur son site ou mettre à jour une page (ex: une grosse partie dans le corps de texte) va agir sur le freshrank . Mais ajouter des liens vers d’anciennes pages depuis des contenu frais va jouer aussi sur le freshrank. Le poids des liens depuis des contenus fraîchement publiés aura plus de poids que des vieux liens. Dans ce cadre, il est intéréssant de faire des liens manuellement ou dynamiquement vers des contenus pérennes et plus anciens depuis des nouvelles pages.

Liens contextuels

Les liens contextuels sont des liens dans le corps de texte d’une page, si possible en haut de page qui apporteront plus de popularité qu’un lien en footer ou dans une barre latérale. C’est le meilleur lien interne qui soit car c’est souvent le plus naturel et souvent réalisé manuellement. On l’utilise souvent dans les articles de blog par exemple. Méfiez vous des plugins qui automatise ce type de liens lorsqu’ils rencontrent certains mots clés, c’est souvent le risque de faire de la suroptimisation si c’est mal maîtrisé.

Blocs de liens dynamiques

Le principe est de stocker en base de données:

  • Page liante
  • Page liée
  • score de pondération
  • score thématique
  • ancre de lien

On ajoute à cela un script « intelligent » pour lequel il faut définir le nombre de liens par page liantes, le nombre d’ancres de liens différents que doit recevoir chaque page, le nombre de liens maximum que peut recevoir une page liée. Pour ce dernier point, le nombre de liens reçus dépendra d’un score de pondération. Ce score peut être calculé en fonction de la somme des volumes de recherches des mots clés visés par la page liée.

Les volumes de recherches peuvent varier en fonction de la saisonnalité d’une requête et donc le score de pondération peut varier également dans le temps, ce qui devient intéressant pour pousser les mots clés saisonniers.

Pour le score thématique, on peut ajouter un score qui permettra de vérifier la présence de l’ancre dans le contenu de la page liée et le nombre de mots clés en commun entre page source et page de destination.

L’ancre de lien sera défini en amont en fonction d’une analyse sémantique, voire dynamiquement en fonction de l’analyse des recherches sur le site (dans ce cas prévoir n occurences pour valider l’ancre). Ici, on est bien sûr dans des développements plus lourds et à adapter pour chaque site mais qui peuvent avoir de très bons résultats avec l’aide d’un bon référenceur et d’un bon développeur.

A ne pas faire en linking interne

Ca va être dur d’être exhaustif mais je vais essayer:

Ne pas faire de liens sortants: c’est une mauvaise compréhension du pagerank qui pousse parfois certains à ne pas faire de liens vers d’autres sites afin de garder le jus sur leur site. Une page ne perd pas de pagerank en faisant des liens vers d’autres pages, elle distribue une partie de son pagerank mais le perd pas. Une page PR5 (cet exemple n’a pas de sens car le PR toolbar n’existe plus, et il n’a jamais vraiment existé en fait) avec 100 liens sortants aura le même pagerank qu’une page PR5 avec 0 liens sortants. Beaucoup de référenceurs le pensent si ce n’est la plupart. La faute à des années de faux schéma de distribution du pagerank sous forme de verres, de bouteilles ou de récipients qui transmettent le fameux liquide (linkjuice) d’une page à une autre à travers des trous représentant les liens, ce qui induit une perte de jus. En fait, il faudrait voir la distribution du pagerank comme un flux lumineux qui se sépare en plusieurs flux à travers une passoire dont chaque trou représente un lien. De plus, faire des liens sortants permettra justement de donner plus de pertinence à votre document en lui apportant plus d’autorité et de crédibilité.

Les mega footer: On l’a vu, ça ruine toute contextualisation sémantique, ca dilue le pagerank souvent vers des pages inutiles, ca créer des blocs de contenu dupliqués (boilerplate)

Les mega menu: Pareil pour que le méga footer. Les méga menu sont vraiment une plaie pour le SEO. En fonction des templates de pages, il faut fermer certains niveaux (réellement ou par des techniques de cryptage) pour garder le jus vers la navigation descendante et garder de la contextualisation sémantique.

Répéter les mêmes ancres de liens: Attention à la suroptimisation et pensez LSI, répétez les mots clés exacts ne suffit pas.

Les pages cul de sac: appelé aussi « dangling page », ce sont des pages sans aucun lien interne sortant et renvoyant vers la structure (ex: popups) de telle sorte que le pagerank transmis à ces pages n’est pas redistribué au reste du site. Ce sont des sortes de trou noir à pagerank.

Outils utiles pour le maillage interne

Le plus indispensable c’est biensûr d’utiliser un crawler:

Quelques crawlers en saas:

Quelques crawlers en logiciel local:

L’analyse de logs sert aussi a déterminer les pages plus ou moins efficaces:

Quelques analyseurs de logs:

Pour bien construire ses silos :

Quelques outils sémantiques:

  • searchintent: Pour trouver l’intention de recherche derrière un mot clé et construire son arbre de concepts
  • Answerthepublic: Très bien aussi pour faire la même chose et d’autres analyses
  • texstat: pour créer son propre corpus sémantique à partir d’une liste de résultats Google
  • seoquantum: Pour le maillage sémantique (et les cocons aussi)

Et pleins d’autres outils sont utiles pour optimiser ses liens internes: Un bon tableur excel aussi, un outil de mindmapping comme freemind, un outil de mockup comme balsamik, le plugin web developper et sa fonction « resize » pour voir son site dans différentes résolutions, un café, un cerveau disponible,… Ça demande du temps et de la réflexion pour faire cohabiter tous les objectifs d’un bon maillage de liens internes.

 

Le glossaire du crawl en SEO >

    A propos de Serge Esteves

    Consultant SEO / Webmarketing : Techniques avancées en référencement combinées aux leviers du marketing entrant (SMO, content marketing, UX, ereputation, ..).

    Vous souhaitez vous joindre à la discussion ?