Indexation seo : Définition et bonnes pratiques

Que se passe-t-il lorsqu’un moteur de recherche a fini d’explorer une page ? Examinons le processus d’indexation que les moteurs de recherche utilisent pour stocker des informations sur les pages Web, ce qui leur permet de renvoyer rapidement des résultats pertinents et de qualité.

Pourquoi l’indexation par les moteurs de recherche est-elle nécessaire ?

Vous vous souvenez de l’époque où, avant l’arrivée d’Internet, vous deviez consulter une encyclopédie pour connaître le monde et fouiller dans les pages jaunes pour trouver un plombier ? Même aux premiers jours du web, avant les moteurs de recherche, nous devions consulter des annuaires pour retrouver des informations. Quel processus fastidieux.

Les moteurs de recherche ont révolutionné la recherche d’informations à tel point que les utilisateurs attendent des réponses quasi instantanées à leurs requêtes.

Qu’est-ce que l’indexation des moteurs de recherche ?

L’indexation est le processus par lequel les moteurs de recherche organisent les informations avant une recherche afin de permettre des réponses ultrarapides aux requêtes (via la balise title). La recherche de mots clés et de sujets dans des pages individuelles (Cf. notre article sur le copywritting) serait un processus très lent pour les moteurs de recherche afin d’identifier les informations pertinentes. Au lieu de cela, les moteurs de recherche (y compris Google) utilisent un index inversé, également appelé « reverse index ».

Qu’est-ce qu’un index inversé ?

Un index inversé est un système dans lequel une base de données d’éléments de texte est compilée avec des pointeurs vers les documents qui contiennent ces éléments. Ensuite, les moteurs de recherche utilisent un processus appelé tokenisation pour réduire les mots à leur signification principale, ce qui réduit la quantité de ressources nécessaires pour stocker et récupérer les données. Cette approche est beaucoup plus rapide que de répertorier tous les documents connus en fonction de tous les mots-clés et caractères pertinents.

Un exemple d’indexation inversée

Vous trouverez ci-dessous un exemple très simple qui illustre le concept d’indexation inversée. Dans l’exemple, vous pouvez voir que chaque mot clé (ou token) est associé à une rangée de documents dans lesquels cet élément a été identifié.

La version en cache d’une page

En plus d’indexer les pages, les moteurs de recherche peuvent également stocker une version en texte seul hautement compressée d’un document, y compris tout le HTML et les métadonnées. Le document mis en cache est le dernier instantané de la page que le moteur de recherche a vu.

Vous pouvez accéder à la version en cache d’une page (dans Google) en cliquant sur la petite flèche verte située à côté de l’URL de chaque résultat de recherche et en sélectionnant l’option « en cache ». Vous pouvez également utiliser l’opérateur de recherche Google « cache : » pour afficher la version en cache de la page.

Bing offre la même possibilité d’afficher la version en cache d’une page par le biais d’une flèche verte vers le bas située en regard de chaque résultat de recherche, mais ne prend pas en charge l’opérateur de recherche « cache : ».

Qu’est-ce que le PageRank ?

« Le PageRank est un algorithme de Google nommé d’après le cofondateur de Google, Larry Page (oui, vraiment !). Il s’agit d’une valeur pour chaque page calculée en comptant le nombre de liens pointant vers une page afin de déterminer la valeur de la page par rapport à toutes les autres pages sur Internet. La valeur transmise par chaque lien individuel est basée sur le nombre et la valeur des liens qui pointent vers la page en question.

Le PageRank n’est que l’un des nombreux signaux utilisés dans le vaste algorithme de classement de Google. Une approximation des valeurs du PageRank était initialement fournie par Google, mais elle n’est plus visible publiquement.

Bien que le PageRank soit un terme de Google, tous les moteurs de recherche commerciaux calculent et utilisent une mesure équivalente de l’équité des liens. Certains outils de référencement tentent de donner une estimation du PageRank en utilisant leur propre logique et leurs propres calculs. Par exemple, Page Authority dans les outils Moz, TrustFlow dans Majestic, ou URL Rating dans Ahrefs.

Comment le PageRank circule dans les pages

Les pages transmettent le PageRank, ou l’équité des liens, à d’autres pages par le biais de liens. Lorsqu’une page renvoie à un contenu situé ailleurs, elle est considérée comme un vote de confiance, dans la mesure où le contenu auquel elle renvoie est recommandé comme pertinent et utile pour les utilisateurs. Le nombre de ces liens – et la mesure de l’autorité du site web qui les a créés – détermine le PageRank relatif de la page liée.

Le PageRank est divisé de manière égale entre tous les liens découverts sur la page. Par exemple, si votre page comporte cinq liens, chaque lien transmettra 20 % du PageRank de la page à travers chaque lien vers les pages cibles. Les liens qui utilisent l’attribut rel= »nofollow » ne transmettent pas de PageRank.

L’importance des liens retour

Les backlinks sont la pierre angulaire de la façon dont les moteurs de recherche comprennent l’importance d’une page. De nombreuses études et tests ont été réalisés pour identifier la corrélation entre les backlinks et les classements.

Les recherches sur les backlinks menées par Moz montrent que pour les 50 premières requêtes de recherche Google (~15 000 résultats de recherche), 99,2 % d’entre elles avaient au moins un backlink externe. De plus, les référenceurs évaluent systématiquement les backlinks comme un facteur important dans le classement. A cela il faudra aussi évidemment penser au maillage interne.

A lire aussi : Suivi position SEO : Quels outils pour votre référencement ?

A lire aussi : SEO et SEA : Quelles différences ?

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *