Index inversé

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

En informatique, un index inversé est une correspondance entre du contenu, comme des mots ou des nombres, et sa position dans un ensemble de données comme un enregistrement en base de données, un document ou un ensemble de documents ; sur le même principe qu'un index terminologique. Le but de l'index inversé est de permettre une recherche plein texte plus rapide, contre un temps d'insertion de nouvelles données augmenté.

Exemple[modifier | modifier le code]

Soient les documents suivant D1 = "L'art de plaire est l'art de tromper.", D2 = "Nous avons l’art, afin de ne pas mourir de la vérité.", un index inversé simple aurait cette forme :

 "art"        {D1, D2}
 "plaire"     {D1}
 "est"        {D1}
 "tromper"    {D1}
 "nous"       {D2}
 "avons"      {D2}
 "afin"       {D2}
 "pas"        {D2}
 "mourir"     {D2}
 "vérité"     {D2}

Dans l'exemple les mots de moins de trois lettres ont été ignorés, le nombre d'apparitions du mot (utilisé pour le TF-IDF) et sa position dans le texte ne sont ici pas pris en compte.


Voir aussi[modifier | modifier le code]