Aller au contenu

BabelNet

Un article de Wikipédia, l'encyclopédie libre.

BabelNet
Adresse babelnet.org
Description Réseau sémantique
Commercial  Non
Publicité  Non
Type de site Base de données
Langue Multilingue
Inscription Facultative
Créé par Roberto Navigli
État actuel En activité

BabelNet[1],[2] est un réseau sémantique multilingue et une ontologie lexicalisée. BabelNet a été créé en intégrant automatiquement la plus grande encyclopédie multilingue – c’est-à-dire Wikipédia – avec le lexique de la langue anglaise le plus connu – WordNet. L’intégration a été réalisée par correspondance automatique. Les entrées manquantes dans d'autres langues ont été obtenues par des techniques de traduction automatique. Le résultat est un « dictionnaire encyclopédique » qui fournit des entrées lexicalisées dans la plupart des langues, reliées entre elles par une grande quantité de relations sémantiques.

Comme WordNet, BabelNet regroupe les mots de différentes langues par groupes de synonymes appelés Babel synsets. Pour chaque Babel synset, BabelNet fournit des définitions textuelles (appelées gloses) en plusieurs langues, obtenues à partir de WordNet et Wikipédia.

Statistiques

[modifier | modifier le code]

Au mois d'août 2016, la version 3.7 de BabelNet couvre 271 langues, dont toutes les langues européennes, la majorité des langues asiatiques et le latin. BabelNet 3.7 contient plus de 13 millions de synsets et à peu près 745 millions des sens (indépendamment de la langue). Chaque Babel synset contient en moyenne 2 synonymes par langue. Le réseau sémantique comprend toutes les relations lexique-sémantiques de WordNet (hyperonymie et hyponymie, méronymie et holonymie, antonymie et synonymie, etc., pour un total d'environ 364 000 arcs relationnels) ainsi qu'une relation générique de corrélation par Wikipédia (pour un total de 380 millions d'arcs). La version 3.7 fournit aussi 11 millions d’images associées à des Babel synsets et encode le réseau au format Lemon RDF.

Applications

[modifier | modifier le code]

BabelNet a été utilisé pour la réalisation d'un système de désambiguïsation et d'entity linking, Babelfy (en), qui - grâce à l'intégration entre les sens lexicographiques et les entités encyclopédiques en un seul réseau sémantique - obtient des performances à l’état de l’art en utilisant des algorithmes de graphes.

Notes et références

[modifier | modifier le code]
  1. R. Navigli and S. P Ponzetto. 2012. BabelNet: The Automatic Construction, Evaluation and Application of a Wide-Coverage Multilingual Semantic Network. Artificial Intelligence, 193, Elsevier, p. 217-250.
  2. R. Navigli, S. P. Ponzetto. BabelNet: Building a Very Large Multilingual Semantic Network. Proc. of the 48th Annual Meeting of the Association for Computational Linguistics (ACL 2010), Uppsala, Sweden, July 11–16, 2010, p. 216–225.