Étiquetage grammatical

Un article de Wikipédia, l'encyclopédie libre.
Aller à : Navigation, rechercher

En linguistique, l'étiquetage grammatical (POS tagging : part-of-speech tagging en anglais) est le processus qui consiste à associer aux mots d'un texte leur fonction grammaticale, grâce à leur définition et leur contexte (c'est-à-dire leur relation avec les mots adjacents dans un terme, une phrase ou un paragraphe).

[modifier] Exemple

  • Texte original :

Nous sommes allées en Bretagne contempler de magnifiques allées couvertes du Néolithique.

  • Texte étiqueté :

Nous/PRO:PER sommes/VER:pres allées/VER:pper en/PRP/en Bretagne/NAM contempler/VER:infi de/PRP magnifiques/ADJ allées/NOM couvertes/VER:pper du/PRP:det Néolithique/NAM ./SENT

[modifier] Logiciels

Les étiqueteurs grammaticaux sont très nombreux pour les langues saxonnes et rares pour le français. Les étiqueteurs fonctionnels associés à un modèle pour le français prêt à l'emploi sont le TreeTagger, LIA Tagg du Laboratoire Informatique d'Avignon, Cordial Analyseur de Synapse Développement ou le Stanford Tagger de l'Université Stanford. De nombreux autres logiciels fonctionnent pour le français, mais ils nécessitent d'être entraînés sur un corpus français pré-étiqueté.

[modifier] Liens externes

Outils personnels
Espaces de noms

Variantes
Actions
Navigation
Contribuer
Imprimer / exporter
Boîte à outils
Autres langues