Étiquetage grammatical
|
|
Cet article est une ébauche concernant la linguistique.
Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.
|
En linguistique, l'étiquetage grammatical (POS tagging : part-of-speech tagging en anglais) est le processus qui consiste à associer aux mots d'un texte leur fonction grammaticale, grâce à leur définition et leur contexte (c'est-à-dire leur relation avec les mots adjacents dans un terme, une phrase ou un paragraphe).
[modifier] Exemple
- Texte original :
Nous sommes allées en Bretagne contempler de magnifiques allées couvertes du Néolithique.
- Texte étiqueté :
Nous/PRO:PER sommes/VER:pres allées/VER:pper en/PRP/en Bretagne/NAM contempler/VER:infi de/PRP magnifiques/ADJ allées/NOM couvertes/VER:pper du/PRP:det Néolithique/NAM ./SENT
[modifier] Logiciels
Les étiqueteurs grammaticaux sont très nombreux pour les langues saxonnes et rares pour le français. Les étiqueteurs fonctionnels associés à un modèle pour le français prêt à l'emploi sont le TreeTagger, LIA Tagg du Laboratoire Informatique d'Avignon, Cordial Analyseur de Synapse Développement ou le Stanford Tagger de l'Université Stanford. De nombreux autres logiciels fonctionnent pour le français, mais ils nécessitent d'être entraînés sur un corpus français pré-étiqueté.
[modifier] Liens externes
- Cordial Analyseur
- LIA Tagg 1.1
- Stanford Tagger (disponible en français depuis le 6 janvier 2012)
- TreeTagger