Aller au contenu

Étienne Brunet (linguiste)

Un article de Wikipédia, l'encyclopédie libre.
Étienne Brunet
Description de l'image Etienne Brunet.png.
Naissance (88 ans)
Nationalité Drapeau de la France Français
Diplôme
Docteur d’État
Profession
Professeur émérite des universités
Activité principale
Linguistique, statistique, informatique
Formation
Université de Nice Sophia Antipolis - CNRS (UMR « Bases, Corpus, Langage »)

Étienne Brunet est un linguiste français né le à La Pommeraye (Maine-et-Loire). Normalien, agrégé de lettres classiques, docteur d’État, il a été professeur de l’université de Nice Sophia Antipolis, où il fonde le laboratoire Bases, Corpus, Langage (UMR 7320)[1]. Pionnier de la linguistique informatique et de la statistique textuelle française, à la suite de Pierre Guiraud et de Charles Muller, il est le concepteur du logiciel universitaire Hyperbase[2], dont il livre en 2022 la version 10.0, et qu’il applique à de très grands corpus (Hugo, Balzac, Zola, de Gaulle, Frantext, Google Books, etc.). Auteur de plus de cent articles et d’une douzaine d’ouvrages, il donne à la lexicométrie littéraire une œuvre théorique et pratique importante dont Le Vocabulaire français de 1789 à nos jours (Genève-Paris, Slatkine-Champion, 1981, 3 tomes, 1824 p.) ou Tous comptes faits. Questions linguistiques (Paris, Champion 2016).

Originaire de l’ouest de la France, Étienne Brunet est formé dans une institution religieuse, passe le baccalauréat à Poitiers et, après une préparation à Lyon, intègre l’ENS Ulm à Paris. En 1963, il est reçu à l’agrégation de lettres classiques et se destine à l’enseignement.

Carrière universitaire et recherches

[modifier | modifier le code]

Assistant, puis chargé de recherche au Centre national de la recherche scientifique (CNRS), il est nommé professeur à l’université de Nice en 1981. En 1980, il fonde le laboratoire « Statistique linguistique » (URL9[Quoi ?] de l’INaLF) qui deviendra l’unité mixte de recherche (UMR) « Bases, Corpus, Langage » (CNRS-Université de Nice Sophia Antipolis). Il le dirige pendant 16 ans et anime toujours les séminaires dans les années 2010. Bénéficiant de l’appui du Centre de Recherche IBM La Gaude, Étienne Brunet comprend précocement la révolution numérique naissante et en devient un acteur majeur dans le domaine des sciences humaines et sociales. Il écrit et publie ses premiers programmes dès 1970 et met au point de nouveaux indices statistiques pour décrire les textes comme dans sa thèse d’État sur Giraudoux soutenue en 1976 : il n’aura dès lors de cesse, en littéraire qu’il reste, d’instrumenter la philologie, la linguistique et les études littéraires par l’informatique et les traitements statistiques.

Responsabilités scientifiques

[modifier | modifier le code]

Étienne Brunet participe à la vie scientifique locale, nationale et internationale au sein de différentes instances : le CNRS (dont il a été médaillé de bronze en 1976), le Conseil national des universités (CNU - section linguistique), l’université de Nice Sophia Antipolis (UNS), l’Institut national de la langue française (INaLF), le Conseil international de la langue française (CILF), l’Association for Literary and Linguistic Computing (en) (ALLC) , les Journées internationales d’analyse statistique de données textuelles (JADT), les éditions Honoré Champion, Computers and the Humanities (publication de l’Association for Computers and the Humanities (en) ou ACH), les Cahiers de lexicologie, etc. Il collabore et se noue d’amitié avec Pierre Guiraud, Paul Imbs, Roberto Busa, Charles Muller, Bernard Quemada, Étienne Evrard, Jean-Paul Benzécri, Antonio Zampolli, Joseph Raben, Robert Martin, Maurice Tournier, Gunnel Engwall, Bernard Cerquiglini, Lou Burnard, André Salem, Ludovic Lebart ou François Rastier. Il forme et influence plusieurs générations de chercheurs : Sylvie Mellet, Jean-Marie Viprey, Carlos Maciel, Véronique Magri, Dominique Longrée, Magareta Kastberg, Damon Mayaffre, Céline Poudat.

Après vingt ans d’expériences en divers langages sur gros systèmes, Étienne Brunet se tourne vers les microordinateurs et crée en 1989 le logiciel Hyperbase[2] à l’occasion du Bicentenaire de la Révolution française, au Centre Georges-Pompidou. Il l’améliore continûment pendant 25 ans au rythme des évolutions technologiques et des progrès de la discipline ; il le développe en 2017 sous Windows dans sa version 10.0. Le logiciel permet de traiter de grands corpus textuels en favorisant la recherche documentaire et la navigation hypertextuelle d’une part (retour au texte, concordancier, convocation de contexte) et un traitement statistique élaboré d’autre part (index fréquentiel, calcul de la richesse lexicale et des distances intertextuelles, calcul des spécificités, recherche thématique, graphe de cooccurrences, analyse factorielle des correspondances, analyse arborée, corrélats sémantiques, topologie textuelle). Depuis la fin des années 1990, Hyperbase s’articule aux étiqueteurs-lemmatiseurs Tree Tagger et Cordial pour rendre compte du texte à différents niveaux linguistiques (formes graphiques, lemmes, étiquetage morpho-syntaxique, structures syntaxiques) : Étienne Brunet fait ainsi basculer la lexicométrie traditionnelle vers une textométrie ou logométrie[3] plus matures linguistiquement. Développé au départ pour le français et le latin, Hyperbase permet aujourd’hui de traiter les grandes langues indo-européennes et de comparer les textes importés par les utilisateurs aux corpus de références Frantext, Google Books ou British National Corpus (en) (BNC).

Bases littéraires et linguistiques

[modifier | modifier le code]

Étienne Brunet a constitué une cinquantaine de bases littéraires et linguistiques de référence directement disponibles et téléchargeables[4], passant ainsi au crible d’Hyperbase les plus grands auteurs français ou francophones et offrant de grandes synthèses sur la langue française.

Références

[modifier | modifier le code]
  1. « UMR 7320 : Bases, Corpus, Langage », sur unice.fr (consulté le ).
  2. a et b « Logométrie et corpus politiques, médiatiques et littéraires », sur unice.fr (consulté le ).
  3. « UMR 7320 : Bases, Corpus, Langage - Logométrie. Corpus, Traitements, Modèles », sur unice.fr (consulté le ).
  4. a b et c « UMR 7320 : Bases, Corpus, Langage - Logométrie. Corpus, Traitements, Modèles », sur unice.fr (consulté le ).

Articles connexes

[modifier | modifier le code]

Liens externes

[modifier | modifier le code]