Utilisateur:Méjanelle/Brouillon

Une page de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

La logométrie (logos = discours ; métrie= mesure) est une méthode d’analyse et d'interprétation des discours utilisée dans les Sciences humaines et sociales (linguistique, histoire, littérature, sociologie, etc.). Cette méthode d'analyse, assistée par ordinateur, combine lecture qualitative et lecture quantitative des corpus numériques.
Épistémologiquement, la logométrie se rattache à l’analyse du discours, à la linguistique du texte et à la sémantique de corpus. Techniquement, elle s’appuie sur l’hypertextualité des corpus numériques (navigation hypertextuelle, index, concordancier) et sur l’analyse de données textuelles et la statistique lexicale (tableau de fréquences et de distribution, calcul de distance, classification).
La logométrie se présente comme un prolongement naturel de la lexicométrie (mesure du lexique) et de la textométrie (mesure du texte). Seulement, c’est le discours (discours politique, discours littéraire, discours médiatique, discours scientifique) dans ses dimensions linguistiques et sociales qui est son objet.

Histoire de la méthode[modifier | modifier le code]

La logométrie se développe au XXIème siècle dans le cadre des digital humanities ou humanités numériques. Elle s’inscrit néanmoins dans une histoire française et internationale qui remonte à l’instrumentation de l’analyse du discours par l’informatique dès le milieu du XXème siècle. Comme pionniers, on cite aussi bien Zellig Harris que Michel Pêcheux, Jean-Paul Benzécri que Charles Muller, Maurice Tournier qu'Etienne Brunet.
Son développement actuel bénéficie de la multiplication et de la disponibilité des corpus numérisés, du développement et de l'usage de logiciels appropriés, et de la maturation scientifique de l'analyse du langage et des discours en SHS (linguistic turn et tournant herméneutique).

Définition[modifier | modifier le code]

Pour Francine Mazière dans son précis sur l'Analyse du discours, la logométrie est avant tout un "retour" assisté par ordinateur vers les unités du discours afin de construire l'interprétation[1]. Pour Laurent Rouveyrol, il s'agit d'une méthode ouverte et "intégrative" dont "l'objet essentiel est de rendre compte de la relativité des stratégies" discursives mise en place par les locuteurs[2]. Pour le linguiste Pierre Fiala, la logométrie est un prolongement certes ambitieux de la lexicométrie mais "encore loin d'un traitement transversal des textes"[3]. Damon Mayaffre définit quant à lui la logométrie dans sa thèse d'Habilitation à diriger des recherches avant tout comme une méthode interprétative dont il met en valeur l'outillage linguistique et statistique :

« Ensemble de traitements documentaires et statistiques du texte et des discours qui ne s'interdit rien pour tout s'autoriser ; qui dépasse le traitement des formes graphiques sans les exclure ou les oublier ; qui analyse les lemmes ou les structures grammaticales sans délaisser le texte natif auquel nous sommes toujours renvoyés. C'est finalement un traitement (semi-)automatique global du texte dans toutes ses dimensions : graphiques, lemmatisées, grammaticalisées. L'analyse ainsi portera sur toutes les unités linguistiques de la lettre aux isotopies, en passant par les n-grams, les mots, les lemmes, les co-occurrences, les codes grammaticaux, les bi-codes ou les enchaînements syntaxiques.[4] »

Périmètre et soutien institutionnel[modifier | modifier le code]

La logométrie se distingue du Traitement automatique du langage naturel ou de l'analyse de contenu par son souci philologique et linguistique des textes et des discours : les corpus analysés recueillent des discours dument identifiés et critiqués par l'analyste qui entend produire une analyse socio-linguistique fine.

La logométrie se distingue de la linguistique textuelle ou l'analyse du discours traditionnelles par sa méthodologie informatisée et l'usage des statistiques.

La logométrie prolonge la lexicométrie et la textométrie en définissant le discours (logos), après le lexique et le texte, comme son objet.
Présente dans plusieurs universités, la logométrie bénéficie à l'Université de Nice Sophia Antipolis d’une équipe de recherche du CNRS et d'un site qui lui sont dédiés : Logométrie et corpus politiques, médiatiques et littéraires (UMR 7320, Bases, Corpus, Langage)[5].

Principes et valeurs[modifier | modifier le code]

La logométrie affiche deux principes fondateurs : la contextualisation des unités et la mesure de leur régularité dans le corpus.

  1. Contextualisation : le sens des unités du discours nait de leur contexte d'utilisation. C'est par l'usage que l'on définit le sens des mots. La convocation des passages du corpus, outillée par l'informatique (indexation et moteur de recherche) devient ainsi une priorité des analyses logométriques.
  2. Régularité et saillance : la valeur des unités du discours nait de leur régularité ou irrégularité. L’absence, la fréquence, la répétition, la répartition deviennent des indices quantitatifs essentiels (tableau de fréquences, approche probabiliste du vocabulaire, Analyse factorielle des correspondances) dans le parcours interprétatif.

La logométrie prétend avoir deux valeurs : descriptive et heuristique

  1. Description : l'ordinateur est convoqué pour produire une description la plus systématique et exhaustive possible de gros corpus numériques [6].
  2. Heuristique : la lecture numérique et le traitement statistique doivent permettre de fournir des chevilles interprétatives différentes et inattendues par rapport à la lecture intuitive ou oculaire des textes.

Domaines d’application[modifier | modifier le code]

Parce que le discours est lui-même un objet interdisciplinaire selon les théoriciens de l'analyse du discours [7], le champ des études logométriques est varié :

* La linguistique

* La littérature

* L'histoire

* Les sciences politiques

* La psychologie sociale

Logiciels[modifier | modifier le code]

Les logiciels universitaires pour l'analyse des discours sont nombreux. Ceux que convoquent la logométrie permettent à la fois le traitement statistique et le retour au texte. Ils doivent offrir la panoplie des outils développés depuis les années 1980[8] pour rendre compte du texte (index fréquentiel, dictionnaire, calcul du vocabulaire spécifique, concordancier, traitement des occurrences et des cooccurrences, statistiques multidimensionnelles (AFC) outils de classification, etc.). Par exemple :

Références[modifier | modifier le code]

  1. Francine Mazière, L'analyse du discours, Paris, Puf, 2005, p. 110.
  2. Laurent Rouveyrol, Vers une logométrie intégrative des corpus politiques médiatisés. L’exemple de la subjectivité dans les débats-panel britanniques, Corpus, n°4, 2005
  3. Pierre Fiala, Mots, n°80, 2006, p. 134
  4. Damon Mayaffre, Vers une herméneutique matérielle numérique. Corpus textuels, Logométrie et Langage politique. Thèse d'Habilitation à diriger des recherches, soutenue à Nice, 30 avril 2010, sous la direction de Sylvie Mellet, vol. 1, p. 22 (http://tel.archives-ouvertes.fr/tel-00655380).
  5. http://logometrie.unice.fr/ et http://www.unice.fr/bcl/
  6. Cf. par exemple les index et concordances publiés par Étienne Brunet (linguiste), Le Vocabulaire de Proust, avec l’Index complet et synoptique de À la recherche du temps perdu, 3 vol., 1918 p., Genève-Paris, Slatkine-Champion, 1983. (ISBN 2051004749) (ISBN 9782051004749). Le Vocabulaire de Zola, suivi de l’Index complet et synoptique des Rougon-Macquart, 3 tomes, 472 p., 646 p., 357 p. et 5500 pages sur microfiches normalisées, Genève-Paris, Slatkine-Champion, 1985 (ISBN 2-05-100670-9). Le vocabulaire de Victor Hugo, vol.1, 484 p., vol.2, 637 p., vol.3, 556 p., + 27 microfiches normalisées contenant l’Index synoptique des œuvres de Hugo (6878 p.), Genève-Paris, Slatkine-Champion, 1988. (ISBN 2051010048) (ISBN 9782051010047). index
  7. P. Charaudeau et D. Maingueneau (dir.), Dictionnaire d'analyse du discours, Paris, Seuil, 2002 (ISBN : 2020378450)
  8. Pour la statistique textuelle, cf. l'ouvrage de référence : Lebart, L. & Salem, A. (1994). Statistique Textuelle. Paris, Dunod, en ligne : http://lexicometrica.univ-paris3.fr/livre/st94/
  9. Hyperbase 9.0 (2014) : http://ancilla.unice.fr/
  10. http://Iramuteq : www.iramuteq.org/
  11. Lexico : http://www.tal.univ-paris3.fr/lexico/
  12. TXM : http://textometrie.ens-lyon.fr/


Wikipedia
Vous êtes ici sur la page personnelle d’un utilisateur de Wikipédia en français.
Cette page ne fait pas partie de l’espace encyclopédique de Wikipédia.

Si vous avez accédé à cette page depuis un autre site que celui de Wikipédia en français, c’est que vous êtes sur un site miroir ou un site qui fait de la réutilisation de contenu. Cette page n’est peut-être pas à jour et l’utilisateur identifié n’a probablement aucune affiliation avec le site sur lequel vous vous trouvez. L’original de cette page se trouve à https://fr.wikipedia.org/wiki/Utilisateur:Méjanelle/Brouillon.