Cooccurrence

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

La cooccurrence est la présence simultanée de deux ou de plusieurs mots (ou autres unités linguistiques) dans le même énoncé. Ces mots ne sont pas nécessairement liés par synonymie ou antonymie ou contenance (hyperonymie ou méronymie) mais possèdent cependant forcément un quelconque lien linguistique. Lorsque les deux mots - ou autres unités linguistiques - ont un rapport sémantique, la notion de cooccurrence est à la base de celle de thématique, champ lexical ou isotopie. L'analyse de données textuelles insiste sur les relations statistiques que les deux cooccurrents doivent entretenir, et a proposé de nombreux indices pour calculer l'attraction constatée. La cooccurrence devient alors la co-présence statistiquement significative de deux ou plusieurs unités dans la même fenêtre contextuelle (la phrase, le paragraphe, l'extrait). Les logiciels de lexicométrie, textométrie, logométrie tels Hyperbase, Iramuteq, Lexico, TXM, etc. proposent de nombreuses représentations des cooccurrences dans le texte.

Graphe de cooccurrences (Hyperbase 9.0-2014)

Exemples[modifier | modifier le code]

  • Élève et professeur
  • Port et bateau
  • Aéroport et avion

Bibliographie[modifier | modifier le code]

  • Baayen R.H. (2001). Word frequency distributions. Dordrecht : Kluwer Academic Publishers.
  • Bertels A. and Speelman D. (2012) « La contribution des cooccurrences de deuxième ordre à l’analyse sémantique », Corpus 11, pp. 147-166.
  • Bolasco S. (2013). L'analisi automatica dei testi. Fare ricerca con il text mining. Roma : Carocci.
  • É. Brunet (2012). « Nouveau traitement des cooccurrences dans Hyperbase », Corpus, 11, pp. 219-248.
  • Church K. W. & Hanks P. (1990). « Word Association Norms, Mutual Information, And Lexicography », Computational Linguistics, vol. 16(1), pp. 177-210.
  • Condamines A. (éd) (2005). Sémantique et corpus. Londres : Hermes
  • CORPUS 2 (2003). « La distance intertextuelle » (sous la direction de X Luong).
  • Firth J. (1957). « A Synopsis of Linguistic Theory 1930-1955 », Studies in Linguistic Analysis, pp. 1-32.
  • Fleury S. (2013). Annotations Rhapsodie pour le Trameur [(http://www.tal.univ-paris3.fr/trameur/bases/rhapsodie2trameur.pdf)]
  • Halliday M. A. K. and Hasan R. (1976). Cohesion in English. London : Longman.
  • Hanneman R. A. and Riddle M. (2005). Introduction to social network methods. Riverside : University of California, Riverside (published in digital form at http://faculty.ucr.edu/~hanneman/).
  • Harris Z. S. (1957). « Co-occurrence and transformation in linguistic structure », Language, 33, pp. 283-340.
  • Heiden S. (2004). « Interface hypertextuelle à un espace de cooccurrences : implémentation dans Weblex », JADT 2004, édité par G. Purnelle, C. Fairon et A. Dister, Louvain : Presses universitaires de Louvain, pp. 577-588.
  • Heiden S. et Lafon P. (1998). « Cooccurrences. La CFDT de 1973 à 1992 », in Des mots en liberté, Mélanges Maurice Tournier, Paris, ENS Éditions, tome 1, pp. 65-83.
  • Keller D. B. and Schultz. (2012). « Morpheme networks reveal language dynamics », JADT 2012, édité par A. Dister, D. Longrée, G. Purnelle. Bruxelles : Université de Liège / Facultés Saint-Louis, pp. 525-535.
  • Lafon P. (1984). Dépouillements et Statistiques en Lexicométrie. Paris : Slatkine-Champion.
  • Lafon P. et Tournier M. (1978). « Une Nouvelle approche lexicométrique des cooccurrences dans un texte », Travaux de lexicométrie et de lexicologie politique, 3, pp.135-148.
  • Lauf A., Valette M. et Khouas L. (2012). « Analyse du graphe des cooccurrents de deuxième ordre pour la classification non-supervisée de documents », JADT 2012, édité par A. Dister, D. Longrée, G. Purnelle. Bruxelles : Université de Liège / Facultés Saint-Louis, pp. 577-589.
  • Lebart L. et Salem A. (1994). Statistique textuelle. Paris : Dunod.
  • Legallois D. (2012). « La colligation : autre nom de la collocation grammaticale ou autre logique de la relation mutuelle entre syntaxe et sémantique ? », Corpus, 11, pp. 31-54.
  • Longrée D. et Mellet S. (2013). « Le motif : une unité phraséologique englobante ? Etendre le champ de la phraséologie de la langue au discours », Langages, 189, pp. 65-79.
  • Luong et al. (2010). « La cooccurrence, une relation asymétrique ? », JADT 2010, édité par S. Bolasco, I. Chiari, L. Giuliano, Milan : Edizioni Universitarie di Lettere Economia Diritto, pp. 321-331.
  • Martinez W. (2012). « Au-delà de la cooccurrence binaire… Poly-cooccurrences et trames de cooccurrence », Corpus, 11, pp. 191-218.
  • Martinez W. (2003). Contribution à une méthodologie de l’analyse des cooccurrences lexicales multiples dans les corpus textuels, Thèse de Doctorat, Université de la Sorbonne nouvelle-Paris 3, sous la direction d’A. Salem.
  • Mayaffre D. (2008-a). « Quand “travail”, “famille”, “patrie” co-occurrent dans le discours de Nicolas Sarkozy. Etude de cas et réflexion théorique sur la co-occurrence », JADT 2008, édité par S. Heiden et B. Pincemin, Lyon : PUL, vol. 2, pp. 811-822.
  • Mayaffre D. (2008-b). « De l’occurrence à l’isotopie. Les co-occurrences en lexicométrie », Sémantique & Syntaxe, 9, pp. 53-72. [Hal : http://hal.archives-ouvertes.fr/hal-00551114].
  • Mayaffre D. (2014). « Plaidoyer en faveur de l’Analyse de Données co(n)Textuelles Parcours cooccurrentiels dans le discours présidentiel français (1958-2014) », JADT 2014, Proceedings of the 12th International Conference on Textual Data Statistical Analysis, édité par E. Néé, M. Valette, J.-M. Daube et S. Fleury, Paris, Inalco-Sorbonne nouvelle, pp. 15-32. [1]
  • Mellet S. et Longrée D. (2009). « Syntactical 'Motifs' and Textual Structures », Belgian Journal of Linguistics, 23, pp. 161-173.
  • Missen M., Boughanem M. et Gaume B. (2008). «  The Small World of Web Network Graphs », International Multitopic Conference (IMTIC 2008), Vol. CCIS, Abdul Qadeer et al. (Eds.), Springer, CCIS, pp. 133-145.
  • Newman M. E. J. (2006). « Modularity and community structure in networks », Proc. Natl. Acad. Sci. USA, vol. 103, no 23, pp. 8577–8582.
  • Palmer (1933). Second Interim Report on English Collocations. Tokyo : Kaitakusha.
  • Ratinaud P. et Marchand P. (2012). « Application de la méthode ALCESTE aux « gros » corpus et stabilité des « mondes lexicaux » : analyse du « CableGate » avec IRAMUTEQ », JADT 2012, édité par A. Dister, D. Longrée, G. Purnelle. Bruxelles : Université de Liège / Facultés Saint-Louis, pp. 835-844.
  • Reinert M. (1993). « Les "mondes lexicaux" et leur "logique" à travers l’analyse statistique d’un corpus de récits de cauchemars », Langage et société, 66, pp. 5-39.
  • Salem A. (1987). Pratique des segments répétés. Essai de statistique textuelle. Paris : Klincksieck.
  • Sinclair J. M. (1991). Corpus, Concordance, Collocation. Oxford : Oxford University Press.
  • Sinclair J. M. (2003). Reading concordances. Londres : Pearson Longman.
  • Tauveron M. (2011). « De la cooccurrence généralisée à la variation du sens lexical », Corpus, 12, pp. 219-248.
  • Tournier M. (1980). « En souvenir de Lagado », Mots, 1, pp. 5-9.
  • Viprey J.-M. (1997). Dynamique du vocabulaire des Fleurs du mal. Paris : Champion.
  • Viprey J.-M. (2006). « Structure non-séquentielle des textes », Langages, 163, pp. 71-85.
  • Watts D. J. et Strogatz S.H. (1998). « Collective dynamics of ‘small-world’ networks », Nature, 393 (6684), pp. 440-442.
  • Williams G. (1999). Les réseaux collocationnels dans la construction et l'exploitation d'un corpus dans le cadre d'une communauté de discours scientifique. Thèse de doctorat, Université de Nantes.

Voir aussi[modifier | modifier le code]

Liens internes[modifier | modifier le code]