Discussion:Fréquence d'apparition des lettres en français

Une page de Wikipédia, l'encyclopédie libre.
Sauter à la navigation Sauter à la recherche
Autres discussions [liste]
  • Suppression
  • Neutralité
  • Droit d'auteur
  • Article de qualité
  • Bon article
  • Lumière sur
  • À faire
  • Archives

Ca peut servir en crypto ?

Oui... (AVD, je venais de chercher ça sur le ouaibe et j'ai pensé à mettre ça ici) @thymik

Besoin d'un autre corpus source et des statistiques associées[modifier le code]

Le corpus source utilisé pour déterminer la fréquence des lettres (celui de Thomas Tempé: http://gpl.insa-lyon.fr/Dvorak-Fr/CorpusDeThomasTempé) n'est pas adapté pour un article dédié à la langue française du fait qu'il contient des échantillons de code source ainsi que des extraits de messageries électroniques (dont la qualité littéraire peut fortement être remise en cause). À savoir que l'un des buts originaux de ce corpus était l'élaboration d'une disposition clavier dvorak pour la langue française.

De plus, le corpus en question n'est plus disponible en ligne. Uiquement sa description peut-être retrouvée via webarchive.

De deux choses l'une: soit il y a possibilité de récupérer le corpus de M. Tempé afin de l'analyser de manière plus détaillée et de l'épurer le cas échéant, soit un nouveau corpus source doit être trouvé et ses statistiques publiées.

J'ai remplacé ce tableau de fréquence par un tableau du même type provenant d'un autre corpus disponible (et dédié à la langue française). --Positronique (discuter) 9 août 2016 à 14:25 (CEST)

Log-log ?[modifier le code]

Serait-il possible d'avoir la même courbe en log-log afin de pouvoir comparer l'allure de la distribution des lettres avec celle de la distribution des mots dans la loi de Benoît Mandelbrot ? François-Dominique 3 aoû 2004 à 17:30 (CEST)

Pur TI à retaper[modifier le code]

Un pur TI, sans source, et qui confond "lettre" et "symbole" : en français, "e", "é", "è", "ê", "ë" sont une seule et même lettre, "E" ; de même que "a", "à", "â" = "A", "c" et "ç" = "C", etc. Article à retaper sérieusement ! SenseiAC (discuter) 13 mars 2016 à 13:56 (CET)

Manque un tableau ne tenant pas compte des accents[modifier le code]

Il faut un tableau par lettre, c'est-à-dire sommer les a à ä â … en un seul A etc. J'ai essayé mais je n'arrive même pas à faire une répétition du tableau dans "Modifier le code" en prévisualisation. Ça doit être un peu plus compliqué, je verrai quand j'aurais le temps. En attendant il y a ici la fréquence des lettres Alexandre Oberlin (discuter) 6 mars 2017 à 21:35 (CET)