Diacritiques utilisés en français

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

Le français utilise plusieurs signes et lettres diacritiques, dont les cinq signes courants suivants :

Onomastique[modifier | modifier le code]

La langue française, accueillant traditionnellement les mots étrangers dans leur orthographe d’origine, pourvu bien sûr que cette orthographe soit en caractères latins, on vit apparaître récemment, avec les nouvelles techniques typographiques, des signes diacritiques issus essentiellement de travaux de translittération[réf. nécessaire]. Entrant en contradiction avec la volonté actuelle de simplification de l’orthographe, cette tendance, qu’avait suivie par exemple Larousse, a été stoppée par l’arrêté du 4 novembre 1993 relatif à la terminologie des noms d'États et de capitales. Larousse a adapté son orthographe[1], mais cette tendance perdure ici et là. L’utilisation de diacritiques étrangers n’est en principe tolérée que pour les patronymes ainsi que pour les toponymes sans envergure internationale qui ne nécessitent pas de francisation. Ces mots restant dans tous les cas étrangers au français.

Patronyme[modifier | modifier le code]

L’orthographe des noms de famille (patronymes) en France est régie par plusieurs textes[2], notamment par la loi du 6 fructidor de l’an II (principe d’immuabilité du nom) et par l’Instruction générale relative à l'état civil (IGREC) du 11 mai 1999 (JORF no 172 du 28/07/1999) qui a pour objet de décrire dans le détail la forme que doivent avoir tous les actes concernant l’état civil, en particulier l’article 106 pour les noms de famille, les prénoms et les noms de lieux :

« Les actes doivent être rédigés en langue française. En effet, aux termes de l’article 2 de la Constitution, le français est la langue de la République, et les actes de l’état civil, qui ont valeur authentique, doivent être rédigés dans cette langue.
Il s'ensuit notamment que l'alphabet utilisé doit être celui servant à l'écriture du français couramment dénommé alphabet romain. Cet alphabet est un dérivé de l'alphabet latin et roman, qui est employé dans divers Etats occidentaux avec quelques variantes par rapport à celui dont il est actuellement fait usage en France. Il faut donc n'entendre par alphabet romain que le seul alphabet utilisé pour l'écriture de la langue française.
Les signes diacritiques utilisés dans notre langue sont : les points, accents et cédilles. Dans la mesure où ils modifient la prononciation ou le sens des lettres ou des mots, ils font partie de notre langue et doivent être reproduits. Ainsi, lorsqu’ils s’appliquent à des noms propres (patronymes, prénoms, noms de lieu), ils doivent autant que possible être portés ; en particulier, lorsque les actes sont établis avec une machine à écrire. Ces noms doivent être inscrits en lettres majuscules. Si le procédé de mise en forme utilisé ne permet pas l’accentuation des majuscules, la lettre accentuée doit être inscrite en minuscule, même si elle constitue la première lettre du nom patronymique (voir aussi nos 112-2 et 195).
On ne doit pas retenir d’autres signes qui font partie de certains alphabets romains mais qui n’ont pas d’équivalent en français (tel que le « tilde » espagnol). A fortiori, l’utilisation de signes appartenant à un autre système d’écriture que l’alphabet romain est exclue (alphabet cyrillique, idéogrammes, etc.).
A cet égard, la pratique de certains officiers de l'état civil consistant à remplacer dans les actes la syllabe « Ker » par un « K » barré constitue une altération manifeste de l'orthographe.
Sous réserve des indications qui précèdent, l'officier de l'état civil doit inscrire le nom des personnes d'origine étrangère en respectant l'orthographe usitée dans le pays, alors même que la prononciation selon la phonétique française serait difficile ou impossible. Les caractères employés doivent toujours être ceux de l'alphabet romain. »

On notera que ce texte ne mentionne pas le tréma – le terme « points » concerne sans doute les points sur les i et j minuscules et les points du tréma[N 1] –, et ne précise pas les accents qu'il évoque.

Cependant, l’Institut national de la statistique et des études économiques (INSEE) applique depuis juin 2010, pour tous ses correspondants informatiques, des normes respectueuses de l’orthographe des noms (espaces de noms pour des schémas d’applications XML[3]). Il est demandé aux officiers d’état civil de

« reproduire strictement le nom de famille tel qu’il figure dans le registre d’état civil.
Les caractères acceptés pour l’écriture du nom sont :

  • les 26 lettres de l’alphabet utilisées dans la langue française en majuscules,
  • 15 lettres avec signes diacritiques en majuscules (À Â Ä Ç É È Ê Ë Î Ï Ô Ö Ù Û Ü),
  • 2 ligatures en majuscules (Æ Œ),
  • l’espace lorsqu’il est partie constituante du nom (par exemple après une particule), l’apostrophe, le tiret ou le double tiret sans espace avant, entre ou après.

Les caractères acceptés pour l’écriture du ou des prénom(s) sont :
Pour la première lettre :

  • les 26 lettres de l’alphabet utilisées dans la langue française en majuscules,
  • 15 lettres avec signes diacritiques en majuscules (À Â Ä Ç É È Ê Ë Î Ï Ô Ö Ù Û Ü),
  • 2 ligatures en majuscules (Æ Œ).

Pour les suivantes :

  • les 26 lettres de l’alphabet utilisées dans la langue française en minuscules,
  • 15 lettres avec signes diacritiques en minuscules (à â ä ç é è ê ë î ï ô ö ù û ü),
  • 2 ligatures en minuscules (æ, œ),
  • l’apostrophe, le tiret sans espace avant et après (obligatoire pour les prénoms composés). »

À noter l’absence de ÿ et Ÿ[N 2], pourtant présents dans quelques noms propres : Balaÿ, Boulennoÿ, Croÿ, Delannoÿ, Demenÿ, Du Faÿ, Faÿ, Fuÿe, Ghÿs, Lannoÿe, Nicolaÿ, Nouÿ, Ysaÿe (voir aussi infra).

Toponyme[modifier | modifier le code]

Pour les toponymes, les noms de pays et de villes étant des noms propres, il est recommandé par l’arrêté référencé infra de respecter la graphie locale en usage, translittérée ou non. On ne portera pas, selon cet arrêté obligatoire uniquement pour les fonctionnaires en France, les signes diacritiques particuliers s'ils n'existent pas dans l'écriture du français. En ce qui concerne l'orthographe exacte de certaines communes françaises, la circulaire numéro 469 (Bulletin officiel du ministère de l’Intérieur) régit l'orthographe du nom d'une commune. Elle précise qu’« est considérée comme seule officielle la dénomination de la commune publiée dans les tableaux donnant la population de cette commune à la suite de chaque recensement général ».

La liste officielle des communes françaises se trouve dans le Code officiel géographique (COG) fourni par l'Insee — voir le lien externe plus bas.

Ainsi, on trouvera dans ce code que la lettre ÿ figure officiellement en France dans le nom de trois communes : Faÿ-lès-Nemours, L'Haÿ-les-Roses et Moÿ-de-l'Aisne.

Majuscules[modifier | modifier le code]

Pour simplifier les claviers des machines à écrire, la dactylographie a renoncé à la possibilité d’écrire les majuscules avec leurs diacritiques. Beaucoup de gens pensaient donc que l’usage en était facultatif ou même ne concernait que les minuscules comme le point du i et du j. L’Académie française rappelle cependant que « l’accent a pleine valeur orthographique[4] ».

Combinaisons[modifier | modifier le code]

Selon les codes typographiques et la région de la francophonie concernée toutes les combinaisons ne sont pas possibles.

Combinaisons
Lettre Accent
aigu
Accent
grave
Accent
circonflexe
Tréma Cédille Ogonek Barre
inscrite
Caron Point
suscrit
Point
souscrit
Macron Tilde
A a Á á À à Â â Ä ä A̧ a̧ Ą ą Ⱥ ⱥ Ǎ ǎ Ȧ ȧ Ạ ạ Ā ā Ã ã
C c Ć ć[N 3] C̀ c̀ Ĉ ĉ C̈ c̈ Ç ç C̨ c̨ Ȼ ȼ Č č Ċ ċ[N 4] C̣ c̣ C̄ c̄ C̃ c̃
E e É é È è Ê ê Ë ë Ȩ ȩ Ę ę Ɇ ɇ Ě ě Ė ė Ẹ ẹ Ē ē Ẽ ẽ
I i Í í Ì ì Î î Ï ï Į į I̧ i̧ Ɨ ɨ Ǐ ǐ İ i Ị ị Ī ī Ĩ ĩ
J j J́ j́ J̀ j̀ Ĵ ĵ J̈ j̈ J̧ j̧ J̨ j̨ Ɉ ɉ J̌ ǰ j J̣ j̣ J̄ j̄ J̃ j̃
L l Ĺ ĺ L̀ l̀ L̂ l̂ L̈ l̈ Ļ ļ[N 5] L̨ l̨ Ł ł
Ƚ ƚ
Ľ ľ L̇ l̇ Ḷ ḷ[N 6] L̄ l̄ L̃ l̃
N n Ń ń Ǹ ǹ N̂ n̂ N̈ n̈ Ņ ņ[N 5] N̨ n̨ Ꞥ ꞥ[N 7] Ň ň Ṅ ṅ[N 8] Ṇ ṇ N̄ n̄[N 9] Ñ ñ
O o Ó ó Ò ò Ô ô Ö ö O̧ o̧ Ǫ ǫ Ø ø
Ɵ ɵ
Ǒ ǒ Ȯ ȯ[N 10] Ọ ọ Ō ō Õ õ
S s Ś ś S̀ s̀ Ŝ ŝ S̈ s̈ Ş ş[N 11] S̨ s̨ Ꞩ ꞩ Š š Ṡ ṡ Ṣ ṣ S̄ s̄ S̃ s̃
T t T́ t́ T̀ t̀ T̂ t̂ T̈ ẗ Ţ ţ[N 12] T̨ t̨ Ⱦ ⱦ
Ŧ ŧ
Ť ť Ṫ ṫ Ṭ ṭ T̄ t̄ T̃ t̃
U u Ú ú Ù ù Û û Ü ü U̧ u̧ Ų ų Ʉ ʉ Ǔ ǔ U̇ u̇ Ụ ụ Ū ū Ũ ũ
Y y Ý ý Ỳ ỳ Ŷ ŷ Ÿ ÿ Y̧ y̧ Y̨ y̨ Ɏ ɏ Y̌ y̌ Ẏ ẏ Ỵ ỵ Ȳ ȳ Ỹ ỹ
Z z Ź ź Z̀ z̀ Ẑ ẑ Z̈ z̈ Z̧ z̧[N 13] Z̨ z̨ Ƶ ƶ Ž ž Ż ż Ẓ ẓ Z̄ z̄ Z̃ z̃

Légende des couleurs :

  • En vert, selon le Lexique des règles typographiques en usage à l'Imprimerie nationale (LRTUIN), 2002, page 102, limite les « lettres accentuées en français » (en minuscules uniquement), auxquelles il faut ajouter l’apostrophe.
  • En orange, les lettres diacritées moins courantes mais présentes dans au moins un dictionnaire francophone.
  • En gris, les lettres diacritées totalement absentes du français mais existant dans d’autres langues ou dans certaines romanisations.
  • En noir, les lettres inexistantes et absentes de toutes les langues. Par exemple ‹ Z̀, z̀ › n’existe dans aucune langue. En Unicode, elles ne sont pas précombinées (elles n’existent pas seules) et doivent être composées (en accolant la lettre et le diacritique).

Le tréma est parfois utilisé pour les lettres a, o, u et y :

On trouve d’autres signes diacritiques dans les dictionnaires francophones pour les termes d’origine étrangère :

Lettres diacritiques[modifier | modifier le code]

Mais le français utilise aussi pour son orthographe deux lettres dans une fonction diacritique[réf. nécessaire] C/CH, G/GU sans compter l’utilisation du H dans les mots d’origine grecque.

Le trait d'union a aussi une fonction diacritique[réf. nécessaire]. Par exemple, il distingue les adjectifs numéraux :

  • mille-cent-vingt septièmes (1120/7)
  • mille-cent vingt-septièmes (1100/27)
  • mille cent-vingt-septièmes (1000/127)
  • mille-cent-vingt-septième (1127e).

Ou bien des doublets comme outremer[11] et outre-mer[12].

L’apostrophe a également une fonction diacritique dans les patronymes[réf. nécessaire] : Michel de L'Hospital, Pierre Alexis Ronarc'h, Odend'hal et dans les toponymes : l'Aber-Wrac'h, Plouezoc'h, Plourac'h, etc. (le trigramme c'h venant du breton).

Codage informatique[modifier | modifier le code]

L’ASCII n'inclut aucune lettre diacritée. Il inclut trois caractères qui peuvent être utilisés comme diacritiques : l'accent circonflexe, l'accent grave et l'apostrophe droite, qui peut servir d'accent aigu.

La norme de codage ISO 8859-1 (dite aussi latin-1), bien que prévue pour coder notamment le français, ne dispose pas des lettres « œ », « Œ » et « Ÿ ». La norme ISO 8859-15 ajoute ces trois caractères.

Unicode est une des seules normes de codage à disposer de toutes les lettres utilisées en français.

Sur les dispositions de claviers francophones (AZERTY, bépo ou dvorak-fr), les caractères diacrités les plus fréquents du français comme « é », « è », « à », « ù » ou « ç », sont accessibles en direct et les autres lettres diacritées sont saisies grâce à des touches mortes (touche morte puis lettre donne la lettre diacritée). Lorsque les caractères n’existent pas dans la disposition utilisée, il faut passer par une table de caractères ou encore par l’utilisation d’Alt codes.

Notes et références[modifier | modifier le code]

Notes[modifier | modifier le code]

  1. La circulaire du 10 juillet 1987, modifiant la précédente instruction du 21 septembre 1955, dans son article 112, précise clairement « accents, trémas, cédilles ».
  2. L'Insee gère ces deux lettres en toponymie (COG), et affirme par ailleurs les gérer également pour les patronymes.
  3. Ć existe en serbo-croate et se retrouve dans des patronymes comme Milošević.
  4. Ċ existe en maltais, par exemple dans Ċipru ou Rivoluzzjoni Franċiża.
  5. a et b Le Ļ et le Ņ en letton notent la palatalisation.
  6. ḷ est utilisé en pali, par exemple biḷāla (chat).
  7. ꞥ était utilisé en letton avant 1921
  8. ṅ est utilisé en venda (muṅadzi) et en douala (cáṅcaṅ).
  9. n̄ est utilisé en vurës, par exemple dans n̄ilinaw (ouragan) ou n̄en̄ere (jardin) ainsi qu’en cheke holo, par exemple dans ḡren̄atha (porte) ou ḡrin̄ni (mur).
  10. ȯ est utilisé en cheyenne, par exemple dans heˀȯtse (cou) ou vȯheˀso (nid).
  11. Ş est utilisé en turc et en roumain.
  12. Le T cédille (qui existe aujourd’hui en roumain) a été proposé plusieurs fois en français pour représenter la lettre T lorsqu’elle se prononce [s].
  13. Le Z cédille est utilisé dans la romanisation GENUNG de l’arabe et du persan, et la romanisation BGN/PCGN de l’afghan, de l’arabe, du baloutche, de l’ourdou, du pachto, et du persan.
  14. Pour une liste plus complète, vous pouvez consulter la catégorie U avec un tréma en français sur le Wiktionnaire.

Références[modifier | modifier le code]

  1. a et b Larousse : 1936 Tokyo, 1980 et 1993 Tōkyō, enfin 2003, 2007 et 2008 en ligne Tokyo.
  2. Accentuez mon nom, Les lois
  3. Insee, exemple module Mariage
  4. (fr) Question courante Accentuation des majuscules sur le site de l’Académie française.
  5. Jacques André, « ISO Latin-1, norme de codage des caractères européens ? trois caractères français en sont absents ! », Cahiers GUTenberg no  25, sur http://www.gutenberg.eu.org, Groupe francophone des Utilisateurs de TEX (GUT),‎ novembre 1996 (consulté le 19 juin 2008).
  6. Définitions lexicographiques et étymologiques de « cañon » du TLFi, sur le site du CNRTL.
  7. Définitions lexicographiques et étymologiques de « señor » du TLFi, sur le site du CNRTL.
  8. Définitions lexicographiques et étymologiques de « doña » du TLFi, sur le site du CNRTL.
  9. Définitions lexicographiques et étymologiques d'« angström » du TLFi, sur le site du CNRTL.
  10. a, b et c Dans le Petit Larousse Illustré 1997 :
    • ‹ č › est utilisé dans « Korčula » ;
    • ‹ ł › est utilisé dans « Wałęsa » ;
    • ‹ ø › est utilisé pour « Øresund » ;
    • ‹ š › est utilisé pour « Beneš » ;
    • ‹ ṣ › et ‹ ṇ › sont utilisés pour « Kriṣṇa » ;
    • ‹ ž › est utilisé pour « Krleža ».
  11. Définitions lexicographiques et étymologiques d'« outremer » du TLFi, sur le site du CNRTL.
  12. Définitions lexicographiques et étymologiques d'« outre-mer » du TLFi, sur le site du CNRTL.

Voir aussi[modifier | modifier le code]

Liens externes[modifier | modifier le code]