Diacritiques de l'alphabet arabe

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Arabic albayancalligraphy.svg Cette page contient des caractères arabes. En cas de problème, consultez Aide:Unicode ou testez votre navigateur.
Article général Pour un article plus général, voir Écriture de l'arabe.

Tel qu'écrit couramment, l'alphabet arabe n'utilise pour ainsi dire pas de diacritiques, outre le point souscrit ou suscrit obligatoire pour distinguer des lettres ambigües.

Pour faciliter la lecture, cependant, et ce dans un cadre didactique ou religieux, de nombreux signes auxiliaires viennent rendre le texte moins ambigu : l'arabe ne notant normalement pas les voyelles brèves, par exemple, ni les géminations ou encore les assimilations, il n'est pas possible à un lecteur débutant de lire à voix haute un texte sans l'aide de ces signes, ou sans une bonne connaissance de la langue.

Diacritiques obligatoires[modifier | modifier le code]

Les seuls diacritiques historiques de l'alphabet arabe, c'est-à-dire ceux qui servent à différencier plusieurs lettres de même tracé, sont le point et la hamza.

Point[modifier | modifier le code]

ثجخ/

Il est conseillé de consulter aussi Histoire de l'alphabet arabe pour comprendre cette partie.

On sait que les premiers modèles de l'alphabet arabe sont riches en ambigüités, ce que montre l'image ci-dessous.

Arabe arch.png

On voit que neuf lettres sont de tracé identique ou peu s'en faut. Au VIIe siècle, par imitation du modèle nabatéen ou syriaque, les lettres ambigües ou ambivalentes ont été distinguées par un, deux ou trois (selon le nombre d'ambiguïtés à lever) points suscrits, inscrits ou souscrits, dans les cas où plus de deux lettres possèdent un tracé trop proche ou pour inventer de nouvelles lettres à partir de lettres simples. En sorte, le point fonctionne doublement :

  • il distingue des graphèmes homographes ;
  • il étend le nombre de graphèmes possibles.

Actuellement, en graphie isolée, 18 lettres (sur 28 au total) ne diffèrent que par la présence ou non de points, ainsi que leur position et leur nombre le cas échéant :

  • ع et غ
  • ب, ت et ث ;
  • ج, ح et خ ;
  • د et ذ ;
  • ر et ز ;
  • س et ش ;
  • ص et ض ;
  • ط et ظ ;

En graphie liée, le nombre d'ambigüités levées est encore plus grand, certaines différences de tracé étant abolies ; la forme fondamentale , en effet, peut recevoir cinq combinaisons de points :

b t n y

Les mêmes lettres, en graphie isolée, ne sont plus si proches (dans le même ordre) :

ب
ت ث ن ي
b t n y

De même, bien qu'en graphie isolée leur position sur la ligne ne soit pas identique, ف f et ق q sont aussi distingués par les points en graphie liée :

ف ق

f q

Hamza et ʾalif waṣla[modifier | modifier le code]

Article détaillé : Écriture de la hamza.
ٱ ئ ؤ إ أ

La hamza est une lettre, ء, qui, dans certaines conditions, s'écrit comme un diacritique. Elle note le phonème /ʔ/, dit coup de glotte. Son placement est relativement complexe.

Le waṣla est un autre diacritique, utilisé principalement dans les éditions du Coran. Il se place au-dessus ou en dessous d'un ʾalif et note la présence d'une hamza instable élidée : ainsi, le ʾalif, support d'une voyelle et d'une hamza, ne se prononce pas.

Diacritiques servant à faciliter la lecture[modifier | modifier le code]

Signes de vocalisation[modifier | modifier le code]

Ces signes annexes permettant de noter les voyelles auraient été inventés par Abou al-Aswad al-Douali, grammairien du VIIe siècle. Le modèle est presque clair : il s'agit de lettres de l'alphabet transformées en signes suscrits. C'est au VIIIe siècle qu'est fixée la notation actuelle.

Voyelles simples[modifier | modifier le code]

ــَــُــِ

Les voyelles (qui peuvent être brèves ou longues) ne sont généralement pas écrites, sauf parfois dans les textes sacrés et didactiques, auquel cas l'on dit de ces textes qu'ils sont « vocalisés ».

Les brèves sont des diacritiques (dont ـُ [u] provient sûrement de la lettre و [w]) placés sur ou sous la consonne qui les précède dans la syllabe, tandis que les longues sont notées par le diacritique de la brève équivalente suivie d'une consonne de prolongement :

  • ا ʾalif ou ى ʾalif maqṣūra (seulement en fin de mot) pour l'allongement de /a/. Ainsi, ce qui est écrit se lit ā ;
  • ي yāʾ pour celui de /i/ : iy = ī ;
  • و wāw pour celui de /u/ : uw = ū.

Comme aucune syllabe arabe ne commence par une voyelle (contrairement aux apparences ; il y a en effet une consonne à l'initiale d'un prénom comme Ali, en arabe ʿAlī, ou d'un mot comme ʾalif), il n'y a pas de forme indépendante.

Dans le tableau suivant, les voyelles seront présentées seules puis placées pour plus de clarté sur ou sous la lettre د dāl.

Voyelles simples Avec consonne Nom Trans. Valeur
دَ fatḥa a [a]
دِ kasra i [i]
دُ ḍamma u [u]
ﹷا دَا fatḥa ʾalif ā [aː]
ﹷى دَى fatḥa ʾalif maqṣūra ā / aỳ [aː]
ﹻي دِي kasra yāʾ ī / iy [iː]
ﹹو دُو ḍamma wāw ū / uw [uː]

Note : ne pas oublier que le ة tāʾ marbūṭa n'est pas une voyelle mais une consonne /t/ ou /h/ souvent muette mais toujours précédée du son /a/.

L'absence de la notation des voyelles brèves rend parfois ambiguë la compréhension des mots, en particulier lorsque ceux-ci sont lus isolés de tout contexte. Notons, par exemple, ce qui se produit avec le mot كتب (ktb) dont on écrit généralement que les trois consonnes et donc qui n'est pas vocalisé. Ce mot qui se rapporte au monde de l'écrit pourra prendre, une fois vocalisé, les sens suivants :

  • un verbe à la 3e personne du masculin singulier de l'accompli actif كَتَبَ (kataba, il a écrit) ou encore كَتَّبَ (kattaba, il a fait écrire)
  • un verbe à la 3e personne du masculin singulier de l'accompli passif كُتِبَ (kutiba, il a été écrit)
  • un nom masculin pluriel كُتُبٌ (kutubun, les livres)
  • un verbe à l'impératif à la 2e personne du masculin singulier كَتِّبْ (kattib, fais écrire)

Tous ces mots sont discriminés par des voyelles brèves qui la plupart de temps ne sont pas écrites. Il en résulte qu'ils se trouveront tous sous l’orthographe unique كتب (ktb) dans la plupart des textes. C'est donc au lecteur de rajouter mentalement les voyelles nécessaires afin de déterminer le sens véritable du mot en question. Il sera pour cela grandement aidé par le contexte[1].

Diphtongues ay et aw[modifier | modifier le code]

Elles sont simplement notées par la voyelle brève suivie des consonnes y ou w. L'écriture les traite comme ī et ū, c'est-à-dire qu'elle ne les note pas différemment des autres suites voyelle + consonne. De même, on pourrait classer parmi les diphtongues celles débutant par īy et ūw ; ce ne sont cependant que des voyelles suivies d'une consonne. Comme précédemment, les diphtongues sont présentées dans le tableau précédées de d et les lettres ne sont pas liées.

Diphtongues Nom Trans. Valeur
دَي fatḥa yāʾ ay / ai / aï [ai]
دَو fatḥa wāw aw / au [au]

Voyelles casuelles et tanwīn[modifier | modifier le code]

ــًــٌــٍ

Lors de la flexion nominale, les noms peuvent recevoir trois désinences différentes, -a, -i, et -u (qu'on transcrira de préférence en les plaçant en exposant : -a, etc). Celles-ci ne sont pas écrites dans un texte non vocalisé, sinon, les signes habituels sont employés. Il est rare qu'on les prononce dans la conversation courante : de fait, n'étant ni écrites ni prononcées d'habitude, ces voyelles flexionnelles ressortissent surtout à l'arabe classique.

Si le mot est indéfini (sans article ni complément du nom), il prend (sauf exceptions) les désinences -an, -in, -un, nommées tanwīn. Celles-ci sont notées par des diacritiques spéciaux qui remplacent la voyelle ainsi que la lettre -n attendue en fin de mot ; selon que le texte est vocalisé ou non, la notation change :

  • tanwīn -an (tanwīn ʾal-fatḥa, ou fathatan) :ــًــ ; un ʾalif est placé à la suite du tanwīn, sauf si le mot se termine par ة tāʾ marbūṭa /a(t)/ (suffixe de féminin), ou par une hamza, أ /aʔ/ ou اء, /aːʔ/ ; dans un texte non vocalisé, seul le ʾalif est écrit, si c'est possible, sinon, rien n'indique la présence d'un tanwīn :
    • رَجُلاً raǧulan, « homme (cas direct) » ; non vocalisé : رجلا (noter la ligature lām ʾalif qui, de fait, porte le tanwīn), جِدًّا ǧiddan, « énormément » ; non vocalisé : جدا
    • عَادَةً ʿādatan, « d'habitude » (noter l'utilisation du tāʾ marbūṭa prononcé ici /t/ devant voyelle casuelle) ; non vocalisé : عادة (pas d'ʾalif après ة),
  • tanwīn -in (tanwīn ʾal-kasra, ou kasratan) : ــٍــ ; il n'est pas écrit dans les textes non vocalisés :
    • رَجُلٍ raǧulin, « homme (cas indirect) » ; non vocalisé : رجل ;
  • tanwīn -un (tanwīn ʾaḍ-ḍamma, ou dammatan) : ــٌــ (il existe une deuxième graphie, ressemblant à « ” » suscrit) ; il n'est pas écrit dans les textes non vocalisés :
    • رَجُلٌ raǧulun, « homme (cas sujet) » : non vocalisé : دجل (le cas sujet et le cas indirect ne se distinguent donc pas).

Dans la pratique, la voyelle et le /n/ des tanwīn ne sont pas prononcés (sauf dans des expressions adverbiales figées en -an, comme شُكْراً šukran, « merci », plus fréquemment écrit شكرا). Ces désinences appartiennent aussi à la langue littéraire de l'arabe classique.

ʾAlif Madda[modifier | modifier le code]

آ

Afin d'éviter la succession de deux ʾalif dans un même mot, on fait usage d'un diacritique nommé madda remplaçant l'un des deux ʾalif et se plaçant sur le restant : آ. Cette rencontre ne se trouve en fait que dans les cas où un ʾalif support d'une hamza précède un [a] long (c'est-à-dire une fatḥa suivie d'un ʾalif), soit ʾā. La madda remplace donc :

  • une éventuelle hamza initiale ;
  • la fatḥa ;
  • l'ʾalif de prolongement.

Ainsi, l'on n'écrit pas أَاخَذَ ʾāḫaḏa, « il a réprimandé » mais آخَذَ ; de même dans un mot : non pas قَرَأَا qaraʾā, « ils ont lu (au duel) », mais قَرَآ.

ʾAlif suscrit[modifier | modifier le code]

ــٰ

Certains mots portent phonétiquement la trace d'un ancien ʾalif de prolongement qui n'était pas écrit dans la graphie othmanienne, et qui n'a pas été rétabli lors de la stabilisation de l'orthographe ; il est cependant parfois écrit sous une forme suscrite, en remplacement d'une éventuelle fatḥa et de son ʾalif de prolongement ; c'est le cas dans certains démonstratifs :

  • هذا ou هٰذَا hāḏā « ce… -ci » ;
  • هذه ou هٰذِهِ hāḏihi « cette… -ci » ;
  • هٰؤُلاَءِ hāʾulāʾi « ces… -ci (féminin) » ;
  • ذلك ou ذٰلِكَ ḏālika « ce… -là » ;

D'autres mots peuvent être écrits avec le ʾalif suscrit :

  • لكن ou لٰكِن lākin, « mais » ;
  • رحمان ou رَحْمٰن raḥmān, « miséricordieux ».

Le terme le plus célèbre portant un ʾalif suscrit est celui désignant le Dieu unique de l'ʾIslām, nommé « Le Dieu », c'est-à-dire, selon l'étymologie populaire (qui ne résiste cependant pas aux analyses [réf. nécessaire]) أَل ʾal (« le / la ») + إِلٰه ʾilāh (« divinité ») ; ce dernier nom commençant par une hamza instable, la forme contractée donne أَللّٰه ʾ Al-lāh, plus communément écrit اللّٰه et transcrit ʾAllāh. Il existe d'ailleurs un emplacement en Unicode permettant d'écrire le nom d'ʾAllāh en un seul caractère ; il s'agit de U+FDF2, Ligature Allâh sous sa forme isolée, soit .

Signes de syllabation[modifier | modifier le code]

De même que pour les signes de vocalisation, les signes de syllabation ne sont pas obligatoirement écrits. Ils permettent cependant une grande précision et s'utilisent parfois quand le texte n'est pas vocalisé.

Sukūn[modifier | modifier le code]

ـْـ

Une syllabe arabe peut être ouverte (elle est terminée par une voyelle) ou fermée (par une ou deux consonnes) :

  • ouverte : C[onsonne]V[oyelle] ;
  • fermée : CVC(C) ; la voyelle en question est le plus souvent brève.

Quand la syllabe est fermée, on peut indiquer que la consonne qui la ferme ne porte aucune voyelle en plaçant au-dessus un signe nommé sukūn, de la forme « ° », pour lever tout ambiguïté, surtout quand le texte n'est pas vocalisé : il faut se souvenir qu'un texte standard n'est composé que de suites de consonnes ; ainsi, le mot qalb, « cœur », est écrit qlb. Les sukūn permettent de savoir où ne pas placer une voyelle : qlb (قلب) pourrait en effet être lu /qVlVbV/, mais écrit avec un sukūn sur le l et sur le b, il ne peut être interprété que sous la forme /qVlb/ (quant à savoir quelle est la voyelle /V/, il faut pour cela connaître le mot) ; on écrit donc قلْبْ (sans ligatures : ق‌لْ‌بْ). De fait, dans un texte vocalisé le sukūn ne semble pas nécessaire, puisque le placement des voyelles est sûr : قَلْبْ est quelque peu redondant.

On peut en théorie faire de même pour l'écriture des voyelles longues et des diphtongues, puisque celles-ci sont notées par une voyelle suivie d'une consonne : ainsi mūsīqā, « musique », s'écrit de manière non vocalisée mwsyqā (موسيقى avec un ʾalif maqṣūra en fin de mot) ; pour éviter une lecture /mVwVsVyVqā/, il est possible d'indiquer que w et y ferment leur syllabe respective : موْسيْقى. Le mot, entièrement vocalisé, est écrit مُوْسِيْقَى. De même pour les diphtongues : le mot zawǧ, « mari », peut être écrit simplement zwǧ : زوج, avec sukūn : زوْج, avec sukūn et voyelle : زَوْج.

Dans la pratique, le sukūn n'est pas placé au-dessus des lettres servant à indiquer l'allongement de la voyelle qui précède (et sa présence pourrait conduire à des erreurs de lecture : on a tendance à considérer qu'un sukūn sur un y ou un w indique une diphtongue et non une voyelle longue) : mūsīqā sera plus simplement écrit مُوسِيقَى. De même, il n'est quasiment jamais écrit en fin de mot quand la dernière syllabe est fermée : dans un texte entièrement vocalisé, aucun nom, par exemple, ne pourrait porter en finale un autre diacritique qu'un tanwīn : قلْبْ est donc une graphie impossible. C'est قلْبٌ, par exemple, qu'on devrait avoir même si, dans la pratique, les tanwīn ne sont pas prononcés.

C'est la marche que l'on a suivie dans ce document.

Le sukūn ne doit pas être confondu avec le rond en chef.

Šadda[modifier | modifier le code]

ـّـ

Ce signe, dont la forme est une simplification de ‍ش‍ (initiale du mot), sert à faire l'économie d'une consonne géminée, c'est-à-dire quand deux consonnes identiques se suivent : c'est le cas lorsqu'une syllabe fermée terminée par une consonne X précède une autre syllabe débutant par cette consonne X. On place la šadda au-dessus d'une des consonnes, tandis que l'autre n'est pas écrite : ainsi, le mot šadda lui-même est orthographié شَدَّة au lieu de شَدْدَة ; il n'y a donc plus besoin d'utiliser un sukūn.

La šadda devrait se rencontrer dans les cas d'assimilation de la consonne /l/ de l'article devant consonne solaire : ainsi, « la lune » s'écrit أَلْقَمَر ʾal-qamar, tandis que « le soleil » pourrait être noté أَلشَّمْس ʾaš-šams (il est écrit en réalité ʾalššams ; le détail de cette convention graphique est décrit plus bas). En réalité, la šadda est le plus souvent omise dans cette assimilation très fréquente. Les détails de cette question sont traités dans l'article principal (section « Assimilations »).

Noter le placement des signes de vocalisation :

  • fatḥa a et ḍamma u sont écrites au-dessus de la šadda tandis que kasra i l'est soit régulièrement sous la consonne qui la porte, soit sous la šadda (depuis quelques années, pour des raisons de simplification typographique) : il ne faut donc pas confondre et  ;
  • les tanwīn -an et -un suivent les mêmes principes (au-dessus de la šadda), mais le tanwīn /in/ ne se place qu'au-dessous de sa lettre (et non sous la šadda).

Diacritiques servant à étendre le nombre de caractères[modifier | modifier le code]

L'alphabet arabe ne servant pas exclusivement à noter la langue arabe, il a fallu, dans de nombreuses autres langues, procéder à des ajustements nécessaires pour lui faire représenter, avec plus ou moins de précision, des phonèmes qui ne sont pas prévus. Pour ce faire, on a souvent recouru à des diacritiques qui ont permis d'étendre le nombre de graphèmes possibles.

On se reportera à l'article Adaptations de l'alphabet arabe pour un article complet sur la question.

Voir aussi[modifier | modifier le code]

Notes et références[modifier | modifier le code]

  1. Collectif dirigé par Kouloughli Djamel et Georges Bohas, Linguistique arabe et sémitique vol. 2, collection Langues et littératures du monde arabe, ENS-LSH Éditions, avril 2002