Alphabet arabe

Un article de Wikipédia, l'encyclopédie libre.
Ceci est une version archivée de cette page, en date du 24 décembre 2014 à 14:04 et modifiée en dernier par Stephane.lecorne (discuter | contributions). Elle peut contenir des erreurs, des inexactitudes ou des contenus vandalisés non présents dans la version actuelle.

Modèle:Unicode arabe

Arabe
Caractéristiques
Type Abjad
Langue(s) Arabe, persan, baloutche, ourdou, kurde, pachto, sindhi et autres
Direction De droite à gauche
Historique
Époque Du Ve siècle jusqu'à nos jours
Système(s) parent(s) Protosinaïtique

 Phénicien
  Araméen
   Hébreu
    Guèze
     Syriaque
      Arabe

Codage
Unicode U+0600 à U+06FF
U+0750 à U+077F
U+FB50 à U+FDFF
U+FE70 à U+FEFF
ISO 15924 Arab

L'alphabet arabe est l'alphabet utilisé pour écrire, entre autres, la langue arabe. Bien que très souvent désigné comme un alphabet, à la manière de l'écriture d'autres langues sémitiques, c'est généralement un abjad[1], terme décrivant un système d'écriture ne notant que les consonnes de la langue (ou peu s'en faut). Cet alphabet comporte 28 lettres.

En tant qu'alphabet de la langue du Coran — sacrée pour les musulmans —, son influence s'est étendue avec celle de l'islam : l'alphabet arabe a aussi été utilisé (ou l'est encore) pour écrire d'autres langues, sans aucune parenté avec l'arabe, comme le persan, le kashmiri, le sindhi, l'ourdou, le kurde et, jusqu'à l'adoption de la transcription latine imposée par Mustafa Kemal Atatürk en 1928, le turc. Ces langues sont toutes indo-européennes, sauf le turc qui est une langue altaïque. On a souvent dû ajouter ou modifier certaines lettres pour adapter cet alphabet au système phonologique des langues en question.

Certaines langues d'Afrique, comme le swahili, haoussa et le somali, s'écrivirent par des adaptations de l'alphabet arabe avant d'être écrites avec l'alphabet latin.

Cet article ne traite pas de la prononciation de cet alphabet.

Histoire

Carte de répartition de l'utilisation de l'alphabet arabe :
  • Pays où il est le seul alphabet officiel
  • Pays où il est un des alphabets officiels
  • On fait remonter cet alphabet à l'araméen dans sa variante nabatéenne ou syriaque, lui-même descendant du phénicien (alphabet qui, entre autres, donne naissance à l'alphabet hébreu, à l'alphabet grec et, partant, au cyrillique, aux lettres latines, etc.). La première attestation d'un texte en alphabet arabe remonte à 512. C'est au VIIe siècle qu'on a ajouté des points sur ou sous certaines lettres afin de les différencier, le modèle araméen ayant moins de phonèmes que l'arabe et l'écriture des origines ayant donc dû confondre par une même lettre plusieurs phonèmes. Lors de ces modifications, l'ordre des lettres a été changé : de fait, l'alphabet arabe ne suit plus l'ordre traditionnel des autres alphabets sémitiques, dit ordre levantin, comme l'hébreu le fait encore.

    Spécificités

    L'alphabet arabe comprend vingt-neuf lettres fondamentales (vingt-huit si l'on exclut la hamza, qui se comporte soit comme une lettre à part entière soit comme un diacritique). Il s'écrit de droite à gauche.

    Il n'y a pas de différence entre les lettres manuscrites et les lettres imprimées, et les notions de lettre majuscule et lettre minuscule n'existent pas : l'écriture est donc monocamérale.

    En revanche, la plupart des lettres s'attachent entre elles, même en imprimerie, et leur graphie peut changer selon qu'elles sont en position initiale (liées à la lettre suivante mais pas la précédente), médiane (liées des deux côtés), finale (liée à la précédente mais pas la suivante) ou qu'elles sont isolées (sans liaison) : on parle de variantes contextuelles. La liaison peut être plus ou moins allongée sans changer la lecture des lettres : كتب (ktb), normalement compacté, peut également être rendu كـــتـــب en allongeant les liaisons, par exemple pour créer un effet calligraphique, ou pour des raisons de justification de mise en page. Par ailleurs, certaines lettres ne s'attachent jamais à la lettre suivante, de sorte qu'un mot peut être entrecoupé d'une ou plusieurs espaces. Ces séparations entre lettres ne s'attachant pas à l'intérieur des mots sont moins grandes que celles séparant les mots. Par exemple, Paris s'écrit باريس (bârîs), où ni le A long ni le R ne se lie à la lettre suivante.

    L'alphabet arabe étant un abjad, le lecteur doit connaître la structure de la langue pour restituer les voyelles. Il est aidé en cela par une répartition des voyelles d'un mot relativement régulière au sein de racines consonantiques, car dépendant de la grammaire (on se reportera à l'article consacré à la langue arabe pour plus de détails). Dans les éditions du Coran où les ouvrages didactiques, cependant, on utilise une notation vocalique plus ou moins précise sous forme de diacritiques. Il existe, de plus, dans de tels textes dits « vocalisés », une série d'autres diacritiques de syllabation dont les plus courants sont l'indication de l'absence de voyelle (sukūn) et la gémination des consonnes (šadda).

    Transcription et translittération

    Machine à écrire en caractères arabes
    caractères arabes manuscrits

    Il existe de nombreuses normes scientifiques de translittération vers l'alphabet latin[2] de l'arabe et transcrit de diverses manières, parmi lesquelles :

    • la translittération DIN-31635 ;
    • la « transcription Arabica », du nom d'une revue française d'études arabes ;
    • la translittération pratiquée par la revue Afriques ;
    • la norme de translittération adoptée par l'Encyclopædia of Islam (EI) ;
    • la norme internationale ISO 233-2 (1993).
    Nom Graphie Translittération Son Tracé
    isolée finale médiane initiale DIN-31635 EI
    hamza ء أ, إ, ؤ, ئ
    ʾ ʔ
    ʾalif ا ــﺎ ā / â ā / â
    bāʾ ب ــﺐ ـﺒـ ﺑــ b b b
    tāʾ ت ــﺖ ـﺘـ ﺗــ t t t
    ṯāʾ ث ــﺚ ـﺜـ ﺛــ th θ
    ǧīm ج ــﺞ ـﺠـ ﺟــ ǧ dj ʤ
    ḥāʾ ح ــﺢ ـﺤـ ﺣــ ħ
    ḫāʾ خ ــﺦ ـﺨـ ﺧــ ḫ / ẖ kh x
    dāl د ــﺪ d d d
    ḏāl ذ ــﺬ dh ð
    rāʾ ر ــﺮ r r r
    zāy ز ــﺰ z z z
    sīn س ــﺲ ـﺴـ ﺳــ s s s
    šīn ش ــﺶ ـﺸـ ﺷــ š sh ʃ
    ṣād ص ــﺺ ـﺼـ ﺻــ
    ḍād ض ــﺾ ـﻀـ ﺿــ , ðˤ
    ṭāʾ ط ــﻂ ـﻄـ ﻃــ
    ẓāʾ ظ ــﻆ ـﻈـ ﻇــ , ðˁ
    ʿayn ع ــﻊ ـﻌـ ﻋــ ʿ / ‘ ʿ / ‘ ʔˤ
    ġayn غ ــﻎ ـﻐـ ﻏــ ġ gh ɣ
    fāʾ ف ــﻒ ـﻔـ ﻓــ f f f
    qāf ق ــﻖ ـﻘـ ﻗــ q q
    kāf ك ــﻚ ـﻜـ ﻛــ k k k
    lām ل ــﻞ ـﻠـ ﻟــ l l l
    mīm م ــﻢ ـﻤـ ﻣــ m m m
    nūn ن ــﻦ ـﻨـ ﻧــ n n n
    hāʾ ه ــﻪ ـﻬـ ﻫــ h h h
    wāw و ــﻮ w w w ou
    yāʾ ي ــﻲ ـﻴـ ﻳــ y y j ou

    Notez que le macron au-dessus des voyelles peut être aisément remplacé par un accent circonflexe. La transcription phonétique (ici quelque peu simplifiée) suit les conventions de l'alphabet phonétique international (API).

    Encodage

    Il peut être codé par plusieurs jeux de caractères, parmi lesquels ISO-8859-6 et Unicode, grâce au bloc « Arabe », des emplacements U+0600 à U+06FF. Ces deux jeux, cependant, n'indiquent pas pour chaque caractère la forme contextuelle qu'il doit prendre. C'est au moteur de rendu de sélectionner le bon œil. Il existe cependant, dans le cas où l'on voudrait coder une forme particulière d'un caractère, les blocs « Formes de présentation arabe A » (U+FB50 à U+FDFF) et « Formes de présentation arabe B » (U+FE70 à U+FEFF), qui contiennent la majorité des caractères convalescents entièrement en variante contextuelle ainsi que les caractères étendus propres à d'autres langues. Il est aussi possible d'utiliser les liants sans et avec chasse. Enfin, le codage de l'arabe est logique, c'est-à-dire qu'on entre les caractères à la suite sans se soucier du sens de l'écriture. C'est encore une fois au moteur de rendu qu'il revient d'afficher les caractères dans le bon sens. À cet égard, si les mots arabes de cette page sont affichés à l'envers, c'est que votre moteur de rendu Unicode n'est pas assez récent. Pour plus de détails concernant les questions de codage de l'arabe, consultez la traduction française du manuel d'Unicode, disponible sur le site Hapax.

    Autres lettres

    Nom Graphie Translittération Son
    isolée finale
    tāʾ marbūṭa ــﺔ h et t / Ø / h / ẗ [t], [h], Ø
    ʾalif maqṣūra ــﻰ ā / ỳ [(a)ː]
    lām ʾalif ــﻼ [l(a)ː]

    Tāʾ marbūṭa

    Le ة tāʾ marbūṭa (« tāʾ bouclé » ; c'est, historiquement, un dérivé du ت tāʾ et non du ه hāʾ, d'où la présence des deux points. Il suffit de boucler un tāʾ pour obtenir un tāʾ marbūṭa) est une consonne, à savoir un /t/ ; toutefois, elle ne se trouve qu'en fin de mot et est toujours précédée de la voyelle brève /a/ (qui n'est que rarement écrit). Le son /t/ n'est prononcé que si elle est précédée d'un alif ا ) ou si les voyelles casuelles finales qui suivent la ta le sont aussi ; or, ces voyelles sont souvent omises dans la prononciation courante. C'est pour cette raison qu'on indique, improprement, que cette lettre vaut [a(t)].

    Le tāʾ marbūṭa a une valeur grammaticale en arabe : c'est souvent la désinence du féminin (pour les adjectifs, les substantifs et les noms propres dont il existe une forme masculine). Le tāʾ marbūṭa n'est donc pas présent dans les verbes arabes.

    Un tāʾ marbūṭa se transforme en « tāʾ ṭāwila » (« long », donc « normal ») lorsque le nom est mis à la forme duelle ou lorsque le mot est suivi d'un morphème, tel que celui de la possession : طاولة - طاولتي (« ma table » ~ « table »)

    Dans une prononciation soutenue, on fait entendre à la pause un [h] à la place du [t]. Le tāʾ marbūṭa est rarement transcrit quand il est muet ; seule la translittération en indique généralement la présence (voir plus bas à la section « Translittération »), mais les usages sont très fluctuants. Dans cette encyclopédie, le tāʾ marbūṭa sera noté par ʰ. Voir aussi plus bas à « Types de lecture » pour d'autres détails.

    ʾAlif maqṣūra

    La lettre ى ʾalif maqṣūra ne s'utilise qu'en fin de mot ; c'est une lettre de prolongement pour le phonème /a/. Son nom indique le son obtenu, « ʾalif de prolongement », et non sa forme, puisque la lettre ressemble à un ي yāʾ. Son utilisation est décrite à la section « Voyelles longues et lettres de prolongement ».

    Ligature lām ʾalif

    Lorsqu'un ل lām est suivi d'un ا ʾalif, il faut remplacer les deux lettres par la ligature لا ; il existait auparavant d'autres ligatures de ce type, qui ne sont cependant plus utilisées, sauf dans des compositions soignées et quelques cas figés. On peut encore les rencontrer dans des textes anciens. Certaines sont représentées dans l'article consacré aux ligatures.

    ʾAlif muet

    Dans quelques mots, et surtout au cours de la flexion verbale, on peut écrire un ʾalif qui ne se prononce pas et ne sert pas de support à un diacritique. On le trouve principalement dans le mot مِائَة miʾa, « cent » (qui serait écrit plus régulièrement مِئَة). Dans la conjugaison, on ajoute un ʾalif muet après un wāw و en fin de mot ; ainsi :

    • كَتَبُوا katabū, « ils ont écrit » ;
    • رَمَوْا ramaw, « ils ont lancé ».

    Diacritiques

    Tel qu'écrit couramment, l'alphabet arabe n'utilise pour ainsi dire pas de diacritiques, outre le point souscrit ou suscrit obligatoire pour distinguer des lettres ambiguës. Pour faciliter la lecture, cependant, et ce dans un cadre didactique ou religieux, de nombreux signes auxiliaires viennent rendre le texte moins ambigu : l'arabe ne notant normalement pas les voyelles, par exemple, ni les géminations ou encore les assimilations, il n'est pas possible à un lecteur débutant de lire à voix haute un texte sans l'aide de ces signes, ou sans une bonne connaissance de la langue.

    Notation des voyelles

    Toutes les lettres des tableaux précédents sont des consonnes (ou des lettres muettes), contrairement à ce qu'on pourrait croire. Les voyelles ne sont que rarement notées, et si elles le sont, c'est sous la forme de diacritiques.

    Voyelles brèves

    Celles-ci ne sont pas indiquées autrement que par des diacritiques, et ce seulement pour lever des ambiguïtés (rarement) ou dans les ouvrages didactiques ou religieux.

    L'absence de la notation des voyelles brèves rend parfois ambiguë la compréhension des mots, en particulier lorsque ceux-ci sont lus isolés de tout contexte. Notons, par exemple, qu'un mot de trois consonnes tel que كتب (ktb) peut théoriquement se lire, selon le contexte, de 17 manières différentes :

    • un verbe à la 3ème personne du masculin singulier de l'accompli actif, simple كَتَبَ (kataba, il a écrit) ou factitif كَتَّبَ (kattaba, il a fait écrire)
    • un verbe à la 3ème personne du masculin singulier de l'accompli passif, simple كُتِبَ (kutiba, il a été écrit) ou factitif كُتِّبَ (kuttiba, on l'a fait écrire)
    • un verbe factitif à la 2ème personne du masculin singulier de l'impératif كَتِّبْ (kattib, fais écrire)
    • un nom masculin pluriel كُتُب (kutub, livres), pouvant prendre cinq désinences casuelles différentes (Nominatif/Accusatif/Génitif défini, Nominatif/Génitif indéfini)
    • un nom d'action singulier كَتْب (katb, le fait d'écrire), pouvant prendre les cinq mêmes désinences casuelles
    • un syntagme préposition + nom كَتَبّ (ka-tabb, comme un tranchement), défini ou indéfini

    Tous ces mots sont discriminés par des voyelles brèves qui la plupart de temps ne sont pas écrites. Il en résulte qu'ils se trouveront tous sous l’orthographe unique كتب (ktb) dans la plupart des textes. C'est donc au lecteur de rajouter mentalement les voyelles nécessaires afin de déterminer le sens véritable du mot en question. Il sera pour cela grandement aidé par le contexte.

    Voyelles longues et lettres de prolongement

    Quatre lettres, dites « de prolongement », sont employées pour indiquer la présence d'une voyelle longue — qui, elle, n'est normalement pas écrite —, ا ʾalif, ى ʾalif maqṣūra (seulement en fin de mot), ي yāʾ, et و wāw. Ces deux dernières sont aussi les consonnes pleines y et w. Dans un texte non vocalisé, ce qui est de loin le cas le plus fréquent, l'on obtient les ambivalences suivantes :

    • ا ʾalif = ā ou d'autres phonèmes, parmi lesquels la consonne ʾ (coup de glotte) ;
    • ى ʾalif maqṣūra = ā en fin de mot ;
    • ي yāʾ = ī ou y ;
    • و wāw = ū ou w.

    En fait, l'arabe, par exemple pour le son ū, décompose logiquement le phonème long en uw ; comme seule la consonne est écrite, celle-ci semble noter aussi ū. De sorte, ces lettres, qui sont toutes des consonnes (historiquement pour ا ʾalif), peuvent, d'une certaine manière, remplir le rôle de voyelles longues ; on dit alors qu'elles sont des matres lectionis (en latin « mère de la lecture »). En effet, l'alphabet arabe, bien qu'il soit un abjad, marque systématiquement l'emplacement de voyelles longues : partant, ces signes indiquant les emplacements en question sont aussi lus comme des voyelles. D'autres écritures sémitiques, du reste, comme l'alphabet hébreu, retiennent ce procédé, ce qui mène certains spécialistes des écritures (comme Thomas Bauer ; cf. bibliographie ci-dessous) à considérer que ces abjads ne sont pas purement consonantiques et qu'ils méritent bien l'appellation d'alphabets dotés de voyelles.

    Diphtongues

    Deux diphtongues sont principalement utilisées, ay et aw ; comme a n'est normalement pas écrit, seul le deuxième élément, y ou w l'est, au moyen de la consonne idoine, ي yāʾ ou و wāw, ce qui crée une nouvelle ambiguïté ; en effet, ي yāʾ et و wāw peuvent donc être lus comme :

    • des consonnes ;
    • des lettres de prolongement ;
    • des seconds éléments de diphtongue.

    Écriture de la hamza

    Historiquement, la lettre ʾalif notait une occlusive glottale, ou « coup de glotte », transcrite par [ʔ], ce que confirment les alphabets issus de la même origine phénicienne. Or, elle a servi, de la même manière que dans d'autres abjads, avec yāʾ et wāw, de mater lectionis, c'est-à-dire de caractère de remplacement pour noter une voyelle longue. De fait, au cours du temps sa valeur phonétique s'est effacée et, depuis, ʾalif sert principalement à remplacer des phonèmes, noter l'allongement de la voyelle /a/ ou servir de support graphique à certains signes.

    L'alphabet arabe se sert maintenant de la lettre hamza pour transcrire le coup de glotte, phonème qui, en arabe, peut se manifester n'importe où dans un mot, même à l'initiale ou en finale. Cette lettre, cependant, ne fonctionne pas comme les autres : elle peut être écrite seule ou avoir besoin d'un support, auquel cas elle devient un diacritique :

    • sans support : ء ;
    • avec support : إ ,أ (sur et sous un ʾalif), ؤ (sur un wāw), ئ (sur un yāʾ sans points ou yāʾ hamza).

    Assimilations

    L'alphabet arabe ne note pas les cas d'assimilations des consonnes en contact :

    • dévoisement : malgré ce que la graphie indique, مُبْتَدَأ mubtadaʾ est prononcé /muptadaʾ/. Il est notable que l'écriture ne se modifie pas dans ce cas pour suivre la prononciation, au contraire de ce qu'elle fait dans d'autres cas (élision de la hamza instable, par exemple) ;
    • assimilation complète de l'article أَل ʾal : le /l/ de l'article est entièrement assimilé aux consonnes dentales qui suivent (traditionnellement nommées consonnes « solaires » par opposition aux autres, dites « lunaires ») ; l'écriture, cependant, ne note pas clairement cette assimilation : /ʔal/+/d/ > /ʔadd/, noté د + أَل (ʾal + d-) > أَلدّ (translittération : ʾaldd- ; noter la šadda) et non *أَدّ (translittération : ʾadd). La lettre lām, en effet, continue d'être écrite bien qu'elle ne soit plus prononcée (elle ne reçoit donc pas de sukūn) ; la graphie est d'autant plus redondante que la gémination obtenue peut être – rarement – indiquée par la šadda. La transcription doit cependant donner la prononciation, dans le cas précédent : ʾad-d (on place un trait d'union entre l'article et le nom pour indiquer que dans la graphie arabe, l'article est directement collé au nom ; c'est aussi le cas pour d'autres mots outils).
    Graphie Translittération Transcription
    1 ز ,ر ,ذ ,د ,ث ,ت + أَل
    ʾal + t-, ṯ-, d-, ḏ-, r-, z- ʾal + t-, ṯ-, d-, ḏ-, r-, z-
    أَلزّ ,أَلرّ ,أَلذّ ,أَلدّ ,أَلثّ ,أَلتّ
    ʾaltt-, ʾalṯṯ-, ʾaldd-, ʾalḏḏ-, ʾalrr-, ʾalzz- ʾat-t-, ʾaṯ-ṯ-, ʾad-d-, ʾaḏ-ḏ-, ʾar-r-, ʾaz-z-
     
    2 ض ,ص ,ش ,س + أَل | ʾal + s-, š-, ṣ-, ḍ- ʾal + s-, š-, ṣ-, ḍ-
    أَلضّ ,أَلصّ ,أَلشّ ,أَلسّ ʾalss-, ʾalšš-, ʾalṣṣ-, ʾalḍḍ- ʾas-s-, ʾaš-š-, ʾaṣ-ṣ-, ʾaḍ-ḍ-
     
    3 ن ,ل ,ظ ,ط + أَل | ʾal + ṭ-, ẓ-, l-, n- ʾal + ṭ-, ẓ-, l-, n-
    أَلنّ ,أَللّ ,أَلظّ ,أَلطّ ʾalṭṭ-, ʾalẓẓ-, ʾalll-, ʾalnn- ʾaṭ-ṭ-, ʾaẓ-ẓ-, ʾal-l-, ʾan-n-

    Lettres non traditionnelles

    Dans l'alphabet arabe dit « occidental », la lettre fāʾ était écrite ڢ (au lieu de ف de l'alphabet oriental), tandis que qāf était représentée par ڧ (plutôt que ق). De nos jours, les éditions maghrébines suivent les usages orientaux. Il faut noter pourtant qu'il existe toujours des publications du Coran en style andalou et maghrébin (occidental).

    Ponctuation

    L'arabe s'écrivant de droite à gauche, les éditions modernes utilisent des signes de ponctuation respectant cette écriture, à savoir :

    • la virgule renversée « ، » (qui permet aussi de ne pas être confondue avec « د », par exemple) ;
    • le point-virgule renversé « ؛ » ;
    • le point d'interrogation inversé « ؟ » ;
    • le point final est noté « ـ »

    Numération

    Autres problèmes d'orthographe

    • Rencontres de sukūn, sukun et hamza instable ;
    • paragoge dans les mots étrangers.

    Styles d'écritures

    Il existe différents styles calligraphiques. On divise généralement les calligraphies arabes en deux groupes facilement distinguables :

    • les écritures coufiques (ou kufiques), qui se caractérisent par leur caractère anguleux
    • les écritures cursives (naskhi), beaucoup plus arrondies.

    Types de lecture

    L'arabe se lit de droite à gauche comme beaucoup d'écritures sémitiques utilisant des abjads (syriaque, hébreu, etc). Les nombres aujourd'hui s'écrivent souvent de gauche à droite mais se lisent toujours de droite à gauche (unités, puis dizaines, centaines, milliers, etc).

    Claviers arabes

    Inspirés des claviers de machines à écrire, les claviers arabes d'ordinateurs peuvent se présenter ainsi : Intellark ajouté à un clavier QWERTY.

    Translittération

    Il existe plusieurs systèmes de translittération de l'arabe, les plus employés étant celui de la revue Arabica et celui de l'Encyclopédie de l'islam. Les remarques qui suivent portent sur la transcription Arabica qui est la plus cohérente des deux (une lettre arabe = une lettre latine). On l'a vu, certaines lettres ont plusieurs fonctions, d'autres sont muettes ; la transcription est donc souvent ambiguë :

    • la hamza indépendante, ainsi que ʾalif, yāʾ et wāw quand ils portent la hamza diacritée, ont tous la valeur [ʔ], transcrite ʾ ;
    • ʾalif et ʾalif maqṣūra servent tous deux à allonger le /a/ : la transcription ne permet pas de savoir laquelle des deux lettres est utilisée ;
    • le tāʾ marbūṭa n'est prononcé /t/ qu'en état d'annexion ou lorsqu'on prononce la désinence casuelle; il ne sera transcrit que dans ces deux cas ;
    • le tanwīn est noté en exposant accompagné de sa voyelle casuelle (raʾaytu kalban) ;
    • au sukūn et à la šadda ne correspondent aucun signe particulier. On note رأيْتُ ainsi raʾaytu et كسّر ainsi kassartu (par simple redoublement de la consonne géminée) ;
    • le /l/ de l'article assimilé devant consonne « solaire » est noté /l/ quand on transcrit de l'arabe littéral: al-sirr. En effet, l'assimilation est dans ce cas totalement prédictible. En revanche, lorsqu'on transcrit un texte en dialecte arabe, on doit faire apparaître l'assimilation quand elle se produit: l-kalb; n-nâr. En effet, les règles d'assimilation de l'article sont variables d'un dialecte à l'autre.

    Toutes ces raisons font qu'il est parfois utile d'utiliser une translittération précise qui suive l'original arabe, caractère par caractère. La norme ISO 233 permet cela (dans les exemples suivants, on placera les translittérations entre accolades) :

    • chaque consonne est écrite avec un symbole consonantique, même le ʾalif (translittéré {’}, apostrophe courbe), le wāw, et autres lettres d'allongement :
    • les voyelles ne sont indiquées que si le texte de départ est vocalisé ;
    • les différents types de hamza sont notés par :
      • {'} (apostrophe droite) avec un support : حَقَائِبْ ḥaqāʾib {ḥaqa’y'ib°},
      • {ˌ} sans support : ضَوْء ḍawʾ {ḍaw°ˌ},
    • ʾalif maqṣura est noté {ỳ} : مَتَى matā {mataỳ} ;
    • tāʾ marbūṭa vaut {ẗ} (dans d'autres normes, un {ʰ}) : سَبْعَة sabʿa {sab°ʻaẗ} ;
    • les tanwīn sont rendues par un accent aigu : رَجُلًا raǧulan {raǧuláʼ} ;
    • le sukūn est noté par un {°} : زَوْج zawǧ {zaw°ǧ}, la šadda par un macron : شَدَّة šadda {šad̄aẗ} ;
    • l'assimilation de l'article est écrite lettre par lettre : أَلشَّمْس ʾaš-šams {'a’lš̄am°s}, etc.

    Notes et références

    1. Certaines écritures, dont par exemple le xiao'erjing, ont introduit des voyelles.
    2. Une translittération de l'arabe doit faire apparaître clairement les caractères qui ne se prononcent pas ou se prononcent comme d'autres afin d'être non ambiguë ; une transcription n'indique cependant que la prononciation.

    Voir aussi

    Bibliographie

    • Michel Neyreneuf et Ghalib Al-Hakkak, Grammaire active de l'arabe, Le Livre de Poche, collection « Les langues modernes », 1996 ;
    • Régis Blachère et Maurice Gaudefroy-Demombynes, Grammaire de l'arabe classique, cinquième édition, Maisonneuve et Larose, 2004 ;
    • The World's Writing Systems, ouvrage collectif sous la direction de Peter T. Daniels et William Bright, article « Arabic Writing » de Thomas Bauer, Oxford University Press, 1996 ;
    • Dictionnaire Mounged de poche (français arabe ─ فرنسيّ عربيّ), dixième édition, éditions Dar el-Machreq, Beyrouth.
    • Mathieu Guidère, Grammaire alphabétique de l'arabe, Paris, Editions Ellipses, collection « Grammaticalement correct », 2004 (nouvelle édition revue et corrigée).

    Articles connexes

    Liens externes

    Sur les autres projets Wikimedia :