DIINAR

Un article de Wikipédia, l'encyclopédie libre.

DIINAR.1 (DIctionnaire INformatisé de l’ARabe, version 1), acronyme arabe Ma‘âlî (« Mu‘jam al-‘Arabiyya l-’?l? » –"مـعـالــي" مختصر "معجم العربية الآلي" ), est une ressource linguistique très complète de l’arabe, structurée comme une base de données, et opérant au niveau du mot-forme – ou du mot graphique –, c.-à-d. à ce qu’on appelle le niveau morphologique. Elle a été réalisée en commun, à Tunis à l’IRSIT (Abdelfattah Braham et Salem Ghazali), et en France à l’ENSSIB (Mohamed Hassoun) et à l’université Lumière-Lyon 2 (Joseph Dichy).

• À chaque entrée sont associés des spécificateurs morphosyntaxiques. L’analyse morphologique peut ainsi traiter des entrées en graphie arabe courante non-vocalisée, et la génération morphologique, produire des formes en graphie entièrement, partiellement ou non-vocalisée, selon le besoin. Ces spécificateurs appartiennent à des ensembles finis, mais qui permettent un traitement exhaustif des données, selon une approche entièrement originale.

• Le nombre total des entrées de la ressource linguistique DIINAR.1 est actuellement de 121.522, pour 6,546 racines.

• Le nombre des entrées inclut 445 mots-outils relevant de diverses catégories grammaticales (prépositions, conjonctions, etc.) et le prototype d’une base de données des noms propres de 1.384 entrées. Ces deux types d’entrées comportent leurs propres jeux de spécificateurs morphosyntaxiques (du niveau du mot). Les principales parties de la base de données comprennent, en outre :


Nombre d’entrées principales appartenant aux catégories lexicales majeures

        Noms, y compris adjectifs	                               29.534
        Pluriels brisés –جموع التكسير	                                9.565
        Noms propres (prototype) (أسماء الأعلام)	                        1.384
        Verbes	19.457
        Dérivés nominaux (مشتقات اسمية)
           * formes infinitives (مصادر)	                               23.274
           * participes actifs  (أسماء الفاعل )	                       17.904
           * participes passifs  (أسماء المفعول )  	               13.373
           * adjectifs analogues’ (صفات مشبهة)                	        5.781
           * noms de temps et lieu’ (أسماء المكان والزمان)	       10.370
       
        Total des dérivés nominaux	                               70.702
        Sous total d’entrées principales 	                      121.077

Nombre d’entrées principales appartenant aux catégories lexicales majeures


• Diffusion : via ELDA, European Evaluation and Language resources Distribution Agency – Agence Européenne d’évaluation et de Distribution des Ressources linguistiques, 55, rue Brillat-Savarin, 75013-Paris – www.elda.org.

La version actuelle (DIINAR1) a été retirée du catalogue, elle sera remplacée par une version DIINAR2 dans le courant du mois de .


• Articles et documents téléchargeables sur le site de DIINAR http://diinar.univ-lyon2.fr/


• Voir également sur le site http://diinar.univ-lyon2.fr/ le rapport du projet européen DIINAR-MBC

Sources[modifier | modifier le code]