Grammaire régulière

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

Une grammaire régulière, rationnelle ou à états finie permet de décrire un langage régulier. Bien que les expressions rationnelles soient le modèle de définition le plus courant d'un langage régulier, en particulier dans le domaine des langages de programmation, il ne s'en trouve pas moins que, techniquement, la reconnaissance d'un mot d'un langage régulier s'effectue par la traduction d'expressions rationnelles en grammaire régulière.

Notation[modifier | modifier le code]

Une grammaire régulière se note de la même manière qu'une grammaire hors-contexte:

G = \{ N, \Sigma, P, S \}
N est le vocabulaire non terminal, \Sigma est le vocabulaire terminal, P est l'ensemble des règles de production et S \in N est le non terminal initial.

Définition[modifier | modifier le code]

L'ensemble des grammaires régulières est inclus dans l'ensemble des grammaires hors-contexte. Aussi les règles de production ne doivent comporter aucun symbole terminal dans leur partie gauche.

De plus, les règles de production doivent être de l'une des 2 formes suivantes:

  • grammaire régulière à gauche
 X \rightarrow Ya
 X \rightarrow a
 X \rightarrow \epsilon
  • grammaire régulière à droite
 X \rightarrow aY
 X \rightarrow a
 X \rightarrow \epsilon
X,Y \in N,  a \in \Sigma et  \epsilon est le mot vide.

À la vue des règles de production, on peut en déduire que le principe d'une grammaire régulière est de reconnaitre un mot en partant d'une de ses extrémités et de progresser vers l'autre bout du mot en reconnaissant un seul caractère à la fois.

Mise en œuvre[modifier | modifier le code]

Puisqu'une grammaire dite régulière est également hors-contexte, il est possible de mettre en œuvre une grammaire régulière par le biais d'un automate à pile. Il est cependant plus à propos d'utiliser un automate fini déterministe. La traduction d'une grammaire régulière en un automate est aisée, voire mécanique.

Soit une grammaire régulière à gauche G = \{ N, \Sigma, P, S \}, alors l'automate A = \{ Q,\Sigma',\delta , Q_0 ,Q_T \} équivalent à G est défini tel que:

  • Q = N \cup \{ q_t \} avec Q l'ensemble des états et q_t un état puits terminal,
  • \Sigma' = \Sigma avec \Sigma' l'ensemble des symboles terminaux
  • Q_0 = S avec Q_0 l'état initial
  • \delta \in Q \times \Sigma \rightarrow Q est la fonction de transition telle que, à la lecture d'un terminal x à partir d'un état q_i vers un autre état q_f = \delta(q_i,t).

La lecture de P permet de construire \delta. Pour chaque Pi \in P:

  • Si P_i = X \rightarrow aY alors on a \delta(X,a) = Y
  • Si P_i = X \rightarrow a alors on a \delta(X,a) = q_t
  • Si P_i = X \rightarrow \epsilon alors on a X \in Q_T, Q_T L'ensemble des états terminaux.

On applique enfin les algorithmes de déterminisation et de minimisation afin d'obtenir un automate déterministe et minimal.

Le même type de jeu de règles peut être établi pour une grammaire régulière à droite.

Exemple de conversion[modifier | modifier le code]

Soit la grammaire G = \{ N, \Sigma, P, S \} dont les règles de production sont:

S \rightarrow dA | rB | mC | \epsilon
A \rightarrow oS
B \rightarrow eS
C \rightarrow iS

On a donc :

N = \{ S,A,B,C \}
\Sigma = \{ d,r,m,o,e,i \}

En appliquant les règles énumérées ci-dessus, on obtient l'automate suivant:

Automate.png

L'automate obtenu est non minimal (bien que déterministe), un algorithme de minimalisation enlèvera ainsi l'état q_t inutile.

Articles connexes[modifier | modifier le code]

Liens utiles[modifier | modifier le code]