Langage local

Un article de Wikipédia, l'encyclopédie libre.

En informatique théorique, et notamment en théorie des langages rationnels, un langage local est un langage formel pour lequel l'appartenance d'un mot au langage peut être testée en considérant les blocs de deux lettres consécutives ou, de manière plus imagée, en faisant glisser sur le mot une « fenêtre » de largeur 2[1]. De manière équivalente, c'est un langage rationnel qui peut être reconnu par un automate fini déterministe d'un type particulier, appelé automate local[2]. Ces automates et langages interviennent notamment dans la construction de Glushkov. Un langage local est un langage sans étoile.

Premier exemple[modifier | modifier le code]

Le langage des mots obtenus en concaténant le motif ab est un langage local. En effet, en faisant glisser une fenêtre de largeur 2 sur un mot, il suffit de vérifier :

  • que le mot commence par un a
  • que toute fenêtre de deux lettres n'est pas aa ou bb
  • que le mot termine par b.

Le mot abababab est dans ce langage. Le mot abababbab ne l'est pas car il y a une fenêtre de deux lettres qui est bb : abababbab.

Définition[modifier | modifier le code]

Définition formelle[modifier | modifier le code]

Un langage L sur un alphabet A est local s'il existe deux parties R et S de A et une partie F de A × A telles que w est un mot de L si et seulement si[3] :

  1. la première lettre de w est dans R ;
  2. la dernière lettre de w est dans S ;
  3. et aucun facteur de longueur 2 de w n'est dans F.

La dernière des conditions peut être remplacée par :

  1. tous les facteurs de longueur 2 de w sont dans l'ensemble (A × A) \ F,

mais celle-ci se prête moins bien à l'écriture formelle[pas clair].

Définition formelle avec expression rationnelle[modifier | modifier le code]

Autrement dit, un langage L est local s'il est décrit par une expression rationnelle (étendue)[1],[4] de la forme :

.

où R, S sont des ensembles de lettres, et F est un ensemble de mots de longueur 2.

On retrouve aussi une version plus générale de la définition qui autorise l'adjonction du mot vide. L'expression régulière étendue d'un langage local montre qu'il est sans étoile.

Exemples[modifier | modifier le code]

Sur l'alphabet [4], les langages suivants sont locaux :

  • , car  ;
  •  ;
  • .

Propriétés[modifier | modifier le code]

Automate local[modifier | modifier le code]

Exemple d'un automate local comme il intervient dans la construction de Glushkov.

Un automate local, aussi appelé automate de Glushkov[4], sur un alphabet à lettres est un automate déterministe complet à états ; les états sont en bijection avec les lettres, avec un état supplémentaire noté 1 qui est aussi l'état initial. La propriété caractéristique de l’automate est que toutes les transitions aboutissant à un état a donné sont étiquetées par la lettre qui est l'état d'arrivée : si est une transition de l'automate, alors . Aucune transition entre dans l'état initial.

Un chemin d'étiquette issu de l'état 1 passe donc successivement par les états . Le chemin est réussi et le mot est accepté si et seulement si

  1. est l'étiquette d'une transition depuis l'état 1 ;
  2. est un état final ;
  3. tous les facteurs sont les étiquettes de transitions consécutives dans l'automate.

Ceci montre qu'un automate local reconnait un langage local et que, réciproquement, un langage local est reconnu par un automate local.

Langage localement testable[modifier | modifier le code]

On peut étendre la définition de langage local. Un langage formel est dit k-testable si l'appartenance d'un mot au langage peut être vérifiée en regardant seulement les préfixes, les suffixes et les facteurs de longueur k du mot. Un langage est dit localement testable s'il est k-testable pour un entier k[8]. Un langage local est 2-testable[1]. Il existe une distinction entre langages localement testables et langages strictement localement testables[9]. Les premiers sont fermés pour les opérations booléennes, les deuxièmes ne le sont pas. La famille des langages localement testables forme une variété de langages formels.

Notes et références[modifier | modifier le code]

  1. a b c et d Salomaa 1981, p. 9.
  2. Lawson 2004, p. 130.
  3. Lawson 2004, p. 129.
  4. a b c et d Sakarovitch 2009, p. 228.
  5. ne contenant pas le mot vide, dans la version stricte de la définition
  6. Lawson 2004, p. 132.
  7. McNaughton et Papert 1971, p. 18.
  8. McNaughton et Papert 1971, p. 14.
  9. Yu 1997, p. 79-80.
(en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « local language (formal language) » (voir la liste des auteurs).

Bibliographie[modifier | modifier le code]

Articles connexes[modifier | modifier le code]