Logique floue

Un article de Wikipédia, l'encyclopédie libre.
(Redirigé depuis Fuzzy logic)
Aller à : navigation, rechercher
Inférence
Les types de raisonnement rigoureux
Déductif (analytique)
Inductif (synthétique)
Abductif
  • Aucun
Les types de raisonnement non-rigoureux
Déductif
  • Aucun
Inductif
Abductif
  • Abduction
Logique floue, modale, probabiliste, temporelle
  • Modalisation (possible, nécessaire), probabilités, temps
Les types de raisonnement faux
Paralogisme (Biais cognitif)
Sophisme (mensonge)
Source : projetconnaissance.free.fr
Page d'aide sur les redirections Pour l'album des Super Furry Animals, voir Fuzzy Logic (album).

La logique floue (fuzzy logic, en anglais) est une extension de la logique classique aux raisonnements approchés. Par ses aspects numériques, elle s'oppose aux logiques modales.

Formalisée par Lotfi Zadeh en 1965, outil de l'intelligence artificielle, elle est utilisée dans des domaines aussi variés que l'automatisme (freins ABS, conduite de processus), la robotique (reconnaissance de formes), la gestion de la circulation routière (feux rouges), le contrôle aérien (gestion du trafic aérien), l'environnement (météorologie, climatologie, sismologie, analyse du cycle de vie), la médecine (aide au diagnostic), l'assurance (sélection et prévention des risques) et bien d'autres.

Elle s'appuie sur la théorie mathématique des ensembles flous. Cette théorie de Zadeh est une extension de la théorie des ensembles classiques aux ensembles définis de façon imprécise. Partant d'un concept de fonction d'appartenance à valeur dans [0, 1], Zadeh :

  • redéfinit ce qu'est un sous-ensemble d'un univers donné,
  • bâtit un modèle complet de propriétés et de définitions formelles,
  • et montre que cette théorie des sous-ensembles flous se réduit effectivement à la théorie des sous-ensembles classiques dans le cas où les fonctions d'appartenance ne prennent que les valeurs binaires de {0,1}.

La logique floue présente aussi l'intérêt d'être plus facile et moins chère à implémenter qu'une logique probabiliste, bien que cette dernière seule soit stricto sensu cohérente (voir Théorème de Cox-Jaynes). Par exemple la courbe Ev(p) peut être remplacée par trois segments de droite sans perte excessive de précision pour beaucoup d'applications considérées ci-dessus.

Principe[modifier | modifier le code]

À l'inverse de l'algèbre de Boole, la logique floue autorise la valeur de vérité d'une condition à parcourir un autre domaine que la paire {vrai,faux}. En logique floue, il y a des degrés dans la satisfaction d'une condition.

Propriétés[modifier | modifier le code]

Prenons l'exemple de la vitesse d'un véhicule sur une route nationale française. La vitesse normale est de 90 km/h. La vitesse est considérée élevée au-dessus de 100 km/h et réglementaire en dessous de 80 km/h. On souhaite caractériser la vitesse du véhicule en répondant par exemple à la question « La vitesse est-elle élevée ? ».

Fuzzy0.svg
fig. 1

Dans ce modèle de réglementation routière, en logique booléenne, la réponse à la question s'énonce de la manière suivante (voir fig. 1) :

  • La vitesse est élevée à 100 % au-dessus de 100 km/h et à 0 % en dessous.

En logique floue, on autorise différents degrés d'énoncés de réponse à la question « La vitesse est-elle élevée ? » (voir fig. 2) :

  • La vitesse est réglementaire en dessous de 80 km/h. On peut donc dire qu'en dessous de 80 km/h, la vitesse est élevée avec un taux de confiance de 0 %.
Fuzzy1.svg
fig. 2
  • La vitesse est élevée au-dessus de 100 km/h. La vitesse est non-réglementaire avec un taux de confiance de 100 % au-dessus de 100 km/h.
  • Aux stades intermédiaires, on considère que la vitesse est non-réglementaire à 50 % de confiance à 90 km/h et à 25 % de confiance à 85 km/h.

De la même manière, on peut définir une fonction correspondant à la question « La vitesse est-elle peu élevée ? » de la manière suivante (voir fig. 3) :

  • La vitesse est peu élevée en dessous de 80 km/h. Elle est donc peu élevée à 100 %.
Fuzzy2.svg
fig. 3
  • La vitesse est considérée comme pas du tout peu élevée au-dessus de 100 km/h. Elle est donc peu élevée à 0 %.
  • La vitesse est donc peu élevée à 50 % à 90 km/h, et à 25 % à 95 km/h.

On peut également définir une fonction correspondant à la question « La vitesse est-elle moyenne ? » (voir fig. 4) :

  • La vitesse est moyenne à 90 km/h. À cette allure, la vitesse est moyenne à 100 %.
Fuzzy3.svg
fig. 4
  • La vitesse n'est pas du tout moyenne en dessous de 80 km/h et au-dessus de 100 km/h. Hors de cet intervalle, la vitesse est moyenne à 0 %.
  • La vitesse est donc moyenne à 50 % à 85 km/h et 95 km/h.

Il n'est pas obligatoire que la transition soit linéaire. Des transitions hyperboliques (comme une sigmoïde ou une tangente hyperbolique), exponentielle, gaussienne (dans le cas d'un état moyen) ou de toute autre nature sont utilisables (voir fig. 5).

Fuzzy4.svgFuzzy5.svgFuzzy6.svg
fig. 5

Relations[modifier | modifier le code]

Le degré de vérité d'une relation floue entre 2 ou plusieurs objets est le degré d'appartenance de la paire ou du t-uple à l'ensemble flou associé à la relation.

Soit la relation est1 (est-un/est-une). Pour dire que toute chaise est un meuble et que 30% des meubles sont des chaises, on accordera un degré de vérité de 1 à est1(chaise, meuble) et un degré 0,3 à est1(meuble, chaise).

La connaissance topographique qu'un agent possède d'un monde clos pourra s'appuyer sur l'attribution de degrés de vérité à une relation du style x est_plus_près_de y que_de z, construite et/ou affinée par apprentissage.

De façon générale, les relations floues permettront de coder des connaissances graduées, empiriques ou typiques, acquises directement ou par des heuristiques, des inductions...

Combinaison d'énoncés[modifier | modifier le code]

Dans le cas d'une combinaison d'énoncés (« Si le ciel est bleu et si j'ai le temps »), trois cas se présentent :

  • Les énoncés sont liés par un « ET » : dans ce cas, on peut assigner à cette conjonction le degré de vérité le plus faible. En fait, il suffit de choisir un opérateur \top tel que \top(x,y)\leq \min(x,y)\top est appelée une t-norme. \min est la plus optimiste des t-normes.
  • Les entrées sont liées par un « OU » : dans ce cas, on peut assigner à cette adjonction le degré de vérité le plus élevé. En fait, il suffit de choisir un opérateur \bot tel que \bot(x,y)\geq \max(x,y)\bot est appelée une t-conorme. \max est la plus pessimiste des t-conormes.
  • Un ou plusieurs énoncés peuvent être niés. Dans ce cas, pour garder un maximum de propriétés logiques on associe à la négation le complément du degré de vérité de l'énoncé.

Premier Système[modifier | modifier le code]

En incarnant ET par min, OU par max et NON(x) par 1-x[1], il est possible de représenter toutes les opérations logiques de base en logique floue. En effet, à partir des opérateurs ET, OU et NON (AND, OR, NOT), on peut représenter les 8 opérations de base :

  • OU (OR) : A OU B = max(A, B)[2];
  • ET : A ET B = min(A, B);
  • NON : NON A = 1 - A;
  • OU EXCLUSIF (OUEX) : A OUEX B = (A OU B) ET NON (A ET B) = max(A, B) - min(A, B);
  • NI (NON-OU ) : A NI B = 1 - max(A, B);
  • ON (NON-ET) : A ON B = 1 - min(A, B);
  • EQV (NON-OUEX)) : A EQV B = 1 + min(A, B) - max(A, B);
  • REPETEUR (REP) : REP A = A.

Ce système conserve de nombreuses propriétés booléennes, mais pas la non contradiction : si A a pour degré de vérité v, non(A) a pour degré de vérité 1-v et leur conjonction min(v, 1-v), à valeur dans [0 0,5]...

Second Système[modifier | modifier le code]

Par ailleurs, la dimension numérique des variables de la logique floue permet d'utiliser d'autres opérations :

  • Le produit : A.B ou A × B pour ET (ce qui fait perdre l'idempotence : A ET A devient alors une interprétation de très A);
  • La composition : A + B - A × B pour OU (la simple addition dépasserait les bornes de l'intervalle [0 1] dans certain cas)[3].
  • En conservant NON(v)=1-v, on garde encore de nombreuses propriétés logiques.

Autres systèmes[modifier | modifier le code]

Pour combattre certains problèmes d'inférence, on peut vouloir un ET plus dur, associant à A ET B, le degré max(A+B-1, 0). Dans un tel cas, OU et NON doivent être choisis de façon à conserver ou non certaines propriétés, par exemple pour sécuriser les raisonnements. On trouvera dans la Théorie des Possibilités (op. cit.) les relations entre axiomes logiques souhaités et équations fonctionnelles que doivent respecter les opérateurs correspondants.

On peut même changer l'espace de vérité, préférer par exemple [-1 +1] pour certaines propriétés bipolaires. Selon Goguen, il est souhaitable que ET et OU dotent cet espace d'une structure de treillis, la définition du NON pouvant se révéler critique.

Une famille paramétrique d'opérateurs permet à un même moteur d'inférence d'incarner des logiques plus ou moins strictes.

Opérateurs flous[modifier | modifier le code]

Les opérateurs flous (ou fuzzy) peuvent être définis de diverses manières et une même application peut d'ailleurs faire appel à des implémentations différentes judicieusement choisies selon le contexte.

L'exemple ci-dessous montre que, contrairement à une opinion parfois exprimée, le choix des opérateurs à utiliser n'est pas une simple question de goût ou d'inspiration du moment.

Exemple d'utilisation[modifier | modifier le code]

Voici un exemple qui montre comment combiner des opérateurs flous (fuzzy) de divers types.

  • l'exemple : confirmer l'appartenance d'une personne à un groupe

Une personne sera plus ou moins membre (à un niveau fzMembre, compris entre 0 et 1, inclusivement) d'un groupe, disons les flower lovers, soit si, pour n'importe quelle raison, elle en fait déjà plus ou moins partie (à un niveau fzDejaMembre), soit si elle a une assez bonne connaissance des orchidées (fzConnaitOrchidees) et que la connaissance des orchidées est un critère assez déterminant (fzOrchideesAmis) d'appartenance au groupe des flower lovers.

  • une solution qui paraît bonne est :
fzMembre = Zadeh_OR( fzDejaMembre, Multiply_AND( fzConnaitOrchidees, fzOrchideesAmis ))
  • et s'implémente comme :
fzMembre = max( fzDejaMembre, ( fzConnaitOrchidees * fzOrchideesAmis ))
pour fzDejaMembre=0 (faux), fzConnaitOrchidees=0.778 et fzOrchideesAmis=0.9, on trouve 0.7
pour fzDejaMembre=0.7, fzConnaitOrchidees=0.8 et fzOrchideesAmis=0.9, on trouve 0.72
pour fzDejaMembre=0.72, fzConnaitOrchidees=0.8 et fzOrchideesAmis=0.9, on retrouve 0.72
pour fzDejaMembre=0.72, fzConnaitOrchidees=0.5 et fzOrchideesAmis=0.9, on conserve 0.72
(ce qui est le résultat vraisemblablement attendu)

Autres solutions[modifier | modifier le code]

  • une solution qui n'utiliserait que les opérateurs de Zadeh serait :
fzMembre = Zadeh_OR( fzDejaMembre, Zadeh_AND( fzConnaitOrchidees, fzOrchideesAmis ))
fzMembre = max( fzDejaMembre, min( fzConnaitOrchidees, fzOrchideesAmis ))
pour fzDejaMembre=0 (faux), fzConnaitOrchidees=0.778 et fzOrchideesAmis=1 (vrai), on trouve 0.778
pour fzDejaMembre=0 (faux), fzConnaitOrchidees=0.778 et fzOrchideesAmis=0.9, on trouve aussi 0.778
(ce qui est trop élevé)
pour fzDejaMembre=0.778, fzConnaitOrchidees=0.8 et fzOrchideesAmis=0.9, on trouve 0.8
pour fzDejaMembre=0.8, fzConnaitOrchidees=0.8 et fzOrchideesAmis=0.9, on retrouve 0.8
pour fzDejaMembre=0.8, fzConnaitOrchidees=0.5 et fzOrchideesAmis=0.9, on conserve 0.8
(ce qui est stable mais trop élevé)
  • une solution qui n'utiliserait que les opérateurs représentables par des paraboloïdes hyperboliques serait :
fzMembre = Add_OR( fzDejaMembre, Multiply_AND( fzConnaitOrchidees, fzOrchideesAmis ))
fzMembre = fzDejaMembre + (fzConnaitOrchidees*fzOrchideesAmis) - (fzDejaMembre*fzConnaitOrchidees*fzOrchideesAmis)
pour fzDejaMembre=0 (faux), fzConnaitOrchidees=0.778 et fzOrchideesAmis=0.9, on trouve 0.7
pour fzDejaMembre=0.7, fzConnaitOrchidees=0.8 et fzOrchideesAmis=0.9, on trouve 0.916
(ce qui est sûrement trop élevé)
pour fzDejaMembre=0.916, fzConnaitOrchidees=0.8 et fzOrchideesAmis=0.9, on trouve 0,97648
(ce qui est instable et sûrement beaucoup trop élevé)
pour fzDejaMembre=0,97648, fzConnaitOrchidees=0.5 et fzOrchideesAmis=0.9, on trouve 0. 987 064
(une augmentation bien malvenue)

Convergence[modifier | modifier le code]

Les trois méthodes exposées ci-dessus convergent lorsque les valeurs d'entrée sont booléennes

pour fzDejaMembre=0 (faux), fzConnaitOrchidees=0 (faux) et fzOrchideesAmis=1 (vrai), on trouve 0 (faux)
pour fzDejaMembre=0 (faux), fzConnaitOrchidees=1 (vrai) et fzOrchideesAmis=1 (vrai), on trouve 1 (vrai)
pour fzDejaMembre=1 (vrai), fzConnaitOrchidees=1 (vrai) et fzOrchideesAmis=1 (vrai), on retrouve 1 (vrai)
pour fzDejaMembre=1 (vrai), fzConnaitOrchidees=0 (faux) et fzOrchideesAmis=1 (vrai), on conserve 1 (vrai)

Opérateur implique[modifier | modifier le code]

Pour l'exemple à l'orchidée ci-dessus, une situation normale est que la connaissance des orchidées implique l'appartenance au groupe. C’est-à-dire, plus précisément, qu'on ne peut pas connaître les orchidées et, simultanément, ne pas être membre du groupe des amis des fleurs.

fzImpliqueOk = NOT( AND( fzConnaitOrchidees, NOT( fzMembre ) ) )

De même qu'on a vu ci-dessus plusieurs manières d'implémenter les opérateurs OR et AND, il y a aussi plusieurs manières d'implémenter la notion d'implication.

fzImpliqueOk = Bool_IMPLIES( fzConnaitOrchidees, fzMembre )
fzImpliqueOk = Zadeh_IMPLIES( fzConnaitOrchidees, fzMembre )
fzImpliqueOk = HypPar_IMPLIES( fzConnaitOrchidees, fzMembre )

Implémentation[modifier | modifier le code]

Les opérateurs ci-dessus s'implémenteront respectivement comme ceci :

fzImpliqueOk = fzConnaitOrchidees ⇐ fzMembre 
fzImpliqueOk = 1 - min( fzConnaitOrchidees, (1 - fzMembre) )
fzImpliqueOk = 1 - fzConnaitOrchidees + (fzConnaitOrchidees*fzMembre

dans un cas extrême mais normal, avec fzConnaitOrchidees=0.8 et fzMembre=0.995, les valeurs trouvées seront respectivement

 1 (true)
 0.995 (Zadeh)
 0.996 (Hyperbolic Paraboloid)

dans un cas considéré comme normal, avec fzConnaitOrchidees=0.8 et fzMembre=0.72, les valeurs trouvées seront respectivement

 0 (false) (la personne est moins membre qu'elle ne connait)
 0.72 (Zadeh)
 0.776 (Hyperbolic Paraboloid)

dans un autre cas qui reste normal, la personne pouvant aussi être membre des amis des fleurs à cause de son amour des tulipes, avec fzConnaitOrchidees=0.66 et fzMembre=0.72, les valeurs trouvées seront respectivement

 1 (true)  (la personne est plus membre qu'elle ne connait)
 0.72 (Zadeh)
 0.772 (Hyperbolic Paraboloid)

dans un cas assez douteux, avec fzConnaitOrchidees=0.5 et fzMembre=0.5, les valeurs trouvées seront respectivement

 1 (true) 
 0.5 (Zadeh)
 0.75 (Hyperbolic Paraboloid)

dans un cas anormal, avec fzConnaitOrchidees=0.8 et fzMembre=0.3, les valeurs trouvées seront respectivement

 0 (false)
 0.3 (Zadeh)
 0.44 (Hyperbolic Paraboloid)

dans un cas anormal et extrême, avec fzConnaitOrchidees=0.8 et fzMembre=0.005, les valeurs trouvées seront respectivement

 0 (false)
 0.2 (Zadeh)
 0.204 (Hyperbolic Paraboloid)

Utilisation pratique[modifier | modifier le code]

Une application informatique qui viserait à proposer à un opérateur humain de traiter les cas anormaux en commençant par les plus suspects utiliserait les valeurs indiquées ci-dessus en gras et obtenues par la méthode identifiée Hyperbolic Paraboloid, particulièrement discriminante.

Il n'est pas sûr que cette application intéresse les amis des fleurs. Par contre, l'intérêt pour un service de médecine préventive (ou même pour un fleuriste) est compréhensible. Lorsque le nombre d'examens des cas suspects doit être plafonné (par exemple pour des raisons de temps, de coût, de dangerosité, etc), un pré-classement intelligent, fondé -sinon sur une théorie incontestée- du moins sur une technologie opérationnelle, peut s'avérer utile.

Représentation graphique[modifier | modifier le code]

L'article commons:Fuzzy operator fournit de nombreuses représentations graphiques de quelques implémentations possibles des opérateurs fuzzy. On trouvera ci-dessous, à titre d'exemple, la représentation de huit implémentations différentes d'une opération qui viserait à apprécier la simultanéité de deux faits (jugés de poids équivalents dans les six images à gauche mais de poids différents dans les deux images de droite).

Commande floue[modifier | modifier le code]

Une fois la valeur de l'entrée (« La vitesse est-elle élevée ? ») évaluée, une valeur peut être déterminée pour une fonction de sortie. Considérons la règle « Si la fièvre est forte, alors administrer de l'aspirine ». Une telle règle est appelée commande floue. Elle est composée de deux parties :

  • Une entrée : « La fièvre est-elle forte ? ». On considère qu'une fièvre n'est pas forte en dessous de 38 °C, et qu'elle est forte au-dessus de 40 °C.
  • Une sortie : « Administrer de l'aspirine »

Ces deux parties sont liées. On peut les représenter ensemble comme sur la fig. 6.

Fuzzy7.png
fig. 6

Il existe plusieurs techniques pour déterminer la valeur de la sortie (dans l'exemple : la quantité d'aspirine à administrer) :

  • La droite ayant la même ordonnée que le point de la courbe de départ ayant pour abscisse la valeur de l'entrée coupe la courbe de sortie. L'abscisse de ce point d'intersection est une valeur de sortie possible (fig. 7).
Fuzzy8.png
fig. 7
  • La droite ayant la même ordonnée que le point de la courbe de départ ayant pour abscisse la valeur de l'entrée délimite un trapèze au niveau de la sortie. Le centre de gravité de ce trapèze est également une valeur de sortie possible (fig. 8).
Fuzzy9.png
fig. 8

Insuffisances en tant que théorie ?[modifier | modifier le code]

Il existe une opinion qui dit que[évasif] "La théorie des ensembles flous présente la particularité de n'avoir aucun théorème à proposer. C'est-à-dire que si elle peut rendre quelques services techniques, elle ne peut pour autant prétendre à un quelconque statut de science, et encore moins de théorie.". [citation nécessaire]

En fait, la logique floue a été formalisée[réf. souhaitée] et un théorème (élémentaire, cependant) montre que dans le cas particulier où les propositions traitées ne sont pas floues, la logique floue se réduit à la logique classique.

D'autre part, bien que des détracteurs de la logique floue prétendent que[évasif] "Le théorème de Cox-Jaynes montre d'une part que l'on peut représenter un état de connaissance incertaine par une probabilité, et d'autre part que tout moyen utilisé pour prendre des décisions sera soit isomorphe à la théorie des probabilités, soit incohérent"[citation nécessaire], ce théorème ne s'applique pas aux connaissances floues, qui ne sont généralement pas des connaissances incertaines (ce qui rend difficile, voire infondée, leur représentation par des probabilités).

Le flou est lié à la forme de la connaissance : son imprécision n'est donc pas de nature probabiliste. Par exemple, dire "l'âge de cette personne est autour de 30 ans" ne présume en rien de la probabilité de l'âge effectif de la personne. On peut mieux voir la distinction entre imprécision et probabilité en pondérant cette assertion : "je suis sûr que l'âge de cette personne est autour de 30 ans" où l'on peut retrouver ici à la fois une imprécision (sur la valeur de l'âge) et une certitude (sur le fait que cet âge soit autour de 30 ans). Ou aussi : "l'âge de cette personne est autour de 30 ans, avec une probabilité de 0.2" où l'on retrouve encore une connaissance floue ("autour de 30 ans") qui est relativisée par une probabilité de véracité.

La logique floue s'attache donc à une certaine forme des connaissances (leur imprécision) et propose un certain formalisme rigoureux permettant d'inférer de nouvelles connaissances. En cela, elle est complémentaire de la théorie des probabilités.

Pour illustrer encore ce propos, on peut citer l'exemple classique de Jim Bezdek qui permet de mieux différencier probabilité et imprécision : "On se trouve dans un désert, après des jours d'errance… Presque mort de soif, on trouve alors 2 bouteilles remplies d'un liquide. Sur la bouteille A, une étiquette annonce "potable avec un degré 0.9", et sur la bouteille B, l'étiquette dit "potable avec une probabilité 0.9". Laquelle de ces 2 bouteilles doit-on choisir ?". Si l'on traduit les indications des étiquettes, on en retire qu'en buvant la bouteille A, on pourra s'en tirer avec comme seuls risques, quelques problèmes intestinaux non mortels… Par contre, en buvant la bouteille B, il y a une probabilité non négligeable (10 % de chance) que le liquide puisse être très nocif (acide…) et absolument pas buvable.

La théorie des possibilités a été introduite (aussi par Lotfi Zadeh en 1978) afin de permettre la prise en compte combinée à la fois de l'imprécision et de l'incertitude dans des connaissances.

La logique floue n'est pas la seule à parler d'incertitude[modifier | modifier le code]

La logique modale a été introduite par Aristote, puis continuée par Leibniz et des chercheurs contemporains pour prendre en compte des affaiblissements ou des renforcements d'affirmations présents dans les langues naturelles, en s'intéressant par exemple aux rapports du vrai, du faux, du nécessaire et du possible.

La théorie de la complexité algorithmique (ou complexité de Kolmogorov) est aussi une méthode mathématiquement rigoureuse pour envisager la difficulté de donner la description précise d'une chose.

Enfin, les probabilités bayésiennes utilisés en avenir incertain utilisent des approches voisines de celles de la logique floue.

Notes et références[modifier | modifier le code]

  1. système de Zadeh qu'on peut considérer comme inspiré de Lukasiewicz
  2. écriture allégée : en toute rigueur, on devrait distinguer l'énoncé A et son degré de vérité v(A), et écrire v(A OU B) = max(v(A), v(B))
  3. dans un style proche de George Boole (1854), ou de Vallée qui appelle cette composition produel dans son Analyse Binaire ; parfois vu aussi comme probabiliste

Voir aussi[modifier | modifier le code]

Godjevac J.,Idées nettes sur la logique floue, PPUR:Lausanne, collection informatique, 1999, 128p., ISBN 2-88074-378-8.
Prade H., Dubois D. & al., Théorie des possibilités : Applications à la représentation des connaissances en informatique, coll. (Méthode + programmes), Masson:Paris, 1985.


Articles connexes[modifier | modifier le code]