Logique floue
La logique floue (fuzzy logic, en anglais) est une technique utilisée en intelligence artificielle. Elle a été formalisée par Lotfi Zadeh en 1965 et utilisée dans des domaines aussi variés que l'automatisme (freins ABS), la robotique (reconnaissance de formes), la gestion de la circulation routière (feux rouges), le contrôle aérien, l'environnement (météorologie, climatologie, sismologie, analyse du cycle de vie), la médecine (aide au diagnostic), l'assurance (sélection et prévention des risques) et bien d'autres.
Elle s'appuie sur la théorie mathématique des ensembles flous. Cette théorie, introduite par Zadeh, est une extension de la théorie des ensembles classiques pour la prise en compte d'ensembles définis de façon imprécise. C'est une théorie formelle et mathématique dans le sens où Zadeh, en partant du concept de fonction d'appartenance pour modéliser la définition d'un sous-ensemble d'un univers donné, a élaboré un modèle complet de propriétés et de définitions formelles. Il a aussi montré que cette théorie des sous-ensembles flous se réduit effectivement à la théorie des sous-ensembles classiques dans le cas où les fonctions d'appartenance considérées prennent des valeurs binaires ({0,1}).
Elle présente aussi l'intérêt d'être plus facile et meilleur marché à implémenter qu'une logique probabiliste, bien que cette dernière seule soit stricto sensu cohérente (voir Théorème de Cox-Jaynes). Par exemple la courbe Ev(p) peut être remplacée par trois segments de droite sans perte excessive de précision pour beaucoup d'applications considérées ci-dessus.
[modifier] Principe
À l'inverse de la logique booléenne, la logique floue permet à une condition d'être en un autre état que vrai ou faux. Il y a des degrés dans la vérification d'une condition.
Considérons par exemple la vitesse d'un véhicule sur une route nationale française. La vitesse normale est de 90 km/h. Une vitesse peut être considérée comme élevée au-dessus de 100 km/h, et comme plus du tout élevée en dessous de 80 km/h.
fig. 1 |
La logique booléenne envisagerait les choses de la manière suivante (voir fig. 1) :
- La vitesse est considérée à 100 % comme élevée à partir de 100 km/h, et à 0 % en dessous.
La logique floue, à l'inverse, permet des degrés de vérification de la condition « La vitesse est-elle élevée ? » (voir fig. 2) :
- La vitesse est considérée comme pas du tout élevée en dessous de 80 km/h. On peut donc dire qu'en dessous de 80 km/h, la vitesse est élevée à 0 %.
fig. 2 |
- La vitesse est considérée comme élevée au-dessus de 100 km/h. La vitesse est donc élevée à 100 % au-dessus de 100 km/h.
- La vitesse est donc élevée à 50 % à 90 km/h, et à 25 % à 85 km/h.
De la même manière, la fonction « La vitesse est-elle peu élevée ? » sera évaluée de la manière suivante (voir fig. 3) :
- La vitesse est considérée comme peu élevée en dessous de 80 km/h. Elle est donc peu élevée à 100 %.
fig. 3 |
- La vitesse est considérée comme pas du tout peu élevée au-dessus de 100 km/h. Elle est donc peu élevée à 0 %.
- La vitesse est donc peu élevée à 50 % à 90 km/h, et à 25 % à 95 km/h.
On peut également définir une fonction « La vitesse est-elle moyenne ? » (voir fig. 4) :
- La vitesse est moyenne à 90 km/h. À cette allure, la vitesse est moyenne à 100 %.
fig. 4 |
- La vitesse n'est pas du tout moyenne en dessous de 80 km/h et au-dessus de 100 km/h. Hors de cet intervalle, la vitesse est moyenne à 0 %.
- La vitesse est donc moyenne à 50 % à 85 km/h et 95 km/h.
Il n'est pas obligatoire que la transition soit linéaire. Des transitions hyperboliques (comme une sigmoïde ou une tangente hyperbolique), exponentielle, gaussienne (dans le cas d'un état moyen) ou de toute autre nature sont utilisables (voir fig. 5).
fig. 5 |
[modifier] Combinaison de plusieurs entrées
Dans le cas d'une combinaison de plusieurs entrées (« Si le ciel est bleu et si j'ai le temps »), deux cas se présentent :
- Les entrées sont liées par une fonction logique « ET » : dans ce cas, on peut considérer comme première approche seulement l'entrée ayant le degré de vérification le plus faible. En fait, il suffit de choisir un opérateur
tel que
où
est appelée une t-norme. min est la plus optimiste des t-normes. - Les entrées sont liées par une fonction logique « OU » : dans ce cas, on peut considérer comme première approche seulement l'entrée ayant le degré de vérification le plus élevé. En fait, il suffit de choisir un opérateur
tel que
où
est appelée une t-conorme. max est la plus pessimiste des t-conormes.
Il est techniquement possible de représenter toutes les opérations binaires de base en se basant sur la logique floue. En effet, à partir des opérateurs ET, OU et NON (AND, OR, NOT), on peut représenter les 8 opérations de base :
- OU (OR) : A OR B = max(A, B);
- ET (AND) : A AND B = min(A, B);
- NON (NOT) : NOT A = 1 - A;
- OU EXCLUSIF (XOR) : A XOR B = (A OR B) AND NOT (A AND B) = A + B - 2 × min(A, B);
- NON-OU (NOR) : A NOR B = 1 - max(A, B);
- NON-ET (NAND) : A NAND B = 1 - min(A, B);
- NON-XOR (NXR) : A NXR B = 1 + 2 × min(A, B) - (A + B);
- SUIVEUR (NOP) : NOP A = A.
Par ailleurs, la dimension décimale des variables de la logique floue permet d'effectuer des combinaisons non binaires :
- Le produit : A.B ou A × B (équivalent en binaire à l'opération AND).
- L'addition : A + B - A × B (équivalent en binaire à l'opération OR ; en effet, la simple addition dépasserait les bornes de l'intervalle [0 ; 1] dans certain cas).
[modifier] Opérateurs flous
Les opérateurs flous (ou fuzzy) peuvent être implémentés de diverses manières et une même application peut d'ailleurs faire appel à des implémentations différentes judicieusement choisies selon le contexte.
L'exemple ci-dessous montre que, contrairement à une opinion parfois exprimée, le choix des opérateurs à utiliser n'est pas une simple question de goût ou d'inspiration du moment.
[modifier] Exemple d'utilisation
Voici un exemple qui montre comment combiner des opérateurs flous (fuzzy) de divers types.
- l'exemple : confirmer l'appartenance d'une personne à un groupe
Une personne sera plus ou moins membre (à un niveau fzMembre, compris entre 0 et 1, inclusivement) d'un groupe, disons les flower lovers, soit si, pour n'importe quelle raison, elle en fait déjà plus ou moins partie (à un niveau fzDejaMembre), soit si elle a une assez bonne connaissance des orchidées (fzConnaitOrchidees) et que la connaissance des orchidées est un critère assez déterminant (fzOrchideesAmis) d'appartenance au groupe des flower lovers.
- une solution qui paraît bonne est :
fzMembre = Zadeh_OR( fzDejaMembre, Multiply_AND( fzConnaitOrchidees, fzOrchideesAmis ))
- et s'implémente comme :
fzMembre = max( fzDejaMembre, ( fzConnaitOrchidees * fzOrchideesAmis ))
pour fzDejaMembre=0 (faux), fzConnaitOrchidees=0.778 et fzOrchideesAmis=0.9, on trouve 0.7 pour fzDejaMembre=0.7, fzConnaitOrchidees=0.8 et fzOrchideesAmis=0.9, on trouve 0.72 pour fzDejaMembre=0.72, fzConnaitOrchidees=0.8 et fzOrchideesAmis=0.9, on retrouve 0.72 pour fzDejaMembre=0.72, fzConnaitOrchidees=0.5 et fzOrchideesAmis=0.9, on conserve 0.72 (ce qui est le résultat vraisemblablement attendu)
[modifier] Autres solutions
- une solution qui n'utiliserait que les opérateurs de Zadeh serait :
fzMembre = Zadeh_OR( fzDejaMembre, Zadeh_AND( fzConnaitOrchidees, fzOrchideesAmis ))
fzMembre = max( fzDejaMembre, min( fzConnaitOrchidees, fzOrchideesAmis ))
pour fzDejaMembre=0 (faux), fzConnaitOrchidees=0.778 et fzOrchideesAmis=1 (vrai), on trouve 0.778 pour fzDejaMembre=0 (faux), fzConnaitOrchidees=0.778 et fzOrchideesAmis=0.9, on trouve aussi 0.778 (ce qui est trop élevé) pour fzDejaMembre=0.778, fzConnaitOrchidees=0.8 et fzOrchideesAmis=0.9, on trouve 0.8 pour fzDejaMembre=0.8, fzConnaitOrchidees=0.8 et fzOrchideesAmis=0.9, on retrouve 0.8 pour fzDejaMembre=0.8, fzConnaitOrchidees=0.5 et fzOrchideesAmis=0.9, on conserve 0.8 (ce qui est stable mais trop élevé)
- une solution qui n'utiliserait que les opérateurs représentables par des paraboloïdes hyperboliques serait :
fzMembre = Add_OR( fzDejaMembre, Multiply_AND( fzConnaitOrchidees, fzOrchideesAmis ))
fzMembre = fzDejaMembre + (fzConnaitOrchidees*fzOrchideesAmis) - (fzDejaMembre*fzConnaitOrchidees*fzOrchideesAmis)
pour fzDejaMembre=0 (faux), fzConnaitOrchidees=0.778 et fzOrchideesAmis=0.9, on trouve 0.7 pour fzDejaMembre=0.7, fzConnaitOrchidees=0.8 et fzOrchideesAmis=0.9, on trouve 0.916 (ce qui est sûrement trop élevé) pour fzDejaMembre=0.916, fzConnaitOrchidees=0.8 et fzOrchideesAmis=0.9, on trouve 0,97648 (ce qui est instable et sûrement beaucoup trop élevé) pour fzDejaMembre=0,97648, fzConnaitOrchidees=0.5 et fzOrchideesAmis=0.9, on trouve 0. 987 064 (une augmentation bien malvenue)
[modifier] Convergence
Les trois méthodes exposées ci-dessus convergent lorsque les valeurs d'entrée sont booléennes
pour fzDejaMembre=0 (faux), fzConnaitOrchidees=0 (faux) et fzOrchideesAmis=1 (vrai), on trouve 0 (faux) pour fzDejaMembre=0 (faux), fzConnaitOrchidees=1 (vrai) et fzOrchideesAmis=1 (vrai), on trouve 1 (vrai) pour fzDejaMembre=1 (vrai), fzConnaitOrchidees=1 (vrai) et fzOrchideesAmis=1 (vrai), on retrouve 1 (vrai) pour fzDejaMembre=1 (vrai), fzConnaitOrchidees=0 (faux) et fzOrchideesAmis=1 (vrai), on conserve 1 (vrai)
[modifier] Opérateur implique
Pour l'exemple à l'orchidée ci-dessus, une situation normale est que la connaissance des orchidées implique l'appartenance au groupe. C’est-à-dire, plus précisément, qu'on ne peut pas connaître les orchidées et, simultanément, ne pas être membre du groupe des amis des fleurs.
fzImpliqueOk = NOT( AND( fzConnaitOrchidees, NOT( fzMembre ) ) )
De même qu'on a vu ci-dessus plusieurs manières d'implémenter les opérateurs OR et AND, il y a aussi plusieurs manières d'implémenter la notion d'implication.
fzImpliqueOk = Bool_IMPLIES( fzConnaitOrchidees, fzMembre ) fzImpliqueOk = Zadeh_IMPLIES( fzConnaitOrchidees, fzMembre ) fzImpliqueOk = HypPar_IMPLIES( fzConnaitOrchidees, fzMembre )
[modifier] Implémentation
Les opérateurs ci-dessus s'implémenteront respectivement comme ceci :
fzImpliqueOk = fzConnaitOrchidees ⇐ fzMembre fzImpliqueOk = 1 - min( fzConnaitOrchidees, (1 - fzMembre) ) fzImpliqueOk = 1 - fzConnaitOrchidees + (fzConnaitOrchidees*fzMembre
dans un cas extrême mais normal, avec fzConnaitOrchidees=0.8 et fzMembre=0.995, les valeurs trouvées seront respectivement
1 (true) 0.995 (Zadeh) 0.996 (Hyperbolic Paraboloid)
dans un cas considéré comme normal, avec fzConnaitOrchidees=0.8 et fzMembre=0.72, les valeurs trouvées seront respectivement
0 (false) (la personne est moins membre qu'elle ne connait) 0.72 (Zadeh) 0.776 (Hyperbolic Paraboloid)
dans un autre cas qui reste normal, la personne pouvant aussi être membre des amis des fleurs à cause de son amour des tulipes, avec fzConnaitOrchidees=0.66 et fzMembre=0.72, les valeurs trouvées seront respectivement
1 (true) (la personne est plus membre qu'elle ne connait) 0.72 (Zadeh) 0.772 (Hyperbolic Paraboloid)
dans un cas assez douteux, avec fzConnaitOrchidees=0.5 et fzMembre=0.5, les valeurs trouvées seront respectivement
1 (true) 0.5 (Zadeh) 0.75 (Hyperbolic Paraboloid)
dans un cas anormal, avec fzConnaitOrchidees=0.8 et fzMembre=0.3, les valeurs trouvées seront respectivement
0 (false) 0.3 (Zadeh) 0.44 (Hyperbolic Paraboloid)
dans un cas anormal et extrême, avec fzConnaitOrchidees=0.8 et fzMembre=0.005, les valeurs trouvées seront respectivement
0 (false) 0.2 (Zadeh) 0.204 (Hyperbolic Paraboloid)
[modifier] Utilisation pratique
Une application informatique qui viserait à proposer à un opérateur humain de traiter les cas anormaux en commençant par les plus suspects utiliserait les valeurs indiquées ci-dessus en gras et obtenues par la méthode identifiée Hyperbolic Paraboloid, particulièrement discriminante.
Il n'est pas sûr que cette application intéresse les amis des fleurs. Par contre, l'intérêt pour un service de médecine préventive (ou même pour un fleuriste) est compréhensible. Lorsque le nombre d'examens des cas suspects doit être plafonné (par exemple pour des raisons de temps, de coût, de dangerosité, etc), un pré-classement intelligent, fondé -sinon sur une théorie incontestée- du moins sur une technologie opérationnelle, peut s'avérer utile.
[modifier] Représentation graphique
L'article commons:Fuzzy operator fournit de nombreuses représentations graphiques de quelques implémentations possibles des opérateurs fuzzy. On trouvera ci-dessous, à titre d'exemple, la représentation de huit implémentations différentes d'une opération qui viserait à apprécier la simultanéité de deux faits (jugés de poids équivalents dans les six images à gauche mais de poids différents dans les deux images de droite).
[modifier] Commande floue
Une fois la valeur de l'entrée (« La vitesse est-elle élevée ? ») évaluée, une valeur peut être déterminée pour une fonction de sortie. Considérons la fonction « Si la fièvre est forte, alors administrer de l'aspirine ». Une telle fonction est appelée commande floue. Elle est composée de deux parties :
- Une entrée : « La fièvre est-elle forte ? ». On considère qu'une fièvre n'est pas forte en dessous de 38 °C, et qu'elle est forte au-dessus de 40 °C.
- Une sortie : « Administrer de l'aspirine »
Ces deux parties sont liées. On peut les représenter ensemble comme sur la fig. 6.
![]() fig. 6 |
Il existe plusieurs techniques pour déterminer la valeur de la sortie (dans l'exemple : la quantité d'aspirine à administrer) :
- La droite ayant la même ordonnée que le point de la courbe de départ ayant pour abscisse la valeur de l'entrée coupe la courbe de sortie. L'abscisse de ce point d'intersection est une valeur de sortie possible (fig. 7).
![]() fig. 7 |
- La droite ayant la même ordonnée que le point de la courbe de départ ayant pour abscisse la valeur de l'entrée délimite un trapèze au niveau de la sortie. Le centre de gravité de ce trapèze est également une valeur de sortie possible (fig. 8).
![]() fig. 8 |
[modifier] Insuffisances en tant que théorie ?
Il existe une opinion qui dit que[évasif] "La théorie des ensembles flous présente la particularité de n'avoir aucun théorème à proposer. C'est-à-dire que si elle peut rendre quelques services techniques, elle ne peut pour autant prétendre à un quelconque statut de science, et encore moins de théorie.". [citation nécessaire]
En fait, la logique floue a été formalisée[réf. souhaitée] et un théorème (élémentaire, cependant) montre que dans le cas particulier où les propositions traitées ne sont pas floues, la logique floue se réduit à la logique classique.
D'autre part, bien que des détracteurs de la logique floue prétendent que[évasif] "Le théorème de Cox-Jaynes montre d'une part que l'on peut représenter un état de connaissance incertaine par une probabilité, et d'autre part que tout moyen utilisé pour prendre des décisions sera soit isomorphe à la théorie des probabilités, soit incohérent"[citation nécessaire], ce théorème ne s'applique pas aux connaissances floues, qui ne sont généralement pas des connaissances incertaines (ce qui rend difficile, voire infondée, leur représentation par des probabilités).
Le flou est lié à la forme de la connaissance : son imprécision n'est donc pas de nature probabiliste. Par exemple, dire "l'âge de cette personne est autour de 30 ans" ne présume en rien de la probabilité de l'âge effectif de la personne. On peut mieux voir la distinction entre imprécision et probabilité en pondérant cette assertion : "je suis sûr que l'âge de cette personne est autour de 30 ans" où l'on peut retrouver ici à la fois une imprécision (sur la valeur de l'âge) et une certitude (sur le fait que cet âge soit autour de 30 ans). Ou aussi : "l'âge de cette personne est autour de 30 ans, avec une probabilité de 0.2" où l'on retrouve encore une connaissance floue ("autour de 30 ans") qui est relativisée par une probabilité de véracité.
La logique floue s'attache donc à une certaine forme des connaissances (leur imprécision) et propose un certain formalisme rigoureux permettant d'inférer de nouvelles connaissances. En cela, elle est complémentaire de la théorie des probabilités.
Pour illustrer encore ce propos, on peut citer l'exemple classique de Jim Bezdek qui permet de mieux différencier probabilité et imprécision : "On se trouve dans un désert, après des jours d'errance… Presque mort de soif, on trouve alors 2 bouteilles remplies d'un liquide. Sur la bouteille A, une étiquette annonce "potable avec un degré 0.9", et sur la bouteille B, l'étiquette dit "potable avec une probabilité 0.9". Laquelle de ces 2 bouteilles doit-on choisir ?". Si l'on traduit les indications des étiquettes, on en retire qu'en buvant la bouteille A, on pourra s'en tirer avec comme seuls risques, quelques problèmes intestinaux non mortels… Par contre, en buvant la bouteille B, il y a une probabilité non négligeable (10% de chance) que le liquide puisse être très nocif (acide…) et absolument pas buvable.
La théorie des possibilités a été introduite (aussi par Lotfi Zadeh en 1978) afin de permettre la prise en compte combinée à la fois de l'imprécision et de l'incertitude dans des connaissances.
[modifier] La logique floue n'est pas la seule à parler d'incertitude
La logique modale a été introduite par Aristote, puis continuée par Leibniz et des chercheurs contemporains pour prendre en compte des affaiblissements ou des renforcements d'affirmations présents dans les langues naturelles.
La théorie de la complexité algorithmique (ou complexité de Kolmogorov) est aussi une méthode mathématiquement rigoureuse pour envisager la difficulté de donner la description précise d'une chose.
Enfin, les probabilités bayésiennes utilisés en avenir incertain utilisent des approches voisines de celles de la logique floue.
[modifier] Voir aussi
- Ensemble flou
- Information partielle linéaire
- Théorie du prototype (sémantique cognitive)
[modifier] Bibliographie: ouvrages de vulgarisation
- (en) Earl Cox, The fuzzy systems handbook: a practitioner's guide to building, using, maintaining fuzzy systems, Boston, AP Professional, 1994 (ISBN 0-12-194270-8)
- (en) Ronald R. Yager, Essentials of fuzzy modeling and control, New York, Wiley, 1994 (ISBN 0-471-01761-2)
- (en) Miles Van Pelt, Fuzzy Logic Applied to Daily Life, Seattle, WA, No No No No Press, 2008 (ISBN 0-252-16341-9)
[modifier] Bibliographie: Les premiers ouvrages sur le sujet (1962/1963)
- (de) Bruno Scarpellini, « Die Nichaxiomatisierbarkeit des unendlichwertigen Prädikatenkalküls von Łukasiewicz », dans Journal of Symbolic Logic, Association for Symbolic Logic, vol. 27, no 2, 1962, p. 159–170 (ISSN 0022-4812) [lien DOI]
- (en) R.H. Wilkinson, « A method of generating functions of several variables using analog diode logic », dans IEEE Transactions on Electronic Computers, vol. 12, no 2, 1963, p. 112–129 [lien DOI]
[modifier] Bibliographie: livres présentant des applications de la logique floue
- Présentations générales des systèmes de logique floue et de leurs applications
- (en) George J. Klir, Fuzzy set theory: foundations and applications, Englewood Cliffs, NJ, Prentice Hall, 1997 (ISBN 0133410587)
- (en) George J. Klir, Fuzzy sets and fuzzy logic: theory and applications, Upper Saddle River, NJ, Prentice Hall PTR, 1995 (ISBN 0-13-101171-5)
- (en) Vilém Novák, Fuzzy Sets and Their Applications, Bristol, Adam Hilger, 1989 (ISBN 0-85274-583-4)
- (en) H. Zimmermann, Fuzzy set theory and its applications, Boston, Kluwer Academic Publishers, 2001 (ISBN 0-7923-7435-5)
- Analyse mathématique
- (en) Pao Ming Pu, « Fuzzy topology. I. Neighborhood structure of a fuzzy point and Moore-Smith convergence », dans Journal of Mathematical Analysis and Applications, vol. 76, no 2, 1980, p. 571–599 (ISSN 0022-247X) [lien DOI]
- (en) Eugene S. Santos, « Fuzzy Algorithms », dans Information and Control, vol. 17, no 4, 1970, p. 326–339 [lien DOI]
- Informatique, gestion de donnees, automatismes
- (en) Arabacioglu, B. C., « Using fuzzy inference system for architectural space analysis », dans Applied Soft Computing, vol. 10, no 3, 2010, p. 926–937 [texte intégral]
- (en) Kevin M. Passino, Fuzzy control, Boston, Addison-Wesley, 1998 (ISBN 020118074X)
- (en) Witold Pedrycz, Fuzzy systems engineering: Toward Human-Centerd Computing, Hoboken, Wiley-Interscience, 2007 (ISBN 978047178857-7)
- (en) Willi-Hans Steeb, The Nonlinear Workbook: Chaos, Fractals, Cellular Automata, Neural Networks, Genetic Algorithms, Gene Expression Programming, Support Vector Machine, Wavelets, Hidden Markov Models, Fuzzy Logic with C++, Java and SymbolicC++ Programs: 4edition, World Scientific, 2008 (ISBN 981-281-852-9)
- (en) J. Wiedermann, « Characterizing the super-Turing computing power and efficiency of classical fuzzy Turing machines », dans Theor. Comput. Sci., vol. 317, no 1-3, 2004, p. 61–69 [lien DOI]
- (en) Zemankova-Leech, M., Fuzzy Relational Data Bases, Florida State University, 1983
- Electronique
- (en) Ahmad M. Ibrahim, Introduction to Applied Fuzzy Electronics, Englewood Cliffs, N.J, Prentice Hall, 1997 (ISBN 0-13-206400-6)
- Reconnaissance d'images
- (en) Frank Höppner, Fuzzy cluster analysis: methods for classification, data analysis and image recognition, New York, John Wiley, 1999 (ISBN 0-471-98864-2)
- Sciences humaines
- (en) Constantin Von Altrock, Fuzzy logic and NeuroFuzzy applications explained, Upper Saddle River, NJ, Prentice Hall PTR, 1995 (ISBN 0-13-368465-2)
- Risque financier, géofinance
- (en) Richard Onses, Second Order Experton: A new Tool for Changing Paradigms in Country Risk Calculation, 1996 (ISBN 8477195587)
- Onses, Richard: Détermination de l´incertitude inhérente aux investissements en Amérique Latine sur la base de la théorie des sous ensembles flous, 1994, isbn=8447508811, Barcelona
tel que
où
tel que
où 

