Sigmoïde (mathématiques)

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Page d'aide sur l'homonymie Pour les articles homonymes, voir Sigmoïde.
La fonction sigmoïde

En mathématiques, la fonction sigmoïde (dite aussi courbe en S) est définie par :

 f(x)=\frac{1}{1 +  e^{- x}} pour tout réel  x\,

mais on la généralise à toute fonction dont l'expression est :

 f(x)=\frac{1}{1 +  e^{-\lambda x}}

Le nom de « sigmoïde » lui vient de sa forme en S.

Elle est souvent utilisée dans les réseaux de neurones et représente la fonction de répartition de la loi logistique. En particulier, cette fonction est utilisée dans la rétropropagation de l'algorithme de Werbos, concernant le seuil d'activation des neurones (assez efficace en simulation des réseaux neuronaux-simulés, quant aux caractéristiques de la vision, et de la reconnaissance des formes).

Une courbe sigmoïde génère par transformation affine une partie des courbes logistiques et en est donc un représentant privilégié.

Propriétés graphiques[modifier | modifier le code]

La courbe sigmoïde possède pour asymptotes les droites d'équation y = 0 et y = 1. Elle a pour centre de symétrie le point I (0;1/2) qui en est un point d'inflexion. En ce point, la dérivée seconde est nulle.

La fonction sigmoïde avec \lambda = 5.

Pour une courbe sigmoïde de paramètre λ la tangente au point d'inflexion est λ/4. Cette propriété permet de paramétrer facilement une sigmoïde en observant la pente au point d'inflexion.

Équation différentielle[modifier | modifier le code]

Les propriétés de la fonction sigmoïde s'expliquent par celles de sa dérivée. En effet celle-ci est égale à

\frac{\mathrm dy}{\mathrm dx} =  \frac{\lambda e^{-\lambda x}}{(1 +  e^{-\lambda x})^2},

qui peut se transformer en

\frac{\mathrm dy}{\mathrm dx} = \lambda \cdot y \cdot (1-y). y varie de 0 à +1.

Cette équation différentielle signifie que la variation de y en fonction de x (souvent le temps d'ailleurs en physique, chimie ou marketing) est proportionnelle à la fois à l'avancement de y depuis 0 et au chemin qui reste à parcourir pour arriver à 1, proportionnalité affectée d'un coefficient \lambda.

Cette équation différentielle est un cas particulier de modèle de Verhulst et a pour autres solutions des fonctions logistiques.

La dérivée seconde possède aussi quelques propriétés : elle peut se transformer en

\frac{\mathrm d^2y}{\mathrm dx^2} = \lambda^2 \cdot y \cdot (1-y) \cdot (1-2y).

ce qui vérifie bien qu'un point d'inflexion est le point-milieu y=½. Les autres points d'inflexion sont rencontrés aux extrémités de la courbe (y=0 et y=1), il s'agit plutôt de points asymptotiques de rayon infini.

Écriture alternative[modifier | modifier le code]

La fonction sigmoïde peut s'exprimer à l'aide de la fonction tangente hyperbolique dont la courbe représentative a aussi une forme en S mais dont les asymptotes ont pour équation y = -1 et y = 1

f(x) = \frac{1}{1+e^{-\lambda x}} = \frac{e^{\lambda x/2}}{e^{\lambda x/2}+e^{-\lambda x/2}}= \frac 12 +\frac 12 \frac{e^{\lambda x/2}- e^{-\lambda x/2}}{e^{\lambda x/2}+e^{-\lambda x/2}} = \frac 12 +\frac 12 \operatorname{tanh}\left(\frac{\lambda x}2\right)

Modélisation[modifier | modifier le code]

Dans le cadre de la modélisation, typiquement pour la modélisation de systèmes biologiques, les deux fonctions suivantes sont utilisées en tant que sigmoïdes :

  • sigp(x) = \frac{x^n}{x^n+\theta^n}
  • sigm(x) = 1 - sigp(x) = \frac{\theta^n}{x^n+\theta^n}

La raideur de ces fonctions aussi nommées "sigmoïdes de Hill" est décrite par le paramètre n et le point d'inflexion est considéré être en \theta. Néanmoins, mathématiquement, ces fonctions ne sont pas des sigmoïdes et le point d'inflexion n'est pas exactement en \theta, mais en \theta\cdot\left(\frac{n-1}{n+1}\right)^{1/n}.

Voir aussi[modifier | modifier le code]

Sur les autres projets Wikimedia :