Logit

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Représentation graphique de la fonction Logit

La fonction Logit est une fonction mathématique utilisée principalement

Son expression est

\operatorname{logit}(p)=\ln\left( \frac{p}{1-p} \right)  \!\, où p est défini sur ]0 ; 1[

La base du logarithme utilisé est sans importance tant que celle-ci est supérieure à 1. Il s'agit souvent du logarithme népérien mais on peut lui préférer pour mettre en évidence les ordres de grandeur décimaux le logarithme décimal. On utilise en fiabilité les décibels, 10 log10(p/(1-p)) pour une meilleure lisibilité (-40 dB correspond à une probabilité de 10^-4, etc.)[réf. souhaitée].

Utilisée avec le logarithme népérien, la fonction Logit est la réciproque de la sigmoïde :

f(x) =  \frac{1}{1+e^{-x}}.

Elle est donc utilisée pour linéariser les fonctions logistiques.

Motivation[modifier | modifier le code]

Si p est une probabilité, cette probabilité sera toujours comprise entre 0 et 1 et toute tentative pour ajuster un nuage de probabilité par une droite sera invalidée par le fait que la droite n'est pas bornée. la transformation de p en p/(1-p) permet de travailler sur des valeurs variant de 0 à + ∞, puis le passage au logarithme permet de travailler sur un nuage de points dont les valeurs varient entre - ∞ et + ∞. C'est sous cette forme que l'on peut tenter un ajustement du nuage de points.

Historique[modifier | modifier le code]

La fonction Logit (prononcer logue ite) a été introduite par Joseph Berkson (1899 - 1982), qui est l'auteur du terme, en 1944. Turing l'utilise indépendamment vers la même époque sous le nom de log-odds[1]. Le premier terme a été construit par analogie et en opposition au terme de probit, notion développée par Chester Ittner Bliss et John Gaddum (1900 - 1965) en 1934. Une distribution de fréquences en forme de S laisse penser, soit à une fonction de répartition d'une loi normale, soit à une courbe logistique. Jusqu'en 1944, le modèle de la loi normale était privilégié et la fonction pour en déterminer les paramètres était la fonction Probit. Pendant plusieurs années, Berkson explique à la communauté scientifique que le modèle Logit possède sa place dans l'arsenal des méthodes au même titre que le modèle Probit, mais sa virulence d'une part et l'habitude acquise de la loi normale d'autre part freinent puissamment l'adoption du modèle. Le développement parallèle des statistiques et de la biométrie le généralisera pourtant (1960). Actuellement, il est principalement employé dans la régression logistique[2].

Références[modifier | modifier le code]

  1. http://www.college-de-france.fr/site/stanislas-dehaene/course-2012-01-10-09h30.htm#%7Cq=../stanislas-dehaene/course-2011-2012.htm%7Cp=../stanislas-dehaene/course-2012-01-10-09h30.htm%7C
  2. (en) J.S. Cramer The origins and development of the logit model, sur le site de l'université de Cambridge