Analyse de survie

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

L'Analyse de survie est une branche des statistiques qui traite de la mort d'organismes biologiques et de l'échec dans les systèmes mécaniques. Ce thème est nommé Théorie de la fiabilité ou Analyse de la fiabilité dans l'ingénierie, et analyse de la durée ou modélisation de la durée en économie ou en sociologie. Plus généralement, l'analyse de survie implique la modélisation du temps dans les données des événements; dans ce contexte, la mort ou l'échec est considéré comme un "événement" dans la littérature de l'analyse de survie. De nombreux concepts en analyse de survie ont été expliqués par la Théorie des processus de dépouillement, qui est apparue plus récemment. La flexibilité d'un processus de dépouillement réside dans ce qu'il permet de modéliser des évènements multiples (ou récurrents). Ce type de modélisation convient très bien à de nombreuses situations (par exemple : des personnes peuvent aller en prison plusieurs fois, les personnes alcooliques peuvent commencer à boire et s'arrêter plusieurs fois, et certaines personnes peuvent se marier et divorcer plusieurs fois).

Historique[modifier | modifier le code]

La première méthode d'analyse de survie, la méthode actuarielle, est apparue en 1912[1]. Elle est utilisée dans le domaine médical pour la première fois en 1950[2]. La seconde méthode, dite de Kaplan-Meier, est apparue en 1958[3].

Formulation Générale[modifier | modifier le code]

Fonction de survie[modifier | modifier le code]

La Fonction de survie ( « Survival function » ), notée S par convention, est définie par :

S(t) = \Pr(T > t)

t est la variable temps, T est une variable aléatoire symbolisant le moment du décès, et "Pr" est la fonction probabilité. La fonction de survie est égale à la probabilité que le décès intervienne après un temps t donné.

Fonction de distribution de longévité et densité d'évènement[modifier | modifier le code]

La fonction de distribution de longévité, notée F, est définie en complément de la fonction de survie,

F(t) = \Pr(T \le t) = 1 - S(t)

La fonction dérivée de F, qui est la fonction densité de la distribution de longévité, est notée conventionnellement f,

f(t) = F'(t) = \frac{d}{dt} F(t).

La fonction f est quelquefois appelée la densité évènement; c'est le taux de mortalité ou d'évènements en échec par unité de temps. La fonction de survie est aussi définie en termes de distribution et de fonction de densité.

S(t) = \Pr(T > t) = \int_t^{\infty} f(u)\,du = 1-F(t).

De manière similaire, une fonction de densité d'évènement de survie peut être définie par :

s(t) = S'(t) = \frac{d}{dt} S(t) = \frac{d}{dt} \int_t^{\infty} f(u)\,du = \frac{d}{dt} [1-F(t)] = -f(t).

Fonction d'aléa et fonction d'aléa cumulative[modifier | modifier le code]

Le taux de défaillance, ou fonction d'aléa, noté \lambda par convention, est défini comme le taux d'évènements (décès, échec,..) au temps t connaissant la probabilité de survie, de réussite au temps t ou au delà,

\lambda(t)\,dt = \Pr(t \leq T < t+dt\,|\,T \geq t) = \frac{f(t)\,dt}{S(t)} = -\frac{S'(t)\,dt}{S(t)}.

La force de mortalité est un synonyme de Fonction d'aléa qui est utilisée particulièrement en démographie et science actuarielle, où elle est notée \mu. Le terme Taux de d'aléa est un autre synonyme.

La fonction d'aléa doit être positive ou nulle, λ(t) ≥ 0, et son intégrale sur [0, \infty] est infinie, mais n'a pas d'autres contraintes; elle peut croître, décroître, être non-monotone, non continue. Un exemple est celui de la fonction de la courbe de la baignoire, qui est grande pour des petites valeurs de t, décroit jusqu'à un minimum, et croit à nouveau; elle peut modéliser la propriété de quelques systèmes mécaniques de tomber en panne peu de temps après être entré en service, ou bien longtemps après alors que le système a vieilli.

Quantités dérivées de la fonction de distribution de longévité[modifier | modifier le code]

Distributions utilisées[modifier | modifier le code]

Voir aussi[modifier | modifier le code]

Notes[modifier | modifier le code]

(en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Survival analysis » (voir la liste des auteurs)

  1. (de) P. E. Böhmer, « Theorie der unabhängigen Wahrscheinlichkeiten », dans Mémoires et procès verbaux du septième congrès international d'actuaires, Amsterdam,‎ 1912, chap. 2, p. 327-343
  2. (en) J. Berkson et R. P. Gage, « Calculation of survivalrates for cancer », Proceedings of the Staff Meetings of the Mayo Clinic, no 25,‎ 1950, p. 270-286
  3. (en) E. L. Kaplan et P. Meier, « Nonparametric estimation from incomplete observations. », Journal of the American Statistical Association, no 53,‎ 1958, p. 457-481

Liens internes[modifier | modifier le code]

Liens externes[modifier | modifier le code]

Références[modifier | modifier le code]