Analyse de survie

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

L'analyse de (la) survie est une branche des statistiques qui cherche à modéliser le temps restant avant la mort pour des organismes biologiques (l'espérance de vie) ou le temps restant avant l'échec ou la panne dans les systèmes artificiels, ce que l'on représente graphiquement sous la forme d'une courbe de survie. On parle aussi d' analyse de la fiabilité en ingénierie, d' analyse de la durée en économie ou d' analyse de l'histoire d'événements[1] en sociologie. La représentation des données de survie se fait souvent sous la forme graphique d'une courbe de survie Plus généralement, l'analyse de survie implique la modélisation du facteur temps dans la probabilité d'occurrence des événements, notamment grâce à des concepts tels que le taux de défaillance instantané ou la loi de fiabilité d'un système. L'analyse de survie a été généralisée à la modélisation d'événements non pas uniques mais récurrents dans le temps, comme peuvent l'être par exemple les rechutes en cas de maladie, voire à des systèmes plus complexes encore soumis à des risques multiples qui peuvent dépendre les uns des autres, etc.

L'analyse de survie repose souvent sur des séries temporelles de données longitudinales. Dans les cas où les événements d'intérêt ne se sont pas produits avant la fin de la période d'observation (e.g., la maladie n'est pas apparue chez un malade) on parle de censure de la série de données.

Historique[modifier | modifier le code]

La première méthode d'analyse de survie, la méthode actuarielle, est apparue en 1912[2]. Elle est utilisée dans le domaine médical pour la première fois en 1950[3]. La seconde méthode, dite de Kaplan-Meier, est apparue en 1958[4].

Formulation Générale[modifier | modifier le code]

Fonction de survie[modifier | modifier le code]

La Fonction de survie ( « Survival function » ), notée S par convention, est définie par :

S(t) = \Pr(T > t)

t est la variable temps, T est une variable aléatoire symbolisant le moment du décès, et "Pr" est la fonction probabilité. La fonction de survie est égale à la probabilité que le décès intervienne après un temps t donné.

Fonction de distribution de longévité et densité d'évènement[modifier | modifier le code]

La fonction de distribution de longévité, notée F, est définie en complément de la fonction de survie,

F(t) = \Pr(T \le t) = 1 - S(t)

La fonction dérivée de F, qui est la fonction densité de la distribution de longévité, est notée conventionnellement f,

f(t) = F'(t) = \frac{d}{dt} F(t).

La fonction f est quelquefois appelée la densité évènement; c'est le taux de mortalité ou d'évènements en échec par unité de temps. La fonction de survie est aussi définie en termes de distribution et de fonction de densité.

S(t) = \Pr(T > t) = \int_t^{\infty} f(u)\,du = 1-F(t).

De manière similaire, une fonction de densité d'évènement de survie peut être définie par :

s(t) = S'(t) = \frac{d}{dt} S(t) = \frac{d}{dt} \int_t^{\infty} f(u)\,du = \frac{d}{dt} [1-F(t)] = -f(t).

Fonction d'aléa et fonction d'aléa cumulative[modifier | modifier le code]

Le taux de défaillance, ou fonction d'aléa, noté \lambda par convention, est défini comme le taux d'évènements (décès, échec,..) au temps t connaissant la probabilité de survie, de réussite au temps t ou au delà,

\lambda(t)\,dt = \Pr(t \leq T < t+dt\,|\,T \geq t) = \frac{f(t)\,dt}{S(t)} = -\frac{S'(t)\,dt}{S(t)}.

La force de mortalité est un synonyme de Fonction d'aléa qui est utilisée particulièrement en démographie et science actuarielle, où elle est notée \mu. Le terme Taux de d'aléa est un autre synonyme.

La fonction d'aléa doit être positive ou nulle, λ(t) ≥ 0, et son intégrale sur [0, \infty] est infinie, mais n'a pas d'autres contraintes; elle peut croître, décroître, être non-monotone, non continue. Un exemple est celui de la fonction de la courbe de la baignoire, qui est grande pour des petites valeurs de t, décroit jusqu'à un minimum, et croit à nouveau; elle peut modéliser la propriété de quelques systèmes mécaniques de tomber en panne peu de temps après être entré en service, ou bien longtemps après alors que le système a vieilli.

Quantités dérivées de la fonction de distribution de longévité[modifier | modifier le code]

Distributions utilisées[modifier | modifier le code]

Voir aussi[modifier | modifier le code]

Notes[modifier | modifier le code]

(en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Survival analysis » (voir la liste des auteurs).

  1. « Syllabus du cours "Données longitudinales et modèles de survie" du Département des Sciences Economiques de l'Université de Genève »
  2. (de) P. E. Böhmer, « Theorie der unabhängigen Wahrscheinlichkeiten », dans Mémoires et procès verbaux du septième congrès international d'actuaires, Amsterdam,‎ 1912, chap. 2, p. 327-343
  3. (en) J. Berkson et R. P. Gage, « Calculation of survivalrates for cancer », Proceedings of the Staff Meetings of the Mayo Clinic, no 25,‎ 1950, p. 270-286
  4. (en) E. L. Kaplan et P. Meier, « Nonparametric estimation from incomplete observations. », Journal of the American Statistical Association, no 53,‎ 1958, p. 457-481

Liens internes[modifier | modifier le code]

Liens externes[modifier | modifier le code]

Références[modifier | modifier le code]