Analyse de survie

Cet article est une ébauche concernant les probabilités et la statistique.

Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.

Exemple de courbe de survie.

L'analyse de (la) survie est une branche des statistiques qui cherche à modéliser le temps restant avant la mort pour des organismes biologiques (l'espérance de vie) ou le temps restant avant l'échec ou la panne dans les systèmes artificiels, ce que l'on représente graphiquement sous la forme d'une courbe de survie. On parle aussi d'analyse de la fiabilité en ingénierie, d'analyse de la durée en économie ou d'analyse de l'histoire d'événements[1] en sociologie. La représentation des données de survie se fait souvent sous la forme graphique d'une courbe de survie. Plus généralement, l'analyse de survie implique la modélisation du facteur temps dans la probabilité d'occurrence des événements, notamment grâce à des concepts tels que le taux de défaillance instantané ou la loi de fiabilité d'un système. L'analyse de survie a été généralisée à la modélisation d'événements non pas uniques mais récurrents dans le temps, comme peuvent l'être par exemple les rechutes en cas de maladie, voire à des systèmes plus complexes encore soumis à des risques multiples qui peuvent dépendre les uns des autres, etc.

L'analyse de survie repose souvent sur des séries temporelles de données longitudinales. Dans les cas où les événements d'intérêt ne se sont pas produits avant la fin de la période d'observation (par exemple, la maladie n'est pas apparue chez un malade) on parle de censure de la série de données.

Historique

La première méthode d'analyse de survie, la méthode actuarielle, est apparue en 1912[2]. Elle est utilisée dans le domaine médical pour la première fois en 1950[3]. La seconde méthode, dite de Kaplan-Meier, est apparue en 1958[4].

Formulation générale

Fonction de survie

La fonction de survie ( « Survival function » ), notée S par convention, est définie par :

S ( t ) = P ( T > t ) {\displaystyle S(t)=\mathbb {P} (T>t)}

t est la variable temps, T est une variable aléatoire symbolisant le moment du décès, et P {\displaystyle \scriptstyle \mathbb {P} } est la fonction probabilité. La fonction de survie est égale à la probabilité que le décès intervienne après un temps t donné.

Fonction de distribution de longévité et densité d'évènement

La fonction de distribution de longévité, notée F, est définie en complément de la fonction de survie,

F ( t ) = P ( T t ) = 1 S ( t ) {\displaystyle F(t)=\mathbb {P} (T\leq t)=1-S(t)}

La fonction dérivée de F, qui est la fonction densité de la distribution de longévité, est notée conventionnellement f,

f ( t ) = F ( t ) = d d t F ( t ) . {\displaystyle f(t)=F'(t)={\frac {d}{dt}}F(t).}

La fonction f est quelquefois appelée la densité évènement ; c'est le taux de mortalité ou d'évènements en échec par unité de temps. La fonction de survie est aussi définie en termes de distribution et de fonction de densité.

S ( t ) = P ( T > t ) = t f ( u ) d u = 1 F ( t ) . {\displaystyle S(t)=\mathbb {P} (T>t)=\int _{t}^{\infty }f(u)\,du=1-F(t).}

De manière similaire, une fonction de densité d'évènement de survie peut être définie par :

s ( t ) = S ( t ) = d d t S ( t ) = d d t t f ( u ) d u = d d t [ 1 F ( t ) ] = f ( t ) . {\displaystyle s(t)=S'(t)={\frac {d}{dt}}S(t)={\frac {d}{dt}}\int _{t}^{\infty }f(u)\,du={\frac {d}{dt}}[1-F(t)]=-f(t).}

Fonction d'aléa et fonction d'aléa cumulative

Le taux de défaillance, ou fonction d'aléa, noté λ {\displaystyle \lambda } par convention, est défini comme le taux d'évènements (décès, échec...) au temps t connaissant la probabilité de survie, de réussite au temps t ou au-delà,

λ ( t ) d t = P ( t T < t + d t | T t ) = f ( t ) d t S ( t ) = S ( t ) d t S ( t ) . {\displaystyle \lambda (t)\,dt=\mathbb {P} (t\leq T<t+dt\,|\,T\geq t)={\frac {f(t)\,dt}{S(t)}}=-{\frac {S'(t)\,dt}{S(t)}}.}

La force de mortalité est un synonyme de Fonction d'aléa qui est utilisée particulièrement en démographie et science actuarielle, où elle est notée μ {\displaystyle \mu } . Le terme taux d'aléa est un autre synonyme.

La fonction d'aléa doit être positive ou nulle, λ(t) ≥ 0, et son intégrale sur [ 0 , ] {\displaystyle [0,\infty ]} est infinie, mais n'a pas d'autres contraintes; elle peut croître, décroître, être non-monotone, non continue. Un exemple est celui de la fonction de la courbe de la baignoire, qui est grande pour des petites valeurs de t, décroit jusqu'à un minimum, et croit à nouveau ; elle peut modéliser la propriété de quelques systèmes mécaniques de tomber en panne peu de temps après être entré en service, ou bien longtemps après alors que le système a vieilli.

Quantités dérivées de la fonction de distribution de longévité

Distributions utilisées

Voir aussi

Notes

(en) Cet article est partiellement ou en totalité issu de l’article de Wikipédia en anglais intitulé « Survival analysis » (voir la liste des auteurs).
  1. « Syllabus du cours "Données longitudinales et modèles de survie" du Département des Sciences Economiques de l'Université de Genève »
  2. (de) P. E. Böhmer, « Theorie der unabhängigen Wahrscheinlichkeiten », dans Mémoires et procès verbaux du septième congrès international d'actuaires, Amsterdam, , chap. 2, p. 327-343
  3. (en) J. Berkson et R. P. Gage, « Calculation of survivalrates for cancer », Proceedings of the Staff Meetings of the Mayo Clinic, no 25,‎ , p. 270-286
  4. (en) E. L. Kaplan et P. Meier, « Nonparametric estimation from incomplete observations. », Journal of the American Statistical Association, no 53,‎ , p. 457-481

Liens internes

Liens externes

  • SOCR Survival analysis applet and interactive learning activity.
  • Survival/Failure Time Analysis @ Statistics' Textbook Page

Références

  • David Collett. Modelling Survival Data in Medical Research, Second Edition. Boca Raton: Chapman & Hall/CRC. 2003. (ISBN 978-1-58488-325-8)
  • Regina Elandt-Johnson and Norman Johnson. Survival Models and Data Analysis. New York: John Wiley & Sons. 1980/1999.
  • Jerald F. Lawless. Statistical Models and Methods for Lifetime Data, 2nd edition. John Wiley and Sons, Hoboken. 2003.
  • Terry Therneau. "A Package for Survival Analysis in S". http://www.mayo.edu/hsr/people/therneau/survival.ps, at: http://mayoresearch.mayo.edu/mayo/research/biostat/therneau.cfm
  • "Engineering Statistics Handbook", NIST/SEMATEK, itl.nist.gov
  • Survival Analysis - Commercial Usage http://www.discover-right.com/images/survival_analysis_-_understanding_and_implementation.pdf
  • Rausand, M. and Hoyland, A. System Reliability Theory: Models, Statistical Methods, and Applications, John Wiley & Sons, Hoboken, 2004. See web site.
  • Richards, S. J. A handbook of parametric survival models for actuarial use. Scandinavian Actuarial Journal informaworld.com
v · m
Index du projet probabilités et statistiques
Théorie des probabilités
Bases théoriques
Principes généraux
Convergence de lois
Calcul stochastique
Lois de probabilité
Lois continues
Lois discrètes
Mélange entre statistiques et probabilités
Interprétations de la probabilité
Théorie des statistiques
Statistiques descriptives
Bases théoriques
Tableaux
Visualisation de données
Paramètres de position
Paramètres de dispersion
Paramètres de forme
Statistiques inductives
Bases théoriques
Tests paramétriques
Tests non-paramétriques
Application
  • icône décorative Portail sur la mort
  • icône décorative Portail des probabilités et de la statistique