Receiver Operating Characteristic

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Page d'aide sur l'homonymie Pour les articles homonymes, voir ROC.
La courbe ROC de trois estimateurs d'épitope

La fonction d’efficacité du récepteur ou caractéristique de fonctionnement du récepteur ou caractéristique de performance (d'un test) ou courbe sensibilité/spécificité ou, plus fréquemment, la courbe ROC[1] (de l’anglais Receiver Operating Characteristic) est une mesure de la performance d'un classificateur binaire, c'est-à-dire d'un système qui a pour objectif de catégoriser des entités en deux groupes distincts sur la base d'une ou plusieurs de leurs caractéristiques. Graphiquement, on représente souvent la mesure ROC sous la forme d'une courbe qui donne le taux de vrais positifs (sensibilité : fraction des positifs qui sont détectés (correctement)) en fonction du taux de faux positifs (fraction des négatifs qui sont détectés (incorrectement)) pour ce même groupe.

Les courbes ROC furent inventées pendant la Seconde Guerre mondiale pour montrer la séparation entre les signaux radar et le bruit de fond.

Elles sont souvent utilisées en statistiques pour montrer les progrès réalisés grâce à un classificateur binaire lorsque le seuil de discrimination varie. Si le modèle calcule un score s qui est comparé au seuil S pour prédire la classe (c.-à-d. (s < S) → positif et (s >= S) → négatif), et qu’on compare ensuite avec les classes réelles (Positif et Négatif), la sensibilité est donnée par la fraction des Positifs classés positifs, et l’antispécificité (1 moins la spécificité) par la fraction des Négatifs classés positifs. On met l’antispécificité en abscisse et la sensibilité en ordonnée pour former le diagramme ROC. Chaque valeur de S fournira un point de la courbe ROC, qui ira de (0, 0) à (1, 1).

À (0, 0) le classificateur déclare toujours 'négatif' : il n’y a aucun faux positif, mais également aucun vrai positif. Les proportions de vrais et faux négatifs dépendent de la population sous-jacente.

À (1, 1) le classificateur déclare toujours 'positif' : il n’y a aucun vrai négatif, mais également aucun faux négatif. Les proportions de vrais et faux positifs dépendent de la population sous-jacente.

Un classificateur aléatoire tracera une droite allant de (0, 0) à (1, 1).

À (0, 1) le classificateur n’a aucun faux positif ni aucun faux négatif, et est par conséquent parfaitement exact, ne se trompant jamais.

À (1, 0) le classificateur n’a aucun vrai négatif ni aucun vrai positif, et est par conséquent parfaitement inexact, se trompant toujours. Il suffit d’inverser sa prédiction pour en faire un classificateur parfaitement exact.

Dans la théorie de la détection du signal, les grandeurs d' et A' mesurent l'aire sous la courbe ROC. Plus cette aire est grande, plus la courbe s’écarte de la ligne du classificateur aléatoire et se rapproche du coude du classificateur idéal (qui passe de (0, 0) à (0, 1) à (1, 1)).

L'intérêt de la courbe ROC dans le domaine médical a été souligné dès 1960. Depuis, cet outil statistique a été utilisé notamment dans le domaine pharmaceutique, en radiologie et en biologie. La courbe ROC s’est imposée en biologie clinique depuis plusieurs années. Elle permet la détermination et la comparaison des performances diagnostiques de plusieurs tests à l’aide de l’évaluation des aires sous la courbe. Elle est aussi utilisée pour estimer la valeur seuil optimale d’un test en tenant compte des données épidémiologiques et médicoéconomiques de la maladie [2].

Notes et références[modifier | modifier le code]

  1. Cette abréviation d’origine anglophone reste la plus couramment employée, y compris dans l'univers scientifique francophone.
  2. Delacour, H., et al., La Courbe ROC (receiver operating characteristic) : principes et principales applications en biologie clinique, Annales de biologie clinique, 2005 ; 63 (2) : 145-54

Articles connexes[modifier | modifier le code]