Donnée aberrante

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

Une donnée aberrante est une observation qui se trouve « loin » des autres observations (Moore et McCabe 1999). La présence d’une donnée aberrante peut signifier toutes sortes de choses. Cela peut être par exemple un cas qui ne fait pas partie de la population que l’on étudie (un adulte parmi un jeu de données concernant des enfants), ou bien une erreur de saisie ou de mesure. Certaines données aberrantes peuvent être aisément identifiées. Toutefois, l’appellation « donnée aberrante » reste très subjective. Il n’existe pas de définition mathématique ou statistique des données aberrantes. Toutefois, cette absence de définition n'est pas gênante, tout comme l'absence de définition de la vie ne gène pas un biologiste[réf. nécessaire].


Dans un domaine concret, la détection des données aberrantes permet la détection de fraudes (cartes de crédit, télécommunications), la détection d'intrusions sur un réseau ou encore la détection d'erreurs de mesure, de saisie, etc.