Discussion:Donnée aberrante

Le contenu de la page n’est pas pris en charge dans d’autres langues.
Une page de Wikipédia, l'encyclopédie libre.
Autres discussions [liste]
  • Admissibilité
  • Neutralité
  • Droit d'auteur
  • Article de qualité
  • Bon article
  • Lumière sur
  • À faire
  • Archives
  • Commons

Problèmes dans les Notes[modifier le code]

Les notes 6,7 et 8 ne s'affichent pas. Pourtant je les ai détaillées. Si quelqu'un de plus calé que moi niveau programmation sur Wikipédia pouvait régler le problème ce serait sympa :) --Heribor le 22 avril 2016 à 10:22 (CEST)[répondre]

✔️. J'ai traduit en français, sauf {{citeseerx|10.1.1.109.1943}} que je n'ai pas compris. — Ariel (discuter) 22 avril 2016 à 14:57 (CEST)[répondre]
Merci beaucoup pour ton aide précieuse, je suis étonné d'une réponse aussi rapide.--Heribor le 22 avril 2016 à 16:41 (CEST)[répondre]

Cet article est tout simplement faux ![modifier le code]

Je n'ai malheureusement pas le temps de le corriger tout de suite, mais cet article est tout simplement faux ! Une valeur aberrante est une erreur. C'est une valeur qui "à l'évidence" est fausse. Par exemple, si je dis que le résultat d'un match de foot a été 95 à 78, tout le monde sait que c'est faux. Une valeur "qui s'éloigne un peu de la moyenne" ou qui sort des moustaches d'une boite a moustache N'est PAS une valeur aberrante, c'est une valeur extrême.

Il est très important de faire la distinction, parce que le seul traitement possible pour une valeur aberrante est de la supprimer, alors que pour les valeurs extrêmes, il existe différents traitements (très bien décrit dans l'article par ailleurs).

Mes sources sont a peu prêt tous les bouquins classique en statistique :

* Le Howel : Méthodes statistiques en sciences humaines
* le Wonnacott : Statistique : Economie - Gestion - Sciences - Médecine (avec exercices d'application)
* Le Falissard : Comprendre et utiliser les statistiques dans les sciences de la vie — Le message qui précède, non signé, a été déposé par Christophe Genolini (discuter), le 23 août 2019 à 10:41 (CEST)[répondre]
Non, dans le domaine des statistiques, une donnée aberrante n'est pas nécessairement une valeur fausse. C'est une valeur qui s'écarte anormalement de la tendance dessinée par les autres données (et c'est d'ailleurs le sens étymologique du mot aberrant), tendance visualisée par un histogramme, une courbe (variation des données en fonction de telle ou telle variable), etc.. Elle peut effectivement provenir d'une grossière erreur de mesure, mais pas seulement, loin de là. Il peut s'agir d'un échantillon particulier qui de fait n'appartient pas à la famille des autres (pour un tas de raisons possibles), ou de caractéristiques de l'échantillon qui viennent perturber la méthodologie de la mesure, etc. Les bons statisticiens savent qu'il ne faut pas rayer d'un trait de plume les données aberrantes, au risque de passer à côté de quelque chose d'important. Je me rappelle (mais je n'ai pas la réf sous la main) une étude ancienne de la tension superficielle d'une solution (de sucre, je crois me rappeler, en tout cas d'un soluté organique) en fonction de la concentration, où les auteurs avaient disqualifié trois valeurs aberrantes (des valeurs de tension superficielle beaucoup plus grandes que la tendance générale) et du coup loupé, plusieurs décennies avant les premières démonstrations publiées, la preuve expérimentale de l'existence de molécules ! — Ariel (discuter) 23 août 2019 à 11:12 (CEST)[répondre]

Nous sommes parfaitement d'accord sur le traitement à faire avec les données. Nous ne sommes pas juste d'accord sur la définition d'aberrante. Pour reprendre votre exemple, personnellement, je l'écrirais comme cela : "les auteurs avaient qualité d'aberrante trois valeurs. Ils les avaient donc supprimé [sous entendu comme il faut le faire avec toute valeur aberrante]. Il s'est avéré des années après que les valeurs n'étaient absolument pas aberrantes et qu'ils n'auraient pas du les supprimer." — Le message qui précède, non signé, a été déposé par Christophe Genolini (discuter), le 23 août 2019 à 13:09 (CEST)[répondre]