Discussion:Matrice de confusion

Le contenu de la page n’est pas pris en charge dans d’autres langues.
Une page de Wikipédia, l'encyclopédie libre.
Autres discussions [liste]
  • Admissibilité
  • Neutralité
  • Droit d'auteur
  • Article de qualité
  • Bon article
  • Lumière sur
  • À faire
  • Archives
  • Commons

Définition[modifier le code]

Je ne comprends "le nombre d'instances" dans les phrase du paragraphe introductif. Par contre, l'exemple est très clair. --Fschwarzentruber (discuter) 6 octobre 2017 à 11:21 (CEST)[répondre]

Problèmes de conventions[modifier le code]

Bonjour, selon moi il y a deux problèmes sur cet article: d'abord les "positifs" devraient être les pourriels (voir sur le site d'où provient le dataset http://archive.ics.uci.edu/ml/datasets/Spambase), ensuite la convention anglo-saxonne veut que les faux positifs soient en haut à droite et les faux négatifs en bas à gauche (ici c'est l'inverse qui a été fait). Je sors d'un TD de machine learning et ces deux problèmes gênent pas mal la compréhension d'une notion pourtant assez simple. --Kradouk (discuter) 4 mai 2020 à 12:58 (CEST)[répondre]

Bonjour, le mieux c'est de s'appuyer sur des sources de référence. Avez vous un ouvrage ou un article de référence sur lequel nous pourrions nous appuyer ?--PAC2 (discuter) 4 mai 2020 à 22:40 (CEST)[répondre]

Bonsoir, merci pour votre réponse. Pour ce qui est des positifs, c'est selon moi du sens commun: un patient est testé "positif" à une maladie s'il est effectivement malade; de même, un mail devrait être "positif" s'il est effectivement un spam. Sur le site du dataset (http://archive.ics.uci.edu/ml/datasets/Spambase), on peut lire, concernant le dernier attribut: "denotes whether the e-mail was considered spam (1) or not (0), i.e. unsolicited commercial e-mail", ce qui va également dans ce sens. Quant à la position relative des "faux positifs" et "faux négatifs" dans la matrice de confusion, on peut se référer à l'article Wikipédia Confusion matrix (https://en.wikipedia.org/wiki/Confusion_matrix) qui utilise la convention inverse. --Kradouk (discuter) 5 mai 2020 à 01:07 (CEST)[répondre]

indication de fiabilité[modifier le code]

'la 2e ligne verticale des pourriels nous donne une indication sur à quel point les prédictions (détection de pourriels) sont fiables (ie : 5% d'erreurs sur les courriels et 3% d'erreurs sur les pourriels soit 4% d'erreur de classification d'un mail en moyenne par le classificateur)' Accessoirement, la ligne verticale peut être nommée "colonne". Mais surtout, l'indication de fiabilité du classificateur n'est-elle pas la diagonale où on voit ses deux taux d'erreur (dans l'exemple, 5 et 3) ? Francool50 (discuter) 5 octobre 2023 à 15:59 (CEST)[répondre]