Base de données MNIST

Un article de Wikipédia, l'encyclopédie libre.
Sauter à la navigation Sauter à la recherche
Un ensemble de 160 chiffres, comprenant 16 exemplaires de chaque chiffre alignés horizontalement.
Un exemple de chiffres de la base MNIST.

La base de données MNIST pour Modified ou Mixed National Institute of Standards and Technology, est une base de données de chiffres écrits à la main. C'est un jeu de données très utilisé en apprentissage automatique[1].

La reconnaissance de l'écriture manuscrite est un problème difficile, et un bon test pour les algorithmes d'apprentissage. La base MNIST est devenu un test standard[1]. Elle regroupe 60000 images d'apprentissage et 10000 images de test, issues d'une base de données antérieure, appelée simplement NIST[1]. Ce sont des images en noir et blanc, normalisées centrées de 28 pixels de côté[1].

Historique[modifier | modifier le code]

En 2018 un groupe de chercheur annonce un taux d'erreur de 0,18%, améliorant le meilleur résultat précédent, en utilisant Random Multimodel Deep Learning (RMDL)[2].

Notes et références[modifier | modifier le code]

  1. a b c et d L. Deng, « The MNIST Database of Handwritten Digit Images for Machine Learning Research (Best of the Web) », IEEE Signal Processing Magazine, vol. 29, no 6,‎ , p. 141-142 (ISSN 1053-5888, DOI 10.1109/MSP.2012.2211477)
  2. Kamran Kowsari, Mojtaba Heidarysafa, Donald E. Brown, Kiana Jafari Meimandi et Laura E. Barnes, « RMDL: Random Multimodel Deep Learning for Classification », sur arXiv.org e-Print archive, (arXiv 1805.01890, consulté le 10 mai 2018)

Liens externes[modifier | modifier le code]