Base de données MNIST

Un article de Wikipédia, l'encyclopédie libre.
Sauter à la navigation Sauter à la recherche

La base de données MNIST pour Modified ou Mixed National Institute of Standards and Technology, est une base de données de chiffres écrits à la main. C'est un jeu de données très utilisé en apprentissage automatique[1].

La reconnaissance de l'écriture manuscrite est un problème difficile, et un bon test pour les algorithmes d'apprentissage. La base MNIST est devenu un test standard[1]. Elle regroupe 60000 images d'apprentissage et 10000 images de test, issues d'une base de données antérieure, appelée simplement NIST[1]. Ce sont des images en noir et blanc, normalisées centrées de 28 pixels de côté[1].

Historique[modifier | modifier le code]

En 2018 un groupe de chercheur annonce un taux d'erreur de 0,18%, améliorant le meilleur résultat précédent, en utilisant Random Multimodel Deep Learning (RMDL)[2].

Notes et références[modifier | modifier le code]

  1. a b c et d L. Deng, « The MNIST Database of Handwritten Digit Images for Machine Learning Research (Best of the Web) », IEEE Signal Processing Magazine, vol. 29, no 6,‎ , p. 141-142 (ISSN 1053-5888, DOI 10.1109/MSP.2012.2211477)
  2. Kamran Kowsari, Mojtaba Heidarysafa, Donald E. Brown, Kiana Jafari Meimandi et Laura E. Barnes, « RMDL: Random Multimodel Deep Learning for Classification », sur arXiv.org e-Print archive, (arXiv 1805.01890, consulté le 10 mai 2018)

Liens externes[modifier | modifier le code]