CIFAR-10

L'ensemble de données CIFAR-10 est une collection d'images couramment utilisées pour former des algorithmes d'apprentissage automatique et de vision par ordinateur. C'est l'un des jeu de données ((en)dataset) les plus largement utilisés pour la recherche en apprentissage automatique^[1]^,^[2]. Il a été créer par l'Institut canadien de recherches avancées (acronyme: CIFAR), et contient 60 000 images de 10 classes d'objets différents (avions, voitures, oiseaux, chats, cerfs, chiens, grenouilles, chevaux, navires et camions). La répartition entre chaque classes est égale (6 000 images pour chaque classe). Les images sont en couleurs, mais en basse résolution (32x32 pixels)^[3]^,^[4].

Les algorithmes informatiques permettant de reconnaître des objets sur des photos apprennent souvent par l'exemple. Ce dataset sert donc souvent à apprendre à un ordinateur à reconnaître des objets. Étant donné que les images du CIFAR-10 sont en basse résolution (32 x 32), cet ensemble de données peut permettre aux chercheurs d’essayer rapidement différents algorithmes en phase d'expérimentation de leurs modèles de réseaux de neurones.

CIFAR-10, publié en 2009, est un sous-ensemble de données étiquetés ((en) labeled data) lui-même issue de l'ensemble de données 80 Million Tiny Images (en) de 2008. Lorsque l’ensemble de données a été créé, les étudiants ont été payés pour étiqueter toutes les images^[5].

Différents types de réseaux de neurones convolutifs ont tendance à être les meilleurs pour reconnaître les images du CIFAR-10.

Articles de recherche ayant utilisé CIFAR-10

Il s'agit d'un tableau de certains des articles de recherche qui ont utilisé CIFARD-10 et ont revendiqués des résultats innovent pour la vision par ordinateur (et par extension, l'intelligence artificiel). Tous les articles ne sont pas standardisés sur les mêmes techniques de prétraitement, comme le retournement ou le décalage d'image. Pour ces raisons, il est possible que le taux d'erreur déclaré d'un article ne soit pas comparable a un autre.

Titre de l'article non traduit	traduction française	Taux d'erreur (%)	Date de publication
Convolutional Deep Belief Networks on CIFAR-10^[6]	Réseaux de croyances profondes convolutionnelles en CIFAR-10	21,1	août 2010
Maxout Networks^[7]	Réseau de Maxout	9,38	13 février 2013
Wide Residual Networks^[8]	Réseaux Larges Résiduels	4,0	23 mai 2016
Neural Architecture Search with Reinforcement Learning^[9]	Recherche d'architecture neurale avec apprentissage de renforcement	3,65	4 novembre 2016
Fractional Max-Pooling^[10]	Fractionnement Max-Pooling	3,47	18 décembre 2014
Densely Connected Convolutional Networks^[11]	Réseaux convolutionnels fortement reliés	3,46	24 aout 2016
Shake-Shake regularization^[12]		2,86	21 mai 2017
Coupled Ensembles of Neural Networks^[13]	Ensembles de réseaux neuronaux couplés	2,68	18 september 2017
ShakeDrop regularization^[14]		2,67	7 février 2018
Improved Regularization of Convolutional Neural Networks with Cutout^[15]	Amélioration de la régularisation des réseaux neuronaux convolutionnels avec réduction	2,56	15 août 2017
Regularized Evolution for Image Classifier Architecture Search^[16]	Évolution régularisée pour la recherche de l'architecture de classificateur d'image	2,13	6 février 2018
Rethinking Recurrent Neural Networks and other Improvements for Image Classification^[17]	Repenser les réseaux neuronaux récurrents et autres améliorations pour la classification des images	1,64	31 juillet 2020
AutoAugment: Learning Augmentation Policies from Data^[18]	Auto-augmentation: Choix d'amélioration de l'apprentissage à partir de données	1,48	24 mai 2018
A Survey on Neural Architecture Search^[19]	Sondage sur la recherche de l'architecture neuronale	1,33	4 mai 2019
GPipe: Efficient Training of Giant Neural Networks using Pipeline Parallelism^[20]	GPipe: Entraînement efficace de réseaux neuronaux géants utilisant les calculs paralléles	1,00	16 novembre 2018
Reduction of Class Activation Uncertainty with Background Information^[21]	Réduction de l'incertitude d'activation de classe avec des informations de base	0,95	5 mai 2023
An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale^[22]	Une image vaut 16x16 Mots: Transformateurs pour la reconnaissance d'images à l'échelle	0,5	2021

Benchmarks

CIFAR-10 est également utilisé comme référence de performance pour les équipes en compétition pour exécuter des réseaux neuronaux plus rapidement et à moindre coût. DAWNBench dispose de données de référence sur son site Web.

Voir également

Références

↑ « AI Progress Measurement », Electronic Frontier Foundation,‎ 12 juin 2017 (lire en ligne, consulté le 11 décembre 2017)
↑ « Popular Datasets Over Time | Kaggle », www.kaggle.com (consulté le 11 décembre 2017)
↑ Tom Hope, Yehezkel S. Resheff et Itay Lieder, Learning TensorFlow: A Guide to Building Deep Learning Systems, O'Reilly Media, Inc., 9 août 2017, 64– (ISBN 9781491978481, lire en ligne)
↑ Plamen Angelov, Alexander Gegov, Chrisina Jayne et Qiang Shen, Advances in Computational Intelligence Systems: Contributions Presented at the 16th UK Workshop on Computational Intelligence, September 7–9, 2016, Lancaster, UK, Springer International Publishing, 6 septembre 2016, 441– (ISBN 9783319465623, lire en ligne)
↑ Krizhevsky, « Learning Multiple Layers of Features from Tiny Images », 2009
↑ « Convolutional Deep Belief Networks on CIFAR-10 »
↑ (en) Ian J. Goodfellow, David Warde-Farley, Mehdi Mirza, Aaron Courville et Yoshua Bengio, « Maxout Networks », 13 février 2013.
↑ (en) Sergey Zagoruyko et Nikos Komodakis, « Wide Residual Networks », 23 mai 2016.
↑ (en) Barret Zoph et Quoc V. Le, « Neural Architecture Search with Reinforcement Learning », 4 novembre 2016.
↑ (en) Benjamin Graham, « Fractional Max-Pooling », 18 décembre 2014.
↑ (en) Gao Huang, Zhuang Liu, Kilian Q. Weinberger et Laurens van der Maaten, « Densely Connected Convolutional Networks », 24 août 2016.
↑ (en) Xavier Gastaldi, « Shake-Shake regularization », 21 mai 2017.
↑ (en) Anuvabh Dutt, « Coupled Ensembles of Neural Networks », 18 septembre 2017.
↑ Yoshihiro Yamada, Masakazu Iwamura et Koichi Kise, « Shakedrop Regularization for Deep Residual Learning », IEEE Access, vol. 7,‎ 7 février 2018, p. 186126–186136 (DOI 10.1109/ACCESS.2019.2960566, arXiv 1802.02375, S2CID 54445621)
↑ (en) DeVries Terrance et Taylor, Graham W., « Improved Regularization of Convolutional Neural Networks with Cutout », 15 août 2017.
↑ (en) Esteban Real, Alok Aggarwal, Yanping Huang et Quoc V. Le, « Regularized Evolution for Image Classifier Architecture Search with Cutout », 5 février 2018.
↑ (en) Huu P. Nguyen et Bernardete Ribeiro, « Rethinking Recurrent Neural Networks and other Improvements for Image Classification », 31 juillet 2020.
↑ (en) Ekin D. Cubuk, Barret Zoph, Dandelion Mane, Vijay Vasudevan et Quoc V. Le, « AutoAugment: Learning Augmentation Policies from Data », 24 mai 2018.
↑ (en) Martin Wistuba, Ambrish Rawat et Tejaswini Pedapati, « A Survey on Neural Architecture Search », 4 mai 2019.
↑ (en) Yanping Huang, Yonglong Cheng, Dehao Chen, HyoukJoong Lee, Jiquan Ngiam et al., « GPipe: Efficient Training of Giant Neural Networks using Pipeline Parallelism », 16 novembre 2018.
↑ (en) Hussain Kabir, « Reduction of Class Activation Uncertainty with Background Information », 5 mai 2023.
↑ (en) Alexey Dosovitskiy, Lucas Beyer, Alexander Kolesnikov, Dirk Weissenborn, Xiaohua Zhai, Thomas Unterthiner, Mostafa Dehghani, Matthias Minderer, Georg Heigold, Sylvain Gelly, Jakob Uszkoreit et Neil Houlsby, « An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale », International Conference on Learning Representations,‎ 2021 (arXiv 2010.11929, lire en ligne)

Liens externes

Page CIFAR-10 – Site hébergent cet ensemble de données
Institut canadien de recherches avancées

Ensembles de données similaires

CIFAR-100 : Similaire au CIFAR-10 mais avec 100 classes et 600 images chacune.
ImageNet (ILSVRC) : 1 million d'images couleur de 1000 classes. Les images Imagenet ont une résolution plus élevée, avec une résolution moyenne de 469 x 387.
Numéros de maison Street View (SVHN) : environ 600 000 images de 10 classes (chiffres de 0 à 9). Également des images couleur 32x32.
Ensemble de données de 80 millions d'images minuscules : CIFAR-10 est un sous-ensemble étiqueté de cet ensemble de données.

[1] « AI Progress Measurement », Electronic Frontier Foundation,‎ 12 juin 2017 (lire en ligne, consulté le 11 décembre 2017)

[2] « Popular Datasets Over Time | Kaggle », www.kaggle.com (consulté le 11 décembre 2017)

[HopeResheff2017-3] Tom Hope, Yehezkel S. Resheff et Itay Lieder, Learning TensorFlow: A Guide to Building Deep Learning Systems, O'Reilly Media, Inc., 9 août 2017, 64– (ISBN 9781491978481, lire en ligne)

[AngelovGegov2016-4] Plamen Angelov, Alexander Gegov, Chrisina Jayne et Qiang Shen, Advances in Computational Intelligence Systems: Contributions Presented at the 16th UK Workshop on Computational Intelligence, September 7–9, 2016, Lancaster, UK, Springer International Publishing, 6 septembre 2016, 441– (ISBN 9783319465623, lire en ligne)

[5] Krizhevsky, « Learning Multiple Layers of Features from Tiny Images », 2009

[6] « Convolutional Deep Belief Networks on CIFAR-10 »

[7] (en) Ian J. Goodfellow, David Warde-Farley, Mehdi Mirza, Aaron Courville et Yoshua Bengio, « Maxout Networks », 13 février 2013.

[8] (en) Sergey Zagoruyko et Nikos Komodakis, « Wide Residual Networks », 23 mai 2016.

[9] (en) Barret Zoph et Quoc V. Le, « Neural Architecture Search with Reinforcement Learning », 4 novembre 2016.

[10] (en) Benjamin Graham, « Fractional Max-Pooling », 18 décembre 2014.

[11] (en) Gao Huang, Zhuang Liu, Kilian Q. Weinberger et Laurens van der Maaten, « Densely Connected Convolutional Networks », 24 août 2016.

[12] (en) Xavier Gastaldi, « Shake-Shake regularization », 21 mai 2017.

[13] (en) Anuvabh Dutt, « Coupled Ensembles of Neural Networks », 18 septembre 2017.

[14] Yoshihiro Yamada, Masakazu Iwamura et Koichi Kise, « Shakedrop Regularization for Deep Residual Learning », IEEE Access, vol. 7,‎ 7 février 2018, p. 186126–186136 (DOI 10.1109/ACCESS.2019.2960566, arXiv 1802.02375, S2CID 54445621)

[15] (en) DeVries Terrance et Taylor, Graham W., « Improved Regularization of Convolutional Neural Networks with Cutout », 15 août 2017.

[16] (en) Esteban Real, Alok Aggarwal, Yanping Huang et Quoc V. Le, « Regularized Evolution for Image Classifier Architecture Search with Cutout », 5 février 2018.

[17] (en) Huu P. Nguyen et Bernardete Ribeiro, « Rethinking Recurrent Neural Networks and other Improvements for Image Classification », 31 juillet 2020.

[18] (en) Ekin D. Cubuk, Barret Zoph, Dandelion Mane, Vijay Vasudevan et Quoc V. Le, « AutoAugment: Learning Augmentation Policies from Data », 24 mai 2018.

[19] (en) Martin Wistuba, Ambrish Rawat et Tejaswini Pedapati, « A Survey on Neural Architecture Search », 4 mai 2019.

[20] (en) Yanping Huang, Yonglong Cheng, Dehao Chen, HyoukJoong Lee, Jiquan Ngiam et al., « GPipe: Efficient Training of Giant Neural Networks using Pipeline Parallelism », 16 novembre 2018.

[21] (en) Hussain Kabir, « Reduction of Class Activation Uncertainty with Background Information », 5 mai 2023.

[22] (en) Alexey Dosovitskiy, Lucas Beyer, Alexander Kolesnikov, Dirk Weissenborn, Xiaohua Zhai, Thomas Unterthiner, Mostafa Dehghani, Matthias Minderer, Georg Heigold, Sylvain Gelly, Jakob Uszkoreit et Neil Houlsby, « An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale », International Conference on Learning Representations,‎ 2021 (arXiv 2010.11929, lire en ligne)

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

[11]

[12]

[13]

[14]

[15]

[16]

[17]

[18]

[19]

[20]

[21]

[22]