DeepDream

Un article de Wikipédia, l'encyclopédie libre.
Sauter à la navigation Sauter à la recherche
Photographie avant et après un traitement partiel par DeepDream.
Étape avancée du traitement d'une photographie de trois hommes.

DeepDream est un programme de vision par ordinateur créé par Google qui utilise un réseau neuronal convolutif pour trouver et renforcer des structures dans des images en utilisant des paréidolies créées par algorithme, donnant ainsi une apparence hallucinogène à ces images[1],[2],[3].

Logiciel[modifier | modifier le code]

Photographie de ciel nuageux ; à droite, sa transformation par DeepDream.
Surinterprétations amenant à des animaux monstrueux dans l'image précédente.

L'idée de départ du programme était de réussir à mieux comprendre le fonctionnement des réseaux de neurones convolutif, en particulier ce qu'il se passe à chaque couche[2].

La technique utilisée par DeepDream est appelé par les auteurs "Inceptionism", en référence au réseau Inception de Szegedy at al.[3],[2]. Ce réseau, surnommé "Inception" d'après le film du même nom[3], a été développé pour le ImageNet Large-Scale Visual Recognition Challenge (ILSVRC, Défi de la reconnaissance visuelle à grande échelle de ImageNet) en 2014[3], et publié en 2015. Le réseau Inception était destiné au départ à détecter des objets dans des images, avec pour objectif leur classification automatique[4].

L'idée de Deep Dream est de renverser ce réseau, en partant d'une image de bruit aléatoire, et en forçant le réseau à générer une image correspondant à un des objets appris[2]. En réitérant l'algorithme pour renforcer les images perçues, il apparaît une forme de paréidolie, créant des images relevant de l'art psychédélique et du surréalisme. La ressemblance souvent mentionnée de ces images avec des hallucinations induites par le LSD et la psilocybine suggère une ressemblance fonctionnelle entre les réseaux de neurones artificiels et certaines couches du cortex visuel, une question qui demandera des études plus approfondies[5].

Après que Google ait publié leurs algorithmes et rendu leur code open source[6], de nombreux outils sont apparus sur le marché, permettant aux utilisateurs de transformer leurs propres photos, sous forme de services web et d'applications pour ordinateurs de bureau, portables, et même smartphones[7].

Références[modifier | modifier le code]

  1. Alexander Mordvintsev, Christopher Olah et Mike Tyka, « DeepDream - a code example for visualizing Neural Networks » [archive du ], Google Research,
  2. a, b, c et d (en) Alexander Mordvintsev, Christopher Olah et Mike Tyka, « Inceptionism: Going Deeper into Neural Networks », Google Research,
  3. a, b, c et d (en) Christian Szegedy, Wei Liu, Yangqing Jia, Pierre Sermanet, Scott Reed, Dragomir Anguelov et Dumitru Erhan, « Going Deeper with Convolutions », Computing Research Repository,‎ (arXiv 1409.4842, lire en ligne)
  4. (en) Rich McCormick, « Fear and Loathing in Las Vegas is terrifying through the eyes of a computer », The Verge, (consulté le 25 juillet 2015)
  5. (en) Adrienne LaFrance, « When Robots Hallucinate », The Atlantic (consulté le 24 septembre 2015)
  6. (en) DeepDream sur le site de GitHub
  7. (en) Daniel Culpan, « These Google "Deep Dream" Images Are Weirdly Mesmerising », Wired, (consulté le 25 juillet 2015)

Liens externes[modifier | modifier le code]