Sujet sur Discussion utilisateur:D Cat laz

Réseaux de neurones

7
Résumé par D Cat laz

Un échange intéressant autour de AlphaZero et de la classification des méthode à Réseau de neurones artificiels

Dfeldmann (discutercontributions)

Ben oui et non : effectivement, en matière d'apprentissage visuel, c'est supervisé (enfin, ça dépend un peu de ce qu'on veut dire : l'utilisation d'un jeu de données initial sur lequel se fait l'apprentissage n'est pas exactement la même chose qu'une intervention humaine à certaines étapes clés de l'apprentissage). Mais dans le cas d'AlphaZero (ou de MuZero), où diable serait la "supervision" ?

D Cat laz (discutercontributions)

Hum, excellente remarque. Néanmoins, je n'ai aucune idée de la manière dont l'appeler car je ne connais pas la structure de l'algorithme. Le papier originel parle d'"apprentissage par renforcement" https://arxiv.org/abs/1712.01815, donc peut être que cette catégorie correspond mieux à AlphaZero et MuZero ?

D Cat laz (discutercontributions)
Dfeldmann (discutercontributions)

Ben si, enfin : voir n'importe quel article sur AlphaZero (ou plutôt sur AlphaGo Zero), celui-ci par exemple. Je dis une bêtise ?

D Cat laz (discutercontributions)

Alors j'ai appris un truc aujourd'hui, c'est que oui on peut parler de Réseau neuronal convolutif pour AlphaGO Zeo et Alpha Zero.

Mais avec ces programmes pour moi on est dans le cas bizarre où c'est tellement complexe (on a le MCTS, le reinforcement learning avec des partie évalué à +1 ou -1, le réseau de neurone amélioré avec la descente de gradient avec les résultats des parties précédentes) qu'on est à la fois dans de l'apprentissage par renforcement et apprentissage non-supervisé.

Toutefois sur pour revenir à l'entrainement de CNN, je pense que la majeur partie des applications ne peuvent pas utilisé cette aspect "self-train" et qu'il faudrait donc garder les CNN dans "apprentissage supervisé" quitte à mentionner dans l'article que quand dans le cas de ces jeux le résultat de la prédiction peut être utiliser pour créer un nouveau jeu de données pour entrainer le modèle ce qui combine à la fois apprentissage par renforcement et apprentissage non-supervisé.

Dfeldmann (discutercontributions)

Ok, donc on garde la palette comme au début (et comme tu l’as remise), et ou bien on revient à ta version (sans la petite phrase entre parenthèses), ou on complète en précisant (d’où d’ailleurs la différence faite chez WPen entre CNN et DNN)

D Cat laz (discutercontributions)

Je pense qu'il faut garder la palette comme au début.

Pourquoi ?

Les réseaux de neurones convolutifs restent très différents des algorithmes classiques non supervisé qui se basent plus sur des densités de cluster. Dans le cas de Alpha Zero, au final, les poids de l'algorithme sont mis à jour à partir de partie labellisé comme "gagnante" ou "perdante", de ce point de vue on pourrai dire que le réseau est bien entraîné sur un jeu de données labellisé (qu'il a certes généré lui même ((chapeau Smiley de Zorro, avec un masque et un chapeau noir)) ).

Pour la subtilité et mon avis sur ces sujets:

J'ai vue que Alpha zero était déjà mentionné dans l'article Apprentissage par renforcement, rien à dire de ce coté là donc. Pour ce qui est de l'article sur les Réseau neuronal convolutif, en parcourant les articles en français et en anglais je ne vois pas de partie pertinente où ajouter cette subtilité à part peut être dans la partie Histoire (au passage je trouve l'article français mieux construit).

Il me semble que Wikipédia français fait aussi la différence entre CNN Réseau neuronal convolutif et DNN Apprentissage profond (même si le second article pique les yeux ). MAIS je trouve l'article en:Deep learning extrêmement redondant avec en:Artificial neural network. La cause ? Le Deep Learning est un truc mal défini (des gros gros réseau de neurones) et donc c'est un concept pas très utile à part pour le buzz. Et donc pour moi on devrai fusionner ces articles dans les deux langues (mais bon je me calme, je me calme )

Bon voilà, tout ça pour dire que je trouve CNN à sa place dans Apprentissage supervisé et que des algorithmes comme AlphaGo Zero sont passionnant d'ingénieusité.

Répondre à « Réseaux de neurones »