« David Silver » : différence entre les versions

Un article de Wikipédia, l'encyclopédie libre.
Contenu supprimé Contenu ajouté
Yoctera (discuter | contributions)
Créé en traduisant la page « David Silver (computer scientist) »
(Aucune différence)

Version du 17 novembre 2022 à 01:46

David Silver (né en 1976) est un informaticien et entrepreneur britannique qui dirige le groupe de recherche sur l'apprentissage par renforcement chez DeepMind et a été chercheur principal pour AlphaGo, AlphaZero et co-responsable d'AlphaStar.

Éducation

Silver a obtenu un diplôme à l'Université de Cambridge en 1997 en remportant le prix Addison-Wesley, et fit la connaissance de Demis Hassabis à ce moment-là.[1] Il reprend les études en 2004 à l'Université d'Alberta avec un doctorat sur l'apprentissage par renforcement, durant lequel il conçoit les algorithmes utilisés par les premiers programmes de Go 9×9 au niveau master et obtient son diplôme en 2009.[2][3] Sa version du programme MoGo (co-écrit avec Sylvain Gelly) a été l'un des programmes Go les plus performants depuis 2009.[4]

Carrière

Après avoir obtenu son diplôme universitaire, Silver participe à la création de la société de jeux vidéo Elixir Studios, où il a été CTO et programmeur principal, lui valant plusieurs prix pour la technologie et l'innovation.[1][5]

Silver reçoit une bourse de recherche de universitaire de la Royal Society en 2011, puis devient professeur à la University College de Londres.[6] Ses conférences sur l'apprentissage par renforcement sont disponibles sur YouTube.[7] Silver a été consultant pour DeepMind depuis sa création, rejoignant à plein temps en 2013.

Son travail récent a été axé sur la combinaison de l'apprentissage par renforcement avec l'apprentissage profond, par exemple avec un programme qui apprend à jouer à des jeux Atari directement à partir de pixels.[8] Silver a mené le projet AlphaGo, dont un des succès initiaux a été de battre un des meilleurs joueurs professionnels dans le jeu de Go à taille réelle.[9] Par la suite, AlphaGo a reçu la certification professionnelle honoraire 9 Dan et a remporté le prix Cannes Lion pour l'innovation.[10] Il a ensuite dirigé le développement d'AlphaZero, utilisant la même intelligence artificielle pour apprendre à jouer Go sans exemple humain, avant d'apprendre à jouer aux échecs et aux shogi de la même manière, surpassant tout les autres programmes informatiques.

David Silver est l'un des employés de DeepMind les plus publiés, avec plus de 110 000 citations et un indice h de 74.[11]

Il a reçu le prix ACM 2019 en informatique pour ses contributions dans la résolution informatique de jeu vidéos.[12]

En 2021, Silver a été élu membre de la Royal Society pour ses contributions aux Deep Q-Networks et AlphaGo.[13]

Références

  1. a et b Shead, « David Silver: The unsung hero and intellectual powerhouse at Google DeepMind », Business Insider (consulté le ) Erreur de référence : Balise <ref> incorrecte : le nom « Unsung Hero » est défini plusieurs fois avec des contenus différents.
  2. (en) David, « Reinforcement Learning and Simulation-Based Search in Computer Go », ERA,‎ (DOI 10.7939/R39D8T, lire en ligne)
  3. Sylvain Gelly, David Silver, « Achieving Master Level Play in 9 × 9 Computer Go », Proceedings of the Twenty-Third AAAI Conference on Artificial Intelligence,‎ (lire en ligne)
  4. Stuart J. Russell, Peter Norvig, Artificial Intelligence: A Modern Approach, 3rd,
  5. « What the AI Behind AlphaGo Can Teach Us About Being Human » (consulté le )
  6. (en-US) « CSML | David Silver », www.csml.ucl.ac.uk (consulté le )
  7. « RL Course by David Silver - Lecture 1: Introduction to Reinforcement Learning »,
  8. (en) Mnih, Kavukcuoglu, Silver et Rusu, « Human-level control through deep reinforcement learning », Nature, vol. 518, no 7540,‎ , p. 529–533 (ISSN 0028-0836, PMID 25719670, DOI 10.1038/nature14236, Bibcode 2015Natur.518..529M, S2CID 205242740)
  9. Silver, Huang, Maddison et Guez, « Mastering the game of Go with deep neural networks and tree search », Nature, vol. 529, no 7587,‎ , p. 484–489 (ISSN 0028-0836, PMID 26819042, DOI 10.1038/nature16961, Bibcode 2016Natur.529..484S, S2CID 515925)Accès payant
  10. (en) {{Article}} : paramètre « titre » manquant, paramètre « périodique » manquant, paramètre « date » manquant
  11. « David Silver – Google Scholar Citations » (consulté le )
  12. Ormond, « ACM Prize in Computing Awarded to AlphaGo Developer: David Silver Recognized for Breakthrough Advances in Computer Game-Playing », acm.org (consulté le )
  13. « Royal Society elects outstanding new Fellows and Foreign Members », royalsociety.org (consulté le )