Richard Sutton

Un article de Wikipédia, l'encyclopédie libre.
Ceci est une version archivée de cette page, en date du 20 janvier 2021 à 23:48 et modifiée en dernier par Hug.Silva (discuter | contributions). Elle peut contenir des erreurs, des inexactitudes ou des contenus vandalisés non présents dans la version actuelle.
Richard S. Sutton
Description de cette image, également commentée ci-après
Richard Sutton, le 27 octobre 2016

Résidence Canada
Domaines Intelligence artificielle, apprentissage par renforcement
Institutions Université de l'Alberta
Diplôme Ph. D; (Temporal credit assignment in reinforcement learning)
Directeur de thèse Andrew Barto (en)
Étudiants en thèse Doina Precup, David Silver, Hamid Maei, Adam White
Renommé pour Temporal difference learning, Dyna, Options, GQ(λ)
Distinctions AAAI Fellow (2001)
President's Award (INNS) (2003)

Richard Sutton est un informaticien canadien, enseignant en informatique à l'université de l'Alberta. Il est considéré comme l'un des fondateurs de l'apprentissage par renforcement, domaine auquel il a apporté plusieurs contributions majeures telles que le temporal difference learning et les méthodes de gradient.

Formation

Sutton a reçu son B.A. en psychologie à l'université Stanford en 1978, et ses M.Sc. et Ph.D en informatique à l'université du Massachusetts à Amherst en 1980 et 1984, sous la direction d'Andrew Barto (en). Sa thèse, « Temporal Credit Assignment in Reinforcement Learning », introduisait en particulier des idées de temporal difference learning.

Publications

  • (en) Sutton, R. S., Barto, A. G., Reinforcement Learning: An Introduction. MIT Press, 1998. 2e édition MIT Press en 2018.
  • (en) Miller, W. T., Sutton, R. S., Werbos, P. J. (Eds.), Neural Networks for Control. MIT Press, 1991.
  • (en) Sutton, R. S. (Ed.), Reinforcement Learning. Reprinting of a special issue of Machine Learning Journal. Kluwer Academic Press, 1992

Références

Liens externes