Apprentissage supervisé

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

L'apprentissage supervisé est une technique d'apprentissage automatique où l'on cherche à produire automatiquement des règles à partir d'une base de données d'apprentissage contenant des « exemples » (en général des cas déjà traités et validés).

Définition mathématique[modifier | modifier le code]

Une base de données d'apprentissage est un ensemble de couples entrée-sortie  (x_n, y_n)_{1 \le n \le N} avec  x_n \in X et  y_n \in Y , que l'on considère être tirées selon une loi sur X \times Y inconnue, par exemple xn suit une loi uniforme et yn = f(xn) + wnwn est un bruit centré.

La méthode d'apprentissage supervisé utilise cette base d'apprentissage pour déterminer une représentation compacte de f notée g et appelée fonction de prédiction, qui à une nouvelle entrée x associe une sortie g(x). Le but d'un algorithme d'apprentissage supervisé est donc de généraliser pour des entrées inconnues ce qu'il a pu « apprendre » grâce aux données déjà traitées par des experts, ceci de façon « raisonnable ».

On distingue deux types de problèmes solubles avec une méthode d'apprentissage automatique supervisée :

  • Y \subset \Bbb{R} : lorsque la sortie que l'on cherche à estimer est une valeur dans un ensemble continu de réels, on parle d'un problème de régression.
  • Y = \{1, \ldots, I\} : lorsque l'ensemble des valeurs de sortie est fini, on parle d'un problème de classification, qui revient à attribuer une étiquette à chaque entrée.

Méthodes d'apprentissage supervisé[modifier | modifier le code]

Applications[modifier | modifier le code]

Voir aussi[modifier | modifier le code]

Articles connexes[modifier | modifier le code]

Liens externes[modifier | modifier le code]

Bibliographie[modifier | modifier le code]

Notes et références[modifier | modifier le code]