Apprentissage non supervisé

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
image illustrant les probabilités et la statistique
Cet article est une ébauche concernant les probabilités et la statistique.

Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.

Dans le domaine informatique, l'apprentissage non supervisé (parfois dénommé « clustering ») est une méthode d'apprentissage automatique. Il s'agit pour un logiciel de diviser un groupe hétérogène de données, en sous-groupes de manière que les données considérées comme les plus similaires soient associées au sein d'un groupe homogène et qu'au contraire les données considérées comme différentes se retrouvent dans d'autres groupes distincts ; l'objectif étant de permettre une extraction de connaissance organisée à partir de ces données

Spécificités[modifier | modifier le code]

Cette méthode se distingue de l'apprentissage supervisé par le fait qu'il n'y a pas de sortie a priori.
Dans l'apprentissage non supervisé il y a en entrée un ensemble de données collectées. Ensuite le programme traite ces données comme des variables aléatoires et construit un modèle de « densités jointes » pour cet ensemble de données.

Utilisations[modifier | modifier le code]

L'apprentissage non supervisé peut aussi être utilisé en conjonction avec une inférence bayésienne pour produire des probabilités conditionnelles pour chaque variable aléatoire étant donné les autres.

Une autre forme d'apprentissage non supervisé est le partitionnement de données qui n'est pas toujours probabiliste.

Voir aussi[modifier | modifier le code]

Articles connexes[modifier | modifier le code]

Bibliographie[modifier | modifier le code]