Apprentissage non supervisé

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

Dans le domaine informatique, l'apprentissage non supervisé (parfois dénommé « clustering ») est une méthode d'apprentissage automatique. Il s'agit pour un logiciel de diviser un groupe hétérogène de données, en sous-groupes de manière à ce que les données considérées comme les plus similaires soient associées au sein d'un groupe homogène et qu'au contraire les données considérées comme différentes se retrouvent dans d'autres groupes distincts ; l'objectif étant de permettre une extraction de connaissance organisée à partir de ces données

Spécificités[modifier | modifier le code]

Cette méthode se distingue de l'apprentissage supervisé par le fait qu'il n'y a pas de sortie a priori.
Dans l'apprentissage non supervisé il y a en entrée un ensemble de données collectées. Ensuite le programme traite ces données comme des variables aléatoires et construit un modèle de « densités jointes » pour cet ensemble de données.

Utilisations[modifier | modifier le code]

L'apprentissage non supervisé peut aussi être utilisé en conjonction avec une inférence bayésienne pour produire des probabilités conditionnelles pour chaque variable aléatoire étant donné les autres.

Une autre forme d'apprentissage non supervisé est le partitionnement de données qui n'est pas toujours probabiliste.

Voir aussi[modifier | modifier le code]

Articles connexes[modifier | modifier le code]

Bibliographie[modifier | modifier le code]