Modèle génératif

Un article de Wikipédia, l'encyclopédie libre.

En classement automatique un modèle génératif est un modèle statistique défini par opposition à un modèle discriminatif. Étant donné une variable X à laquelle il doit associer une autre variable Y, le modèle génératif cherchera à décrire la probabilité conditionnelle ainsi que la probabilité puis d'utiliser la formule de Bayes pour calculer la probabilité [1].

Autrement dit le modèle génératif cherche à décrire chaque classe et à en déduire à quel point une donnée présente les caractéristiques de cette classe.

Avantages et inconvénients[modifier | modifier le code]

Les avantages d'un modèle génératif sont les suivants :

  • Un modèle génératif permet d'estimer la confiance d'une prédiction et donc de formuler un rejet d'une prédiction, ce qui est impossible dans un modèle discriminatif.
  • La connaissance de permet également de générer des nouvelles données [2].
  • Des nouvelles classes peuvent facilement être ajoutées en additionnant leurs densités de probabilité à celles qui ont déjà été calculées. On peut également combiner différents modèles avec des combinaisons linéaires de leurs prédictions, un modèle génératif permet donc une accumulation continue des connaissances.

Un modèle génératif présente cependant un certain nombre d'inconvénients :

  • Le calcul de est très coûteux, d'autant plus que la dimension de est grande[3].

Formalisme[modifier | modifier le code]

Soit deux variables aléatoires et , appelées respectivement la donnée et la classe, un modèle génératif est une loi de probabilité jointe sur qui s'écrit . En particulier le modèle est défini par les distributions et , ce dernier terme étant appelé a priori bayésien sur la classe . La probabilité que la classe soit pour une donnée est donc déduite par l'inférence bayésienne suivante :

ou la valeur de est déduite par la loi des probabilités totales : pour l'ensemble des classes existantes.

Exemples de modèles génératifs[modifier | modifier le code]

Les modèles génératifs couramment utilisés en classification automatique sont les suivants :

Notes et références[modifier | modifier le code]

  1. (en) Siwei Xu, « Generative vs Discriminative Probabilistic Graphical Models », sur Medium, (consulté le )
  2. (en) Prakash Pandey, « Deep Generative Models », sur Medium, (consulté le )
  3. Rahul G. Krishnan, Dawen Liang et Matthew Hoffman, « On the challenges of learning with inference networks on sparse, high-dimensional data », arXiv:1710.06085 [cs, stat],‎ (lire en ligne, consulté le )