Modèle statistique

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
image illustrant les probabilités et la statistique
Cet article est une ébauche concernant les probabilités et la statistique.

Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.

Un modèle statistique est une description mathématique approximative du mécanisme qui a généré les observations, que l'on suppose être un processus stochastique et non un processus déterministe. Il s’exprime généralement à l’aide d’une famille de distributions (ensemble de distributions) et d’hypothèses sur les variables aléatoires X1, . . ., Xn. Chaque membre de la famille est une approximation possible de F : l’inférence consiste donc à déterminer le membre qui s’accorde le mieux avec les données.

Les types principaux : modèle linéaire, modèle linéaire généralisé, modèle multi-niveau (en), modèle d'équation structurelle (en).

Structure d'un modèle statistique[modifier | modifier le code]

Un modèle :

  • est une représentation idéalisée de la réalité ;
  • fait des hypothèses explicites sur les processus étudiés  ;
  • ses hypothèses peuvent être fausses ;
  • permet un raisonnement abstrait.

Évaluation et comparaison d'un modèle statistique[modifier | modifier le code]

Un bon modèle est un bon compromis entre :

  • description juste de la réalité (paramètres nombreux, hypothèses correctes) ;
  • facilité de manipulation mathématique ;
  • production de solutions proches de l'observation.

Ceci peut être confirmé à l'aide d'analyse explicatoire des données (en) et de test d'hypothèse. Des modèles différents peuvent être comparés via le likelihood ratio.

Liens externes[modifier | modifier le code]