Analyse des données
Un article de Wikipédia, l'encyclopédie libre.
|
Vous pouvez partager vos connaissances en l’améliorant (comment ?) selon les recommandations des projets correspondants.
|
L’analyse des données est un sous domaine des statistiques qui se préoccupe de la description de données conjointes. On cherche par ces méthodes à donner les liens pouvant exister entre les différentes données et à en tirer une information statistique qui permet de décrire de façon plus succincte les principales informations contenues dans ces données. On peut également chercher à classer les données en différents sous groupes plus homogènes.
Par exemple l’age, le sexe et la catégorie socioprofessionnelle des joueurs de golf peuvent être étudiés simultanément.
Les principales méthodes de l’analyse des données sont :
- L’analyse en composantes principales (ACP), utilisée pour des données quantitatives.
- L’analyse factorielle discriminante (AFD) ou analyse discriminante qui permet d’identifier des groupes homogènes au sein de la population du point de vue des variables étudiées,
- L'analyse factorielle des correspondances (AFC), utilisée pour des données qualitatives (tableau d’association).
- La classification automatique.
- L’analyse en composantes indépendantes (ACI).
- L'iconographie des corrélations.
Ces méthodes permettent notamment de manipuler et de synthétiser l’information provenant de tableaux de données de grande taille.
Pour cela, il est très important de bien estimer les corrélations entre les variables que l’on étudie. On a alors souvent recours à la matrice des corrélations (ou la matrice de variance-covariance) entre les variables.
Les pères de l’analyse des données sont :
- Jean-Paul Benzécri
- John Tukey (sous le terme de Exploratory Data Analysis, ou EDA)
- Chikio Hayashi (sous le terme de Data Sciences)
[modifier] Références
- (fr) Benzécri J.-P. et al. (1976), L'analyse des données, Paris, Dunod
- (en) The Collected Works of John W. Tukey - (ISBN 0412063212); (ISBN 0534051014)
- (en) Graphical Analysis of Multiresponse Data, by J W Tukey, K E Basford - (ISBN 0849303842)
- (fr) Michel Volle, Analyse des données, Economica, 4e édition, 1997 - (ISBN 2717832122)
- (fr) Jean-Marie Bouroche et Gilbert Saporta, L'analyse des données, P.U.F , 8e édition, 2002 - (ISBN 2 13 052495 8)

