Aller au contenu

Données de composition

Un article de Wikipédia, l'encyclopédie libre.

En statistiques, les données de composition, ou données compositionnelles, sont des données relatives décrivant des parties d'un ensemble, sous forme de pourcentage ou de proportions. Mathématiquement, les données compositionnelles appartiennent au simplexe.

Espace des données de composition

[modifier | modifier le code]

En 1982, John Aitchison définit les données compositionnelles comme étant des proportions d'un ensemble[1]. En particulier, une composition peut être représentée par un vecteur à composantes positives, dont la somme vaut le plus souvent 1. L'espace des données de composition est un simplexe:

D est le nombre de parts (ou de composants). Puisque la seule information est le ratio entre les composants, l'information d'une composition est préservée par la multiplication par une constante positive. Ainsi, le simplexe peut toujours être considéré comme étant un simplexe standard, avec .

Références

[modifier | modifier le code]
  1. John Aitchison, « The Statistical Analysis of Compositional Data », Journal of the Royal Statistical Society. Series B (Methodological), vol. 44, no 2,‎ , p. 139–177 (DOI 10.1111/j.2517-6161.1982.tb01195.x)