Étoile (modèle de données)

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher
Page d'aide sur l'homonymie Pour les articles homonymes, voir étoile (homonymie).

Dans les datawarehouse ou datamart, le modèle de données « en étoile » est typique des structures multidimensionnelles stockant des données atomiques ou agrégées.

Le modèle en étoile est souvent considéré (à tort) comme un modèle dénormalisé, ce qui permet une économie de jointures à l'interrogation. Il est ainsi optimisé pour les requêtes d'analyse.

Le modèle en étoile est implémenté sur un SGBD relationnel classique, tel Oracle,IBM DB2, SQL Server ou encore Teradata).

La table située au centre de l'étoile est la table des faits ou mesures (ou encore métriques) : ce sont les éléments mesurés dans l'analyse comme les montants, les quantités, les taux, etc.

Les tables situées aux extrémités de l'étoile sont les tables de dimensions (ou encore axes d'analyse) ou niveaux de suivi. Ce sont les dimensions explorées dans l'analyse comme par exemple le temps (jour, mois, période, etc.), la nomenclature des produits (référence, famille, etc.), la segmentation clientèle (tranche d'âge, marché, etc.), etc.

Le principe d'optimisation de ce modèle en étoile est le suivant : une clé calculée "technique" (clé générique) sert de jointure relationnelle entre les tables de dimensions et la table des faits. La requête SQL réalise d'abord sa sélection sur les tables de dimensions (peu volumineuses) et ensuite seulement, à partir des clés ainsi sélectionnées, la jointure avec la volumineuse table des faits.

Le modèle de données dit « en flocon » est une variante du modèle en étoile : chaque table de dimension est re-normalisée pour faire apparaître la hiérarchie sous-jacente (nomenclature, etc.). La normalisation n'est pas indispensable car ni mises à jour ni suppressions ne sont effectuées directement sur l'entrepôt de données. L'intérêt principal du modèle en flocon réside dans le gain en espace de stockage qui est de l'ordre de 5 à 10 %.

Un ensemble d'étoiles ou de flocons dans lequel les tables de faits se partagent certaines tables de dimensions forme un modèle « en constellation ».