Architecture de données

Un article de Wikipédia, l'encyclopédie libre.
Aller à : navigation, rechercher

Une architecture de données en Informatique est composée de modèles, de règles ou de standards qui désignent quelles données sont collectées et comment elles sont stockées, triées, intégrées et utilisées dans des systèmes de données[1]. En d’autres termes, elle décrit la structure de données utilisée par une organisation et / ou des applications et inclut les descriptions des données stockées. Elle fournit les critères pour les opérations de traitement des différents types de données et contrôle donc celles qui circulent dans le système.

L’architecte de données est chargée de définir la situation future, l'alignement au cours du développement et le suivi nécessaire pour s'assurer que la conception est faite selon les spécifications architecturales d'origine. Il considère ces systèmes de données comme une ressource stratégique de l'organisation, en les représentant indépendamment des processus des différentes unités qui les utilisent. Son principal but est de concevoir des structures de données d'une manière organisée, fournissant ainsi une base pour la construction de systèmes d'information flexibles et intégrés.

Généralités[modifier | modifier le code]

Une architecture de données doit établir des normes de données pour l'ensemble de ses systèmes de données comme une vision ou un modèle d’interactions éventuelles entre ces systèmes. L'intégration des données, par exemple, doit dépendre de normes d'architecture de données. Une architecture de données décrit partiellement les structures entre les données utilisées par une entreprise et celles utilisées par les applications logicielles des différents ordinateurs qu’elle utilise. L’architecture de données permet de créer une cartographie des données, applications et sites d’un entreprise.

Essentielle à la réalisation d’un projet, l'architecture de données décrit comment les données sont traitées, stockées et utilisées dans un système. Elle fournit des critères pour les traitements de données qui permettent de concevoir des flux de données et également de contrôler le flux de données dans le système.

Lors de la conception, l’architecte de données va analyser et séparer chaque élément jusqu’à atteindre le niveau atomique pour ensuite remodeler le système et stocker les données sous la forme désirée.

Approche du Cadre Zachman pour les architectures de données

Couche Vision Données Intéressé
1 Portée / Contexte Liste des choses importantes pour l'entreprise (domaines thématiques) Responsable planification
2 Modèle Business / Conceptuel Modèle sémantique ou Conceptuel / Enterprise Data Modeling (en) Exploitant
3 Modèle Système / Logique Entreprise / Modèle logique de données Concepteur
4 Modèle Technologique / Physique Modèle physique de données Développeur
5 Représentations Détaillées Base de données actuelle Sous-traitant

Dans ce second sens large, l’architecture de données comprend une analyse complète des relations entre les fonctions de l'organisation, les technologies disponibles et les types de données.

L’architecture de données doit être définie lors de la phase de planification d'un nouveau système de stockage. Les principaux types et sources de données nécessaires pour soutenir une entreprise doit être identifié de manière complète, cohérente et compréhensible.

À ce stade de la conception il est important de définir les entités de données pertinentes et non les technologies informatiques qu’il faudra utiliser par la suite. Une entité de données est une chose réelle ou abstraite sur laquelle une organisation ou individu souhaite stocker des données.


Principales architectures de données[modifier | modifier le code]

Architecture fédérée[modifier | modifier le code]

L’objectif de la création d’une base fédérée est de donner aux utilisateurs une vue unique des données présentes sur plusieurs systèmes a priori hétérogènes. Il s’agit d’une problématique typique lors de la concentration ou de la fusion d’entreprises : faire cohabiter les différents systèmes tout en leur permettant d’interopérer d’une manière harmonieuse.

Architecture Ansi/Sparc[modifier | modifier le code]

Le principe de l’Architecture Ansi/Sparc est de séparer en trois niveaux distincts afin de pouvoir différencier facilement l’implémentation physique et la représentation logique des données ainsi que la possibilité de créer des schémas externes qui servent à créer des sous-bases virtuelles.

Architecture distribuée (Architecture Répartie)[modifier | modifier le code]

L’Architecture distribuée est un système gérant une collection de BD logiquement reliées, réparties sur différents sites en fournissant un moyen d ’accès rendant la distribution transparente.

Architecture BD Scalable (BDS)[modifier | modifier le code]

Le principe de cette architecture réside dans le fait de multiplier les sites de traitement des données sur un même réseau. De cette manière en cumulant les ressources (Mémoire, espace disque ...) il est possible de traiter en parallèle une grande quantité d’information.

Référence[modifier | modifier le code]

  1. (en) Business Dictionary - Data Architecture .

Lien externe[modifier | modifier le code]

  • Cours sur les architectures d’intégration de données, par Dan Vodislav.
  • Chapitre sur les architectures de données, Urbanisation, SOA et BPM - 4ème édition par Yves Caseau.
  • Cours général sur les architectures de données d’Odile Papani
  • Cours sur les bases de données réparties et fédérés, par René J. Chevance.

Notes[modifier | modifier le code]

  1. [1]