Centre de traitement de données

Un article de Wikipédia, l'encyclopédie libre.
Aller à : Navigation, rechercher
Centre de traitement de données

Un centre de traitement de données (data center en anglais) est un site physique sur lequel se trouvent regroupés des équipements constituants du système d’information de l’entreprise (mainframes, serveurs, baies de stockage, équipements réseaux et de télécommunications, etc.). Il peut être interne et/ou externe à l’entreprise, exploité ou non avec le soutien de prestataires[1]. C'est un service généralement utilisé pour remplir une mission critique relative à l'informatique et à la télématique. Il comprend en général un contrôle sur l'environnement (climatisation, système de prévention contre l'incendie, etc.), une alimentation d'urgence et redondante, ainsi qu'une sécurité physique élevée.

Sommaire

Description [modifier]

Tablettes d'équipement de télécommunications

Un centre de traitement des données se présente comme un lieu où se trouvent différents équipements électroniques, des ordinateurs, des systèmes de stockage et des équipements de télécommunications. Comme son nom l'indique, il sert surtout à traiter les informations nécessaires aux activités d'une entreprise. Par exemple, une banque peut recourir à un tel centre, lui confiant les informations relatives à ses clients, tout en traitant les transactions de ceux-ci. En pratique, presque toutes les entreprises de taille moyenne utilisent un tel centre. Quant aux grandes entreprises, elles en utilisent souvent plusieurs.

Les bases de données étant souvent cruciales au fonctionnement des entreprises, celles-ci sont très sensibles à leur protection. Pour cette raison, ces centres maintiennent de hauts niveaux de sécurité et de service dans le but d'assurer l'intégrité et le fonctionnement des appareils sur place.

Avant la bulle Internet, des millions de mètres carrés destinés à abriter de tels centres furent construits dans l'espoir de les voir occupés par des serveurs. Depuis, la concentration des centres s'est poursuivie, avec le développement de centres spécialisés pour lesquels les défis les plus importants sont la maîtrise de la climatisation et surtout de la consommation électrique. Ce mouvement a été intégré dans le green computing et vise à aboutir à des centres de traitement de données dits écologiques pour lesquels sont apparus des outils spécialisés[2].

Composantes [modifier]

Physique [modifier]

  • Climatisation précise et stable
  • Contrôle précis de la poussière environnante
  • Unité de distribution de l'énergie
  • Bloc d'alimentation d'urgence, ainsi qu'une unité de secours
  • Système perfectionné d'alerte d'incendie
  • Extinction automatique des incendies par micro-gouttelettes ou gaz inerte
  • Plancher surélevé
  • Conduites pour câbles au-dessous et au-dessus du plancher
  • Surveillance par caméras en circuit fermé
  • Contrôle des accès, ainsi que sécurité physique
  • Surveillance 24/7 des serveurs dédiés (ordinateurs)
  • Gardes de sécurité continuellement présents
  • Câbles de paires torsadées de cuivre en Ethernet (Fast ou Gigabit) pour liaisons inter-[jarretières/switches/routeurs/firewall]
  • Fibres optiques pour liaisons inter-sites ou inter-[jarretières/switches/routeurs/firewall]

Réseau [modifier]

Applications [modifier]

Les missions principales du centre sont d'offrir une bonne connexion réseau (internet, intranet, etc.) et une haute disponibilité du système d'information. En conséquence, il est possible de déployer différentes applications logicielles pour les tâches essentielles à l'activité métier des clients. Parmi ces applications, on retrouve des gestionnaires de bases de données, des serveurs de fichiers et des serveurs d'applications.

Aménagements physiques [modifier]

Salle de calcul du CERN.
Principe du refroidissement de racks

Un centre de traitement de données peut occuper une pièce, un étage ou un immeuble en entier. On y retrouve des serveurs 1U (surnommés « boîtes à pizza ») ou plus, « U » correspondant à une unité de hauteur de 4,445 cm (soit 1,75 pouce) empilés dans des racks, lesquels sont arrangés pour former des rangées simples, ce qui permet de circuler facilement parmi les serveurs, tant à l'avant qu'à l'arrière. Quelques appareils, ordinateurs centraux par exemple, sont de dimensions semblables à ces racks. Ils sont souvent placés à leurs côtés.

L'environnement physique des centres est sous stricte surveillance :

  • Climatisation pour maintenir la pièce fraîche en tout temps, à environ 20 degrés Celsius. Ce maintien est essentiel, puisque les appareils électroniques génèrent beaucoup de chaleur et deviennent défectueux lorsque la température s'élève au-delà d'une certaine limite[3].
    • Les allées sont alternées entre allée froide (avant des serveurs) et allée chaude (arrière des serveurs) afin d'éviter que l'air chaud ne s'accumule au fond de la pièce et nécessite encore plus de climatisation. Les allées chaudes peuvent alors être ciblées plus efficacement pour extraire la chaleur[4].
    • Dernièrement, les corridors froids sont apparus dans les centres de données performants en énergie. Ils consistent en un couloir hermétiquement fermé où circule de l'air froid dans les serveurs (parfois l'espace entre les machines est même obstrué par des caches pour obliger l'air frais à emprunter leur intérieur). Abaisser la température de l'ensemble permet d'avoir une plus grande densité de serveurs[5].
    • Le free cooling (refroidissement à air) permet de limiter le recours à des refroidisseurs et ainsi de réduire la facture énergétique[6]. Le free cooling n'est intéressant que dans les implantations où l'air extérieur est froid suffisamment longtemps durant l'année.
    • La climatisation peut être complétée par un refroidissement à eau, qui est 4000 fois plus efficace que l'air pour conduire la chaleur[7].
  • L'alimentation de secours peut être fournie via un UPS et un générateur électrique ou via un groupe tournant (no-break) couplé à un accumulateur cinétique.
  • Dans le but de prévenir une perte d'alimentation électrique, toutes les composantes électriques, y compris les systèmes de secours, sont habituellement doublées. Les serveurs dits essentiels sont de plus alimentés par un système qui fait appel à deux sources électriques indépendantes à l'intérieur du centre.
  • Les centres ont habituellement un plancher surélevé de 60 cm, fait de dalles amovibles. Cet espace permet la libre circulation de l'air, tout comme il facilite le câblage d'alimentation et de données par des chemins de câble différents. Cependant, des datacenters sont sans plancher technique (alimentation par le dessus des racks, afin de supporter plus facilement des éléments lourds de type mainframe (IBM z10, etc.).
Bouteille d'extinction FM-200 dans un centre de calcul
  • Ils ont souvent des systèmes complexes de prévention et d'extinction des incendies. Les centres modernes sont souvent équipés de deux systèmes d'alarme. Le premier détecte les particules chaudes émises par les composantes surchauffées de l'équipement, particules qui provoquent souvent un feu. De cette façon, il est possible d'éliminer à sa source un foyer d'incendie (parfois, il suffit d'éteindre un ensemble à soudure pour éliminer le risque d'incendie). Un deuxième système sert à activer un ensemble d'activités si un début d'incendie se manifeste. Ces systèmes sont également dédiés à une portion du centre de traitement de données. Couplés à d'excellentes portes anti-feu et autres appareils de confinement, il est possible de contrôler le feu et de l'éteindre sans affecter le reste du bâtiment.
  • Les systèmes conventionnels d'extinction du feu sont aussi nocifs que le feu pour les composants électroniques, c'est pourquoi des procédés alternatifs ont été développés. Certains utilisent l'azote, l'argonite, le FM-200 ou le Novec(tm)1230 FK-5-1-12, alors que d'autres se rabattent sur l'émission de fines particules d'eau ultra-pure (cette eau n'est pas électriquement conductrice, ce qui n'endommage pas les composants électroniques).
  • La sécurité est aussi essentielle au fonctionnement de tels centres. L'accès physique à ces centres est restreinte au personnel autorisé, tout comme des caméras vidéo permettent de suivre les personnes sur place. Également, des gardes de sécurité veillent si le centre est grand ou contient des informations considérées comme essentielles.

L'exploitation des serveurs d'un centre de données génère un coproduit : la chaleur, qui est dissipée par les serveurs. Indésirable ici, elle est en revanche désirable et valorisable dans d'autres domaines: chauffage des logements[8], des bureaux ou même d'arboretum[6].

L’ingénierie thermique des Data centers [modifier]

En 2012, dans un data center, les onduleurs et la climatisation comptent pour environ 50 % de l'énergie consommée par le data center. Les serveurs modernes (2012) peuvent supporter jusqu'à 45 °C (à ne jamais dépasser), mais demandent une température de 20-35 °C). Or, malgré les progrès faits sur les composants (plus efficients), les serveurs tendent à être de plus en plus compacts et denses (par surface). L'efficience énergétique du serveur et du data center sont en cours d'amélioration (optimisation (de la conception à l'utilisation), adaptation du besoin à la puissance du serveur, free-cooling par eau ou air). La climatisation est souvent surdimensionnée mais néanmoins en partie inefficace, en raison d'une homogénéisation thermique du volume d'air, due à une mauvaise disposition des matériels dans les salles de data centers. De nouveaux serveurs plus tolérants à la chaleur peuvent supporter de petits « pics » de chaleur et permettent de limiter ce surdimensionnement, si les équipements sont judicieusement placés. C'est le rôle (métier) de l'"urbaniste de data center" de mieux concevoir (ou réaménager) les salles pour pouvoir gérer et optimiser la puissance informatique en situation confinée (via des allées froides cloisonnées ou allées chaudes cloisonnées ou confinées par exemple ; les allées chaudes sont celles qui sont en arrière des serveurs, et les allées froides sont celles qui sont devant). Idéalement, les rangées de serveurs ne doivent pas dépasser 20 °C ou un peu plus pour les matériels récents. Cet urbanisme s'appuie sur la simulation aérolique, pour améliorer la gestion (avec éventuelle récupération/valorisation) de la chaleur dégagée par les serveurs, et pour aménager l'intérieur du data center, avec le meilleur positionnement des serveurs dans de bonnes conditions de poids, de densité, d'aération, de longueur de câbles. Cette activité est située au croisement entre les règles de l'informatique et celles de la connexion électrique et du thermicien, tout en devant faciliter la maintenance.

Une bonne "urbanisation" peut fortement améliorer l'efficience énergétique du data center. De la fin des années 2000 à 2012, on est passé de 10 à 50 % de "serveurs virtuels" ; ces derniers peuvent aussi contribuer à optimiser la gestion des flux d'énergie[9].

Réseau [modifier]

Les communications à l'intérieur d'un centre se font maintenant presque exclusivement par protocole Internet. Il contient donc des routeurs, des commutateurs et tout autre équipement qui permet d'assurer la communication entre les serveurs et le monde extérieur. La redondance est parfois obtenue en faisant usage de multiples équipements réseau de marques différentes.

Quelques serveurs servent à fournir aux utilisateurs de la société les services Internet et Intranet de base dont ils ont besoin : courriel, proxy, DNS, fichiers, etc.

Des équipements de sécurité réseau y sont aussi présents : pare-feu, VPN, systèmes de détection d'intrusion, etc. ainsi que des systèmes de monitoring du réseau et de certaines applications.

Applications [modifier]

Le but principal d'un centre de traitement de données est d'exécuter des applications qui traitent des données essentielles au fonctionnement d'une société. Ces applications peuvent être conçues et développées en interne par l'entreprise cliente ou par un fournisseur de progiciel de gestion d'entreprise. Il peut s'agir typiquement de ERP et CRM.

Souvent, ces applications sont réparties dans plusieurs ordinateurs, chacun exécutant une partie de la tâche. Les composantes les plus habituelles sont des systèmes de gestion de base de données, des serveurs de fichiers, des serveurs d'applications, des middleware.

Localisation des centres de traitement de données [modifier]

Centre de traitement de Google de The Dalles en Oregon.

En 2011, on dénombre 2 087 centres de traitement de données dans le monde. Le Groupement des industries de l’équipement électrique, du contrôle-commande et des services associés (Gimélec) estime à 130 le nombre de centres de traitement de données d'offreurs en France dont 40 % en région parisienne. Globalement les centres de traitement sont dispersés sur l'ensemble du territoire avec des zones de concentration en partie liées au réseau urbain sur les départements de Paris, d'Ile de France (essentiellement Hauts de Seine, Seine Saint Denis), le Nord et les Bouches du Rhône. L'ouest et la région Rhône-Alpes sont également des zones privilégiées [10].

Les services informatiques des grandes entreprises sont généralement implantés dans des centres de traitement de données, dédiés ou mutualisés. Les plus gros centres dans le monde sont ceux des géants de l'internet comme Google, qui utilise des infrastructures modulaires basées sur des conteneurs qui peuvent héberger jusqu'à 1 160 serveurs[11] (voir Plateforme Google), ou Facebook qui a étendu son centre de traitement de Prineville dans l'Oregon[12]. Amazon a lui aussi implanté son centre de traitement dans l'Oregon compte-tenu du faible coût de l'énergie dans cet état[13]. Des sociétés comme Microsoft ou Apple investissent des sommes considérables dans ces infrastructures[14] ainsi que Twitter[15]. Les enjeux principaux des centres de traitement concernent l'efficacité énergétique.

Caractéristiques des serveurs dans les centres de données [modifier]

De plus en plus de serveurs dans les centres de données sont virtualisés. En France, un tiers des serveurs hébergés dans des datacenters serait virtualisé et un cinquième à haute densité en 2011. Ces taux devraient doubler d’ici 2013[16].

Enjeux et impacts environnementaux [modifier]

Malgré des progrès importants en matière d'adaptation des réseaux[17] et d'efficacité énergétique des matériels informatiques[18], en raison de l'explosion des besoins, les gros centres de traitement de données sont des systèmes physiques et cybernétiques (Cyber-Physical System[19],[20]) qui peuvent consommer des quantités très importantes d'électricité[21] ; Selon un rapport Votre cloud est-il Net? (avril 2012), « Certains centres de traitement des données consomment autant d’électricité que 250 000 foyers européens. Si le « cloud » était un pays, il se classerait (en 2012) au 5e rang mondial en termes de demande en électricité, et ses besoins devraient être multipliés par trois d’ici à 2020. »[22].

Les centres de traitement de données émettent de la chaleur et doivent être réfrigérés ou tempérés. Leur empreinte écologique est de plus en plus importante[23] (et pourrait être réduite de 25 % environ en 2010 par une optimisation et un partage des ressources). Depuis peu, dans quelques expériences, les joules récupérées sont utilisées pour des besoins énergétiques locaux ou de proximité (chauffage, chauffage urbain, réseau de chaleur). Sinon, les joules sont gaspillées et rejetées dans l'environnement et contribuent a aggraver les effets du changement climatique en élevant la température de l'air, ou des eaux qui reçoivent les eaux de refroidissement.

Les prospectivistes estiment que le volume des données numériques transportées par le Net pourrait être multiplié par 40[24] à 50 d’ici à 2020[22], « Akamai, responsable de la gestion d’un gros volume de trafic sur le Net, est la première entreprise du secteur à avoir pris l’initiative de mesurer son intensité carbone au moyen de l’«indicateur d'efficacité de l'utilisation carbone » (Carbon Utilization Effectiveness). Les autres entreprises n’ont pas mis à profit cet indicateur »[22].

Au début du XXIe siècle, certains grands groupes de l'informatique utilisent le pétrole ou le charbon[22] et d'autres investissent dans les énergies renouvelables (éolien notamment) pour se fournir en électricité verte. L'un (AMD) envisage de décentraliser ses centres de traitement de données en un réseau distribué tel que proposé par[20] d'unités (petits centres de traitement de données bénéficiant chacun d'une éolienne, maillés entre eux par des fibres optiques[25],[26]).

Les installateurs et propriétaires de centres de traitement de données et les producteurs d'énergie[27]) pourraient à l'avenir associer leurs investissements dans un smart grid, éventuellement intégré dans l'« Internet de l'énergie » que Jeremy Rifkin propose dans son concept de « troisième révolution industrielle ».

Le cloud computing pourrait alors évoluer vers un modèle totalement décentralisé, nécessitant une « gestion dynamique du refroidissement »[28],[29] (refroidir là où il faut et quand il faut, et passivement tant que possible[29]), ainsi qu'une conception différente de la sécurité des serveurs et de leurs donnée, de la gestion distribuée des données, de la gestion de l'énergie[30] et de la capacité des réseaux de centres de traitement de données à s'autoadapter aux fluctuations des besoins, mais aussi de l'énergie disponible[31]. Leurs réponses doivent être plus élastiques[32], sans augmentation globale des consommations d'énergie, dans le cadre d'un green cloud[33] qui reste à inventer.

Dès le début des années 2000, une autre solution a été envisagée, complémentaire des précédentes (qui pourraient être réservée aux données devant être plus sécurisées). C'est de développer des réseaux de serveurs en grande partie virtuel (ou plus précisément partagés et distribués, utilisant une partie des ressources des ordinateurs familiaux et d'entreprises ou les utilisant quand leur propriétaire ne les utilisent pas ou les sous-utilisent[34], ce qui demande aussi de repenser la sécurité informatique). Pour cela, des systèmes d'allocation sécurisée des ressources et de répartition des tâches (éventuellement différées quand elles ne sont pas urgentes) doivent encore être testés et validés à grande échelle. Dans tous les cas la recherche et développement est à développer[35].

Notes et références [modifier]

  1. Source : club « France for Datacenters », Livre Blanc « Datacenters, une chance pour la France »
  2. Climatisation et serveurs : vers des salles informatiques plus vertes, Thierry Lévy-Abégnoli, ZDNet France, le 5 décembre 2007
  3. Les progrès des équipements informatiques, Christophe Auffray, ZDNet France, le 14 janvier 2010
  4. Des couloirs chauds et froids, Christophe Auffray, ZDNet France, le 14 janvier 2010
  5. Des corridors froids pour accroître le rendement énergétique, Christophe Auffray, ZDNet France, le 14 janvier 2010
  6. a et b Le free-cooling fait des émules, Fred Bordage, le 17 février 2010
  7. Le chiffre : 4000 fois plus efficace, Frédéric Bordage, 13 août 2008
  8. Les habitants de Helsinki sont chauffés par un datacenter !, Frédéric Bordage, le 24 décembre 2009
  9. Baptiste Roux, Dit Riche, Data centers nouveaux ou existants : l’importance de l’urbanisation Green-IT ; Cleantech Republic ; 11.06.2012
  10. Source : MARKESS International, Cartographie des datacenters en France à l’ère du cloud computing
  11. (en) http://www.datacenterknowledge.com/archives/2009/04/02/inside-a-google-data-center/
  12. (en) http://www.datacenterknowledge.com/archives/category/facebook/
  13. (en) http://www.datacenterknowledge.com/archives/2008/11/07/amazon-building-large-data-center-in-oregon/
  14. http://gridatacenter.org/apple-construit-un-des-plus-gros-datacenter-au-monde/
  15. http://www.lemondeinformatique.fr/actualites/lire-twitter-va-se-doter-de-son-propre-datacenter-31260.html
  16. Source : Etude de MARKESS International, Datacenters & Clouds Privés d’Entreprise, Approches – Perspectives 2013
  17. S. Nedevschi, L. Popa1, G. Iannaccone, S. Ratnasamy, D. Wetherall, « Reducing Network Energy Consumption via Sleeping and Rate- Adaptation », in Proceedings of the 5th USENIX Symposium on Networked Systems Design & Implementations (NSDI’08), San Francisco, CA, April 2008.
  18. M. Elnozahy, M. Kistler, R. Rajamony, « Energy-Efficient Server Clusters », Power-Aware Computer Systems, 2003, pp. 179-197.
  19. National Science Foundation. Cyber-physical systems. Technical report, NSF Workshop on Cyber-Physical Systems, 2006. http://varma.ece.cmu.edu/cps/.
  20. a et b L Rao, X Liu, Le Xie, Wenyu Liu, Minimizing electricity cost: Optimization of distributed internet data centers in a multi-electricity-market environment ; INFOCOM, 2010 Proceedings ; 2010 PDF, 9 pages
  21. G. Chen, W. He, J. Liu, S. Nath, L. Rigas, L. Xiao, F. Zhao. « Energy- Aware Server Provisioning and Load Dispatching for Connection- Intensive Internet Services », in Proceedgins of the 5th USENIX Symposium on Networked Systems Design & Implementation (NSDI’08), San Francisco, CA, April 2008.
  22. a, b, c et d résumé en français, et rapport en anglais
  23. Saurabh Kumar Garg, Chee Shin Yeo, Arun Anandasivam, Rajkumar Buyya, Environment-conscious scheduling of HPC applications on distributed Cloud-oriented datacenters  ; Journal of Parallel and Distributed Computing Volume 71, Issue 6, June 2011, Pages 732–749 Special Issue on Cloud Computing, PDF
  24. Rich Miller, ‘Digital Universe’ Nears A Zettabyte ; Datacenter Knowledge ; 2010-05-04
  25. « Installer une fibre optique coûte entre 5 000 euros et 15 000 euros par kilomètre, contre 475 000 euros pour une ligne électrique », Source : Steve Kester cité par Frédéric Bordage, in AMD veut mixer éolienne et data center ; Green It, 2012-01-27, consulté 2012-04-20
  26. Frédéric Bordage, AMD veut mixer éolienne et data center ; Green It, 2012-01-27, consulté 2012-04-20
  27. L. Parolini, B. Sinopoli, and B. Krogh, Reducing Data Center Energy Consumption via Coordinated Cooling and Load Management, Hot- Power ’08: Workshop on Power Aware Computing and Systems, ACM, 2008
  28. Cullen E. Bash, Chandrakant D. Patel, Ratnesh K. Sharma, Dynamic thermal management of air cooled data centers ; IEEE, 2006
  29. a et b Chandrakant D. Patel, Cullen E. Bash, Ratnesh Sharma, Smart Cooling of Data Centers pp. 129-137 ; ASME 2003 International Electronic Packaging Technical Conference and Exhibition (InterPACK2003) ; July 6–11, 2003 , Maui, Hawaii, Volume 2 ISBN: 0-7918-3690-8
  30. R. Raghavendra, P. Ranganathan, V. Talwar, Z. Wang, and X. Zhu, No power struggles: coordinated multi-level power management for the data center, in ASPLOS XIII: Proceedings of the 13th international conference on Architectural support for programming languages and operating systems. New York, NY, USA: ACM, 2008, pp. 48C59.
  31. J. Heo, D. Henriksson, X. Liu, T. Abdelzaher, « Integrating Adaptive Components: An Emerging Challenge in Performance-Adaptive Systems and a Server Farm Case-Study », in Proceedings of the 28th IEEE Real- Time Systems Symposium (RTSS’07), Tucson, Arizona, 2007
  32. J. Liu, F. Zhao, X. Liu, W. He, « Challenges Towards Elastic Power Management in Internet Data Centers », icdcsw, pp.65-72, 2009 29th IEEE International Conference on Distributed Computing Systems Workshops, 2009
  33. L. Liu, H. Wang, X. Liu, X. Jin, W.B. He, Q.B. Wang, and Y. Chen, « GreenCloud: a new architecture for green data center », Proceedings of the 6th international conference industry session on Autonomic computing and communications industry session, Barcelona, Spain: ACM, 2009, pp. 29-38.
  34. Graupner, S., Kotov, V. ; Trinks, H., Resource-sharing and service deployment in virtual data centers (Conference Publications) IEE, Systems Workshops, 2002-07-11; ISBN: 0-7695-1588-6
  35. Cullen E. Bash, Chandrakant D. Patel & Ratnesh K. Sharmaa, Efficient Thermal Management of Data Centers—Immediate and Long-Term Research Needs Efficient Thermal Management of Data Centers—Immediate and Long-Term Research Needs ; Volume 9, Issue 2, 2003 DOI:10.1080/10789669.2003.10391061, pages 137-152 ([1])

Liens externes [modifier]

Sur les autres projets Wikimedia :