Site Reliability Engineering

Un article de Wikipédia, l'encyclopédie libre.

L'ingénierie de la fiabilité des sites (ou SRE pour Site Reliability Engineering) est une discipline qui intègre des aspects de l'ingénierie logicielle et les applique aux problèmes d'infrastructure et d'exploitation. Les principaux objectifs sont de créer des systèmes logiciels évolutifs et extrêmement fiables. Selon Ben Treynor, fondateur de la Site Reliability Team de Google, le SRE est « ce qui se passe quand un ingénieur logiciel est chargé de ce qu'on appelle des opérations »[1].

Rôles[modifier | modifier le code]

Un ingénieur de fiabilité de site (SRE) consacrera jusqu'à 50 % de son temps à des tâches liées aux « opérations » telles que les problèmes, les astreintes et les interventions manuelles. Comme on s'attend à ce que le système logiciel supervisé par un SRE soit hautement automatique et autoréparable, le SRE devrait consacrer l'autre moitié de son temps aux tâches de développement comme les nouvelles fonctionnalités, l'évolution ou l'automatisation. Le candidat idéal pour devenir ingénieur en fiabilité de site est soit un ingénieur en logiciel avec une bonne formation en administration, soit un administrateur système hautement qualifié avec des connaissances en codage et en automatisation.

DevOps vs SRE[modifier | modifier le code]

La SRE se distingue du devops par son accent sur la fiabilité.

Articles connexes[modifier | modifier le code]

Notes et références[modifier | modifier le code]

  1. Are SRE the next data scientists?, TechCrunch, Mar 2, 2016, Donald Fischer