SCOP (base de données)

Un article de Wikipédia, l'encyclopédie libre.

SCOP, de l'anglais Structural Classification of Proteins, est une base de données bio-informatique de classification structurelle des domaines protéiques à partir de similitudes entre leur séquence en acides aminés et leur structure tridimensionnelle. Elle a été créée en 1994 au Centre d'ingénierie des protéines (en)[1] (CPE) puis a été maintenue à partir de 2010 par le Laboratoire de biologie moléculaire[2],[3],[4] (LMB), tous deux situés à Cambridge, au Royaume-Uni. Le travail sur SCOP, essentiellement manuel, a été interrompu fin 2013 devant l'accélération exponentielle des publications de nouvelles structures protéiques, et la dernière version disponible est la 1.75, publiée en , qui organisait quelque 38 000 entrées PDB de manière strictement hiérarchique.

En 2012 était mise en ligne la version étendue SCOPe, développée à l'université de Californie à Berkeley, en Californie, qui prolonge SCOP avec un traitement des données automatisé permettant de faire face à l'explosion du volume des données à classer. Entièrement compatible avec SCOP, elle a évolué en 2014 avec la réintroduction de traitements manuels afin de garantir l'exactitude de l'allocation des structures identifiées, et la version SCOPe 2.06 classait 77 439 entrées PDB parmi près 120 000 entrées PDB disponibles en 2016[5].

Le prototype d'une nouvelle classification structurelle des protéines, appelée SCOP2, a été mise en ligne, avec une approche différente, non hiérarchique, reposant au contraire sur un réseau reliant les superfamilles de protéines présentant des parentés structurelles et évolutives telles que des permutations circulaires (en) ou des fusions de domaines (en). Dans ce modèle, les domaines ne sont pas définis par des frontières précises et fixes, mais plutôt par les relations existantes avec d'autres motifs semblables. En , le prototype SCOP2 classait 995 entrées PDB[6].

La classification de SCOP dépend davantage de décisions humaines que la classification semi-automatique de CATH (en), sa principale concurrente. L'expertise humaine intervient pour évaluer dans quelle mesure certaines protéines présentent une relation évolutive et doivent par conséquent être rangées dans la même superfamille, et dans quelle mesure leur similitude résulte de contraintes structurelles, ce qui les fait alors ranger dans la même classe de repliement.

Notes et références[modifier | modifier le code]

  1. (en) Antonina Andreeva, Dave Howorth, John-Marc Chandonia, Steven E. Brenner, Tim J. P. Hubbard, Cyrus Chothia et Alexey G. Murzin, « Data growth and its impact on the SCOP database: new developments », Nucleic Acids Research, vol. 36, no Supplement 1,‎ , D419-D425 (PMID 18000004, PMCID 2238974, DOI 10.1093/nar/gkm993, lire en ligne)
  2. (en) Tim J. P. Hubbard, Bart Ailey, Steven E. Brenner, Alexey G. Murzin et Cyrus Chothia, « SCOP: a Structural Classification of Proteins database », Nucleic Acids Research, vol. 27, no 1,‎ , p. 254-256 (PMID 9847194, PMCID 148149, DOI 10.1093/nar/27.1.254, lire en ligne)
  3. (en) Loredana Lo Conte, Bart Ailey, Tim J. P. Hubbard, Steven E. Brenner, Alexey G. Murzin et Cyrus Chothia, « SCOP: a Structural Classification of Proteins database », Nucleic Acids Research, vol. 28, no 1,‎ , p. 257-259 (PMID 10592240, PMCID 102479, DOI 10.1093/nar/28.1.257, lire en ligne)
  4. (en) Antonina Andreeva, Dave Howorth, Steven E. Brenner, Tim J. P. Hubbard, Cyrus Chothia et Alexey G. Murzin, « SCOP database in 2004: refinements integrate structure and sequence family data », Nucleic Acids Research, vol. 32, no Supplement 1,‎ , D226-D229 (PMID 14681400, PMCID 308773, DOI 10.1093/nar/gkh039, lire en ligne)
  5. (en) « Changes to SCOP(e) design and size », sur SCOPe à Berkeley (consulté le ).
  6. (en) « What is the relationship between SCOP, SCOPe, and SCOP2? », sur SCOPe à Berkeley (consulté le ).

Annexes[modifier | modifier le code]