ChEMBL

Un article de Wikipédia, l'encyclopédie libre.

ChEMBL ou ChEMBLdb est une base de données chimique ouverte organisée manuellement de molécules susceptibles de posséder une activité biologique[1]. Elle est géré par l'Institut européen de bioinformatique (EBI) dépendant du laboratoire européen de biologie moléculaire (EMBL), siau Wellcome Trust Genome Campus, à Hinxton, au Royaume-Uni.

La base de données, initialement connue sous le nom de StARlite, a été développée par la société de biotechnologie Inpharmatica, acquise plus tard par Galapagos NV (en). Les données ont ensuite été acquises par l'EMBL en 2008 grâce à un prix du Wellcome Trust, aboutissant à la création du groupe de chimiogénomique ChEMBL, dirigé par John Overington[2],[3].

Portée et accès[modifier | modifier le code]

La base de données ChEMBL contient des données sur l'activité biologique des composés par rapport aux cibles médicamenteuses. La bioactivité est rapportée en Ki, Kd, IC50 et EC50[4]. Les données peuvent être filtrées et analysées les rendant utilisables comme bibliothèques de criblage de composés. De telles bibliothèques aident à la conception de nouveaux médicaments[5].

La version 2 de ChEMBL (ChEMBL_02) a été lancée en janvier 2010, et comprends 2,4 millions de résultats de tests biologiques couvrant 622 824 composés, dont 24 000 produits naturels. Cette masse de données a été obtenu en exploitant plus de 34 000 publications dans douze revues de chimie médicinale. La base de données d'activité biologique constituée par ChEMBL est si importante qu'elle a été qualifiée « plus complète jamais vue dans une base de données publique »[2]. En octobre 2010, la version 8 de ChEMBL (ChEMBL_08) a été lancée, avec plus de 2,97 millions de résultats de tests biologiques couvrant 636 269 composés.

ChEMBLdb est accessible via une interface Web et peut également être téléchargée par protocole de transfert de fichiers. Elle est formatée de manière à permettre l'exploration de données par ordinateur et tente de normaliser les activités entre les différentes publications, afin de permettre une analyse comparative[1]. ChEMBL est également intégré à d'autres ressources chimiques à grande échelle, notamment PubChem et le système ChemSpider de la Royal Society of Chemistry.

Ressources associées[modifier | modifier le code]

En plus de la base de données, le groupe ChEMBL a développé des outils et des ressources pour l'exploration de données[6]. Ceux-ci incluent Kinase SARfari, un programme de chimiogénomique intégré axé sur les kinases.

Voir aussi[modifier | modifier le code]

Références[modifier | modifier le code]

  1. a et b Gaulton, « ChEMBL: a large-scale bioactivity database for drug discovery », Nucleic Acids Research, vol. 40, no Database issue,‎ , D1100-7 (PMID 21948594, PMCID 3245175, DOI 10.1093/nar/gkr777)
  2. a et b Bender, « Databases: Compound bioactivities go public », Nature Chemical Biology, vol. 6, no 5,‎ , p. 309 (DOI 10.1038/nchembio.354)
  3. Overington J, « ChEMBL. An interview with John Overington, team leader, chemogenomics at the European Bioinformatics Institute Outstation of the European Molecular Biology Laboratory (EMBL-EBI). Interview by Wendy A. Warr », J. Comput.-Aided Mol. Des., vol. 23, no 4,‎ , p. 195–8 (PMID 19194660, DOI 10.1007/s10822-009-9260-9, Bibcode 2009JCAMD..23..195W, S2CID 2946417)
  4. Mok et Brenk, « Mining the ChEMBL Database: An Efficient Chemoinformatics Workflow for Assembling an Ion Channel-Focused Screening Library », J. Chem. Inf. Model., vol. 51, no 10,‎ , p. 2449–2454 (PMID 21978256, PMCID 3200031, DOI 10.1021/ci200260t)
  5. Brenk, Schinpani, James et Krasowski, « Lessons learnt from assembling screening libraries for drug discovery for neglected diseases », ChemMedChem, vol. 3, no 3,‎ , p. 435–44 (PMID 18064617, PMCID 2628535, DOI 10.1002/cmdc.200700139)
  6. Bellis, « Collation and data-mining of literature bioactivity data for drug discovery. », Biochemical Society Transactions (en), vol. 39, no 5,‎ , p. 1365–1370 (PMID 21936816, DOI 10.1042/BST0391365)

Liens externes[modifier | modifier le code]