« OrthoDB » : différence entre les versions

Un article de Wikipédia, l'encyclopédie libre.
Contenu supprimé Contenu ajouté
Nouvelle page : {{primary sources|date=August 2011}} {{infobox biodatabase |title = OrthoDB |logo =150px |description =catalogue de orthologues. |scope = |organism =...
(Aucune différence)

Version du 16 mars 2016 à 20:51

Modèle:Primary sources Modèle:Infobox biodatabase

'OrthoDB[1]'[2][3][4] présente un catalogue de gènes codant pour des protéines orthologues à travers les vertébrés, les arthropodes, les fungi, et les bactéries. L'orthologie fait référence au dernier ancêtre commun d'un ensemble d'espèces considérées, et donc OrthoDB definie explicitement les orthologues à chaque point de rayonnement le long de la phylogénie des espèces. La base de données OrthoDB fourni des descripteurs de protéines, ainsi que les attributs GO et InterPro, qui servent à fournir des annotations descriptives générales des groupes orthologues et faciliter l'interrogation de base de données de orthologie. OrthoDB fournit également des traits évolutifs d'orthologues calculés, comme les duplications et les profils de perte, les taux de divergence, et des familles, qui sont maintenant étendus pour inclure les détails d'architecture d'intron-exon, orthologues de synténie, et les arbres parent-enfant.

Méthodologie

L'orthologie est définie par rapport au dernier ancêtre commun des espèces considérées, de manière à déterminer la nature hiérarchique des orthologues. Cela est explicitement abordée dans OrthoDB par l'application de la procédure de retracement d'orthologie à chaque point de rayonnement de la phylogénie, calculée empiriquement sur le super-alignement des orthologues de copie unique à l'aide d'une methode de maximum-likelihood maximum-likelihood. OrthoDB emploie un algorithme de classification de Best-Reciprocal-Hit (BRH) basé sur des comparaisons de séquences de protéines "tous-contre-tous" de Smith-Waterman. Un pré-traitement de gènes sélectionne le transcrit codant une protéine plus long entre le gène et des copies des gènes très similaires . La procédure ameliore les BRHS pour construire progressivement les groupes et nécessite un alignement de séquence global minimum pour éviter une "marche de domaine". Ces groupes de base sont encore élargies pour inclure tous les gènes plus étroitement liés au sein des espèces en-paralogues, et aussi les copies de gènes très similaires précédemment identifiés.

Contenu des données

La base de données contient maintenant plus de 300 espèces eucaryotes et plus de 1000 bactéries [2] [2] provenant de Ensembl, UniProt, NCBI, FlyBase et plusieurs autres bases de données. L'échantillonnage de génomes séquencés eclairci la généalogies de gènes et facilite la creation de hypothèses de la fonction des gènes dans les génomes nouvellement séquencés.

Des exemples d'études qui ont utilisé les données de OrthoDB sont [5][6] comparisons of fruit fly and mosquito developmental genes,[7],[8][9][10] and analysis of the evolution of mammalian milk production.[11] d'autres études citant OrthoDB peut être trouvé à PubMed . PubMed et ici .

Performance

OrthoDB a effectué toujours bien dans l'analyse comparative des évaluations aux côtés d'autres procédures orthologie de délimitation. Les résultats ont été comparés à la référence des arbres pour trois familles de protéines bien conservées,[12]et à un plus grand nombre de familles de protéines .[13]


Notes et références

  1. Erreur de référence : Balise <ref> incorrecte : aucun texte n’a été fourni pour les références nommées pmid25428351
  2. a et b Waterhouse RM, Tegenfeldt F, Li J, Zdobnov EM, Kriventseva EV, « OrthoDB: a hierarchical catalog of animal, fungal and bacterial orthologs », Nucleic Acids Res., vol. 41, no Database issue,‎ , D358-65 (PMID 23180791, PMCID 3531149, DOI 10.1093/nar/gks1116, lire en ligne)
  3. Waterhouse RM, Zdobnov EM, Tegenfeldt F, Li J, Kriventseva EV, « OrthoDB: the hierarchical catalog of eukaryotic orthologs in 2011 », Nucleic Acids Res., vol. 39, no Database issue,‎ , D283–8 (PMID 20972218, PMCID 3013786, DOI 10.1093/nar/gkq930, lire en ligne)
  4. Kriventseva EV, Rahman N, Espinosa O, Zdobnov EM, « OrthoDB: the hierarchical catalog of eukaryotic orthologs », Nucleic Acids Res., vol. 36, no Database issue,‎ , D271-5 (PMID 17947323, PMCID 2238902, DOI 10.1093/nar/gkm845, lire en ligne)
  5. Waterhouse RM, Zdobnov EM, Kriventseva EV, « Correlating traits of gene retention, sequence divergence, duplicability and essentiality in vertebrates, arthropods, and fungi. », Genome Biol Evol., vol. 3,‎ , p. 75–86 (PMID 21148284, PMCID 3030422, DOI 10.1093/gbe/evq083, lire en ligne)
  6. Hase T, Niimura Y, Tanaka H., « Difference in gene duplicability may explain the difference in overall structure of protein-protein interaction networks among eukaryotes. », BMC Evol Biol., vol. 10,‎ (PMID 21087510, PMCID 2994879, DOI 10.1186/1471-2148-10-358)
  7. Behura SK, Haugen M, Flannery E, Sarro J, Tessier CR, Severson DW, Duman-Scheel M., « Comparative Genomic Analysis of Drosophila melanogaster and Vector Mosquito Developmental Genes. », PLoS ONE, vol. 6,‎ (PMID 21754989, PMCID 3130749, DOI 10.1371/journal.pone.0021504)
  8. Bonizzoni M, Dunn WA, Campbell CL, Olson KE, Dimon MT, Marinotti O, James AA., « RNA-seq analyses of blood-induced changes in gene expression in the mosquito vector species, Aedes aegypti. », BMC Genomics, vol. 12,‎ (PMID 21276245, PMCID 3042412, DOI 10.1186/1471-2164-12-82)
  9. Pinto SB, Lombardo F, Koutsos AC, Waterhouse RM, McKay K, An C, Ramakrishnan C, Kafatos FC, Michel K., « Discovery of Plasmodium modulators by genome-wide analysis of circulating hemocytes in Anopheles gambiae. », Proc Natl Acad Sci U S A., vol. 106,‎ (PMID 19940242, PMCID 2783009, DOI 10.1073/pnas.0909463106)
  10. Bartholomay LC, Waterhouse RM, Mayhew GF, Campbell CL, Michel K, Zou Z, Ramirez JL, Das S, Alvarez K, Arensburger P, Bryant B, Chapman SB, Dong Y, Erickson SM, Karunaratne SH, Kokoza V, Kodira CD, Pignatelli P, Shin SW, Vanlandingham DL, Atkinson PW, Birren B, Christophides GK, Clem RJ, Hemingway J, Higgs S, Megy K, Ranson H, Zdobnov EM, Raikhel AS, Christensen BM, Dimopoulos G, Muskavitch MA., « Pathogenomics of Culex quinquefasciatus and meta-analysis of infection responses to diverse pathogens. », Science, vol. 330,‎ (PMID 20929811, PMCID 3104938, DOI 10.1126/science.1193162)
  11. Lemay DG, Lynn DJ, Martin WF, Neville MC, Casey TM, Rincon G, Kriventseva EV, Barris WC, Hinrichs AS, Molenaar AJ, Pollard KS, Maqbool NJ, Singh K, Murney R, Zdobnov EM, Tellam RL, Medrano JF, German JB, Rijnkels M., « The bovine lactation genome: insights into the evolution of mammalian milk. », Genome Biol., vol. 10,‎ (PMID 19393040, PMCID 2688934, DOI 10.1186/gb-2009-10-4-r43)
  12. Boeckmann B, Robinson-Rechavi M, Xenarios I, Dessimoz C., « Conceptual framework and pilot study to benchmark phylogenomic databases based on reference gene trees. », Brief Bioinform., vol. 12, no 5,‎ , p. 423–35 (PMID 21737420, PMCID 3178055, DOI 10.1093/bib/bbr034, lire en ligne)
  13. http://eggnog.embl.de/orthobench OrthoBench]
    Trachana K, Larsson TA, Powell S, Chen WH, Doerks T, Muller J, Bork P., « Orthology prediction methods: a quality assessment using curated protein families. », Bioessays., vol. 33, no 10,‎ , p. 769–80 (PMID 21853451, PMCID 3193375, DOI 10.1002/bies.201100062, lire en ligne)

See also

External links