Aller au contenu

« Réseaux de co-expression de gènes » : différence entre les versions

Un article de Wikipédia, l'encyclopédie libre.
Contenu supprimé Contenu ajouté
JPLeRouzic (discuter | contributions)
Créé en traduisant la page « Gene co-expression network »
(Aucune différence)

Version du 7 janvier 2016 à 14:13

Un réseau de co-expression de gène construit à partir d'un ensemble de données issues d'une micromatrice contenant des profils d'expression génique de 7221 gènes provenant de 18 patients affligés d'un cancer de l'estomac

Un réseau de co-expression de gène (GCN) est un graphe, où chaque nœud correspond à un gène et où une paire de nœuds est reliée par un arc s'il existe une relation significative de co-expression entre eux.[1] Un réseau de co-expression de gène peut être construit, si l'on dispose de suffisament de profils d'expression de gènes, en provenance de plusieurs échantillons ou d'expérimentations, en recherchant des paires de gènes qui ont un modèle d'expression similaire. C'est à dire un modèle d'expression où les niveaux de transcription de deux gènes exprimés conjointement montent et retombent simultanément dans les différents échantillons. Les réseaux de co-expression de gènes (GCN) sont intéressants sur le plan biologique car les gènes exprimés conjointement sont contrôlées par le même programme de régulation transcriptionnel, ou alors ils sont fonctionnellement lié, ou bien encore ce sont des membres du même réseau de régulation génétique.[2]

La direction et le type de la relations de co-expression ne sont pas définis dans les réseaux de co-expression de gènes; au contraire d'un réseau de régulation génique (GRN), où un arc orienté reliant deux gènes représente un processus biochimique comme une réaction, une transformation, une interaction, une activation ou une inhibition.[3] Par rapport à un GRN, un GCN ne permet pas de déduire les relations de causalité entre les gènes et dans un GCN les arcs représentent seulement une corrélation ou la relation de dépendance entre les différents gènes.[4] Les modules ou les sous-graphes fortement interconnectés dans les réseaux de co-expression de gène (GCN) correspondent aux groupes de gènes ayant une fonction similaire ou participant à un processus biologique commun qui provoque de nombreuses interactions entre eux.[3]

La direction des arcs est absente dans les réseaux de la co-expression de gène. Par exemple si trois gènes X, Y et Z s'expriment conjointement, il n'est pas indiqué si X active Y et Y active Z, ou si Y active X et Z, ou si un autre gène les activent tous les trois.

Réseaux de la co-expression de gènes sont généralement construits à l'aide d'ensembles de données générées par l'expression de gènes de haut débit des technologies telles que les biopuces/micromatrices (microarray)ou RNA-Seq.

History

Le concept de réseaux de la co-expression de gènes a été introduit par la Butte et Kohane en 1999 en tant que "relevance networks".[5] Bute et Kohane utilisèrent cette approche plus tard avec la co-expression et à l'aide de données d'expression de gène pour construire le premier réseau de co-expression de gène.[6]

Constructing gene co-expression networks

Pour construire un gène co-expression réseaux il faut suivre une approche en deux étapes : D'abord calculer la montant de la co-expression, puis sélectionner le seuil à partir duquel on considère que cette expression devient significative. 

En premier on sélectionne une mesure de la co-expression et un score de similarité est calculé pour chaque paire de gènes à l'aide de cette valeur. Ensuite, un seuil est déterminé et des paires de gènes qui ont un score de similarité plus élevé que le seuil sélectionné sont considérés comme ayant une co-expression significative  et ils sont reliés par un arc dans le réseau.
La figure décrit les deux étapes générales pour la construction d'un réseau de co-expression de gène : 1) Calculer la valeur de la co-expression (par exemple la valeur absolue du coefficient de corrélation de Pearson) pour chaque paire de gènes et la sélection d'un seuil de signification (p. ex. corrélation > 0,8).

Les données d'entrée pour la construction d'un réseau de co-expression de gène sont souvent représentées par une matrice. Si nous avons les valeurs d'expression génique de m gènes pour n échantillons (conditions), les données d'entrée serait une matrice m × n, appelée matrice de similarité. La matrice résultante, appelée matrice de similarité, représente le graphe du réseau de co-expression de gène. Dans cette matrice, chaque élément indique si les deux gènes sont reliés en réseau (les éléments 1) ou non (les éléments 0).

Pearson's correlation coefficient, Mutual Information, Spearman's rank correlation coefficient and Euclidean distance sont les quatre méthodes les plus fréquemment utilisés pour construire des réseaux de co-expression de gènes. Plusieurs autres mesures, telles que partial correlation,[7] regression,[8] et combinaison de corrélation partielle et échange d'informations[9] ont aussi été utilisé.

See also

  • Weighted correlation network analysis
  • Gene regulatory networks
  • Biological network inference
  • Biological network

References

  1. Joshua M Stuart, Eran Segal, Daphne Koller et Stuart K Kim, « A gene-coexpression network for global discovery of conserved genetic modules », Science, vol. 302, no 5643,‎ , p. 249–55 (PMID 12934013, DOI 10.1126/science.1087447, Bibcode 2003Sci...302..249S)
  2. Matthew T Weirauch, « Gene coexpression networks for the analysis of DNA microarray data », Applied Statistics for Network Biology: Methods in Systems Biology,‎
  3. a et b Swarup Roy, Dhruba K Bhattacharyya et Jugal K Kalita, « Reconstruction of gene co-expression network from microarray data using local expression patterns », BMC Bioinformatics, vol. 15,‎ , S10 (DOI 10.1186/1471-2105-15-s7-s10)
  4. Riet De Smet et Kathleen Marchal, « Advantages and limitations of current network inference methods », Nature Reviews Microbiology, vol. 8, no 10,‎ (DOI 10.1038/nrmicro2419)
  5. Atul J Butte et Isaac S Kohane, « Unsupervised knowledge discovery in medical databases using relevance networks », Proceedings of the AMIA Symposium,‎
  6. Atul J Butte et Isaac S Kohane, « Mutual information relevance networks: functional genomic clustering using pairwise entropy measurements », Pac Symp Biocomput, vol. 5,‎
  7. Nathalie Villa-Vialaneix, Laurence Liaubet, Thibault Laurent, Pierre Cherel, Adrien Gamot et Magali SanCristobal, « The structure of a gene co-expression network reveals biological functions underlying eQTLs », PLOS ONE, vol. 8, no 4,‎ , p. 60045 (DOI 10.1371/journal.pone.0060045, Bibcode 2013PLoSO...860045V)
  8. Staffan Persson, Hairong Wei, Jennifer Milne, Grier P Page et Christopher R Somerville, « Identification of genes required for cellulose synthesis by regression analysis of public microarray data sets », Proceedings of the National Academy of Sciences of the United States of America, vol. 102, no 24,‎ , p. 8633–8 (PMID 15932943, DOI 10.1073/pnas.0503392102, Bibcode 2005PNAS..102.8633P)
  9. Antonio Reverter et Eva KF Chan, « Combining partial correlation and an information theory approach to the reversed engineering of gene co-expression networks », Bioinformatics, vol. 24, no 21,‎ , p. 2491–2497 (DOI 10.1093/bioinformatics/btn482)