Nexus (format de fichier)

Un article de Wikipédia, l'encyclopédie libre.
Nexus (format de fichier)
Caractéristiques
Extensions
.nex, .nxs, .nxzVoir et modifier les données sur Wikidata
Type MIME
application/octet-streamVoir et modifier les données sur Wikidata
Signature
20 73 78 4E (hexa)Voir et modifier les données sur Wikidata
Développé par
Istituto di Scienza e Tecnologie dell'Informazione (en), Conseil national de la rechercheVoir et modifier les données sur Wikidata

Le format de fichier extensible NEXUS est largement utilisé en bio-informatique. Ces fichiers stockent des informations concernant les taxons, les caractères morphologiques et moléculaires, les distances, les codes génétiques, les estimations, arbres, etc[1]. Plusieurs programmes phylogénétiques populaires comme PAUP*[2], MrBayes[3], Mesquite[4], MacClade[5] et SplitsTree[6] utilisent ce format. Rajoutons aussi les analyses de délimitation par Poisson Tree Process (arbres produits selon des lois de Poisson)[7].

Suivre ce lien pour un convertisseur de formats d'écriture de distances par paire de bases.

Syntaxe[modifier | modifier le code]

Un fichier NEXUS est constitué d'un en-tête fixe #NEXUS suivi de multiples blocs. Chaque bloc commence par BEGIN block_name; et se finit par END;. Les mots-clés sont insensibles à la casse. Les commentaires sont mis entre crochets [...][8].

Il y a quelques noms de blocs prédéfinis pour les types de data les plus communs. Par exemple[8] :

TAXA block
Le "TAXA block" contient des informations concernant les taxons.
DATA block
Le "DATA block" contient les matrices de data (ex: alignement de séquence).
TREES block
Le "TREES block" contient des arbres phylogénétiques décrits en utilisant le format Newick, e.g. ((A,B),C);:

Les exemples suivants utilisent les trois types de blocs ci-dessus :

#NEXUS
Begin TAXA;
  Dimensions ntax=4;
  TaxLabels SpaceDog SpaceCat SpaceOrc SpaceElf
End;

Begin data;
  Dimensions nchar=15;
  Format datatype=dna missing=? gap=- matchchar=.;
  Matrix
    [ Quand une position est un "matchchar", ça veut dire qu'elle est similaire que la première entrée à la même position. ]
    SpaceDog   atgctagctagctcg
    SpaceCat   ......??...-.a.
    SpaceOrc   ...t.......-.g. [ pareil que atgttagctag-tgg ]
    SpaceElf   ...t.......-.a.           
  ;
End;

BEGIN TREES;
  Tree tree1 = (((SpaceDog,SpaceCat),SpaceOrc,SpaceElf);
END;

Références[modifier | modifier le code]

  1. Maddison DR, Swofford DL, Maddison WP, « NEXUS: An extensible file format for systematic information », Systematic Biology, vol. 46, no 4,‎ , p. 590–621 (PMID 11975335, DOI 10.1093/sysbio/46.4.590)
  2. PAUP* « https://web.archive.org/web/20060903115314/http://paup.csit.fsu.edu/index.html »(Archive.orgWikiwixArchive.isGoogleQue faire ?), — Phylogenetic Analysis Using Parsimony *and other methods
  3. MrBayes
  4. Mesquite: A modular system for evolutionary analysis
  5. MacClade
  6. Huson and Bryant, Application of Phylogenetic Networks in Evolutionary Studies, Mol Biol Evol (2005) 23 (2): 254-267. https://doi.org/10.1093/molbev/msj030
  7. « bPTP server: a Bayesian implementation of the PTP model for species delimitation »
  8. a et b Detailed NEXUS specification

Liens externes[modifier | modifier le code]