Aller au contenu

Nexus (format de fichier)

Un article de Wikipédia, l'encyclopédie libre.
Nexus (format de fichier)
Caractéristiques
Extensions
.nex, .nxs, .nxzVoir et modifier les données sur Wikidata
Type MIME
application/octet-streamVoir et modifier les données sur Wikidata
Signature
20 73 78 4E (hexa)Voir et modifier les données sur Wikidata
Développé par
Istituto di Scienza e Tecnologie dell'Informazione (en), Conseil national de la rechercheVoir et modifier les données sur Wikidata

Le format de fichier extensible NEXUS est largement utilisé en bio-informatique. Ces fichiers stockent des informations concernant les taxons, les caractères morphologiques et moléculaires, les distances, les codes génétiques, les estimations, arbres, etc[1]. Plusieurs programmes phylogénétiques populaires comme PAUP*[2], MrBayes[3], Mesquite[4], MacClade[5] et SplitsTree[6] utilisent ce format. Rajoutons aussi les analyses de délimitation par Poisson Tree Process (arbres produits selon des lois de Poisson)[7].

Suivre ce lien pour un convertisseur de formats d'écriture de distances par paire de bases.

Syntaxe[modifier | modifier le code]

Un fichier NEXUS est constitué d'un en-tête fixe #NEXUS suivi de multiples blocs. Chaque bloc commence par BEGIN block_name; et se finit par END;. Les mots-clés sont insensibles à la casse. Les commentaires sont mis entre crochets [...][8].

Il y a quelques noms de blocs prédéfinis pour les types de data les plus communs. Par exemple[8] :

TAXA block
Le "TAXA block" contient des informations concernant les taxons.
DATA block
Le "DATA block" contient les matrices de data (ex: alignement de séquence).
TREES block
Le "TREES block" contient des arbres phylogénétiques décrits en utilisant le format Newick, e.g. ((A,B),C);:

Les exemples suivants utilisent les trois types de blocs ci-dessus :

#NEXUS
Begin TAXA;
  Dimensions ntax=4;
  TaxLabels SpaceDog SpaceCat SpaceOrc SpaceElf
End;

Begin data;
  Dimensions nchar=15;
  Format datatype=dna missing=? gap=- matchchar=.;
  Matrix
    [ Quand une position est un "matchchar", ça veut dire qu'elle est similaire que la première entrée à la même position. ]
    SpaceDog   atgctagctagctcg
    SpaceCat   ......??...-.a.
    SpaceOrc   ...t.......-.g. [ pareil que atgttagctag-tgg ]
    SpaceElf   ...t.......-.a.           
  ;
End;

BEGIN TREES;
  Tree tree1 = (((SpaceDog,SpaceCat),SpaceOrc,SpaceElf);
END;

Références[modifier | modifier le code]

  1. Maddison DR, Swofford DL, Maddison WP, « NEXUS: An extensible file format for systematic information », Systematic Biology, vol. 46, no 4,‎ , p. 590–621 (PMID 11975335, DOI 10.1093/sysbio/46.4.590)
  2. PAUP* « https://web.archive.org/web/20060903115314/http://paup.csit.fsu.edu/index.html »(Archive.orgWikiwixArchive.isGoogleQue faire ?), — Phylogenetic Analysis Using Parsimony *and other methods
  3. MrBayes
  4. Mesquite: A modular system for evolutionary analysis
  5. MacClade
  6. Huson and Bryant, Application of Phylogenetic Networks in Evolutionary Studies, Mol Biol Evol (2005) 23 (2): 254-267. https://doi.org/10.1093/molbev/msj030
  7. « bPTP server: a Bayesian implementation of the PTP model for species delimitation »
  8. a et b Detailed NEXUS specification

Liens externes[modifier | modifier le code]