Binary Alignment Map
Le format cartographie d'alignement binaire, binary alignment map (BAM) est constitué de données brutes complètes sur le séquençage génomique[1] ; il s'agit de la représentation binaire compressée sans perte du format SAM[2],[3]. La compression utilisée est le format BGZF. Les fichiers BAM peuvent être générés directement par les programmes d'alignement ou par SAMtools[4].
Les fichiers BAM possèdent la même structure que les fichiers SAM. Du fait de leur taille réduite, les fichiers BAM sont plus facilement lisibles par les programmes dédiés au séquençage à haut débit. Il existe par exemple des librairies pour lire les fichiers BAM en Python et en R. [5],[6] Les fichiers BAM triés peuvent être indexés au travers d'un fichier BAI accompagnant, qui sert de table des matières au fichier BAM et permet d’accéder directement des parties spécifiques du fichier concerné (par exemple, une coordonnée chromosomique particulière), ce qui accélère grandement l'accès aux données. Certains logiciels comme IGV, DeepTools et pyDNAse requièrent un index pour lire les fichiers BAM.
Voir également
[modifier | modifier le code]- Format FASTQ
- Format SAM
- SAMtools
- Format CRAM
- Liste des formats de fichiers pour la biologie moléculaire
Références
[modifier | modifier le code]- « Carl Zimmer's Game of Genomes, Season 1: Episode 3, BAM Reveals All », STAT (consulté le )
- Li, Heng, « The Sequence Alignment/Map format and SAMtools », Bioinformatics, vol. 25, , p. 2078–9 (PMID 19505943, PMCID 2723002, DOI 10.1093/bioinformatics/btp352, lire en ligne)
- « Binary Alignment Map », National Cancer Institute Wiki (consulté le )
- « Formats de fichiers utilisés dans le NGS »
- (en) « pysam - An interface for reading and writing SAM files »
- « Rsamtools », sur kasperdanielhansen.github.io (consulté le )