BAM formátumból CRAM

Szerző: Herczeg Róbert - 2023-10-04 08:49:49

#bam #cram

CRAM (Compressed Reference-oriented Alignment Map) fájlt egyszerűen lehet létre hozni BAM fájlból a Samtools segítségével. A CRAM fájl létrehozásához szükség van a referencia szekvenciára (genome-ra) is. A CRAM formátum-specifikációt a Global Alliance for Genomics and Health (GA4GH) szervezet tartja karban, a hozzá kapcsolodó dokumentum pedig az EBI cram toolkit oldalán érhető el.

BAM formátumból az alábbi samtools paranccsal lehet CRAM formátummá alakítani.

samtools view -@ 4 -T reference.fasta -C -o test.cram test.bam

Számos bioinformatikai program még nem kezeli a CRAM formátumot, de bármikor vissza lehet alakítani BAM formátummá.

samtools view -@ 4 -T reference.fasta -b test.cram -o test.bam

Előny, hátrány avagy mire jó a CRAM formátum?

Mivel számos bioinformatikai program még nem kezeli a CRAM formátumot, ezért az át/visszaalakításával időt veszítünk, ami néhány esetben fontos lehet: például ha az elemzéshez használt gépet/gépeket béreljük, egy újabb lépést kell hozzáadni az elemzésekhez, amik elvégzik az átalakítást.

Az adatok másolása is időbe telik, főleg, ha sok és nagyméretű fájlokat mozgatunk, ekkor már előny a CRAM formátum, mivel kisebb méretűek és így gyorsabban lehet őket másolni. A másik előnye, ami szintén a méretéhez kapcsoódik, az archíválásban lehet, amikor fontos, hogy kisebb méretűek legyen a fájlok (pl.: WES, WGS projekten esetében sok mintával).

Vissza