Header Image - bioinformatika

Tag Archives

2 Articles

Fastq feldolgozás Seqtk programmal

Fastq feldolgozás Seqtk programmal
fastq

Seqtk – fastq feldolgozás

A Seqtk egy egyszerű program, amellyel fastq fájlokon véghezhetünk egyszerű műveleteket.

Telepítése könnyű, github-ról letöltve az alábbi paranccsal már használhatjuk is.

git clone https://github.com/lh3/seqtk.git
cd seqtk
make

Számos funkció elérhető a seqtk-n belül:

fastq feldolgozás seqtk programmal

seqtk fastq

 

Egyedüli függőséggént a zlib könyvtárat kelltelepíteni, ha még nincs telepítve.

Példák

  • FASTQ -ból FASTA
seqtk seq -a in.fq.gz > out.fa
  • Szűrés read nevek alapján, amelyek soronként a nevek.lst fájlban vannak
seqtk subseq in.fq nevek.lst > out.fq
  • Random mintavétel a fastq fájlból, összesen 1000 read
seqtk sample -s100 in.fq 1000 > out.fq

Fastq emoji

Fastqe egy egyszerű program (python nyelven), amellyel minden egyes pozicióra kiszámolhatjuk az átlag, valamint a min/max minőség értékeket és azokat emojiként jeleníti meg.

fastq minőség értékek emoji

Telepítés és használata:

A pip-el könnyen telepíthetjük:

pip install fastqe

Használata is egyszerű:

fastqe [--bin] [--min] [--max] [FASTQ_FILE ...]

 

Példa

fastqe test.fastq

fastqe --min test.fastq

fastqe --max test.fastq

Ha a --bin argumentumot is megadjuk, akkor az alábbiak szerint jeleníti meg az egyes minőségi értékeket.

Bin Emoji
N 🚫
2-9 💀
10–19 💩
20–24 ⚠️
25–29 😄
30–34 😆
35–39 😎
≥ 40 😍