Header Image - bioinformatika

Tag Archives

One Article

Bioinformatikai egysorosak

Az alábbiakban összeszedtünk pár oneliner-et a teljesség igénye nélkül. Az awk, valamint a sed a két leggyakrabban használt parancs, amely a linux-os rendszerekben általában megtalálhatóak.

FASTQ -ból FASTA

sed -n '1~4s/^@/>/p;2~4p' file.fq > file.fa

Átlagos read hossz a Fastq fájlban

awk 'NR%4==2{sum+=length($0)}END{print sum/(NR/4)}' input.fastq

Szekvenciák száma egy fasta fájlban

-cat minta.fasta | grep -c ">"

Szekvenciák száma egy fastq fájlban

cat minta.fastq | echo $((`wc -l`/4))

További egysorosak