アメリエフの技術ブログ

Amelieff Staff Blog

QCの道 その3

こんにちは。detです。
今日は前回のQCの道 その2の続きです。

FASTX-Toolkitが持つ機能について、引き続き紹介いたします。

・fastx_trimmer
FASTA/FASTQ ファイルの各リードの先頭から、指定した塩基数を削除して出力することができます。全てのリードの塩基が同じ数だけ削除されます。

【optionの説明】
-h: ヘルプを表示します。
-f N: リードの先頭からN塩基の手前までを削除します。
-l N: リードの先頭からN塩基まで残して削除します。
-z: 出力をgzip形式で圧縮します。
-i: 入力ファイルを指定します。
-o: 出力ファイルを指定します。指定しない場合は標準出力に出力されます。

【実行例1: 先頭から4塩基削除】
$ fastx_trimmer -f 5 -i test.fastq -o out.fastq -Q33

【実行例2: 4から10塩基を抽出】
$ fastx_trimmer -f 4 -l 10 -i test.fastq -o out.fastq -Q33


・fastq_quality_filter
FASTA/FASTQ ファイルの各リードのクオリティをチェックし、一定のクオリティ以上の塩基が指定した割合未満であった時に、そのリードそのものを削除するツールです。

【optionの説明】
-h: ヘルプを表示します。
-q N: 最低でも維持しなければならないクオリティ値(QV)を指定します。
-p N: リードを占める指定したQVを維持する塩基の割合が、ここで指定した数値(%)未満のときはそのリードを削除します。
-z: 出力をgzip形式で圧縮します。
-i: 入力ファイルを指定します。
-o: 出力ファイルを指定します。指定しない場合は標準出力に出力されます。
-v: 処理前後でのリード数などを出力してくれます。

【実行例: QVが20以上の塩基の割合が20%未満のリードを削除】
$ fastq_quality_filter -i test.fastq -o qual_fil_1.fastq -q 20 -p 20 -Q 33


それでは、また次回に。