アメリエフのブログ

Amelieff Staff Blog

QCの道 その7

こんにちは。detです。
今日はQCの道 その6の続きです。

FASTX-Toolkitの使い方について、引き続き紹介いたします。

・fastx_collapser
FASTA/Q ファイルの中で、同じ配列のリードが重複して存在していた場合に1つを除いてすべて削除します。入力がFASTQ形式の場合は強制的にFASTA形式で出力され、ID行は連番で振り直されます。重複していたリードのID行には[連番-重複数]の形式で重複数が記載されます。

【optionの説明】
-h: ヘルプを表示します。
-i: 入力ファイルを指定します。
-o: 出力ファイルを指定します。指定しない場合は標準出力に出力されます。
-v: 処理前後でのリード数などを出力してくれます。

【実行例: 重複リードを削除】
$ fastx_collapser -i input.fastq -o out.fasta -v -Q 33


・fastx_reverse_complement
FASTA/Q ファイルの各リードの塩基配列をその相補鎖で置き換えます。FASTQファイルを入力に選んだ場合はクオリティ行も対応するように並べ替えられます。

【optionの説明】
-h: ヘルプを表示します。
-i: 入力ファイルを指定します。
-o: 出力ファイルを指定します。指定しない場合は標準出力に出力されます。
-v: 処理前後でのリード数などを出力してくれます。

【実行例: 相補鎖の作成】
$ fastx_reverse_complement -i input.fastq -o out.fastq -v -Q 33


---これまでの記事へのリンク---
QCの道 その1
QCの道 その2
QCの道 その3
QCの道 その4
QCの道 その5
QCの道 その6