アメリエフの技術ブログ

Amelieff Staff Blog

テスト用Fastqファイルを作る

マッピングソフトウェアの性能比較をする際に、
正解がわかっているデータを使いたい場合があります。

そんな時に便利な、ゲノム配列からFastqファイルを作成できる
ArtificialFastqGeneratorというソフトウェアをご紹介します。

例えばヒトゲノムhg19から150bp Paired-EndのFastqを作成するには
以下のようなコマンドを実行します。
$ java -jar ArtificialFastqGenerator.jar -R hg19.fa -O OUTNAME -RCNF 2 -S ">chr1" -E ">" -RL 150

パラメータの意味です。
・-R:ゲノム配列のMultiFastaファイル
・-O:出力ファイル名
(この例では、OUTNANE.1.fastq, OUTNANE.2.fastqができます)
・-RCNF:N入り配列を許すか
(0:N入りを許す、1:全部Nの配列は除く、
 2:1つでもNが入っている配列は除く)
・-S、-E:-Rで指定したFastaのどの配列を使うか(この例ではchr1)
・-RL:リード長

エラーを入れたり、実際のFastqを参照してリアルなクオリティスコアを
入れたりすることもできます。

とても便利なソフトウェアです。