マッピングソフトウェアの性能比較をする際に、
正解がわかっているデータを使いたい場合があります。
そんな時に便利な、ゲノム配列からFastqファイルを作成できる
ArtificialFastqGeneratorというソフトウェアをご紹介します。
例えばヒトゲノムhg19から150bp Paired-EndのFastqを作成するには
以下のようなコマンドを実行します。
$ java -jar ArtificialFastqGenerator.jar -R hg19.fa -O OUTNAME -RCNF 2 -S ">chr1" -E ">" -RL 150
パラメータの意味です。
・-R:ゲノム配列のMultiFastaファイル
・-O:出力ファイル名
(この例では、OUTNANE.1.fastq, OUTNANE.2.fastqができます)
・-RCNF:N入り配列を許すか
(0:N入りを許す、1:全部Nの配列は除く、
2:1つでもNが入っている配列は除く)
・-S、-E:-Rで指定したFastaのどの配列を使うか(この例ではchr1)
・-RL:リード長
エラーを入れたり、実際のFastqを参照してリアルなクオリティスコアを
入れたりすることもできます。
とても便利なソフトウェアです。