今日はVCFtoolsについてご紹介したいと思います。
URL:http://vcftools.sourceforge.net/
VCFToolsは、NGSのデータ解析で出力されたVCFファイルを加工するのに役に立つツールです。
VCFtoolsを使用する際にはbgzip、tabixの使用が必要となります。
例えばマージする場合
まずbgzipで固めます。
bgzip $FILE1.vcf
bgzip $FILE2.vcf
次にtabixでインデックスを付けます。
tabix $FILE1.vcf.gz
tabix $FILE2.vcf.gz
これでVCFToolsを実行することが出来ます。
vcf-merge $FILE1.hetero.gz $FILE2.hetero.gz|bgzip -c > $OUT.vcf.gz
前処理はちょっと手間はかかりますが、複数のVCFファイルのマージや比較、共通部分の抜き出しなど様々なコマンドがあります。
また機会がありましたら便利なコマンドをご紹介したいと思います。