有言実行です。
第2回使ってみたシリーズです。
今回ご紹介するのは
DeNovoGear
サイト
http://denovogear.weebly.com/index.html
論文
http://www.nature.com/nmeth/journal/v10/n10/full/nmeth.2611.html
trioデータからDeNovoのmutationやIndelを検出するツールです。
likelihood-based errorというモデルを使用し、
false positiveを減らしているようです。
Inputファイルはpedファイルとbcfファイルです。
pedファイルについては過去のブログ記事をご参照ください。
bcfファイルは簡単に言うとVCFファイルのバイナリ版で、
検出したvariantの情報が記載されています。
詳しい説明はこちらに。
http://samtools.sourceforge.net/mpileup.shtml
このDeNovoGearでは
1.trioデータから新規変異を検出する(X染色体については別解析)
2.pairデータから新規変異を検出する
3.Phasing denovo mutations
といったパターンの解析が出来るようです。
テストデータもありましたので、1のtrioデータで実行してみました。
実行コマンドは以下です。
$ ./denovogear dnm auto --bcf sample_CEU.bcf --ped ¥
sample_CEU.ped
上記を実行しますとCHILD_IDのサンプルに特異的な変異を検出してくれます。
outputの指定なしだと以下のように結果が出力されました。
Denovogear0.5.3
Created SNP lookup table
First mrate: 1 last: 1
First code: 6 last: 6
First target string: AA/AA/AA last: TT/TT/TT
First tref: 0.0002388 last: 0.99301
Created indel lookup table First code: 6 last: 6
First target string: RR/RR/RR last: DD/DD/DD
First prior: 0.05 last: 0.114
Created paired lookup table
First target string: AA/AA last: TT/TT
First prior 1 last: 1
DENOVO-SNP CHILD_ID: NA12878_vald-sorted.bam.bam chr: 2 pos: 214668360 ref: G alt: A maxlike_null: 3.95324e-12 pp_null: 0.000399465 tgt_null(child/mom/dad): GG/GG/GG snpcode: 1 code: 6 maxlike_dnm: 9.9301e-09 pp_dnm: 0.999601 tgt_dnm(child/mom/dad): AG/GG/GG lookup: 4 flag: 0 READ_DEPTH child: 48 dad: 76 mom: 34 MAPPING_QUALITY child: 59 dad: 59 mom: 59
Total number of SNP sites interrogated: 36
Total number of SNP sites passing read-depth filters: 36
Total number of INDEL sites interrogated: 1
Total number of INDEL sites passing read-depth filters: 1
Total number of Paired sample sites interrogated: 0
Total number of Paired sample sites passing read-depth filters: 0
Done !
--out_vcfオプションで
vcfファイルを出力することも可能です。
ご興味のある方は試されてみてはいかがでしょうか?