アメリエフの技術ブログ

Amelieff Staff Blog

DeNovoGear

tokunagaです。

有言実行です。
第2回使ってみたシリーズです。

今回ご紹介するのは

DeNovoGear

サイト
http://denovogear.weebly.com/index.html
論文
http://www.nature.com/nmeth/journal/v10/n10/full/nmeth.2611.html


trioデータからDeNovoのmutationやIndelを検出するツールです。
likelihood-based errorというモデルを使用し、
false positiveを減らしているようです。

Inputファイルはpedファイルとbcfファイルです。

pedファイルについては過去のブログ記事をご参照ください。

bcfファイルは簡単に言うとVCFファイルのバイナリ版で、
検出したvariantの情報が記載されています。
詳しい説明はこちらに。
http://samtools.sourceforge.net/mpileup.shtml

このDeNovoGearでは

1.trioデータから新規変異を検出する(X染色体については別解析)
2.pairデータから新規変異を検出する
3.Phasing denovo mutations

といったパターンの解析が出来るようです。

テストデータもありましたので、1のtrioデータで実行してみました。
実行コマンドは以下です。
$ ./denovogear dnm auto --bcf sample_CEU.bcf --ped ¥
 sample_CEU.ped

上記を実行しますとCHILD_IDのサンプルに特異的な変異を検出してくれます。
outputの指定なしだと以下のように結果が出力されました。


Denovogear0.5.3
Created SNP lookup table
First mrate: 1 last: 1
First code: 6 last: 6
First target string: AA/AA/AA last: TT/TT/TT
First tref: 0.0002388 last: 0.99301

Created indel lookup table First code: 6 last: 6
First target string: RR/RR/RR last: DD/DD/DD
First prior: 0.05 last: 0.114

Created paired lookup table
First target string: AA/AA last: TT/TT
First prior 1 last: 1
DENOVO-SNP CHILD_ID: NA12878_vald-sorted.bam.bam chr: 2 pos: 214668360 ref: G alt: A maxlike_null: 3.95324e-12 pp_null: 0.000399465 tgt_null(child/mom/dad): GG/GG/GG snpcode: 1 code: 6 maxlike_dnm: 9.9301e-09 pp_dnm: 0.999601 tgt_dnm(child/mom/dad): AG/GG/GG lookup: 4 flag: 0 READ_DEPTH child: 48 dad: 76 mom: 34 MAPPING_QUALITY child: 59 dad: 59 mom: 59

Total number of SNP sites interrogated: 36
Total number of SNP sites passing read-depth filters: 36
Total number of INDEL sites interrogated: 1
Total number of INDEL sites passing read-depth filters: 1
Total number of Paired sample sites interrogated: 0
Total number of Paired sample sites passing read-depth filters: 0
Done !


--out_vcfオプションで
vcfファイルを出力することも可能です。

ご興味のある方は試されてみてはいかがでしょうか?