アメリエフの技術ブログ

Amelieff Staff Blog

構造多型を解析するツール : paired-endとsplit-read mapping

これまで、ゲノムの構造多型を検出ツールのうち、split-readか、paired-endを用いているツールを紹介してきました。
どちらかの手法だけでなく、両方を合わせて使用するツールも存在します。
複数の検出方法を併用するメリットは、paired-end mappingによる感度の高さとsplit-read mappingによるbreakpointの精度の高さの両方が得られることの他に、complex SVを検出できることがあります。


SVMerge
複数のソフトをまとめて使って解析できるパイプラインです。
使用されているのは、BreakDancer/Pindel/SECluster/RetroSeq/RDXplorer/Exonerateで、それぞれpaired-end mapping、split-read mapping、対となるreadのクラスタ分布、可動性遺伝因子データベースへのマッピング、read depth、アライメントによってSVを検出し、その結果をマージしています。
検出後、さらにVelvetによるlocal de novoアセンブリでSVを確認し、偽陽性を減らしています。

DELLY
Deletion、tandem duplication、inversion、translocationを検出するツールです。それぞれのSV種が独立して検出されるため、結果のネストや重複の可能性があります。
論文中では、他のツールと比べて、depthが少ないデータにも強いと紹介されています。
ホームページを見ると、メンテナンスやBWAなどの依存しているツールのアップデートに合わせたアップデートがこまめに行われているようです。


3回にわたり、様々なSV検出ツールについてご紹介いたしましたが、現在も新しい検出ツールは登場し続けています。
もしかしたら、、ご紹介したものよりも精度も感度も抜群に優れた定番となる新たなツールが現れるかもしれません。