アメリエフの技術ブログ

Amelieff Staff Blog

構造多型を解析するツール : pair-end mapping

前回は、次世代シーケンスデータを用いて構造多型を検出するツールのうち、split-read mappingを用いているものを紹介しました。
今回の記事ではpair-end mappingを用いているツールをご紹介します。


MoDIL
10-50 bpのindelの検出ツールです。
ライブラリのInsert sizeの分布とマップされたreadのinsert sizeを比較し、その変化からindelを検出します。そのため、検出されたindelサイズは直接観測したものではなく間接的に推測した値になりますが、論文では実際の値と非常に近い値となったようです。
十分なdepthのあるshort readのシーケンスデータに向いているツールです。

BreakDancer
10-100 bpのindelを検出するMini(開発停止)と、それより大きなSVを検出するMaxの2パッケージがあります。Indelやinversion、translocationは検出できますが、tandem duplicationの検出には対応していません。
ちなみに、このBreakDancerの出力ファイルは、そのまま先週ご紹介したPindelに入力することができます。その他のツールでも検出結果を一定のフォーマットに変換すれば入力できるようです。

GASV
アルゴリズムを改良し、depthまで考慮するようになったGASVProもあります。
array-CGHデータの解析にも使えるので、アレイとシーケンサの結果を同一ツールで解析し、比較することができます。
今も時々メンテナンスされているようです。


Split-readとpaired-endを用いてSVを検出するツールについて紹介させていただきました。
ところで、この2つの方法のメリットとデメリットについてはそれぞれご説明しましたが(Split-readPaired-end)、欠点と長所があるなら補い合えたらいいと思いませんか?
次回はsplit-readとpaired-endを併せて使用してSVを検出するツールについてご紹介いたします。