次世代シーケンスデータを用いて構造多型を検出するツールは、これまでに数多く登場しています。
そのうちのいくつかを簡単にご紹介いたします。
今回はSplit-read mappingを用いているツールです。
Pindel
論文が発表されたのは2009年ですが、最近でも頻繁にメンテナンスされているようです。
およそ10-80 bpの小さなSVの検出に推奨されています。100bp以上のSVを検出するのが得意なツールと組み合わせて使うといいようです。
SLOPE
Target sequenceデータの解析に特化したツールです。また、Target sequencingの強みであるread depthが十分にあるデータが必要なようです。
Pair-end readの解析はsam他マップされたreadを入力しますが、single-end readの解析も、fastq形式なら行えるそうです。
CREST
Split-read mappingではマップされなかったreadを解析に用いますが、CRESTは、soft-clipping read(完全にはマップされなかったread)のうち長75 bp以上のものを解析に使用するところが特徴です。
BWAやBowtie2など、local alignmentが行えるマッピングツールでないとsoft clipされないため、マッピングソフトがlocal alignmentに対応しているか、注意が必要です。
次回はpair-end mappingを用いてSVを検出するツールについてご紹介いたします。