前回に引き続き、今回は次世代シーケンサーを用いて構造多型(SV)を検出するもう一つの方法、Paired-end mappingを用いた方法についてご紹介します。
マップされなかったreadを用いていたSplit-read mappingと異なり、Paired-end mappingでは、マップされたものの、位置や向きがリファレンスと一致しなかったread(anomalously mapped read)を利用します。
たとえば、サンプル配列にinsertionがあると、対となるreadは本来ゲノム配列にマッピングされる距離よりも近距離にマップされます。Deletionがあった配列では逆に離れてマッピングされます。
また、inversionならreadの方向が逆になりますし、translocationならまったく離れた場所にマッピングされることもあります。
この方法の長所としては、染色体間のtranslocationなど、split-read mappingを用いる方法に比べ多様なSVの検出が得意であることがあります。
欠点としてはbreakpointの精確な検出ができないこと、single-end readの解析は検出原理上不可能であることがあります。
また、もともと対となるread同士の距離にばらつきがあるため、小さなindelは検出できないことがあります。
次世代シーケンサを用いた構造多型(SV)の検出原理の説明はここまでです。
次回からはそれぞれの方法について、どのような構造多型検出ツールがあるのかご紹介します。