アメリエフの技術ブログ

Amelieff Staff Blog

アライメント続編

先日は、bwaのアライメントアルゴリズムに関して記述しました。
本日は、その続編を記述致します。
よろしくお願い致します。

bwaでアライメントを行う際は、必ずReferenceゲノムのindex化が必要です。つまり、Suffix Arrayを作成しておく必要があります。

そもそもアライメント(Alignment)とは、“位置合わせ”、“一列に揃える”という意味です。つまり、Referenceゲノムの配列と、Sampleの配列で位置合わせを行う事がアライメントです。
すごく簡単に言ってしまえば、Sample配列の文字列検索をするようなものだと考えます。

それでは、なぜ、ReferenceゲノムのSAを作る必要があったのでしょうか?
ということで、ここからSAの補足を行います。


ReferenceゲノムのSAを作っておくことで、検索が容易になり、かつ同時に位置情報まで判明します!
このようなメカニズムでアライメントを行うから、短時間で必要情報を得る事ができるのですね。