本日は、その続編を記述致します。
よろしくお願い致します。
bwaでアライメントを行う際は、必ずReferenceゲノムのindex化が必要です。つまり、Suffix Arrayを作成しておく必要があります。
そもそもアライメント(Alignment)とは、“位置合わせ”、“一列に揃える”という意味です。つまり、Referenceゲノムの配列と、Sampleの配列で位置合わせを行う事がアライメントです。
すごく簡単に言ってしまえば、Sample配列の文字列検索をするようなものだと考えます。
それでは、なぜ、ReferenceゲノムのSAを作る必要があったのでしょうか?
ということで、ここからSAの補足を行います。

ReferenceゲノムのSAを作っておくことで、検索が容易になり、かつ同時に位置情報まで判明します!
このようなメカニズムでアライメントを行うから、短時間で必要情報を得る事ができるのですね。