BWAの最新バージョンはv0.6.1ですが(2012年6月現在)、まだv0.5.x系をお使いの方も多いのではないでしょうか。
BWA v0.5.x系とv0.6.x系で何が違うかまとめてみました。
■BWA v0.6.xの変更点
・4GB以上のゲノムに対応
・ForwardとReverseのインデックスを統合することにより、BWA-shortで20%、BWA-SWで90%のスピードアップを実現
・BWA-SWがPaired-endに対応
■インデックスファイルのちがい
ヒトリファレンスゲノムhg19.faに対して、bwa v0.5.9とbwa v0.6.1でそれぞれインデックスを作成すると、生成されるファイルサイズは次のように異なります。
BWA v0.6.1ではReverse用のインデックスが生成されなくなっていて、bwtやsaといったインデックスファイルのサイズが大きくなっています。
■デフォルトパラメータのちがい
・bwa indexの-c(build color-space index)オプションが削除されました。
・bwa alnは-c(input sequences are in the color space)オプションが削除されて、-Y(filter Casava-filtered sequences)オプションが追加されました。
・bwa sampeは(Usageを見る限り)変更がないようです。
■互換性
・v0.5.x系はv0.5.x系のインデックスファイルを使って、v0.6.x系はv0.6.x系のインデックスファイルを使って、マッピングしないといけません。
・bwa v0.5.9で作成したインデックスファイルに対してbwa v0.6.1でalnを実行しても、bwa v0.6.1で作成したインデックスファイルに対してbwa v0.5.9でalnを実行しても、エラーになります。
■iGenomes
ちなみに最近のIllumina iGenomesには、bwa v0.5.x系と0.6.x系両方のインデックスファイルが含まれています。
次回は、マッピング結果のちがいについてまとめます。