アメリエフの技術ブログ

Amelieff Staff Blog

BWA v0.5.xとv0.6.xの比較(1)

BWAの最新バージョンはv0.6.1ですが(2012年6月現在)、まだv0.5.x系をお使いの方も多いのではないでしょうか。
BWA v0.5.x系とv0.6.x系で何が違うかまとめてみました。

■BWA v0.6.xの変更点
・4GB以上のゲノムに対応
・ForwardとReverseのインデックスを統合することにより、BWA-shortで20%、BWA-SWで90%のスピードアップを実現
・BWA-SWがPaired-endに対応

■インデックスファイルのちがい
ヒトリファレンスゲノムhg19.faに対して、bwa v0.5.9とbwa v0.6.1でそれぞれインデックスを作成すると、生成されるファイルサイズは次のように異なります。



BWA v0.6.1ではReverse用のインデックスが生成されなくなっていて、bwtやsaといったインデックスファイルのサイズが大きくなっています。

■デフォルトパラメータのちがい
・bwa indexの-c(build color-space index)オプションが削除されました。
・bwa alnは-c(input sequences are in the color space)オプションが削除されて、-Y(filter Casava-filtered sequences)オプションが追加されました。
・bwa sampeは(Usageを見る限り)変更がないようです。

■互換性
・v0.5.x系はv0.5.x系のインデックスファイルを使って、v0.6.x系はv0.6.x系のインデックスファイルを使って、マッピングしないといけません。
・bwa v0.5.9で作成したインデックスファイルに対してbwa v0.6.1でalnを実行しても、bwa v0.6.1で作成したインデックスファイルに対してbwa v0.5.9でalnを実行しても、エラーになります。

■iGenomes
ちなみに最近のIllumina iGenomesには、bwa v0.5.x系と0.6.x系両方のインデックスファイルが含まれています。

次回は、マッピング結果のちがいについてまとめます。