アメリエフの技術ブログ

Amelieff Staff Blog

bwa のバージョン検討 その1

 最も広く利用されているマッピングソフトの一つにbwaがあります。bwaは2011年にリリースされたバージョン0.6が広く使用されてきましたが、今年の2月末にバージョン0.7がリリースされました。0.7ではBWA-backtrack、BWA-SW、BWA-MEMの、三種類のアルゴリズムが選択できます。この中でBWA-backtrackはilluminaのショートリード用、残り二つがショートリードから1Mbまでのロングリードに対応しているようです。また、bwaのサイトによれば、BWA-SWとMEMでは、MEMの方がより新しく、精度も高いとのことです。
 こうなると今までの0.6と、0.7[MEM]を比較したくなりますね。というわけでやってみました。条件は以下の通りです。

【サンプル】
WholeExomeSequenceデータ(SRR077486、paired-end)

【データ解析】
1. QC(FastQC、QCleaner)
2. マッピング(bwa0.6.1、bwa0.7.4[MEM])
3. リアライメント/リキャリブレーション(GATK1.6)
4. 変異のコール(GATK1.6)

上記の解析の流れは、弊社製Reseq解析パイプラインとほぼ同じです。

 では、コールされた変異について簡単に比較してみたいと思います。




 bwa(バージョン0.6と0.7[MEM])を用いて得られた変異がどの程度重なっているかを、ベン図にしてみました。SNVとIndelで分けています。このように、かなりの変異が重なっていますが、どちらか一方でしか検出されなかった変異も数%存在しています。

次回はこの数%の変異に焦点を当ててみたいと思います。