アメリエフの技術ブログ

Amelieff Staff Blog

BWA v0.5.xとv0.6.xの比較(2)

hatです。前回から随分開いてしまいましたが、BWA v0.5.xとv0.6.xの比較(1)のつづきです。

bwa v0.5.x系とv0.6.x系のマッピング結果の違いを、公開データを使って比較してみました。
それぞれhg19に対してマッピングして、samtools flagstatでマッピング結果を出しました。

■使用したデータ
ERR034601(日本人女性Exome)

■bwa v0.5.9のマッピング結果
118495810 + 0 in total (QC-passed reads + QC-failed reads)
0 + 0 duplicates
117074076 + 0 mapped (98.80%:-nan%)
118495810 + 0 paired in sequencing
59247905 + 0 read1
59247905 + 0 read2
116292908 + 0 properly paired (98.14%:-nan%)
116571052 + 0 with itself and mate mapped
503024 + 0 singletons (0.42%:-nan%)
234772 + 0 with mate mapped to a different chr
217456 + 0 with mate mapped to a different chr (mapQ>=5)

■bwa v0.6.1のマッピング結果(減:青字、増:赤字
118495810 + 0 in total (QC-passed reads + QC-failed reads)
0 + 0 duplicates
117071517 + 0 mapped (98.80%:-nan%)
118495810 + 0 paired in sequencing
59247905 + 0 read1
59247905 + 0 read2
116287794 + 0 properly paired (98.14%:-nan%)
116565920 + 0 with itself and mate mapped
505597 + 0 singletons (0.43%:-nan%)
234930 + 0 with mate mapped to a different chr
217494 + 0 with mate mapped to a different chr (mapQ>=5)

bwa v0.6.1では、若干マッピング率が下がりました。ペアエンドのマッピング数が減ってシングルトンのマッピング数が増えています。

しかし、個々のマッピング箇所を並べて見ていると、下図のような例もありました。

bwa v0.5.9ではペアエンドが別々の染色体にマッピングされていたものが、bwa v0.6.1ではペアエンドでマッピングできるようになった例です。ミスマッチは入ってしまっていますが、これくらいのミスマッチであればbwa v0.6.1の結果のほうを採用してもいい気がします。

bwa v0.5.x系とv0.6.x系の差はWebで調べてもまだあまり情報がないようです。微妙な違いなのでしょうか。なにか見つけましたら、またブログに書かせていただきます。