アメリエフの技術ブログ

Amelieff Staff Blog

ソフトウェア結果比較【BAMソート編・1】

NGS解析では、同じ処理を行うのにいくつものソフトウェアがあって、どれを使ったらいいのか迷うことがあります。

例えばBAMファイルをゲノムポジションでソートする場合、以下の選択肢があります。
1. samtools sortを使う
2. picard toolsのSortSam.jarを使う

同じBAMファイルを異なるソフトウェアでソートしても、結果は同じになるのでしょうか?

テストデータとして、NCBI SRAのSRR077861の先頭1000リードをhg19にBWAでマッピングした結果のBAMを使いました。

・テストデータ
sample.bam(222,146 bytes)


【samtools sortでソート】
・実行コマンド
samtools sort sample.bam sort_samt

・結果BAM
sort_samt.bam(219,312 bytes)


【SortSam.jarでソート】
・実行コマンド
java -jar /usr/local/src/java/picard-tools-1.75/SortSam.jar I=sample.bam O=sort_pica.bam SO=coordinate

・結果BAM
sort_pica.bam(221,293 bytes)


結果BAMが異なりました!
いったいどこが異なるのでしょうか。

比較結果は次回で。