NGS解析では、同じ処理を行うのにいくつものソフトウェアがあって、どれを使ったらいいのか迷うことがあります。
例えばBAMファイルをゲノムポジションでソートする場合、以下の選択肢があります。
1. samtools sortを使う
2. picard toolsのSortSam.jarを使う
同じBAMファイルを異なるソフトウェアでソートしても、結果は同じになるのでしょうか?
テストデータとして、NCBI SRAのSRR077861の先頭1000リードをhg19にBWAでマッピングした結果のBAMを使いました。
・テストデータ
sample.bam(222,146 bytes)
【samtools sortでソート】
・実行コマンド
samtools sort sample.bam sort_samt
・結果BAM
sort_samt.bam(219,312 bytes)
【SortSam.jarでソート】
・実行コマンド
java -jar /usr/local/src/java/picard-tools-1.75/SortSam.jar I=sample.bam O=sort_pica.bam SO=coordinate
・結果BAM
sort_pica.bam(221,293 bytes)
結果BAMが異なりました!
いったいどこが異なるのでしょうか。
比較結果は次回で。