読者です 読者をやめる 読者になる 読者になる

アメリエフのブログ

Amelieff Staff Blog

気軽にbamファイルの中を見る

入社して四か月になり、私も簡単な解析ならできるようになりました。
とはいえ、解析中に起きたエラーについて先輩に相談したところ
「ちょっとBAMファイルをless(コマンド)で確認してみようか」
と言われ、
「BAMってバイナリデータでは……?」
と狼狽したので、まだ初心者のようです……。
(バイナリデータとは、人が読める文字で書かれたテキストデータではない、コンピュータが読みやすい二進数で記されたデータのことです。テキストデータと同じように開こうとするとエラーが出るか、無理やり普通のデータと同じように開いてみても、文字化けのようになります。下図はBAMファイルをWindows上のテキストエディタで開いてみたものです)
バイナリの文字化け

BAMファイルの中身を閲覧したいときには、samtools viewでBAMをSAMに変換します。もちろん、SAMファイルとして出力してもいいでのすが、少し中を確認したいだけのときは、パイプ(|)でlessコマンドを続け、扱いやすいテキストとして気軽に読むようにできます。

$ samtools view example.bam | less