アメリエフの技術ブログ

Amelieff Staff Blog

気軽にbamファイルの中を見る

入社して四か月になり、私も簡単な解析ならできるようになりました。
とはいえ、解析中に起きたエラーについて先輩に相談したところ
「ちょっとBAMファイルをless(コマンド)で確認してみようか」
と言われ、
「BAMってバイナリデータでは……?」
と狼狽したので、まだ初心者のようです……。
(バイナリデータとは、人が読める文字で書かれたテキストデータではない、コンピュータが読みやすい二進数で記されたデータのことです。テキストデータと同じように開こうとするとエラーが出るか、無理やり普通のデータと同じように開いてみても、文字化けのようになります。下図はBAMファイルをWindows上のテキストエディタで開いてみたものです)

f:id:Fuku-I:20210805143804p:plain




BAMファイルの中身を閲覧したいときには、samtools viewでBAMをSAMに変換します。もちろん、SAMファイルとして出力してもいいでのすが、少し中を確認したいだけのときは、パイプ(|)でlessコマンドを続け、扱いやすいテキストとして気軽に読むようにできます。

$ samtools view example.bam | less


アメリエフでは、バイオデータ解析やそのシステム・インフラ環境の開発に興味のあるエンジニア・リーダー候補を募集しています。
www.wantedly.com