アメリエフの技術ブログ

Amelieff Staff Blog

SAM format②

tokunagaです。

前回はSAM formatの概要についてお話ししました。
本日はSAM formatのヘッダーについて説明します。

ヘッダーには、シーケンスやリードグループなどのタグ情報が記述されており、以下のような形式で書かれています。

@<TAG>   <TYPE>:<VALUE> <TYPE>:<VALUE>

(例)
@SQ SN:gi|49175990|ref|NC_000913.2| LN:4639675


@マークの次にアルファベット2文字でタグが記され、
その後ろに「タイプ(アルファベット2文字):バリュー」のセットが並んでいます。

そして、各タグおよびタイプの簡単な説明を下記の表にまとめました。



このタグとタイプの内容がバリューの部分に記されています。
これらの情報でヘッダー行以下のアライメント部分の定義をしています。

次はアライメント部分について説明したいと思います。

*参考URL
http://samtools.sourceforge.net/SAM1.pdf