アメリエフの技術ブログ

Amelieff Staff Blog

samtools ゲノムのインデックスファイルの中身

次世代シーケンサ解析では、リファレンスゲノムやbamファイルなど、サイズの大きなファイルを扱う必要があります。
大きなファイルには扱う前にインデックス(目次)を作成することがしばしばあります。多くのソフトはインデックスファイルがないと動きません。
同じデータでも、ソフトごとに別のインデックスファイルが必要な場合もあります。

インデックスファイルには人が読めないバイナリデータも、プレーンテキストのものもありますが、Samtoolsが作成するゲノムファイルのインデックスファイルは、人にも読めるものです。
内容を知っていると便利なこともあるので、ご紹介いたします。