アメリエフの技術ブログ

Amelieff Staff Blog

fastq format②

tokunagaです。

少し1回目と間が空いてしまいましたが、
本日はfastq formatの2回目です。
各リードの4行目に記されているqualityについて説明したいと思います。

・Quality value
3行目に使われているquality valueは以下のように計算されています。




・ASCIIコード
各塩基ごとのquality valueを一文字で表すためにASCIIコードが使われています。




・比較
S - Sanger Phred+33, raw reads typically (0, 40)
X - Solexa Solexa+64, raw reads typically (-5, 40)
I - Illumina 1.3+ Phred+64, raw reads typically (0, 40)
J - Illumina 1.5+ Phred+64, raw reads typically (3, 40)
L - Illumina 1.8+ Phred+33, raw reads typically (0, 41)

()の中はquality valueの最大値と最小値です。
現行のIllumina formatでは、実際に使われているquality valueの最大値は41です。

参考URL
http://en.wikipedia.org/wiki/FASTQ_format