アメリエフの技術ブログ

Amelieff Staff Blog

fastq format①

今日から次世代シーケンサー解析で使われているformatについて書いていきたいと思います。
まず、今回はfastq formatについてです。

・構成
塩基配列と各塩基に対するquality valueの情報が書かれているテキストファイルです。各リードは4行で構成されています。


[例]
① @SRR022885.1 BI:080102_SL-XAR_0001_
  FC201E9AAXX:6:1:752:593

② CGTACCAATTATTCAACGTCGCCAGTTGCTTCATGT

③ +
④ IIIIIIIIII>IIIIIII@IIII.I+I>35I0I&+/

次回に続きます。