今日から次世代シーケンサー解析で使われているformatについて書いていきたいと思います。
まず、今回はfastq formatについてです。
・構成
塩基配列と各塩基に対するquality valueの情報が書かれているテキストファイルです。各リードは4行で構成されています。
[例]
① @SRR022885.1 BI:080102_SL-XAR_0001_
FC201E9AAXX:6:1:752:593
② CGTACCAATTATTCAACGTCGCCAGTTGCTTCATGT
③ +
④ IIIIIIIIII>IIIIIII@IIII.I+I>35I0I&+/
次回に続きます。