次世代シーケンシングデータのQCツールとして、一番使われているのがFastQCだと思います。
FastQCは非常に高機能なツールなのですが、「ポジションごとのクオリティスコア分布図」で、ポジション10bp以降の領域がグループ化されてしまうのだけが残念だと思っていました。
100bpくらいのリードだと、リードの後ろのほうでどのくらいクオリティが低下するかディテールが見えづらくなってしまうのです。
ところが、今日FastQCのUsageを見ていて、FastQCに--nogroup オプションを付けて実行すると、グループ化を無効にできることを知りました。
このオプションは実は結構前(Version 0.9.1)から実装されていたようです。
今日の教訓:
使い慣れていると思っているツールこそ、Usageをよく読もう。
もしかしたら世間では常識かもしれないのですが、社内で最初にこれを発見したのが嬉しくて、ドヤ顔しています。