hg20/GRCh38が出る と浮かれていた、去年の夏。
やっと出たhg38(hg20という名前では無かった)をダウンロードして
染色体の長さやNの数を調べた 今年の正月。
それで満足してその後hg38のことはすっかり忘れていましたが、
気が付くと8月も後半。小学生は夏休みの宿題が気になりだす時期です。
私も放置していたhg38のことが気になってきました。
ということで、RNA-seqとChIP-seqの公開データを同じコマンドで
hg19とhg38にマッピングし、マッピング率の違いを調べました。
ゲノムの精度が上がっているなら、マッピング率が上がることが
期待されます。
以下、結果です。左がhg19、右がhg38のマッピング率です。
RNA-seq Paired-end(tophatでマッピング)
サンプルA:85.28% → 85.79%
サンプルB:91.28% → 91.76%
ChIP-seq Single-end(bowtieでマッピング)
サンプルC:69.83% → 70.34%
サンプルD:98.19% → 99.04%
今回選んだ4サンプルは、いずれもhg38でマッピング率がわずかに向上しました。
いいですね!
次回、Reseqデータでも検証してみたいと思います。