アメリエフの技術ブログ

Amelieff Staff Blog

hg38調査(1)

hg20/GRCh38が出る と浮かれていた、去年の夏。

やっと出たhg38(hg20という名前では無かった)をダウンロードして
染色体の長さやNの数を調べた 今年の正月。

それで満足してその後hg38のことはすっかり忘れていましたが、
気が付くと8月も後半。小学生は夏休みの宿題が気になりだす時期です。
私も放置していたhg38のことが気になってきました。

ということで、RNA-seqとChIP-seqの公開データを同じコマンドで
hg19とhg38にマッピングし、マッピング率の違いを調べました。
ゲノムの精度が上がっているなら、マッピング率が上がることが
期待されます。

以下、結果です。左がhg19、右がhg38のマッピング率です。

RNA-seq Paired-end(tophatでマッピング)
サンプルA:85.28% → 85.79%
サンプルB:91.28% → 91.76%

ChIP-seq Single-end(bowtieでマッピング)
サンプルC:69.83% → 70.34%
サンプルD:98.19% → 99.04%

今回選んだ4サンプルは、いずれもhg38でマッピング率がわずかに向上しました。
いいですね!

次回、Reseqデータでも検証してみたいと思います。