ヒトの新しいリファレンスゲノムGRCh38が公開されました。
GRCh37(≒hg19)と比較してどれくらい変わったのでしょうか?
まずは、各染色体の長さや、N(不明塩基)の数がGRCh37→GRCh38で
どのように変わったか調べてみました。
染色体長の変化
・各染色体につき最大30Mbpくらい増えたり減ったりしている
・ゲノム全体では7.4Mbp減少
N数の変化
・ゲノム全体で83Mb減少
・ゲノムに占めるNの割合は7.6%から4.9%に減少
GenomeRef:Announcing GRCh38によると、GRCh37で
セントロメア領域にあった大量のNが、GRCh38では減らせている
そうです。
また、1000ゲノムプロジェクトと一致しない領域やIndelが
修正されているそうです(1q21、10q11、chr9など)。
新しいリファレンスゲノムで新しい知見がたくさん見つかることを
期待しています。