アメリエフの技術ブログ

Amelieff Staff Blog

HGVDについて (1)

先月の11月12日、日本人のゲノム情報データベースHuman Genetic Variation Databaseが公開されました。このことは一般紙でも報道されました。
以前の連載でも、ゲノム情報のデータベース、特に人種や民族別のデータベースが、高スループットの遺伝子解析機器を用いた解析に有用だと少し触れました。ぜひ、今後このデータベースが日本人の遺伝子研究に活用され、様々な病気の治療に役立って欲しいと思います。

このデータベース上のSNPの半分以上は、dbSNPなどこれまでの既知変異データベースに含まれていない日本人特異的なものだということで、日本人の遺伝性疾患の研究に、日本人特有のデータベースがいかに重要かということがわかります。
一方で、アレル頻度が非常に低いSNPも大量に含まれているとも言われています。


次回では、せっかくなので、実際に中身を覗いてみます。
ホームページによると、このデータベースは日本人1208名のエクソームシーケンシングデータから発見されたアリルやジェノタイプの頻度が載っています。
他のゲノム情報データベースと比べてみますと、HapMapではサンプル270人、1000人ゲノムプロジェクトではサンプル2577人ということですので、日本人集団だけで1208人というのは、大規模に感じられます。
そのほか、データベースには信頼性の指標となりそうな、SNPをカバーできたサンプル人数や平均カバレージなどの情報が含まれていると説明されています。
これらの数字を見てみたいと思います。


HGVDについて (2) サンプル数編
HGVDについて (3) 平均depth編



データベースの名前を「Human Genome Variation Database」と記載しておりましたが、これは別のデータベースの名前でした。
正しくは「Human Genetic Variation Database」でした。
ブログをご覧くださった皆様、並びに関係者様各位にご迷惑をおかけしてしまい申し訳ございません。