アメリエフの技術ブログ

Amelieff Staff Blog

1000 人ゲノムプロジェクトJPT データの活用⑤

 皆様、こんにちは。detです。前回に引き続きまして、1000人ゲノムプロジェクトJPTデータの解析に関する記事を書かせていただきます。

 今回は、1000人ゲノムJPTサンプルのデータ解析結果から得られたアレル頻度分布と、他の人種におけるアレル頻度分布を比較した結果をご紹介いたします。比較には、1000 genome project が公開している下記のデータを利用しました。
1092サンプルの多型情報をまとめたVCFファイル
 このデータには人種毎のアレル頻度も記載されているため、今回の比較において有用であると判断しました。それでは、比較した結果を下の図に示します。
 
 濃い青色の線が、弊社で解析した1000人ゲノムJPTサンプルのアレル頻度分布であり、それ以外の線が公開VCFファイルの人種毎のアレル頻度分布になります。JPTとEast Asians(※)の分布が、他の人種に比べて比較的似ているのが分かります。つまり、欧米人とアジア人ではリファレンスゲノム上での多型の分布や、頻度が異なる可能性が高いことが分かります。このことは、日本人ゲノムのデータ解析をする際に、日本人のリファレンスゲノムに基づいたデータ解析が必要であることを示しているのかもしれません。

※East Asiansに含まれる人種:CHB(Han Chinese in Bejing), JPT(Japanese in Tokyo), CHS(Southern Han Chinese)

 次回からは、1000人ゲノムから少し離れて、日本人全ゲノムシーケンスデータ(慶応大冨田先生のデータ)の解析についてご紹介いたします。

-----関連記事-----
1000 人ゲノムプロジェクトJPT データの活用④
1000 人ゲノムプロジェクトJPT データの活用③
1000 人ゲノムプロジェクトJPT データの活用②
1000 人ゲノムプロジェクトJPT データの活用①