アメリエフの技術ブログ

Amelieff Staff Blog

HGVDについて (3) 平均depth編

HGVDについて (1)
HGVDについて (2) サンプル数編

※※ 前回の記事まで、データベースの名称を誤っておりました。ブログをご覧くださった皆様、並びに関係者様各位にご迷惑をおかけしてしまい申し訳ございません。

前の記事に引き続き、Human Genetic Variation Databaseで公開している日本人ゲノムデータの、データの確からしさの判断に使えそうな項目を見てみます。
データベースに含まれている項目の詳細については、前の記事をご参照ください。

今回は、Mean_depthについて調べてみます。
まず全SNPのMean_depthの分布のグラフを書いてみます。
HGVDのdepth(all)

depthが1〜200xのSNPが多いようです。
基本統計量を求めてみると、Mean_depthが浅いSNPもあります。
もう少し、Mean_depthの浅いSNPに注目してみるため、Mean_depthが50以下のSNPでMean_depthの分布を調べてみました。

HGVDのdepth(50以下)

全体における割合は少ないですが(2.81%)、Mean_depthが10未満のSNPが13,534個ありました。
もちろん、これはそのSNPをシーケンスしたサンプル全体における平均なので、ただdepthが浅いと判断するのではなく、サンプル数や、depthの標準偏差も見ながら判断するする必要があると思います。


以上でHGVD(Human Genetic Variation Database)についての紹介を終えたいと思います。
連載の最初にも書きましたが、人種特異的な遺伝情報のデータベースは、病気の遺伝子研究に役立つと考えられます。
これからも様々なデータベースが作られ、発達していくのが待ち遠しいですね。