アメリエフの技術ブログ

Amelieff Staff Blog

変異の絞り込み 【6】 遺伝型による絞り込み

変異の絞り込み 【1】論文紹介
変異の絞り込み 【2】変異検出
変異の絞り込み 【3】候補の絞り込み方
変異の絞り込み 【4】公開データベースを用いた候補の絞り込み
変異の絞り込み 【4.5】お詫びと訂正
変異の絞り込み 【5】変異のクオリティとインパクト



前回の記事までで、変異の公開データベース、変異のクオリティ、さらにタンパク質に与える影響(インパクト)を用いて約100,000個の変異を920個に絞り込みました。
今回は最終段階である、遺伝型による絞り込みの話です。

パキスタン家系図-トリオ


この家系では、LCA罹患者の両親(III-4、III-5)はLCAを発症していないことから、LCA関連変異は劣性遺伝していると考えられます。そこで、920個のうち両親ではヘテロ、罹患者ではホモである変異を抜き出しました。
本解析で用いているQmergeVCFは遺伝型もアノテーションしていますので、引き続きawkコマンドで抜き出しました。
その結果、疾患関連変異候補をたったの24個にまで減らすことができました。

pakistan-filter

最終的に疾患関連変異候補に残った24個はこちらです。24遺伝子一覧
上から2つめの変異が第1回でご紹介した論文中でLCAの原因遺伝子と報告されているNMNAT1遺伝子上の変異です(NMNAT1 mutations cause Leber congenital amaurosis)。

5回に分けてご紹介してきましたが、総括すると

■ dbSNPや1000人ゲノムプロジェクトなど、既知の変異の公開データベース
■ 変異のクオリティ
■ 変異がタンパク質に与えると予測されるインパクト
■ 家系情報(トリオ)

などの情報は、Exome解析により得られた大量の変異から疾患関連候補を絞り込むのに有効であることが示されました。


……と、実は連載開始時点ではここで終わる予定だったのですが、さらにあと1回続きます。
ここまでの解析では父、母、子のトリオ(それぞれIII-5、III-4、IV-1)のExomeシーケンスデータを用いていますが、論文で用いられている子(IV-1)の兄弟(LCA罹患者と非罹患者が1人ずつ)のExomeシーケンスデータも公開されています。

パキスタン家系図



トリオに加え、兄弟のExomeシーケンスデータにより得られたより詳細な家系情報を用いて、さらに絞り込みを行いました。
結果を次回でお話しします。

変異の絞り込み 【7】罹患同胞を用いた絞り込み