アメリエフの技術ブログ

Amelieff Staff Blog

Merlinでパラメトリック解析

これまでにMerlinに必要なInputファイル形式に関して記述して参りました。
本日は、Merlinを用いてパラメトリック解析を行いたいと思います。
よろしくお願いします。

今回は、Merlinの“exampleフォルダ”内に付属しています
・parametric.ped
・parametric.dat
・parametric.map
を用います。
ダウンロードはこちらから

まずは、pedファイルとdatファイルに矛盾がないか、
間違いがないか確認を行います。

pedstats -d parametric.dat -p parametric.ped

-d ; datファイル
-p;pedファイル

下記に結果(数か所を抜粋)を記します。
PEDIGREE STRUCTURE
==================
Individuals: 16
Founders: 5 founders, 11 nonfounders
Gender: 6 females, 10 males
Families: 1


入力した家系情報が合っているか確認します。
※もし、pedファイルの情報とdatファイルの情報(量)に
差異がある場合はエラーを返してくれます。

AFFECTION STATISTICS
====================
[Diagnostics] [Founders] Prevalence
VERY_RARE_DISEA 16 100.0% 5 100.0% 50.0%
Total 16 100.0% 5 100.0%

羅病の割合は合っていますかー。

次にLODスコアを算出します。
パラメトリック解析を行う際は、optional inputファイルとして
modelファイルというものが必要となります。

Modelファイル形式
1列目:affection名
   (datファイルのAエンコードと名前を合わせる)
2列目:疾患アレルの頻度
3列目:浸透率(0, 1 and 2 copies of the disease allele)
4列目: モデル名(自由に)

merlin -d parametric.dat -p parametric.ped -m parametric.map
-model parametric.model --step 1

-m;mapファイル
-model;modelファイル
--step n;LODスコアを算出する際にMarkerをnつ飛ばし。

結果は
Parametric Analysis, Model Dominant_Model
=========================================
   POSITION   LOD    ALPHA   HLOD
    5.000   -13.302   0.000   0.000
    10.000   -4.227   0.000   0.000
    15.000   -17.29   0.000   0.000
    20.000   -3.270   0.000   0.000
    25.000   -5.809   0.000   0.000
・・・

というようにLODスコアを得ます。
オプションコマンドの詳細はコチラ