これまでにMerlinに必要なInputファイル形式に関して記述して参りました。
本日は、Merlinを用いてパラメトリック解析を行いたいと思います。
よろしくお願いします。
今回は、Merlinの“exampleフォルダ”内に付属しています
・parametric.ped
・parametric.dat
・parametric.map
を用います。
ダウンロードはこちらから。
まずは、pedファイルとdatファイルに矛盾がないか、
間違いがないか確認を行います。
pedstats -d parametric.dat -p parametric.ped
-d ; datファイル
-p;pedファイル
下記に結果(数か所を抜粋)を記します。
PEDIGREE STRUCTURE
==================
Individuals: 16
Founders: 5 founders, 11 nonfounders
Gender: 6 females, 10 males
Families: 1
↑
入力した家系情報が合っているか確認します。
※もし、pedファイルの情報とdatファイルの情報(量)に
差異がある場合はエラーを返してくれます。
AFFECTION STATISTICS
====================
[Diagnostics] [Founders] Prevalence
VERY_RARE_DISEA 16 100.0% 5 100.0% 50.0%
Total 16 100.0% 5 100.0%
↑
羅病の割合は合っていますかー。
次にLODスコアを算出します。
パラメトリック解析を行う際は、optional inputファイルとして
modelファイルというものが必要となります。
Modelファイル形式
1列目:affection名
(datファイルのAエンコードと名前を合わせる)
2列目:疾患アレルの頻度
3列目:浸透率(0, 1 and 2 copies of the disease allele)
4列目: モデル名(自由に)
merlin -d parametric.dat -p parametric.ped -m parametric.map
-model parametric.model --step 1
-m;mapファイル
-model;modelファイル
--step n;LODスコアを算出する際にMarkerをnつ飛ばし。
結果は
Parametric Analysis, Model Dominant_Model
=========================================
POSITION LOD ALPHA HLOD
5.000 -13.302 0.000 0.000
10.000 -4.227 0.000 0.000
15.000 -17.29 0.000 0.000
20.000 -3.270 0.000 0.000
25.000 -5.809 0.000 0.000
・・・
というようにLODスコアを得ます。
オプションコマンドの詳細はコチラ。