先日、連鎖解析の為のフリーツールソフトMerlinについて記述致しました
(こちらに関する記事はコチラ)。
MerlinではInput ファイルとしてpedファイル、datファイル、mapファイルが必要です。
本日は、pedファイルのファイル形式を記述致します。
■pedファイル(pedigreeファイル)
pedファイルでは、1検体(サンプル)の情報を1行で表します。
基本構成は下記の5列です。
1列目:a family ID(家系の識別名)
2列目:an individual ID(個々のサンプルID)
3列目:a link to Father ID (if available)
(父親がサンプル内にある場合は父親のindividual IDを記述)
4列目:a link to Mother ID (if available)
(母親がサンプル内にある場合は母親のindividual IDを記述)
5列目:an individual's sex.
(個々のサンプルの性別、1=male, 2=female, 0=unknown)
基本構成以降の記述の順番は、比較的自由です(記載の順番は、datファイルに反映されますが、こちらに関しては、次回記述します)。
今回は、Merlinのtutorialに従って記述します。
6列目:an affection status
(1=unaffecteds, 2=affecteds, 0=missing)
7列目:quantitative trait
(量的形質)
8列目以降:各アレルに対するgenotype
詳細はコチラ!
次回は、datファイルおよびmapファイルに関して記述します。