アメリエフの技術ブログ

Amelieff Staff Blog

datファイルとmapファイルfor Merlin

先日、連鎖解析ツールソフトMerlinのInput ファイルの一つであるpedファイルに関して記述致しました(詳細はコチラ)。
本日は、datファイルとmapファイルのファイル形式を記述致します。

■datファイル(Describing the pedigree file)
datファイルは、pedファイルの基本構成以降(6列目以降)が何を表すのかという情報を記載するファイルです。
例えば、先日のブログに記載した順で行くと、基本構成以降は、下記のようになります。

 6列目: affection情報
 7列目: 量的形質情報
 8列目: SNP1に対するgenotype
 9列目: SNP2に対するgenotype
 ・・・・

datファイルでは、上記の情報をエンコードを用いて表します。
まずdatファイルのエンコードを下記に記します。

 M: SNP位置およびSNP名(マーカー)
 A: 疾患の状態
 T: 量的形質
 C: 共変量

datファイルの構成は、pedファイルの6列目から順に
“エンコード 名前”
という風に、行で区切って記載していきます。

つまり上記のpedファイル情報からdatファイルを作成すると・・・

 A  AFFECTION (ここは自由にaffection名を記入してください)
 T  trait
 M  SNP1
 M  SNP2
 ・・・

となります!

■mapファイル
続いてmapファイルです。
Mapファイルは、datファイルに記載したSNP1の位置が記載されているファイルです。

ファイル構成は下記に記します。

 1列目: 染色体番号
 2列目: datファイルで記載したSNP名
 3列目: 2列目のSNPの位置(単位はセンチモルガンで!)

です!
詳細はコチラ