アメリエフの技術ブログ

Amelieff Staff Blog

PLINKの使い方2

これまで何回か、SNP統計解析ソフトPLINKについて書きました。
QTL解析2(2番目の記事)
PLINKの使い方1
今日は、コマンドのオプションについて書きたいと思います。
ファイルのinput/outputに関するオプションを何個か紹介します。

1.PEDファイル作成(拡張子「.ped」)
縦にサンプル情報、横にSNPごとのGenotypeが並ぶファイルです。
基本のカラム数は7つです。
1 Family ID
2 Individual ID
3 Paternal ID
4 Maternal ID
5 SEX
6 affection status
7.. Genotype

データや血縁関係が無いサンプルの場合、下記のようにPEDファイルに入力しても動きます。
1 Family ID = サンプル名
2 Individual ID = 1
3 Paternal ID = 0
4 Maternal ID = 0
5 SEX = 0
6 affection status
7.. Genotype

オプションでも対応できます。
--no-fid
説明:PED file does not contain column 1 (family ID)
--no-parents
説明:PED file does not contain columns 3,4 (parents)
--no-sex
説明:PED file does not contain column 5 (sex)
上記の3つのオプションを使う場合、カラム数は3つです。
1 Individual ID
2 affection status
3.. Genotype

2.MAPとPEDの書式を確認
ファイル名は
PEDファイル    :study1.ped
MAPファイル    :study1.map
ということで説明していきます。

PEDファイル(カラム数7つ)の時は

plink --file study1


PEDファイル(カラム数3つ)の時はオプションを付けて、

plink --file study1 --no-fid --no-parents --no-sex --allow-no-sex

他にもいろいろオプションを設定します。

【参考】
・PLINK
http://pngu.mgh.harvard.edu/~purcell/plink/index.shtml