アメリエフの技術ブログ

Amelieff Staff Blog

Eigenstratで主成分分析〜必要なファイル〜

本日は、eigenstratに必要なファイルを紹介させていただきます。
eigenstratでは、下記の3つのファイルが必要となります。
・pedファイル
・pedindファイル
・pedsnpファイル

pedファイルの形式は、plinkやmerlinのものとほとんど一緒です。
  1列目: Family ID
  2列目: sample ID
  3列目: Father ID
  4列目: Mother ID
  5列目: sex(male=1, female=2)
  6列目:case-control(control=1, case=2) 
  ※ここは、affection情報でも良いです。
  7列目以降:genotype
pedindファイルは、pedファイルの1列目から6列目までをsample毎に各行に設置します。

pedsnpファイル形式は、plinkやmerlinのmapファイルの様なものです。
  1列目: chromosome number
  2列目: snp name
  3列目: genetic position (Morgan)
  4列目: physical position (bp)
が必須です。

5列目は、optionalです。
  5列目: alleles(reference variant)

上記のファイルをeigenstratを用いて、eigenstrat用のファイル形式に変更します。