アメリエフの技術ブログ

Amelieff Staff Blog

Eigenstratで主成分分析〜ファイルを変換〜

昨日は、eigenstratに必要なファイルとその形式を記述致しました。
本日は、それらのファイルをeigenstrat用に変換する方法を記述します。
よろしくお願いします。

ここでeigenstratに必要なファイルを再度下記に記します。
 ・pedファイル
 ・pedindファイル
 ・pedsnpファイル

今回は、eigenstratのCONVERTFディレクトリ内に付属しているexampleファイルを用います。
 ・example.ped
 ・example.pedind
 ・example.pedsnp

上記のファイルをeigenstrat用に変換するためには、CONVERTFディレクトリ内にあるpar.PED.EIGENSTRATのファイル内を書きなおす必要があります。
※CONVERTFディレクトリ以外のディレクトリで使用する際は、このファイルをpedファイル等があるディレクトリ内にコピーしておきましょう。
※今回はeigenstratに付属されているファイルを使用するため、変更はしていません。

par.PED.EIGENSTRATファイル内は下記のようになっています。

   genotypename: example.ped
   snpname: example.pedsnp # or example.map, either works
   indivname: example.pedind # or example.ped, either works
   outputformat: EIGENSTRAT
   genotypeoutname: example.geno
   snpoutname: example.snp
   indivoutname: example.ind
   familynames: NO

変更箇所は以下の通りです。

 Input用変更箇所(準備したファイル名を記入します)
   Genotypename:pedファイル名
   Snpname:pedsnpファイル名
   Indivname:pedindファイル名

 Output用変更箇所
   Outputformatは変更せず。
   Genotypeoutname:output名.geno
   Snpoutname:output名..snp
   Indivoutname:output名..ind
   Familynames:ある場合は記述し、ない場合は“NO”

par.PED.EIGENSTRATファイル変更後、CONVERTFディレクトリ内で
   ../bin/convertf -p par.PED.EIGENSTRAT

とタイプしましょう。するとeiganstrat用のファイル
   example.geno
   example.ind
   example.snp
が作成されます!