アメリエフの技術ブログ

Amelieff Staff Blog

Phased vs. Unphased

VCFファイルの一番右側には、以下のようにジェノタイプ情報が記されています。

----------------------------------------
#CHROM POS ID REF ALT QUAL FILTER INFO FORMAT NA00001 NA00002 NA00003
20 14370 rs6054257 G A 29 PASS NS=3;DP=14;AF=0.5;DB;H2 GT:GQ:DP:HQ 0|0:48:1:51,51 1|0:48:8:51,51 1/1:43:5:.,.
----------------------------------------

このジェノタイプ情報が、パイプ(|)で区切られている場合とスラッシュ(/)で区切られている場合があります。例えば、1|0とか0/1のように。
今までこの違いを意識したことはなかったのですが、どうやらちゃんとしたルールがあるようです。

"|"で区切られているデータは、フェーズされている(Phasedな)データ
"/"で区切られているデータは、フェーズされていない(Unphasedな)データ
といいます。

詳細は1000人ゲノムプロジェクトのWebページで解説されています。
http://www.1000genomes.org/node/101