アメリエフの技術ブログ

Amelieff Staff Blog

CNV解析 -CNV領域を決定する1-

100検体のSNPジェノタイピングアレイデータを、CNV統計解析ソフト「PennCNV」を使って、解析していきたいと思います。
50人の患者さんから、100検体(腫瘍細胞50検体+正常細胞50検体)をそれぞれ採取したと考えます。
まず、サンプル99HI0698C(腫瘍細胞)のジェノタイピング結果について解析を行います。

細かい流れは、こちらの図をご覧ください。

1.入力するデータファイル「signal intensity file」の作成
ファイル名は「99HI0698C.txt」で、CNVフォルダに配置しました。
Name Chr Position 99HI0698C.GType 99HI0698C.Log R Ratio 99HI0698C.B Allele Freq
rs13072188 3 38411 AA 0.1042794 0
rs9681213 3 41894 BB 0.07361082 0.9804617
rs1516321 3 57010 AA 0.06956207 0.01255646
rs1400176 3 70973 BB -0.2123737 0.9924203
         :
         :
(上の例はexampleフォルダのfather.txtの中身です)

2.CNV解析の実行
以下のコマンドを入力します。
$ detect_cnv.pl -test -hmm /Users/penncnv/lib/hh550.hmm -pfb /Users/penncnv/lib/hh550.hg18.pfb -log /Users/CNV/99HI0698C.log -out /Users/CNV/99HI0698C.rawcnv -gcmodel /Users/penncnv/lib/hh550.hg18.gcmodel 99HI0698C.txt


3.出力されるデータ
プログラムを実行したフォルダに、「99HI0698C.log」と「99HI0698C.rawcnv」がちゃんと作成されましたか??
chr3:37957465-37961253 numsnp=3 length=3,789 state2,cn=1 99HI0698C.txt startsnp=rs9837352 endsnp=rs9844203
chr3:75511365-75650909 numsnp=7 length=139,545 state2,cn=1 99HI0698C.txt startsnp=rs4677005 endsnp=rs2004089
chr3:153830172-153837935 numsnp=6 length=7,764 state2,cn=1 99HI0698C.txt startsnp=rs2203686 endsnp=rs1517241
chr11:81181640-81194909 numsnp=9 length=13,270 state2,cn=1 99HI0698C.txt startsnp=rs7947005 endsnp=rs12293984
         :
         :

来週は、コマンドの内容と、出力結果を詳しく見ていきます。