アメリエフの技術ブログ

Amelieff Staff Blog

CNV解析 -CNVデータの比較-

先週から、100検体のSNPジェノタイピングアレイデータをCNV解析する方法について、少しずつ紹介してきました。
50人の患者さんから、100検体(腫瘍細胞50検体+正常細胞50検体)をそれぞれ採取したと想定して、まずサンプル99HI0698C(腫瘍細胞)のジェノタイピング結果について解析を行いました。

無事にデータが得られましたでしょうか??

3 37957465 37961253 1 99HI0698C.txt rs9837352 rs9844203 NA 3
3 75511365 75650909 1 99HI0698C.txt rs4677005 rs2004089 NA 7
3 153830172 153837935 1 99HI0698C.txt rs2203686 rs1517241 NA 6

(上の例は「CNV解析 -ファイルの形式-」で紹介した「99HI0698C.cnv.txt」の中身です)

問題はここからですね。

第一に、今はまだひとつのサンプルしか解析していませんので、残りの99検体をどう処理するかです。
複数のファイルを同時に扱うこともできるのでしょうか??
「99HI0698C.txt」と「99HI0698T.txt」の解析結果を、「99HI0698.rawcnv」に出力します。

detect_cnv.pl -test -hmm /Users/penncnv/lib/hh550.hmm -pfb /Users/penncnv/lib/hh550.hg18.pfb -log /Users/CNV/99HI0698.log -out /Users/CNV/99HI0698.rawcnv -gcmodel /Users/penncnv/lib/hhall.hg18.gcmodel 99HI0698C.txt 99HI0698T.txt


実際のデータによっては「WARNING」が表示される(99HI0698.logにも記録されます)サンプルもあると思いますので、上記の方法で一気に行うのが効率が良いかと言われると、そうでもない気がします・・。

第二に、出力されたCNVデータをどう比較するかです。
正常細胞と腫瘍細胞を比較したり、サンプル間で比較したりと、いろいろ試したいですね。

アメリエフではこれらの問題を、自動化したり独自のアルゴリズムを作成することで解決しています。

アメリエフのサービスページはこちらです。


【参考】
・PennCNV
http://www.openbioinformatics.org/penncnv/

ブログランキングに参加しています。
花の金曜日に予定のない私に、お恵みの一票をお願いします♪

医学人気ブログランキング