融合遺伝子検出ソフトウェア defuseを使ってみる【第二回】のつづきです。
第一回ではデータの準備とソフトウェアのインストール、第二回では設定ファイルの編集とデータセットの作成を行いました。
今回はいよいよ融合遺伝子の検出を行います。
【第一回】
1. 解析データの準備
2. アノテーションデータの準備
3. ソフトウェアのインストール
【第二回】
4. 設定ファイルの編集
5. データセットの作成
【第三回】
6. 融合遺伝子予測
6. 融合遺伝子予測
defuseのscriptsディレクトリにあるdefuse.plを実行します。
この際、以下のオプションを指定します。
-c config.txtファイルのパス
-d 解析データ(Fastqファイル)があるディレクトリのパス
-o 結果を出力するディレクトリのパス
-p 実行プロセス数(指定しなければ1)
◆実行例
$ perl /usr/local/defuse-0.5.0/scripts/defuse.pl ¥
-c /home/hat/test_defuse/config.txt ¥
-d /home/hat/test_defuse/read ¥
-o /home/hat/test_defuse/out -p 2
-oで指定したディレクトリに結果が出力されます。
たくさんのファイルが出力されますが、重要なのは以下の3ファイルになります。
・result.tsv
予測された融合遺伝子です。1行が1融合を示します。
・result.classify.tsv
result.tsvにprobability列を追加したものです。
・result.filtered.tsv
config.txtで指定したprobability_thresholdで、result.tsvをフィルタリングしたものです。
result.filtered.tsvの例を見てみましょう。
各遺伝子の染色体番号・染色体上の座標・向き、融合の位置・ロケーション(coding, UTR, intron, 上流下流など)、probabilityなどが記載されています。
本当に融合遺伝子らしいものがどれか、各情報で絞り込みを行ってください。
出力結果の詳しい説明はdeFuse manualをご参照ください。
これは第一回でご紹介した、融合遺伝子 TMPRSS2-ERGが入っているデータに対してdeFuseを実行した結果なのですが、ちゃんとTMPRSS2遺伝子-ERG遺伝子間の融合が予測できています。
これでdeFuseの記事は終わりです。お疲れ様でした!
無事に実行できましたでしょうか?
融合遺伝子解析が癌研究のさらなる発展につながることを期待しています。
ご注意
・本記事ではヒトの解析例を示します。同等の情報を用意できれば他の生物種でも実行可能と思われます。
・データを置く場所・ソフトウェアのインストール先などは、お使いの環境にあわせて読み替えてください。
・defuseは現時点の最新版(0.5.0)を使用しました。