アメリエフの技術ブログ

Amelieff Staff Blog

chimerascanで融合遺伝子を検出する

融合遺伝子検出ソフトウェアは数多くありますが、ベストなソフトがないのが現状だと思います。
TopHat-FusionやdeFuse(deFuseの記事)などが有名ですが、今回はchimerascanというソフトの使い方を紹介したいと思います。

1. アノテーションデータの準備


・UCSCからヒトリファレンスゲノム(hg19)をダウンロードして、解凍します。染色体のFASTAファイルのみ(chr1.fa〜chrY.fa )を1ファイルにマージします。

・UCSCからヒトトランスクリプトームのデータをダウンロードして、解凍します。chimerascanのダウンロードリストからダウンロードすることもできます。

2. ソフトウェアのインストール


chimerascanからソースコードをダウンロードして解凍します。

・chimerasanのディレクトリにあるsetup.pyを使ってコンパイルします。

・chimerascan_index.pyでchimerascanのインデックスを作成します。
インデックスの作成にはbowtie-buildを使うのでパスを通しておく必要があります。

これで、ソフトウェアの準備ができました。

3. ソフトウェアの実行


chimerascanのディレクトリには、ヒト前立腺癌のRNA-Seqデータ(Fastqファイル)があり、融合遺伝子 TMPRSS2-ERG が含まれています。
これを用いた場合、以下のように実行できます。

$ python /usr/local/bin/chimerascan_run.py -v --quals solexa /home/genome/hg19/chimerascan/ /usr/local/src/chimerascan-0.4.5/tests/vcap_pe_53bp/TMPRSS2-ERG_1.fq /usr/local/src/chimerascan-0.4.5/tests/vcap_pe_53bp/TMPRSS2-ERG_2.fq output_dir



outputに生成されたchimerascan.bedpeからhtmlを作成することもできます。

$ python /usr/local/src/chimerascan-0.4.5/chimerascan/tools/chimerascan_html_table.py --read-throughs -o chimeras.html chimeras.bedpe



chimerascanは実行までの準備が比較的簡単だと思うので、ぜひ試してみてください。