融合遺伝子検出ソフトウェアは数多くありますが、ベストなソフトがないのが現状だと思います。
TopHat-FusionやdeFuse(deFuseの記事)などが有名ですが、今回はchimerascanというソフトの使い方を紹介したいと思います。
1. アノテーションデータの準備
・UCSCからヒトリファレンスゲノム(hg19)をダウンロードして、解凍します。染色体のFASTAファイルのみ(chr1.fa〜chrY.fa )を1ファイルにマージします。
・UCSCからヒトトランスクリプトームのデータをダウンロードして、解凍します。chimerascanのダウンロードリストからダウンロードすることもできます。
2. ソフトウェアのインストール
・chimerascanからソースコードをダウンロードして解凍します。
・chimerasanのディレクトリにあるsetup.pyを使ってコンパイルします。
・chimerascan_index.pyでchimerascanのインデックスを作成します。
インデックスの作成にはbowtie-buildを使うのでパスを通しておく必要があります。
これで、ソフトウェアの準備ができました。
3. ソフトウェアの実行
chimerascanのディレクトリには、ヒト前立腺癌のRNA-Seqデータ(Fastqファイル)があり、融合遺伝子 TMPRSS2-ERG が含まれています。
これを用いた場合、以下のように実行できます。
$ python /usr/local/bin/chimerascan_run.py -v --quals solexa /home/genome/hg19/chimerascan/ /usr/local/src/chimerascan-0.4.5/tests/vcap_pe_53bp/TMPRSS2-ERG_1.fq /usr/local/src/chimerascan-0.4.5/tests/vcap_pe_53bp/TMPRSS2-ERG_2.fq output_dir
outputに生成されたchimerascan.bedpeからhtmlを作成することもできます。
$ python /usr/local/src/chimerascan-0.4.5/chimerascan/tools/chimerascan_html_table.py --read-throughs -o chimeras.html chimeras.bedpe
chimerascanは実行までの準備が比較的簡単だと思うので、ぜひ試してみてください。