このページではlinux環境にTrinityをインストールする方法を記載しています。
Trinityとは
de novo transcriptomeアセンブリング(リファレンス配列のない生物遺伝子を構築する)ツールです。
アルゴリズム
Trinityは以下のInchworm -> Chrysalis -> Butterflyの順にアルゴリズムが動作します。これらの詳細については以下をご覧ください。
Inchworm
k-mer ベースでcontigを生成します。メモリを大量に消費します。
Chrysalis
Inchwormで作成されたcontigから似ている配列を集め、選択的スプライシングやパラログのような配列をクラスター化します。そのcontig部分を基にde Bruijn graph(ド・ブラングラフ)を作成します。 de Bruijn graphに関する良質な記事: http://hoxo-m.hatenablog.com/entry/20100930/p1
Butterfly
Chrysalisでまとめられたcontigをもとにgraphを精査し、全体の再構築を行います。
事前準備
必要マシンスペック
1M(100万)ベースペアあたり1G(10億)bのメモリが必要です。
必須ソフトウェア
Trinityの実行には以下の3つのソフトウェアが必要です。
ディレクトリ構成
ホームディレクトリ直下(~/)にsrcとbinを作っておきます。
/src...パッケージ等を解凍したものの置き場所。
/bin...実行ファイル置き場。
のように置き場所を決めておくと便利です。
インストール
適当な場所にtrinitynaseq-Trinity-v2.8.4.tar.gzをダウンロードします。 以下コマンドで解凍します。
tar xvzf trinitynaseq-Trinity-v2.8.4.tar.gz
解凍したものを~/srcディレクトリに配置します。
mv trinitynaseq-Trinity-v2.8.4 ~/src/
~/src配下に置いたTrinityのインストールディレクトリに移動します。
cd ~/src/trinitynaseq-Trinity-v2.8.4
makeします。
make make plugins
必要であれば --prefix=
オプションでインストール先を変更することができます。
vimで.bashrcに追記します。
export PATH="$HOME/bin:$PATH" export TRINITY_HOME="$HOME/bin"
シェルを再起動するか、
source .bashrc
で環境変数を反映させます。 最後に~/binにTrinityへのシンボリックリンクを貼ります。
ln -s $HOME/src/trinitynaseq-Trinity-v2.8.4/Trinity $HOME/bin
これで、どの場所からでも
Trinity
コマンド一つでTrinityを起動できるようになりました。