アメリエフの技術ブログ

Amelieff Staff Blog

Trinityのインストール

このページではlinux環境にTrinityをインストールする方法を記載しています。

Trinityとは

de novo transcriptomeアセンブリング(リファレンス配列のない生物遺伝子を構築する)ツールです。

github.com

アルゴリズム

Trinityは以下のInchworm -> Chrysalis -> Butterflyの順にアルゴリズムが動作します。これらの詳細については以下をご覧ください。

Inchworm

k-mer ベースでcontigを生成します。メモリを大量に消費します。

Chrysalis

Inchwormで作成されたcontigから似ている配列を集め、選択的スプライシングやパラログのような配列をクラスター化します。そのcontig部分を基にde Bruijn graph(ド・ブラングラフ)を作成します。 de Bruijn graphに関する良質な記事: http://hoxo-m.hatenablog.com/entry/20100930/p1

Butterfly

Chrysalisでまとめられたcontigをもとにgraphを精査し、全体の再構築を行います。

事前準備

必要マシンスペック

1M(100万)ベースペアあたり1G(10億)bのメモリが必要です。

必須ソフトウェア

Trinityの実行には以下の3つのソフトウェアが必要です。

ディレクトリ構成

ホームディレクトリ直下(~/)にsrcとbinを作っておきます。

/src...パッケージ等を解凍したものの置き場所。
/bin...実行ファイル置き場。

のように置き場所を決めておくと便利です。

インストール

適当な場所にtrinitynaseq-Trinity-v2.8.4.tar.gzをダウンロードします。 以下コマンドで解凍します。

tar xvzf trinitynaseq-Trinity-v2.8.4.tar.gz

解凍したものを~/srcディレクトリに配置します。

mv trinitynaseq-Trinity-v2.8.4 ~/src/

~/src配下に置いたTrinityのインストールディレクトリに移動します。

cd ~/src/trinitynaseq-Trinity-v2.8.4

makeします。

make
make plugins

必要であれば --prefix=オプションでインストール先を変更することができます。
vimで.bashrcに追記します。

export PATH="$HOME/bin:$PATH"
export TRINITY_HOME="$HOME/bin"

シェルを再起動するか、

source .bashrc

で環境変数を反映させます。 最後に~/binにTrinityへのシンボリックリンクを貼ります。

ln -s $HOME/src/trinitynaseq-Trinity-v2.8.4/Trinity $HOME/bin

これで、どの場所からでも

Trinity

コマンド一つでTrinityを起動できるようになりました。