アメリエフの技術ブログ

Amelieff Staff Blog

10x Genomics Long Rangerについて

前回のブログでも少し触れましたが、10x Genomicsが開発したGemCodeシステムは、ショートリードから擬似的にロングリードを生成する革新的な技術です。

今回はそのGemCodeシステムに対応したゲノム解析パイプラインLong Rangerのご紹介をしたいと思います。

今年の2月にGemCodeシステムの新機種Chromiumが発表され、先月Chromiumに対応したLong Rangerのバージョン2がリリースされました!
Long Rangerは、Whole GenomeおよびExome Sequencingに対応しています。
GemCodeシステムではilluminaのシーケンサーを使うため、BCLファイルが出力されます。
BCLファイルからFASTQへの変換は以下のコマンドを実行します。

$ longranger demux --run=/path/to/BCL/output


内部では、illuminaのbal2fastqが動いているため、あらかじめbal2fastqをインストールしておく必要があります。
出力は、リードとバーコードのFASTQファイルが分かれて出力されます。

次にこのFASTQファイルを入力として、以下のコマンドを実行すると、マッピングから変異検出、ハプロタイプフェージング、構造変異の検出を行ってくれます。

$ longranger run --id=sampleID --sex=female --fastqs=/path/to/fastqs --reference=/refdata-hg19-2.0.0


Long Rangerの変異検出はデフォルトでは、freebaysというソフトウェアを用いていますが、--vcmodeオプションでGATK(v2.4以上)で実行することができます。

Chromiumを使って調整したサンプルのシーケンスデータは、10xGenomicsのサイトで公開されています。

実際にWGSのデータ(FASTQファイル)を実行してみたところ、40時間ほどで実行が終了しました。解析には、Intelの16-coreのプロセッサー、256GBのメモリを搭載したマシンを用いました。

出力結果には、フェージング後のBAM、VCFファイルと構造変異のBEDファイルに加えて、専用のゲノムブラウザLoupeに用いる.loupeという形式のファイルも出力されます。

ゲノム解析パイプラインのLong Ranger以外にも、シングルセルRNA-seq解析パイプラインのCell Rangerやde novoアセンブリ用のSupernovaが公開されています。