アメリエフの技術ブログ

Amelieff Staff Blog

次世代シーケンサ解析

snpEffデータベースの作成方法

snpEffとは、SNVやIndelなどの変異にアノテーション付けをしてくれるソフトの事です。 既に広く解析されている生物種の場合は、snpEff内にアノテーションのデータベースが揃っていますが、多少マニアックなものだとデータベースが無い場合もあります。その際…

miRNA-Seq解析の論文

最近のPLoS Oneに載っていたmiRNA-Seqの論文をご紹介します。 Bansal A, et al. Discovery and Validation of Barrett's Esophagus MicroRNA Transcriptome by Next Generation Sequencing. PLoS One. 2013;8(1):e54240. Epub 2013 Jan 23. PubMed PMID: 233…

次世代シーケンスデータ解析サーバーのHPをリニューアルしました

弊社では研究目的に合わせてお選びいただける、下記の2つの解析サーバーをご用意しております。 ☆スタンダード ☆エンタープライズ 2つのサーバーはCPU、メモリ、ストレージ、冷却システムなどの性能に違いがありますが、最も特徴的な差は、サーバーによって…

NGSの「顔」

チャーノフの顔グラフは、多次元のデータを「顔」のパーツの大きさや配置にあてはめて視覚的に示す手法です。 群馬大・青木繁伸先生が公開されている、Rによるチャーノフの顔グラフ描画プログラムを使って、次世代シーケンサーの「顔」を描いてみました。 こ…

1000 人ゲノムプロジェクトJPT データの活用⑦

皆様、こんにちは。detです。今回は、前回に引き続きまして、日本人全ゲノムシーケンスデータの解析についてご紹介いたします。 解析には、弊社製の Reseq パイプラインを用いました。前回は、データのクリーニング結果について、ご紹介しました。今回は、マ…

1000 人ゲノムプロジェクトJPT データの活用⑥

皆様、こんにちは。detです。今回は、前回までの1000人ゲノムプロジェクトJPTデータの解析からは少し離れまして、日本人の全ゲノムシーケンスデータに関する解析についてご紹介いたします。 2012年7月31日に慶応大の富田先生の全ゲノムが 日本DNAデータバン…

1000 人ゲノムプロジェクトJPT データの活用⑤

皆様、こんにちは。detです。前回に引き続きまして、1000人ゲノムプロジェクトJPTデータの解析に関する記事を書かせていただきます。 今回は、1000人ゲノムJPTサンプルのデータ解析結果から得られたアレル頻度分布と、他の人種におけるアレル頻度分布を比較…

1000 人ゲノムプロジェクトJPT データの活用④

皆様、こんにちは。detです。前回に引き続きまして、1000人ゲノムプロジェクトJPTデータの解析に関する記事を書かせていただきます。 前回は1000人ゲノムJPTサンプルのデータ解析から得られた、88人の多型情報をまとめたVCFファイルについてご紹介いたしまし…

1000 人ゲノムプロジェクトJPT データの活用③

皆様、こんにちは。detです。前回に引き続きまして、1000人ゲノムプロジェクトJPTデータの解析に関する記事を書かせていただきます。 前回は88人の1000ゲノムJPTサンプルに対して、Reseq パイプラインでデータ解析した結果から、リードのクリーニング結果と…

1000 人ゲノムプロジェクトJPT データの活用②

皆様、こんにちは。detです。 akbさんに引き続きまして、1000人ゲノムプロジェクトJPTデータの解析に関する記事を書かせていただきます。 前回の記事の目的に従いまして、今回は、1000人ゲノムのデータベースに含まれる100程度の日本人サンプルから88サンプ…

1000 人ゲノムプロジェクトJPT データの活用①

akbです。 「日本人類遺伝学会 第57回大会」に出展いたしました。 弊社のポスター発表、ならびにブースまで足を運んでくださった皆さま方に、この場をかりて厚く御礼申し上げます。 本日から「日本人類遺伝学会 第57回大会」で発表させていただいたポスター…

BWAでRNA-Seq解析

最近読んだRNA-Seqの論文をご紹介します。 Brooks MJ, Rajasimha HK, Roger JE, Swaroop A. Next-generation sequencing facilitates quantitative analysis of wild-type and Nrl(-/-) retinal transcriptomes. Mol Vis. 2011;17:3034-54. Epub 2011 Nov 23…

NCBI SRA Toolkitの使い方

NCBI SRAで公開されているデータをテストデータとして使うには、sraファイルをダウンロードした後、fastqファイルに変換する必要があります(注:fastqで公開されているものもあります)。 sra→fastq変換には、NCBIが提供しているSRA Toolkitに含まれるfastq…

BWA v0.5.xとv0.6.xの比較(2)

hatです。前回から随分開いてしまいましたが、BWA v0.5.xとv0.6.xの比較(1)のつづきです。 bwa v0.5.x系とv0.6.x系のマッピング結果の違いを、公開データを使って比較してみました。 それぞれhg19に対してマッピングして、samtools flagstatでマッピング結果…

意外と知らない?FastQCの便利オプション

hatです。 次世代シーケンシングデータのQCツールとして、一番使われているのがFastQCだと思います。 FastQCは非常に高機能なツールなのですが、「ポジションごとのクオリティスコア分布図」で、ポジション10bp以降の領域がグループ化されてしまうのだけが残…

QCの道 その4

こんにちは。detです。 今日は前回のQCの道 その3の続きです。 FASTX-Toolkitが持つ機能について、引き続き紹介いたします。 ・fastq_quality_trimmer FASTQ ファイルの各リードの 3'側から、指定したクオリティ値(qv)未満の塩基を順番に削除していきます。…

QCの道 その3

こんにちは。detです。 今日は前回のQCの道 その2の続きです。 FASTX-Toolkitが持つ機能について、引き続き紹介いたします。 ・fastx_trimmer FASTA/FASTQ ファイルの各リードの先頭から、指定した塩基数を削除して出力することができます。全てのリードの…

QCの道 その2

こんにちは。detです。 今日は前回のQCの道 その1の続きです。 まずは、FASTX-Toolkitが持つ各機能について順番に説明して行きたいと考えています。 1.インストール方法 上記のFASTX_Toolkitのウェブサイトからダウンロードページに飛ぶと、一番上に、コ…

BWA v0.5.xとv0.6.xの比較(1)

BWAの最新バージョンはv0.6.1ですが(2012年6月現在)、まだv0.5.x系をお使いの方も多いのではないでしょうか。 BWA v0.5.x系とv0.6.x系で何が違うかまとめてみました。 ■BWA v0.6.xの変更点 ・4GB以上のゲノムに対応 ・ForwardとReverseのインデックスを統…

DNAメチル化解析 その1

akbです。 本日は、DNAメチル化解析について説明したいと思います。 DNAメチル化解析の実験段階では、よくバイサルファイトと呼ばれる処理が用いられます。 バイサルファイト処理とは、メチル化されていないシトシン(非メチル化C)をウラシル(U)に変換する…

QC の道 その1

こんにちは。detです。 今日は、次世代シーケンサーから得られる生データのクオリティコントロールについて、お話したいと思います。 次世代シーケンサーから得られるデータ(例えば、Fastq形式のファイル)は、クオリティに問題があることが多いため、その後…

SAM format③

tokunagaです。 第一回目はSAM formatの概要について 第二回目はSAM formatのヘッダー部分についてお話ししました。 本日はSAM formatのアライメント部分についての説明をしたいと思います。 アライメント部分の形式は というように 「QNAME」から「QUAL」ま…

SAM format②

tokunagaです。 前回はSAM formatの概要についてお話ししました。 本日はSAM formatのヘッダーについて説明します。 ヘッダーには、シーケンスやリードグループなどのタグ情報が記述されており、以下のような形式で書かれています。 @<TAG> <TYPE>:<VA…

SAM format①

tokunagaです。 本日からはSAM formatについてです。 SAMとはSequence Alignment/Mapの略で、 次世代シーケンサー解析に用いられるformatの一つで、マッピングの結果が書かれています。 BAM formatは、このSAMファイルをバイナリ化したものです。 SAM format…

fastq format②

tokunagaです。 少し1回目と間が空いてしまいましたが、 本日はfastq formatの2回目です。 各リードの4行目に記されているqualityについて説明したいと思います。 ・Quality value 3行目に使われているquality valueは以下のように計算されています。 ・ASCI…

VCF format③

どうもakbです。 VCF formatの連載三日目です。 今日は、FORMATの"PL"について説明しようと思います。 まず、前回の復習ですが、FORMATの"GT"はGenotypeの略で 0:reference 1:alternate(sample1)のように数字に意味を持たせており、 0/0,0/1,1/1はそれぞれRE…

VCF format②

どうもakbです。 VCF formatの連載二日目です。 今日は、INFOカラムのIDとFORMATのIDの説明をします。 まずは、INFOカラムの説明です。 (例) (例) FORMATの"GT"はGenotypeの略で 0:reference 1:alternate(sample1)のように数字に意味を持たせており、 0/…

VCF format①

どうもakbです。 今日からVCF formatの連載が始まります。 さて、VCFとは (Variant Call Format)の略で、次世代シーケンサー解析に用いられるformatの一つです。 samtoolsを用いて抽出した多型情報が、VCFファイルに格納されて出力されます。 まず、VCFファ…

融合遺伝子検出ソフトウェア defuseを使ってみる【第三回】

融合遺伝子検出ソフトウェア defuseを使ってみる【第二回】のつづきです。 第一回ではデータの準備とソフトウェアのインストール、第二回では設定ファイルの編集とデータセットの作成を行いました。 今回はいよいよ融合遺伝子の検出を行います。 【第一回】 …

融合遺伝子検出ソフトウェア defuseを使ってみる【第二回】

融合遺伝子検出ソフトウェア・defuse【第一回】のつづきです。 前回は、データの準備とソフトウェアのインストールを行いました。 今回は、設定ファイルの編集とデータセットの作成を行います。 【第一回】 1. 解析データの準備 2. アノテーションデータの準…