アメリエフのブログ

Amelieff Staff Blog

次世代シーケンサ解析

変異の絞り込み 【4.5】 訂正とお詫び

変異の絞り込み 【1】論文紹介 変異の絞り込み 【2】変異検出 変異の絞り込み 【3】候補の絞り込み方 変異の絞り込み 【4】公開データベースを用いた候補の絞り込み 第4回の記事の訂正です。 公開データベースを用いた絞り込みの例として、QmergeVCFでdbSNP…

変異の絞り込み 【4】 公開データベースを用いた候補の絞り込み

変異の絞り込み 【1】論文紹介 変異の絞り込み 【2】変異検出 変異の絞り込み 【3】候補の絞り込み方 前回は、疾患関連変異候補の絞り込みの概要についてご説明しました。 今回の記事では、その絞り込みを実際にはどのように行うのか、ご紹介します。 絞り込…

アダプタ除去ソフトの比較

シーケンシングデータをFastQCなどでチェックしていると アダプタ配列が混入しているのを見つけることがあります。 アダプタ除去ソフトウェアはいろいろありますが 今回は以下の3ソフトウェアの使い方をご紹介します。 cutadapt FastX-Toolkit(fastxclipper…

bwa のバージョン検討 その1

最も広く利用されているマッピングソフトの一つにbwaがあります。bwaは2011年にリリースされたバージョン0.6が広く使用されてきましたが、今年の2月末にバージョン0.7がリリースされました。0.7ではBWA-backtrack、BWA-SW、BWA-MEMの、三種類のアルゴリズム…

変異の絞り込み 【3】 候補の絞り込み方

変異の絞り込み 【1】論文紹介 変異の絞り込み 【2】変異検出 前回は、LCA患者とその両親のトリオのfastqデータをダウンロードし、変異検出まで行いました。 今回は、主題である疾患関連変異候補の絞り込みについてお話します。 絞り込みの流れは、以下の通…

変異の絞り込み 【2】 変異検出

変異の絞り込み 【1】論文紹介 前回は、exome sequencingによりある家系においてレーバー先天黒内障(LCA)を引き起こしている原因変異を特定した論文についてご紹介しました。 今回は、その論文で使用されたデータから、変異検出を行った結果についてご紹介…

変異の絞り込み 【1】

今回は、次世代シーケンサーを用いて検出した変異の絞り込み解析の具体例についてご紹介したいと思います。 次世代シーケンサーを用いた解析の難点のひとつに、多数の変異が検出されるため、目的の疾患に関連した遺伝子の探索が困難であることが挙げられます…

Exome家系解析論文

Plos Oneに出ていたExome家系解析の論文をご紹介します。 Wu CC, Lin YH, Lu YC, Chen PJ, Yang WS, Hsu CJ, Chen PL. Application of massively parallel sequencing to genetic diagnosis in multiplex families with idiopathic sensorineural hearing im…

ソフトウェア結果比較【BAMソート編・2】

ソフトウェア結果比較【BAMソート編・1】のつづきです。 前回、同じBAMをsamtools sortとSortSam.jar(picard)でソートしたところ、結果のBAMが異なりました。 異なる箇所を調べるため、まず結果BAMをsamtools view -hでSAMに変換しました。 【samtools sort…

「Reseq解析GUIマニュアル」を公開しました

本日は、弊社が slide share に新しく公開した「次世代シーケンス解析サーバー Reseq解析GUIマニュアル」をご紹介いたします。 この資料は、弊社で販売しております次世代シーケンスデータ解析サーバーのマニュアルの一部です。 Linux上であってもWindowsと…

snpEffデータベースの作成方法

snpEffとは、SNVやIndelなどの変異にアノテーション付けをしてくれるソフトの事です。 既に広く解析されている生物種の場合は、snpEff内にアノテーションのデータベースが揃っていますが、多少マニアックなものだとデータベースが無い場合もあります。その際…

miRNA-Seq解析の論文

最近のPLoS Oneに載っていたmiRNA-Seqの論文をご紹介します。 Bansal A, et al. Discovery and Validation of Barrett's Esophagus MicroRNA Transcriptome by Next Generation Sequencing. PLoS One. 2013;8(1):e54240. Epub 2013 Jan 23. PubMed PMID: 233…

次世代シーケンスデータ解析サーバーのHPをリニューアルしました

弊社では研究目的に合わせてお選びいただける、下記の2つの解析サーバーをご用意しております。 ☆スタンダード ☆エンタープライズ 2つのサーバーはCPU、メモリ、ストレージ、冷却システムなどの性能に違いがありますが、最も特徴的な差は、サーバーによって…

NGSの「顔」

チャーノフの顔グラフは、多次元のデータを「顔」のパーツの大きさや配置にあてはめて視覚的に示す手法です。 群馬大・青木繁伸先生が公開されている、Rによるチャーノフの顔グラフ描画プログラムを使って、次世代シーケンサーの「顔」を描いてみました。 こ…

1000 人ゲノムプロジェクトJPT データの活用⑦

皆様、こんにちは。detです。今回は、前回に引き続きまして、日本人全ゲノムシーケンスデータの解析についてご紹介いたします。 解析には、弊社製の Reseq パイプラインを用いました。前回は、データのクリーニング結果について、ご紹介しました。今回は、マ…

1000 人ゲノムプロジェクトJPT データの活用⑥

皆様、こんにちは。detです。今回は、前回までの1000人ゲノムプロジェクトJPTデータの解析からは少し離れまして、日本人の全ゲノムシーケンスデータに関する解析についてご紹介いたします。 2012年7月31日に慶応大の富田先生の全ゲノムが 日本DNAデータバン…

1000 人ゲノムプロジェクトJPT データの活用⑤

皆様、こんにちは。detです。前回に引き続きまして、1000人ゲノムプロジェクトJPTデータの解析に関する記事を書かせていただきます。 今回は、1000人ゲノムJPTサンプルのデータ解析結果から得られたアレル頻度分布と、他の人種におけるアレル頻度分布を比較…

1000 人ゲノムプロジェクトJPT データの活用④

皆様、こんにちは。detです。前回に引き続きまして、1000人ゲノムプロジェクトJPTデータの解析に関する記事を書かせていただきます。 前回は1000人ゲノムJPTサンプルのデータ解析から得られた、88人の多型情報をまとめたVCFファイルについてご紹介いたしまし…

1000 人ゲノムプロジェクトJPT データの活用③

皆様、こんにちは。detです。前回に引き続きまして、1000人ゲノムプロジェクトJPTデータの解析に関する記事を書かせていただきます。 前回は88人の1000ゲノムJPTサンプルに対して、Reseq パイプラインでデータ解析した結果から、リードのクリーニング結果と…

1000 人ゲノムプロジェクトJPT データの活用②

皆様、こんにちは。detです。 akbさんに引き続きまして、1000人ゲノムプロジェクトJPTデータの解析に関する記事を書かせていただきます。 前回の記事の目的に従いまして、今回は、1000人ゲノムのデータベースに含まれる100程度の日本人サンプルから88サンプ…

1000 人ゲノムプロジェクトJPT データの活用①

akbです。 「日本人類遺伝学会 第57回大会」に出展いたしました。 弊社のポスター発表、ならびにブースまで足を運んでくださった皆さま方に、この場をかりて厚く御礼申し上げます。 本日から「日本人類遺伝学会 第57回大会」で発表させていただいたポスター…

BWAでRNA-Seq解析

最近読んだRNA-Seqの論文をご紹介します。 Brooks MJ, Rajasimha HK, Roger JE, Swaroop A. Next-generation sequencing facilitates quantitative analysis of wild-type and Nrl(-/-) retinal transcriptomes. Mol Vis. 2011;17:3034-54. Epub 2011 Nov 23…

NCBI SRA Toolkitの使い方

NCBI SRAで公開されているデータをテストデータとして使うには、sraファイルをダウンロードした後、fastqファイルに変換する必要があります(注:fastqで公開されているものもあります)。 sra→fastq変換には、NCBIが提供しているSRA Toolkitに含まれるfastq…

BWA v0.5.xとv0.6.xの比較(2)

hatです。前回から随分開いてしまいましたが、BWA v0.5.xとv0.6.xの比較(1)のつづきです。 bwa v0.5.x系とv0.6.x系のマッピング結果の違いを、公開データを使って比較してみました。 それぞれhg19に対してマッピングして、samtools flagstatでマッピング結果…

意外と知らない?FastQCの便利オプション

hatです。 次世代シーケンシングデータのQCツールとして、一番使われているのがFastQCだと思います。 FastQCは非常に高機能なツールなのですが、「ポジションごとのクオリティスコア分布図」で、ポジション10bp以降の領域がグループ化されてしまうのだけが残…

QCの道 その4

こんにちは。detです。 今日は前回のQCの道 その3の続きです。 FASTX-Toolkitが持つ機能について、引き続き紹介いたします。 ・fastq_quality_trimmer FASTQ ファイルの各リードの 3'側から、指定したクオリティ値(qv)未満の塩基を順番に削除していきます。…

QCの道 その3

こんにちは。detです。 今日は前回のQCの道 その2の続きです。 FASTX-Toolkitが持つ機能について、引き続き紹介いたします。 ・fastx_trimmer FASTA/FASTQ ファイルの各リードの先頭から、指定した塩基数を削除して出力することができます。全てのリードの…

QCの道 その2

こんにちは。detです。 今日は前回のQCの道 その1の続きです。 まずは、FASTX-Toolkitが持つ各機能について順番に説明して行きたいと考えています。 1.インストール方法 上記のFASTX_Toolkitのウェブサイトからダウンロードページに飛ぶと、一番上に、コ…

BWA v0.5.xとv0.6.xの比較(1)

BWAの最新バージョンはv0.6.1ですが(2012年6月現在)、まだv0.5.x系をお使いの方も多いのではないでしょうか。 BWA v0.5.x系とv0.6.x系で何が違うかまとめてみました。 ■BWA v0.6.xの変更点 ・4GB以上のゲノムに対応 ・ForwardとReverseのインデックスを統…

DNAメチル化解析 その1

akbです。 本日は、DNAメチル化解析について説明したいと思います。 DNAメチル化解析の実験段階では、よくバイサルファイトと呼ばれる処理が用いられます。 バイサルファイト処理とは、メチル化されていないシトシン(非メチル化C)をウラシル(U)に変換する…