読者です 読者をやめる 読者になる 読者になる

アメリエフのブログ

Amelieff Staff Blog

BWAでRNA-Seq解析

最近読んだRNA-Seqの論文をご紹介します。 Brooks MJ, Rajasimha HK, Roger JE, Swaroop A. Next-generation sequencing facilitates quantitative analysis of wild-type and Nrl(-/-) retinal transcriptomes. Mol Vis. 2011;17:3034-54. Epub 2011 Nov 23…

NCBI SRA Toolkitの使い方

NCBI SRAで公開されているデータをテストデータとして使うには、sraファイルをダウンロードした後、fastqファイルに変換する必要があります(注:fastqで公開されているものもあります)。 sra→fastq変換には、NCBIが提供しているSRA Toolkitに含まれるfastq…

BWA v0.5.xとv0.6.xの比較(2)

hatです。前回から随分開いてしまいましたが、BWA v0.5.xとv0.6.xの比較(1)のつづきです。 bwa v0.5.x系とv0.6.x系のマッピング結果の違いを、公開データを使って比較してみました。 それぞれhg19に対してマッピングして、samtools flagstatでマッピング結果…

意外と知らない?FastQCの便利オプション

hatです。 次世代シーケンシングデータのQCツールとして、一番使われているのがFastQCだと思います。 FastQCは非常に高機能なツールなのですが、「ポジションごとのクオリティスコア分布図」で、ポジション10bp以降の領域がグループ化されてしまうのだけが残…

QCの道 その4

こんにちは。detです。 今日は前回のQCの道 その3の続きです。 FASTX-Toolkitが持つ機能について、引き続き紹介いたします。 ・fastq_quality_trimmer FASTQ ファイルの各リードの 3'側から、指定したクオリティ値(qv)未満の塩基を順番に削除していきます。…

QCの道 その3

こんにちは。detです。 今日は前回のQCの道 その2の続きです。 FASTX-Toolkitが持つ機能について、引き続き紹介いたします。 ・fastx_trimmer FASTA/FASTQ ファイルの各リードの先頭から、指定した塩基数を削除して出力することができます。全てのリードの…

QCの道 その2

こんにちは。detです。 今日は前回のQCの道 その1の続きです。 まずは、FASTX-Toolkitが持つ各機能について順番に説明して行きたいと考えています。 1.インストール方法 上記のFASTX_Toolkitのウェブサイトからダウンロードページに飛ぶと、一番上に、コ…

BWA v0.5.xとv0.6.xの比較(1)

BWAの最新バージョンはv0.6.1ですが(2012年6月現在)、まだv0.5.x系をお使いの方も多いのではないでしょうか。 BWA v0.5.x系とv0.6.x系で何が違うかまとめてみました。 ■BWA v0.6.xの変更点 ・4GB以上のゲノムに対応 ・ForwardとReverseのインデックスを統…

DNAメチル化解析 その1

akbです。 本日は、DNAメチル化解析について説明したいと思います。 DNAメチル化解析の実験段階では、よくバイサルファイトと呼ばれる処理が用いられます。 バイサルファイト処理とは、メチル化されていないシトシン(非メチル化C)をウラシル(U)に変換する…

QC の道 その1

こんにちは。detです。 今日は、次世代シーケンサーから得られる生データのクオリティコントロールについて、お話したいと思います。 次世代シーケンサーから得られるデータ(例えば、Fastq形式のファイル)は、クオリティに問題があることが多いため、その後…

SAM format③

tokunagaです。 第一回目はSAM formatの概要について 第二回目はSAM formatのヘッダー部分についてお話ししました。 本日はSAM formatのアライメント部分についての説明をしたいと思います。 アライメント部分の形式は というように 「QNAME」から「QUAL」ま…

SAM format②

tokunagaです。 前回はSAM formatの概要についてお話ししました。 本日はSAM formatのヘッダーについて説明します。 ヘッダーには、シーケンスやリードグループなどのタグ情報が記述されており、以下のような形式で書かれています。 @<TAG> <TYPE>:<VA…

SAM format①

tokunagaです。 本日からはSAM formatについてです。 SAMとはSequence Alignment/Mapの略で、 次世代シーケンサー解析に用いられるformatの一つで、マッピングの結果が書かれています。 BAM formatは、このSAMファイルをバイナリ化したものです。 SAM format…

fastq format②

tokunagaです。 少し1回目と間が空いてしまいましたが、 本日はfastq formatの2回目です。 各リードの4行目に記されているqualityについて説明したいと思います。 ・Quality value 3行目に使われているquality valueは以下のように計算されています。 ・ASCI…

VCF format③

どうもakbです。 VCF formatの連載三日目です。 今日は、FORMATの"PL"について説明しようと思います。 まず、前回の復習ですが、FORMATの"GT"はGenotypeの略で 0:reference 1:alternate(sample1)のように数字に意味を持たせており、 0/0,0/1,1/1はそれぞれRE…

VCF format②

どうもakbです。 VCF formatの連載二日目です。 今日は、INFOカラムのIDとFORMATのIDの説明をします。 まずは、INFOカラムの説明です。 (例) (例) FORMATの"GT"はGenotypeの略で 0:reference 1:alternate(sample1)のように数字に意味を持たせており、 0/…

VCF format①

どうもakbです。 今日からVCF formatの連載が始まります。 さて、VCFとは (Variant Call Format)の略で、次世代シーケンサー解析に用いられるformatの一つです。 samtoolsを用いて抽出した多型情報が、VCFファイルに格納されて出力されます。 まず、VCFファ…

融合遺伝子検出ソフトウェア defuseを使ってみる【第三回】

融合遺伝子検出ソフトウェア defuseを使ってみる【第二回】のつづきです。 第一回ではデータの準備とソフトウェアのインストール、第二回では設定ファイルの編集とデータセットの作成を行いました。 今回はいよいよ融合遺伝子の検出を行います。 【第一回】 …

融合遺伝子検出ソフトウェア defuseを使ってみる【第二回】

融合遺伝子検出ソフトウェア・defuse【第一回】のつづきです。 前回は、データの準備とソフトウェアのインストールを行いました。 今回は、設定ファイルの編集とデータセットの作成を行います。 【第一回】 1. 解析データの準備 2. アノテーションデータの準…

融合遺伝子検出ソフトウェア defuseを使ってみる【第一回】

前回ご紹介した融合遺伝子検出ソフトウェア・defuseを使ってみます。 一回目の今回は、データの準備とソフトウェアのインストールを行います。 【第一回】 1. 解析データの準備 2. アノテーションデータの準備 3. ソフトウェアのインストール 【第二回】 4. …

融合遺伝子検出ソフトウェア・defuse

最近この業界でホットなキーワードの一つが、「融合遺伝子(fusion gene)」ではないでしょうか? 融合遺伝子は、体細胞ゲノムで生じたリアレンジメント部位から転写された異常な遺伝子のことで、癌との関連が注目されています。 同じ染色体上で生じる場合も…

Webinar

イルミナさんのWebinarに注目しています。 Webinarとは、Webサイト上での登録会員制オンラインセミナーです。 すでに、5回のセッションが開催されています。 2月23日にはTruSeqカスタムアンプリコンについてのセッションがあります。 見逃した方も、過去のセ…

vcfファイル

samtoolsは、次世代シーケンサデータ解析において、多型を抽出するツールとして広く使用されています。 このsamtoolsで抽出された多型情報は、“vcfファイル”のファイル形式で算出されます。 WETな先生方からよくお聞きする声の中に、 「このvcfファイルの中…

生命情報工学研究センターワークショップ 2011

1月24日から27日まで、生命情報工学研究センター(CBRC)ではBiWO2011 (Bioinformatics Week in Odaiba 2011) が開催されています。 今日は、「次世代シークエンサーのデータ解析」にフォーカスしたHPCIワークショップがあったので参加しました。 HPCI(High…

Ion Proton Sequencer

2012年1月10日(米国現地時間)、Life Technologies社がIon Protonシーケンサの先行受注を開始しました。 「1日と1000ドルでヒトゲノム解読を実現するシーケンサ」の登場です。 PGM(Ion Personal Genome Machine)の半導体シーケンシング技術を基盤としていま…

アライメント続編

先日は、bwaのアライメントアルゴリズムに関して記述しました。 本日は、その続編を記述致します。 よろしくお願い致します。 bwaでアライメントを行う際は、必ずReferenceゲノムのindex化が必要です。つまり、Suffix Arrayを作成しておく必要があります。 …

アライメントのアルゴリズム

次世代シーケンサの解析を行う際、アライメントという作業を行います。 本日は、アライメントツールとしてbwaを例にとり、アライメントのアルゴリズムに関して記述していきます。 よろしくお願いします。 bwaのInformationでは、Burrows-Wheeler Transform (…

未来に向けて。次世代シーケンサーと共に。

本日の日経産業新聞に“ITが導く医の進化論”という見出しがあり、次世代シーケンサーによる医学への貢献について特集されています。 記事には、主に下記の3つについて記載されています。 ・ここ8年で次世代シーケンスに要するコスト、時間の著しい変動をグラ…

NGSデータ解析Linuxサーバー販売開始しました

次世代シーケンサー(NGS)のデータ解析で利用するソフトには、専用ソフトやオープンソースソフトウェア、さらには自作のプログラムなど、いくつかの選択肢がありますが、自分の研究テーマにぴったりのソフトはなかなか見つからないのが現状かとおもいます。…

次世代シーケンシング結果を用いたデータ解析

本日は次世代シーケンシングのデータ解析を例として、アノテーションの方法を記述していきます。 次世代シーケンシングのデータは、まずリファレンスゲノムと比較する必要があります。 以下に大まかなデータ解析方法を記載していきます。 1. 公開されている…

アノテーション付け(入門編)について

本日は、データ解析を行っているとよく耳にする“アノテーション付け”について記していきたいと思います。よろしくお願いします。 アノテーションという言葉を調べると、“塩基配列データに遺伝子構造や遺伝子機能の情報、また文献情報などを注釈付けする事を…

次世代シーケンサーの参考動画

こんにちは。タノです。 本日は、私が次世代シーケンサーの勉強資料として参考にしている動画を紹介します。 次世代シーケンサを開発していらっしゃる各企業様のHPには、シーケンシング原理の紹介動画が掲載されています。 たとえば illumina社 http://www.i…

次世代シーケンサーのデータ解析受託サービス 2

次世代シーケンサーのデータ解析受託サービスを開始して、1年が経とうとしています。同様のサービスを行う会社さまもどんどん増えています。NGS Surfer's Wikiの次世代シーケンサー受託データ解析企業一覧だけでも、12社もの名前が挙がっていました。 そこで…

NGS勉強会@熱海に参加します!

今週末の土日(5/28〜29)に開かれるNGS現場の会 第一回研究会に参加します。 会社からは私を含め2名での参加です。 参加者は、当初予定の60人からなんと100人余りになっているそうです! しかも全員がポスター発表をしないといけないというルールまでありま…

次世代シーケンサーのデータ解析受託サービス 1

アメリエフ株式会社ホームページの 「次世代シーケンサーのデータ解析受託サービス」ページで より詳細なサービス内容をご覧いただけるようになりました。 弊社では、データ解析の受託に加え、「パイプライン構築/解析ツール開発」も承ります。研究室内に処…

BEDTools 2

以前、BEDToolsについて簡単にご紹介しましたが、今日は「BEDファイル」についてお話します。 UCSC Genome Browserではアノテーションが図のように表示されますね。 オリジナルのアノテーションを追加したいとき、BEDファイルを作成してカスタムトラックとし…

BEDTools 1

今日は、BEDToolsを簡単にご紹介いたします。 URL:http://code.google.com/p/bedtools/ BEDToolsは、NGSのデータ解析で役に立つツールです。 まず、bamToBedを使って、BAMファイルをBEDファイルに変換する作業をしてみましょう。 igvで表示すると下記のよう…

NGSデータ解析勉強会

明日は、第5回バイオインフォマティクス勉強会の日です。 今回の内容は、次世代シーケンサーのデータ解析入門です。 これまでの勉強会の内容を思い出してみると‥ 第1回 統計解析ソフトR入門 第2回 SNP解析の実践 第3回 ゲノムマップのviewer 第4回 バイオ研…

DDBJ Sequence Read Archive (DRA) 3

DRASearch http://trace.ddbj.nig.ac.jp/DRASearch/ で、オブジェクトごとにAccession番号のついたリストを表示できると紹介しました。 ちなみに、オブジェクトごとにAccession番号のプレフィックスが異なります。 DRA : Submission(登録者など) DRP : S…

NGSデータ解析勉強会の準備中

今週末23日(土)に行われる「バイオインフォマティクス勉強会 次世代シーケンサーのデータ解析入門」の準備をしています。 おかげさまで増席後も満席となっておりますので、期待の大きさに少々プレッシャーを感じつつも、自分たちが行っているNGSのデータ解析…

DDBJ Sequence Read Archive (DRA) 2

DRASeqarch http://trace.ddbj.nig.ac.jp/DRASearch/ で欲しいデータを検索しましょう! Statisticsを眺めると、どのくらいの数のどんなデータがどのように管理されているか、概要をつかむ事が出来ます。 「Released Entries」の各Typeをクリックすると、Acc…

DDBJ Sequence Read Archive (DRA) 1

「試しに、次世代シーケンサーで得られたデータの解析をしたいなぁ」 という時、皆さまはどうしていますか?? 日本にいる皆さまは、ココ↓↓↓ DDBJ Sequence Read Archive (DRA) http://trace.ddbj.nig.ac.jp/dra/index.shtml から、データをダウンロードして…

Next Generation Sequencing Platforms「第四世代シーケンサー5」

Ion Personal Genome Machine (PGM™) sequencerについて、この場を借りて、簡単にメモしたいと思います。 ・原理について 半導体チップ上の各ウェルでシーケンシングが行われる。 ヌクレオチドがポリメラーゼによってDNA鎖に取り込まれる時に、副産物として…

Next Generation Sequencing Platforms「第四世代シーケンサー4」

Life Technologies社が、12月14日にIon Personal Genome Machine (PGM™) sequencerの発売を開始しましたね。 製品紹介には、3つのポイントが大きく書いてありました。 ・scalability massively scalable semiconductor technology ・simplicity natural bio…

Next Generation Sequencing Platforms「第三世代シーケンサー4」

Next Generation Sequencing Platforms「第三世代シーケンサー」として PACBIO RSについて少し書きました。 Next Generation Sequencing Platforms「第三世代シーケンサー1」 Next Generation Sequencing Platforms「第三世代シーケンサー2」 Next Generatio…

Next Generation Sequencing Platforms「第四世代シーケンサー3」

今日は、Ion Torrent SystemsのPostLight sequencing technologyについて紹介したいと思います。 チップは、CMOS(complementary metal-oxide semiconductor:相補型金属酸化膜半導体)という半導体のチップを使用します。 CMOS(シーモスと呼ぶらしい)構造は…

Next Generation Sequencing Platforms「第四世代シーケンサー2」

Ion Torrent Systemsのシーケンサーについて書こうと思います。 ケミカルデータを直接デジタルデータに変換するため、第三世代シーケンサーでは重要な技術であったカメラ/レーザー/スキャンが要らないのです。 そのため第四世代シーケンサーで使われている技…

Next Generation Sequencing Platforms「第四世代シーケンサー1」

キムです。皆さまこんにちは。 今日は、オフィス家具の搬入やPCの設置などで、 経理のスタッフさんと大わらわでした。 とりあえずは、床に転がっている物はなくなったので、 分子生物学会に出張している山口さんに顔向けできそうです(笑) 昨日まで、第三世代…

Next Generation Sequencing Platforms「第三世代シーケンサー3」

先週、PACBIO RSのSMRT(Single Molecule Real Time)シーケンシングを実現するための3つの技術革新とシーケンスオプションについて少し書きました。 彼らは、 ・flushing, scanning, washingステップが不要 ・PCR増幅が不要 ・長いシーケンス長(平均1000b…

Next Generation Sequencing Platforms「第三世代シーケンサー2」

昨日から、PACBIO RSについて書いています。 テンプレートとなるSMRTbell libraryは、DNAサンプルの両端でループ状になるアダプターをライゲーションすることで作成されます。シーケンスオプションは下記の通り。 ・Standard sequencing 標準的なシーケンシ…