次世代シーケンサ解析
Bowtie2のdovetail機能
CUT&RUN-seqをご存知ですか。 メリット、解析上の注意点を紹介します。(執筆・インターン生hattorit)
眠ったままのデータはありませんか?アメリエフに相談して、気持ちよく年末を迎えましょう!
SnpSift filterでsnpEffの複雑に見えるアノテーション結果をフィルタします。
本日のテーマはPCR duplicateの除去について。とは? なぜするの?
「〇〇解析とは」シリーズ1。reseq解析 は、DNAの変異検出を目的とした解析です
クオリティコントロールを行う大人気ソフトウェア FastQC。結果をさくっと見るときに役立つファイルと短いコマンドを紹介します。
ペアエンドリードのデータ を2つのFASTQファイルにする方法を紹介します。① SRAから②FASTQから
アメリエフでは、下記の解析サービスを開始いたしました。 ■ tandem repeat解析 ロングリード(PacBio、Oxford Nanopore)データから、Tandem repeat数を算出します。Reference repeat countsからのズレにて報告します。 ■ Chromiumを用いたV(D)J解析 Chromi…
アメリエフでは、下記の解析サービスを新たに開始いたしました。■ MEDIPseq / MBDseq解析 ■ Neoantigen予測 ■ WGBS解析 ■ RIP-seq解析
7月の勉強会の模様をお届けします(^-^) 東京では久しぶりの晴れ空となったこの日。 テーマは 1. NGS解析頻出データフォーマット解説 2. Pythonを使ってNGSデータを自分好みのExcelにまとめる。
こんにちは。 VCF(variant call format)ファイルにおける、性染色体のgenotype表記についてご紹介します。 下に、VCFの例を示します。father、つまり男性の情報を見てみます。 fatherの列の左端に、それぞれの変異のGT(genotype、遺伝型)が載っています…
抗体のV(D)J配列のマッピングする場合には、BLASTのアルゴリズムを利用したIgBLASTはとても便利です。 しかし、FASTQファイルが使えないことや、出力結果が独自フォーマットであることなどから、扱いづらいと感じることもあります。 また、ローカルで実行す…
10/18~22はアメリカ人類遺伝学会(ASHG)2016がバンクーバーで開催されていました。 その中でBroad Institueから発表されたGenome Aggregation Database (gnomAD)について紹介したいと思います。 次世代シーケンサー(NGS)を使っている人にはお馴染みの図です…
2014年6月21日に開催した、アメリエフ株式会社・第33回バイオインフォマティクス勉強会の「フリーソフトではじめるがん体細胞変異解析入門」のスライドをSlideShareにて公開いたしました。 主に、ブログでもご紹介したことがあるソフトウェアSomaticSniperを…
融合遺伝子検出ソフトウェアは数多くありますが、ベストなソフトがないのが現状だと思います。 TopHat-FusionやdeFuse(deFuseの記事)などが有名ですが、今回はchimerascanというソフトの使い方を紹介したいと思います。 1. アノテーションデータの準備 ・UCS…
fastaフォーマットの配列行は、 FastX-toolkitのfasta_formatterを使うと、折り返す長さを変えることができます。お肌の曲がり角もコマンド一発で折り返しなしにできたらいいですね!(ちょっと何言ってるかわからない)
ある公開されているexomeデータのfastqファイルをダウンロードして解析しようとしたところ、うまくいきませんでした。 最初は何が何だかわからず困っていたのですが、fastqファイルを確認するとID行の書式がよく見かけるものと違いました。 例として、最初の…
GATKは、BAMのフォーマットに厳しく(参照ページ)、たとえばヘッダにサンプル名を含むread groupのリストがあり、かつすべてのリードがそのread groupに属しているBAMしか受け付けません。 Read group(以下RG)は、たとえばBWAではマッピングのときに -R …
先日鈴鹿サーキットに初めて行ってきた久保(kubor)です。レーシングカーのスピードもさることながら、時の流れも早いもので、僕がアメリエフに入社して2ヶ月が経ちました。これからもどうぞ、よろしくお願いいたします。 さて、SeqCap Epi連載第5回目の今…
先日、VCF format③の記事に一部誤りがあるとご指摘を受け、記述を訂正いたしました。 VCFのGTに関する解釈についての部分です。 VCFのフォーマットのGTやPLの解釈については、こちらのページ、GTとPLの関係についてはGATKのガイドを参照しています。 当ブロ…
「Trick or treat!!シーケンシングデータをくれないといたずらしちゃうぞ!!」 ということで記事執筆時の今日はハロウィンですが、ジャック・オ・ランタンはいままで作ったことがない久保です(kubor)。新しい解析方法を試してみたいけど、最適な公開データ…
学生時代ですと今頃の時期は、実験圃場のイネの刈り取り時期を気にしている頃ですが、今年は来月の学会の準備ばかりを気にしているバイオインフォマティクス事業部の久保(kubor)です。 さて、3回目のSeqCap Epi連載ですが、今回からはまだアメリエフブログ…
前回に引き続き、SeqCap Epi連載の第2回です。 今回は、SeqCap Epiによる実験データをどのように解析していくのか、ご紹介いたします。用いるソフトはすべてオープンソースのフリーウェアです。 このパイプラインでは、SeqCap Epi CpGiant Enrichment Kit(…
DNAのメチル化解析手法はこれまでマイクロアレイや、リアルタイムPCRを使用したものがありましたが、どれも解析可能なゲノム範囲に限りがありました。 しかし、NGS(次世代シーケンサー)を使用するSeqCap Epi CpGiant Enrichment Kit(ロシュ・ダイアグノス…
次世代シーケンサ解析では、リファレンスゲノムやbamファイルなど、サイズの大きなファイルを扱う必要があります。 大きなファイルには扱う前にインデックス(目次)を作成することがしばしばあります。多くのソフトはインデックスファイルがないと動きませ…
RNA-Seqを何度も実行している弊社の某社員が、先日 「bowtie、tophat、cufflinksの名前が紳士関連なのに気づいた」 と言っていたので「気づくの遅っ」と思ったのですが、 私には二十歳を過ぎてからサザエさんの登場人物名が海産物関係である ことに気付いた…
SomaticSniperについての続きです。 SomaticSniperを実際に動かしてみます。 SomaticSniperはCentOSでも問題なく動作しますが、Ubuntuでの使用が推奨されています。 基本的な実行コマンドは下の通りになります。 必要なファイルは腫瘍サンプルと、ペアとなる…
以前、heshiさんがSomatic Mutationを検出するツールについてのブログ記事を書かれましたが、そのうちSomaticSniperについて少しご紹介します。 ・論文:(SomaticSniper: identification of somatic point mutations in whole genome sequencing data. Bioin…
先日、構造多型を解析するツールについてご紹介しました。 (Paired-end/Split-read/Complex) これらのツールの一部は、解析の際、シーケンスデータのinsert sizeの入力が必要です。 自ら実験して得たデータならinsert sizeはわかると思いますが、公共のデー…