次世代シーケンサ解析
BGIシーケンサーデータに対する問い合わせが増えてきたため、Trimmomaticを使ってアダプター配列除去を行う方法をお教えします。
RNA-seqのデータから発現変動遺伝子(DEG)を経験ベイズモデルで検出するプログラムEBSeqの紹介です。多群比較においてDEGを検出する考え方と方法を丁寧に紹介します。
アラインメントファイル(BAM)から、「Depthが10以上のゲノム領域」を示す領域ファイル(BED)を作成する方法を丁寧に解説。便利なソフトウェアbedtoolsのインストール方法も紹介。
edgeR を用いたRNA-seq の発現比較において比較群を定義する時のポイント。これがコントロール群、あれが比較群だよ、とバッチリ指定しましょう!【コマンド例あり】
Linuxサーバで、ダウンロードした好きなデータベースを参照して blastnを実行する方法
シーケンスリードをゲノムにマッピングしたあと、カバレッジやデプスなどを簡単に確認する方法を紹介。samtoolsを使います。
BAM/SAMファイルのヘッダーにある項目のひとつ「PP」タグについて説明します。エラー対処法も。
DNAの変異を検出するReseq解析の最新レビューを紹介。(筆・インターンtsuyuh)
Bowtie2のdovetail機能
CUT&RUN-seqをご存知ですか。 メリット、解析上の注意点を紹介します。(執筆・インターン生hattorit)
眠ったままのデータはありませんか?アメリエフに相談して、気持ちよく年末を迎えましょう!
SnpSift filterでsnpEffの複雑に見えるアノテーション結果をフィルタします。
本日のテーマはPCR duplicateの除去について。とは? なぜするの?
「〇〇解析とは」シリーズ1。reseq解析 は、DNAの変異検出を目的とした解析です
クオリティコントロールを行う大人気ソフトウェア FastQC。結果をさくっと見るときに役立つファイルと短いコマンドを紹介します。
ペアエンドリードのデータ を2つのFASTQファイルにする方法を紹介します。① SRAから②FASTQから
アメリエフでは、下記の解析サービスを開始いたしました。 ■ tandem repeat解析 ロングリード(PacBio、Oxford Nanopore)データから、Tandem repeat数を算出します。Reference repeat countsからのズレにて報告します。 ■ Chromiumを用いたV(D)J解析 Chromi…
アメリエフでは、下記の解析サービスを新たに開始いたしました。■ MEDIPseq / MBDseq解析 ■ Neoantigen予測 ■ WGBS解析 ■ RIP-seq解析
7月の勉強会の模様をお届けします(^-^) 東京では久しぶりの晴れ空となったこの日。 テーマは 1. NGS解析頻出データフォーマット解説 2. Pythonを使ってNGSデータを自分好みのExcelにまとめる。
こんにちは。 VCF(variant call format)ファイルにおける、性染色体のgenotype表記についてご紹介します。 下に、VCFの例を示します。father、つまり男性の情報を見てみます。 fatherの列の左端に、それぞれの変異のGT(genotype、遺伝型)が載っています…
抗体のV(D)J配列のマッピングする場合には、BLASTのアルゴリズムを利用したIgBLASTはとても便利です。 しかし、FASTQファイルが使えないことや、出力結果が独自フォーマットであることなどから、扱いづらいと感じることもあります。 また、ローカルで実行す…
10/18~22はアメリカ人類遺伝学会(ASHG)2016がバンクーバーで開催されていました。 その中でBroad Institueから発表されたGenome Aggregation Database (gnomAD)について紹介したいと思います。 次世代シーケンサー(NGS)を使っている人にはお馴染みの図です…
2014年6月21日に開催した、アメリエフ株式会社・第33回バイオインフォマティクス勉強会の「フリーソフトではじめるがん体細胞変異解析入門」のスライドをSlideShareにて公開いたしました。 主に、ブログでもご紹介したことがあるソフトウェアSomaticSniperを…
融合遺伝子検出ソフトウェアは数多くありますが、ベストなソフトがないのが現状だと思います。 TopHat-FusionやdeFuse(deFuseの記事)などが有名ですが、今回はchimerascanというソフトの使い方を紹介したいと思います。 1. アノテーションデータの準備 ・UCS…
fastaフォーマットの配列行は、 FastX-toolkitのfasta_formatterを使うと、折り返す長さを変えることができます。お肌の曲がり角もコマンド一発で折り返しなしにできたらいいですね!(ちょっと何言ってるかわからない)
ある公開されているexomeデータのfastqファイルをダウンロードして解析しようとしたところ、うまくいきませんでした。 最初は何が何だかわからず困っていたのですが、fastqファイルを確認するとID行の書式がよく見かけるものと違いました。 例として、最初の…
GATKは、BAMのフォーマットに厳しく(参照ページ)、たとえばヘッダにサンプル名を含むread groupのリストがあり、かつすべてのリードがそのread groupに属しているBAMしか受け付けません。 Read group(以下RG)は、たとえばBWAではマッピングのときに -R …
先日鈴鹿サーキットに初めて行ってきた久保(kubor)です。レーシングカーのスピードもさることながら、時の流れも早いもので、僕がアメリエフに入社して2ヶ月が経ちました。これからもどうぞ、よろしくお願いいたします。 さて、SeqCap Epi連載第5回目の今…
先日、VCF format③の記事に一部誤りがあるとご指摘を受け、記述を訂正いたしました。 VCFのGTに関する解釈についての部分です。 VCFのフォーマットのGTやPLの解釈については、こちらのページ、GTとPLの関係についてはGATKのガイドを参照しています。 当ブロ…
「Trick or treat!!シーケンシングデータをくれないといたずらしちゃうぞ!!」 ということで記事執筆時の今日はハロウィンですが、ジャック・オ・ランタンはいままで作ったことがない久保です(kubor)。新しい解析方法を試してみたいけど、最適な公開データ…