次世代シーケンサ解析
RNA-seqデータ解析における遺伝子発現定量と主要なデータ可視化手法とは。発現定量、正規化、主成分分析、階層的クラスタリングを通し、高次元データから生物学的知見を引き出す方法を解説します。
RNA-seqデータ解析成功の鍵は前処理にあり。FastQCでの品質評価、PRINSEQによる低品質リード除去、STARでのゲノムマッピングまで、実践的な手法と成功のポイントを解説します。
RNA-seq解析の有効なケース、メリット・デメリット、データ取得から機能解析までの全体像を解説。適切なツールと解析環境の重要性も示し、RNA-seq解析の基礎を網羅的に理解できます。
BGIシーケンサーデータに対する問い合わせが増えてきたため、Trimmomaticを使ってアダプター配列除去を行う方法をお教えします。
RNA-seqのデータから発現変動遺伝子(DEG)を経験ベイズモデルで検出するプログラムEBSeqの紹介です。多群比較においてDEGを検出する考え方と方法を丁寧に紹介します。
アラインメントファイル(BAM)から、「Depthが10以上のゲノム領域」を示す領域ファイル(BED)を作成する方法を丁寧に解説。便利なソフトウェアbedtoolsのインストール方法も紹介。
edgeR を用いたRNA-seq の発現比較において比較群を定義する時のポイント。これがコントロール群、あれが比較群だよ、とバッチリ指定しましょう!【コマンド例あり】
Linuxサーバで、ダウンロードした好きなデータベースを参照して blastnを実行する方法
シーケンスリードをゲノムにマッピングしたあと、カバレッジやデプスなどを簡単に確認する方法を紹介。samtoolsを使います。
BAM/SAMファイルのヘッダーにある項目のひとつ「PP」タグについて説明します。エラー対処法も。
DNAの変異を検出するReseq解析の最新レビューを紹介。(筆・インターンtsuyuh)
Bowtie2のdovetail機能
CUT&RUN-seqをご存知ですか。 メリット、解析上の注意点を紹介します。(執筆・インターン生hattorit)
眠ったままのデータはありませんか?アメリエフに相談して、気持ちよく年末を迎えましょう!
SnpSift filterでsnpEffの複雑に見えるアノテーション結果をフィルタします。
本日のテーマはPCR duplicateの除去について。とは? なぜするの?
「〇〇解析とは」シリーズ1。reseq解析 は、DNAの変異検出を目的とした解析です
クオリティコントロールを行う大人気ソフトウェア FastQC。結果をさくっと見るときに役立つファイルと短いコマンドを紹介します。
ペアエンドリードのデータ を2つのFASTQファイルにする方法を紹介します。① SRAから②FASTQから
アメリエフでは、下記の解析サービスを開始いたしました。 ■ tandem repeat解析 ロングリード(PacBio、Oxford Nanopore)データから、Tandem repeat数を算出します。Reference repeat countsからのズレにて報告します。 ■ Chromiumを用いたV(D)J解析 Chromi…
アメリエフでは、下記の解析サービスを新たに開始いたしました。■ MEDIPseq / MBDseq解析 ■ Neoantigen予測 ■ WGBS解析 ■ RIP-seq解析
7月の勉強会の模様をお届けします(^-^) 東京では久しぶりの晴れ空となったこの日。 テーマは 1. NGS解析頻出データフォーマット解説 2. Pythonを使ってNGSデータを自分好みのExcelにまとめる。
こんにちは。 VCF(variant call format)ファイルにおける、性染色体のgenotype表記についてご紹介します。 下に、VCFの例を示します。father、つまり男性の情報を見てみます。 fatherの列の左端に、それぞれの変異のGT(genotype、遺伝型)が載っています…
抗体のV(D)J配列のマッピングする場合には、BLASTのアルゴリズムを利用したIgBLASTはとても便利です。 しかし、FASTQファイルが使えないことや、出力結果が独自フォーマットであることなどから、扱いづらいと感じることもあります。 また、ローカルで実行す…
10/18~22はアメリカ人類遺伝学会(ASHG)2016がバンクーバーで開催されていました。 その中でBroad Institueから発表されたGenome Aggregation Database (gnomAD)について紹介したいと思います。 次世代シーケンサー(NGS)を使っている人にはお馴染みの図です…
2014年6月21日に開催した、アメリエフ株式会社・第33回バイオインフォマティクス勉強会の「フリーソフトではじめるがん体細胞変異解析入門」のスライドをSlideShareにて公開いたしました。 主に、ブログでもご紹介したことがあるソフトウェアSomaticSniperを…
融合遺伝子検出ソフトウェアは数多くありますが、ベストなソフトがないのが現状だと思います。 TopHat-FusionやdeFuse(deFuseの記事)などが有名ですが、今回はchimerascanというソフトの使い方を紹介したいと思います。 1. アノテーションデータの準備 ・UCS…
fastaフォーマットの配列行は、 FastX-toolkitのfasta_formatterを使うと、折り返す長さを変えることができます。お肌の曲がり角もコマンド一発で折り返しなしにできたらいいですね!(ちょっと何言ってるかわからない)
ある公開されているexomeデータのfastqファイルをダウンロードして解析しようとしたところ、うまくいきませんでした。 最初は何が何だかわからず困っていたのですが、fastqファイルを確認するとID行の書式がよく見かけるものと違いました。 例として、最初の…
GATKは、BAMのフォーマットに厳しく(参照ページ)、たとえばヘッダにサンプル名を含むread groupのリストがあり、かつすべてのリードがそのread groupに属しているBAMしか受け付けません。 Read group(以下RG)は、たとえばBWAではマッピングのときに -R …