アメリエフの技術ブログ

Amelieff Staff Blog

次世代シーケンサ解析

TrimmomaticによるBGISEQデータのアダプター配列除去方法について

BGIシーケンサーデータに対する問い合わせが増えてきたため、Trimmomaticを使ってアダプター配列除去を行う方法をお教えします。

EBSeqの使い方(三群以上の多群比較)

RNA-seqのデータから発現変動遺伝子(DEG)を経験ベイズモデルで検出するプログラムEBSeqの紹介です。多群比較においてDEGを検出する考え方と方法を丁寧に紹介します。

BAMから、depth10以上の領域を示すbedを作る方法【bedtoolsの使い方】

アラインメントファイル(BAM)から、「Depthが10以上のゲノム領域」を示す領域ファイル(BED)を作成する方法を丁寧に解説。便利なソフトウェアbedtoolsのインストール方法も紹介。

edgeRにおける比較グループ指定の方法

edgeR を用いたRNA-seq の発現比較において比較群を定義する時のポイント。これがコントロール群、あれが比較群だよ、とバッチリ指定しましょう!【コマンド例あり】

Linuxサーバでblastnを実行する・ダウンロード方法

Linuxサーバで、ダウンロードした好きなデータベースを参照して blastnを実行する方法

samtools coverage

シーケンスリードをゲノムにマッピングしたあと、カバレッジやデプスなどを簡単に確認する方法を紹介。samtoolsを使います。

bamファイルのPPタグ

BAM/SAMファイルのヘッダーにある項目のひとつ「PP」タグについて説明します。エラー対処法も。

Reseq解析 2021アップデート

DNAの変異を検出するReseq解析の最新レビューを紹介。(筆・インターンtsuyuh)

鳥のしっぽ

Bowtie2のdovetail機能

ChIP-seqに代わる技術 CUT&RUN

CUT&RUN-seqをご存知ですか。 メリット、解析上の注意点を紹介します。(執筆・インターン生hattorit)

データの大掃除はいかが?

眠ったままのデータはありませんか?アメリエフに相談して、気持ちよく年末を迎えましょう!

snpEffとSnpSiftのfilter

SnpSift filterでsnpEffの複雑に見えるアノテーション結果をフィルタします。

リシーケンス解析でのPCR duplicateの扱い

本日のテーマはPCR duplicateの除去について。とは? なぜするの?

reseq 解析超入門

「〇〇解析とは」シリーズ1。reseq解析 は、DNAの変異検出を目的とした解析です

FastQCをたくさんかけたら・・・| FASTQのクオリティコントロール

クオリティコントロールを行う大人気ソフトウェア FastQC。結果をさくっと見るときに役立つファイルと短いコマンドを紹介します。

FASTQをペアリードに分割する

ペアエンドリードのデータ を2つのFASTQファイルにする方法を紹介します。① SRAから②FASTQから

受託解析サービスに新ラインナップを追加しました!

アメリエフでは、下記の解析サービスを開始いたしました。 ■ tandem repeat解析 ロングリード(PacBio、Oxford Nanopore)データから、Tandem repeat数を算出します。Reference repeat countsからのズレにて報告します。 ■ Chromiumを用いたV(D)J解析 Chromi…

受託解析サービスに新ラインナップを追加しました!

アメリエフでは、下記の解析サービスを新たに開始いたしました。■ MEDIPseq / MBDseq解析 ■ Neoantigen予測 ■ WGBS解析 ■ RIP-seq解析

第49回バイオインフォマティクス勉強会を開催しました

7月の勉強会の模様をお届けします(^-^) 東京では久しぶりの晴れ空となったこの日。 テーマは 1. NGS解析頻出データフォーマット解説 2. Pythonを使ってNGSデータを自分好みのExcelにまとめる。

性染色体のgenotype

こんにちは。 VCF(variant call format)ファイルにおける、性染色体のgenotype表記についてご紹介します。 下に、VCFの例を示します。father、つまり男性の情報を見てみます。 fatherの列の左端に、それぞれの変異のGT(genotype、遺伝型)が載っています…

IgBLASTのラッパーMiGMAP

抗体のV(D)J配列のマッピングする場合には、BLASTのアルゴリズムを利用したIgBLASTはとても便利です。 しかし、FASTQファイルが使えないことや、出力結果が独自フォーマットであることなどから、扱いづらいと感じることもあります。 また、ローカルで実行す…

ASHG2016でgnomADが公開

10/18~22はアメリカ人類遺伝学会(ASHG)2016がバンクーバーで開催されていました。 その中でBroad Institueから発表されたGenome Aggregation Database (gnomAD)について紹介したいと思います。 次世代シーケンサー(NGS)を使っている人にはお馴染みの図です…

Somatic SNV検出編

2014年6月21日に開催した、アメリエフ株式会社・第33回バイオインフォマティクス勉強会の「フリーソフトではじめるがん体細胞変異解析入門」のスライドをSlideShareにて公開いたしました。 主に、ブログでもご紹介したことがあるソフトウェアSomaticSniperを…

chimerascanで融合遺伝子を検出する

融合遺伝子検出ソフトウェアは数多くありますが、ベストなソフトがないのが現状だと思います。 TopHat-FusionやdeFuse(deFuseの記事)などが有名ですが、今回はchimerascanというソフトの使い方を紹介したいと思います。 1. アノテーションデータの準備 ・UCS…

fastaの折り返し位置を変える

fastaフォーマットの配列行は、 FastX-toolkitのfasta_formatterを使うと、折り返す長さを変えることができます。お肌の曲がり角もコマンド一発で折り返しなしにできたらいいですね!(ちょっと何言ってるかわからない)

fastqのIDの書式の話

ある公開されているexomeデータのfastqファイルをダウンロードして解析しようとしたところ、うまくいきませんでした。 最初は何が何だかわからず困っていたのですが、fastqファイルを確認するとID行の書式がよく見かけるものと違いました。 例として、最初の…

bamにread groupを追記する

GATKは、BAMのフォーマットに厳しく(参照ページ)、たとえばヘッダにサンプル名を含むread groupのリストがあり、かつすべてのリードがそのread groupに属しているBAMしか受け付けません。 Read group(以下RG)は、たとえばBWAではマッピングのときに -R …

SeqCap Epi連載[5]|BSMAP methratio.pyでメチル化検出

先日鈴鹿サーキットに初めて行ってきた久保(kubor)です。レーシングカーのスピードもさることながら、時の流れも早いもので、僕がアメリエフに入社して2ヶ月が経ちました。これからもどうぞ、よろしくお願いいたします。 さて、SeqCap Epi連載第5回目の今…

VCFのフォーマットに関するブログ記事について

先日、VCF format③の記事に一部誤りがあるとご指摘を受け、記述を訂正いたしました。 VCFのGTに関する解釈についての部分です。 VCFのフォーマットのGTやPLの解釈については、こちらのページ、GTとPLの関係についてはGATKのガイドを参照しています。 当ブロ…

SeqCap Epi連載[4]|BSMAPでバイサルファイトシーケンスのマッピング

「Trick or treat!!シーケンシングデータをくれないといたずらしちゃうぞ!!」 ということで記事執筆時の今日はハロウィンですが、ジャック・オ・ランタンはいままで作ったことがない久保です(kubor)。新しい解析方法を試してみたいけど、最適な公開データ…