アメリエフの技術ブログ

Amelieff Staff Blog

バイオインフォマティクス

bamファイルのPPタグ

BAM/SAMファイルのヘッダーにある項目のひとつ「PP」タグについて説明します。エラー対処法も。

sedコマンドで染色体名を変更する

LInuxのsedコマンドでbedファイル内の染色体名を変更する方法

single cell RNA-Seqデータから コピー数変異を予測

がん細胞のシングルセルRNA-seq データからCNV コピー数変異を予測するプログラムの紹介です。図の見方も説明。

VCFファイルをPythonで扱う(cyvcf2の紹介)

VCFを分析できるPythonモジュール・cyvcf2の紹介です⭐️

2020年分子生物学会年会バイテクセミナーで発表しました

日本分子生物学年会にて、入門者向けのセミナーを行いました(ででん!) 年会に参加登録した方は2021/01/29 まではアーカイブとしてご覧いただけます。

Pythonで全ゲノムFASTA=>染色体毎FASTAを作成してみた

全ゲノムFASTAだけでなく、染色体ごとのFASTAの入力が必要な解析ツールってありますよね🥺全ゲノムFASTAならある、、、そんな時はpythonですぐに作れます💫

データの大掃除はいかが?

眠ったままのデータはありませんか?アメリエフに相談して、気持ちよく年末を迎えましょう!

Bedtools intersectに指定されたフォーマット以外のファイルを入力して,出力結果がおかしくなった話

これでできそう!と思っても結果をよく見てみると思ったのと違うこともある.横着せず,プログラムが指定するちゃんとしたフォーマットのファイルを入力しましょう

snpEffとSnpSiftのfilter

SnpSift filterでsnpEffの複雑に見えるアノテーション結果をフィルタします。

手っ取り早くRをビルドしてインストールする

Rをソースからビルドしてインストール!! (語感がルー◯柴感ある)

バイオインフォマティクスをリモート講義で学習💻実際どんな感じ?

バイオインフォマティクスのトレーニングがオンラインに対応しました。本記事ではお客様目線でその流れをレポートします!

簡単♪環境構築② Reseq環境を作ってみる編

Anaconda, Reseq, 環境構築

簡単♪環境構築① 入門編

AnacondaでYAMLファイルを使った簡単解析環境構築!YAMLファイルを解析環境の設計図のように用いて、複数のツールやパッケージを自動的にインストールできます。

reseq 解析超入門

「〇〇解析とは」シリーズ1。reseq解析 は、DNAの変異検出を目的とした解析です

遺伝子シンボルから遺伝子領域ファイル(BED)生成

「あれ?この遺伝子どこにあったっけ?」 遺伝子アノテーションソフト"SnpEff"の隠れた名機能、遺伝子シンボル ⇨ BED の変換について!

FastQCをたくさんかけたら・・・| FASTQのクオリティコントロール

クオリティコントロールを行う大人気ソフトウェア FastQC。結果をさくっと見るときに役立つファイルと短いコマンドを紹介します。

FASTQをペアリードに分割する

ペアエンドリードのデータ を2つのFASTQファイルにする方法を紹介します。① SRAから②FASTQから

微生物ゲノムの環状可視化ツール

web上で手軽に利用できる微生物ゲノム情報の環状視覚化ツール「CiVi」の使い方をご紹介!

bcftools queryでVCFから情報を抽出する

bcftools queryを使うと、VCFまたはBCFから、任意の形式で列を抽出して出力することができます。例えば好きな列だけ拾ってタブ区切りテキストに。めちゃ便利! 最後に読者への挑戦(?)もあるよ

bcftools簡単説明

bcftoolsは、NGSを用いた変異解析で用いられる、変異を記述するVCF(variant call format)形式のファイルを扱うためのユーティリティです。多機能かつ結構速い。よく使う機能を解説します♪

インフルエンザウイルスを調べよう

「はてブロ今週のお題:人生最大の危機」は子ども時代のインフルエンザでした。今日は、打倒ウイルス研究に役立つ!? Influenza Virus Database を紹介しちゃいます。

CITE-seq解析の紹介

ちょっと前にmiya-yさんがシングルセルATAC-seqについて記事を書いていたので便乗します。 CITE-seq解析について概要と関連ツールのご紹介。Cellular Indexing of Transcriptomes and Epitopes by Sequencing 略してCITE-seqです。

複数の配列のFASTAを分割する

マルチFASTAを配列ごとに分割するツールについてご紹介!

Trinityのインストール

de novo transcriptomeアセンブリングツール "Trinity"のインストール方法完全版! Trinityの名前の通り、大きく三つのアルゴリズムでできています。

メチル化アレイをIGVで可視化する

アレイデータとNGSデータをIGVで並べたい 最近、メチル化アレイのデータをNGSデータと並べて見てみたいから、IGVで可視化できないかと相談を受けました。 日頃、様々なツール間でデータをやり取りするためにファイルを変換するスクリプトをよく書いているの…

BAMファイルの切り取り bedtools intersect ? samtools ?

bamファイルから一部の領域を切り取るときはbedtoolsを使うことが多いですが、ほしい領域が1箇所〜少ない場合はsamtoolsが手軽&高速です。 ツール豆知識シリーズ・新作!(?)

(Rで)VCFにアノテーション "VariantAnnotation" ②

Rに読み込んだVCFに、アノテーションを付加しましょう。 staffblog.amelieff.jp VariantAnnotationの公式説明書はこちらです。 アノテーションの付加には、Bioconducterのアノテーションデータパッケージを利用します。 パッケージ一覧はこちらから見られま…

(Rで)VCFの読み込み "VariantAnnotation" ①

VCF(Variant Call Format)をRで読みましょう! Rパッケージ "VariantAnnotation" をご紹介します。 VariantAnnotationはVCFを読み込み、更にアノテーションパッケージを利用してアノテーションを付与することが可能です。 列の分類やPOS表記に少しクセがあり…

性染色体のgenotype

こんにちは。 VCF(variant call format)ファイルにおける、性染色体のgenotype表記についてご紹介します。 下に、VCFの例を示します。father、つまり男性の情報を見てみます。 fatherの列の左端に、それぞれの変異のGT(genotype、遺伝型)が載っています…

ツールの出力をまとめてレポートに! MultiQC ①

kimotonです。 今回はMultiQCを紹介します。 その名の通りマルチなQCツールです。 論文はこちら マルチなQCツールなんて言いましたが、要するにバイオインフォマティクス系ツールの結果ファイル、ログファイルをまとめていい感じにレポートにしてくれるツー…