アメリエフのブログ

Amelieff Staff Blog

バイオインフォマティクス

coverageBedの使い方(2)

coverageBedの使い方(1)のつづきです。 ■カバレッジ計算 マッピング結果とゲノム、2つのBEDが用意できたら、以下のコマンドでカバレッジを計算します。 $ coverageBed -a map.bed -b genome.bed 以下のような結果が出力されます。 chr1___0__249250621__1…

coverageBedの使い方(1)

以前、bedtoolsの一つであるintersectBedの使い方についてご紹介しましたが、今回はcoverageBedについてご紹介します。 マッピング結果がどのくらいゲノム全体をカバーできているか知りたい時、coverageBedを使うとカバレッジが簡単に計算できます。 ■用意す…

鎖鋸

皆様こんにちは。detです。 本日は、とあるデータベースをご紹介したいと思います。 タイトルにもある鎖鋸とは、DRA/SRAなどのリードアーカイブの中から、論文が発表済みのリードデータのみを収集したデータベースです。DRAやSRAには論文が発表されていない…

統合データベース講習会に参加してきました

皆様こんにちは。detです。 先週の土曜と日曜に、NBDC主催の「統合データベース講習会(AJACS駿河)」に参加してきました。 今回は生命科学系のデータベースに関する講演だけでなく、超高速シーケンサーのデータ解析パイプラインに関する講演もあり、様々な…

intersectBedの使い方

bedtoolsはBEDフォーマットのファイルを扱うのに便利なツール群です。 今回はその中の1つ、intersectBedについてご紹介します。 intersectBedを使うと、複数BED間で重複している領域を簡単に抽出することができます。 テストデータとして、2つのBEDファイル…

これ、なんて読みますか

ゲノム解析の定番ソフトウェアに「Picard」というのがあります。 私はずっと「ピ・カード」と呼んでいましたが 学会などでは「ピカール」と呼ばれるのをよく聞きます。 正式には「ピカール」なんでしょうか? マイクロRNAのデータベース「miRBase」も、 私は…

Rでアノテーション付け

tokunagaです。 これまでにVCFtoolsを使ったVCFファイルの加工や比較の方法をご紹介しました。 VCFtools VCFtools② 今回はVCFファイルに関するRパッケージをご紹介いたします。 VariantAnnotation Bioconductorのパッケージです。 VCFフォーマットのファイル…

PBSIM

tokunagaです。 本日はBioinfomaticsで気になる記事を見つけましたのでご紹介いたします。 Bioinformatics. 2012 Nov 4 PBSIM: PacBio reads simulator–toward accurate genome assembly Ono Y, Asai K, Hamada M PacBioのシーケンサーから出力されるリード…

VCFtools②

tokunagaです。 本日は以前ご紹介したVCFtoolsでちょっと気になっていたコマンドを調べましたのでご紹介したいと思います。 vcf-compareというVCFファイル同士の簡単な比較を行ってくれるコマンドです。 前回ご紹介したように前処理としてVCFファイルをbgzip…

VCFtools

tokunagaです。 今日はVCFtoolsについてご紹介したいと思います。 URL:http://vcftools.sourceforge.net/ VCFToolsは、NGSのデータ解析で出力されたVCFファイルを加工するのに役に立つツールです。 VCFtoolsを使用する際にはbgzip、tabixの使用が必要となり…

便利なオプション①

akbです。 今日はLinuxコマンドの便利なオプションを ご紹介したいと思います。 ①ファイルやディレクトリの検索 $ find [パス][オプション][ファイルまたはディレクトリ名] 【optionの説明】 -name <パターン>: ファイル名がパターンと同じファイルを検索す…

Galaxy による QC

こんにちは。detです。 今日はGalaxyを用いたQCについてご紹介いたします。 これまで、このブログで「QCの道」というタイトルでFASTX-Toolkitの使い方をご紹介してきました。 今回は、このQC機能をGalaxy上で実行しつつ、Galaxyの基本的な使い方を紹介したい…

Galaxy の紹介 その3

こんにちは。detです。 本日は先日ご紹介したGalaxyに関する記事の続きです。 Galaxyは、基本的には、公開のパブリックサーバーにジョブを投げて利用することになります。しかし、重いデータや、外部に出したくないデータを解析したいこともあるでしょう。特…

Galaxy の紹介 その2

こんにちは。detです。 本日は以前ご紹介したGalaxyに関する記事の続きです。 先月下旬にシカゴでGalaxyに関する国際会議(GCC2012)が開かれました。全世界から数百人の参加者が集まり、活発なディスカッションが繰り広げられたようです。次世代シーケンサ…

Galaxy の紹介 その1

こんにちは。detです。 本日はゲノムデータ解析インターフェイスツールであるGalaxyをご紹介したいと思います。 Galaxyはペンシルベニア州立大学のNekrutenko labとエモリー大学のTaylor labの共同で開発されているシステムであり、ウェブ上で利用できます。…

QCの道 その7

こんにちは。detです。 今日はQCの道 その6の続きです。 FASTX-Toolkitの使い方について、引き続き紹介いたします。 ・fastx_collapser FASTA/Q ファイルの中で、同じ配列のリードが重複して存在していた場合に1つを除いてすべて削除します。入力がFASTQ形…

cmpfastq と cmpfastq_pe

以前の記事でcmpfastqというfastqファイルのペアエンドリードを揃えるツールをご紹介いたしました。本日は、cmpfastqの改良版である cmpfastq_peとの相違についてご紹介いたします。 cmpfastq_peはcmpfastqから以下の点を改良したバージョンのようです。 1. …

シーケンサーとしての私

こんにちは、hatです。 趣味で1年ほど前から三味線教室に通っています。 先日お稽古をしていて、楽器の演奏はシーケンシングに通じるものがあるなあと思いました。 シーケンサーが塩基を読んで結果データを出すように、私は楽譜を読んでメロディーを出してい…

QCの道 その6

こんにちは。detです。 今日は前回のQCの道 その5の続きです。 FASTX-Toolkitの使い方について、引き続き紹介いたします。 ・fastx_quality_stats FASTA/Q ファイルのリードに含まれる塩基のポジション毎の統計量を算出し、表形式で出力してくれます。FASTA…

QCの道 その5

こんにちは。detです。 今日は前回のQCの道 その4の続きです。 FASTX-Toolkitが持つ機能について、引き続き紹介いたします。 ・fastx_artifacts_filter FASTA/Q の各リードにおいて、塩基が特定の種類に偏っている場合にそのリードを除去してくれます。他の…

Perl デバッグ

さて、あなたがPerlでプログラムを作成し、use strict や use warnings で怒られないところまで進んだとします。 次に、やることはプログラムを実際に動かすところですね。 ところが、実は、ここでも上手くいかないことが多々あります。 出るはずのない数字…

fastq format①

今日から次世代シーケンサー解析で使われているformatについて書いていきたいと思います。 まず、今回はfastq formatについてです。 ・構成 塩基配列と各塩基に対するquality valueの情報が書かれているテキストファイルです。各リードは4行で構成されていま…

Perl プログラムの性能解析(NYTProf)

こんにちは。detです。 少々複雑なPerlプログラムを組んだ時に、 どの部分にどれだけ時間がかかっているか、 知りたいことがあると思います。 そんな時は、プログラムの各処理ごとに時間や実行回数などを計測し、 出力してくれるプロファイラを使うと便利で…

Microarray解析

tokunagaです。 今回は、遺伝子発現変動を網羅的に調べたいときに使われているmicroarrayのデータ解析について流れを簡単にご紹介します。 生データ 発光強度をスキャナーの画像から数値化する ↓ バックグラウンド補正 出力された時点で補正されている場合も…

perlに挑戦中

perl初心者も初心者のtokunagaです。 まだまだ勉強中です。 先ほどまでvcfファイルをフィルタリングするプログラムを作成していました。 vcfとはVariant Call Formatの略で、次世代シーケンサーのデータから検出された多型を記述する一般的な形式です。 そし…

perlを他の言語から見つめてみる

こんにちは。detです。 今回は、他言語出身者(特にC言語出身者)がperlに触れるときに、 最初に躓きやすい点について簡単に記事にしてみました。 1.条件分岐において Cでifの次にもう一度条件分岐するときは、else if と書きます。 perlも同じような制御…

Perl

こんにちは。detです。 先週から、仕事で使用するスクリプトをPerlで書き続けています。 少しずつPerlの記法というものが、理解できて来ました。 なにより、Perlは自由な面が多く、これがメリットでもあり、 デメリットでもあると思います。 たとえば、以下…

間違えていたのは最初でした・・・・

tokunagaです。 前回の記事で私は、Linux基礎の課題で多くのエラーが出て苦しんでおりましたが、 CentOSをインストールしなおしたところ拍子抜けするほどうまくいきました。 どうやら最初のセットアップの手順を間違えていたようで・・・・ 色々なツールが入…

英語の論文を読む際に便利なツール

akbです。 ブログ更新の順番で、1週間の早さを実感しております。 さて、今日は英語の論文を読む際に便利なツールを紹介します。 1.準備するもの 下記の①〜③をインストールします。①ブラウザ:Fire fox②アドオン:Greasmonkey (https://addons.mozilla.org/j…

遺伝子ビジネス

本日は、気になる記事を御紹介します。 遺伝子ビジネスの最前線 国家プロジェクトである「オーダーメイド医療実現化プロジェクト」が始り、早9年。 (弊社もそのうちの1つとなるでしょうが)次世代シーケンサーの普及と共に 様々なバイオベンチャーが旗揚げ…