バイオインフォマティクス
こんにちは。detです。 今日は前回のQCの道 その5の続きです。 FASTX-Toolkitの使い方について、引き続き紹介いたします。 ・fastx_quality_stats FASTA/Q ファイルのリードに含まれる塩基のポジション毎の統計量を算出し、表形式で出力してくれます。FASTA…
こんにちは。detです。 今日は前回のQCの道 その4の続きです。 FASTX-Toolkitが持つ機能について、引き続き紹介いたします。 ・fastx_artifacts_filter FASTA/Q の各リードにおいて、塩基が特定の種類に偏っている場合にそのリードを除去してくれます。他の…
さて、あなたがPerlでプログラムを作成し、use strict や use warnings で怒られないところまで進んだとします。 次に、やることはプログラムを実際に動かすところですね。 ところが、実は、ここでも上手くいかないことが多々あります。 出るはずのない数字…
今日から次世代シーケンサー解析で使われているformatについて書いていきたいと思います。 まず、今回はfastq formatについてです。 ・構成 塩基配列と各塩基に対するquality valueの情報が書かれているテキストファイルです。各リードは4行で構成されていま…
こんにちは。detです。 少々複雑なPerlプログラムを組んだ時に、 どの部分にどれだけ時間がかかっているか、 知りたいことがあると思います。 そんな時は、プログラムの各処理ごとに時間や実行回数などを計測し、 出力してくれるプロファイラを使うと便利で…
tokunagaです。 今回は、遺伝子発現変動を網羅的に調べたいときに使われているmicroarrayのデータ解析について流れを簡単にご紹介します。 生データ 発光強度をスキャナーの画像から数値化する ↓ バックグラウンド補正 出力された時点で補正されている場合も…
perl初心者も初心者のtokunagaです。 まだまだ勉強中です。 先ほどまでvcfファイルをフィルタリングするプログラムを作成していました。 vcfとはVariant Call Formatの略で、次世代シーケンサーのデータから検出された多型を記述する一般的な形式です。 そし…
こんにちは。detです。 今回は、他言語出身者(特にC言語出身者)がperlに触れるときに、 最初に躓きやすい点について簡単に記事にしてみました。 1.条件分岐において Cでifの次にもう一度条件分岐するときは、else if と書きます。 perlも同じような制御…
こんにちは。detです。 先週から、仕事で使用するスクリプトをPerlで書き続けています。 少しずつPerlの記法というものが、理解できて来ました。 なにより、Perlは自由な面が多く、これがメリットでもあり、 デメリットでもあると思います。 たとえば、以下…
tokunagaです。 前回の記事で私は、Linux基礎の課題で多くのエラーが出て苦しんでおりましたが、 CentOSをインストールしなおしたところ拍子抜けするほどうまくいきました。 どうやら最初のセットアップの手順を間違えていたようで・・・・ 色々なツールが入…
akbです。 ブログ更新の順番で、1週間の早さを実感しております。 さて、今日は英語の論文を読む際に便利なツールを紹介します。 1.準備するもの 下記の①〜③をインストールします。①ブラウザ:Fire fox②アドオン:Greasmonkey (https://addons.mozilla.org/j…
本日は、気になる記事を御紹介します。 遺伝子ビジネスの最前線 国家プロジェクトである「オーダーメイド医療実現化プロジェクト」が始り、早9年。 (弊社もそのうちの1つとなるでしょうが)次世代シーケンサーの普及と共に 様々なバイオベンチャーが旗揚げ…
本日は、創薬・診断分野とバイオインフォマティクスの関係について記述します。 現在、創薬・診断分野に関する基礎研究は大きく進展してきています。ゲノム、エピゲノム、RNA、タンパク質などのさまざまな切り口や統合的なアプローチによって疾患のメカニズ…
本日より、友人の結婚式に参加するため、シンガポール経由でマレーシアに行ってきます。初マレーシアです!とても興奮しております。 今日は、アジアとバイオインフォマティクスに関して記述したいと思います。 よろしくお願いいたします。 バイオインフォマ…
キムです。 最近、GEN2PHEN ConsortiumのHPをのぞく機会が増えてきました。 http://www.gen2phen.org/ GEN2PHENプロジェクトは、ヒトゲノム計画から怒涛の勢いで増大している‘parts list ’ ( the gene sequences ) と ‘toolkit ’ ( technologies )を、「Geno…
7/14(水)・15(木)と弊社のキムが、アプライドバイオシステムズの第2世代シーケンサーである「SOLiD」の講習会に参加させていただきました。 SOLiDの詳細 詳細は上記リンクや他の資料をご参照いただくとして、他の第2世代シーケンサーと比べてリード長が短い…
今日は、統計解析パッケージソフト「SPSS」の年に一度のセミナー「SPSS Data Mining Day 2010」が渋谷であったので参加してきました。 仕事の都合もあって、午前のセッションしか聞けなかったのですが、その午前のセッションの一つに「データマイニングの医…