アメリエフの技術ブログ

Amelieff Staff Blog

2012-05-01から1ヶ月間の記事一覧

SAM format③

tokunagaです。 第一回目はSAM formatの概要について 第二回目はSAM formatのヘッダー部分についてお話ししました。 本日はSAM formatのアライメント部分についての説明をしたいと思います。 アライメント部分の形式は というように 「QNAME」から「QUAL」ま…

SAM format②

tokunagaです。 前回はSAM formatの概要についてお話ししました。 本日はSAM formatのヘッダーについて説明します。 ヘッダーには、シーケンスやリードグループなどのタグ情報が記述されており、以下のような形式で書かれています。 @<TAG> <TYPE>:<VA…

SAM format①

tokunagaです。 本日からはSAM formatについてです。 SAMとはSequence Alignment/Mapの略で、 次世代シーケンサー解析に用いられるformatの一つで、マッピングの結果が書かれています。 BAM formatは、このSAMファイルをバイナリ化したものです。 SAM format…

fastq format②

tokunagaです。 少し1回目と間が空いてしまいましたが、 本日はfastq formatの2回目です。 各リードの4行目に記されているqualityについて説明したいと思います。 ・Quality value 3行目に使われているquality valueは以下のように計算されています。 ・ASCI…

VCF format③

どうもakbです。 VCF formatの連載三日目です。 今日は、FORMATの"PL"について説明しようと思います。 まず、前回の復習ですが、FORMATの"GT"はGenotypeの略で 0:reference 1:alternate(sample1)のように数字に意味を持たせており、 0/0,0/1,1/1はそれぞれRE…

VCF format②

どうもakbです。 VCF formatの連載二日目です。 今日は、INFOカラムのIDとFORMATのIDの説明をします。 まずは、INFOカラムの説明です。 (例) (例) FORMATの"GT"はGenotypeの略で 0:reference 1:alternate(sample1)のように数字に意味を持たせており、 0/…

VCF format①

どうもakbです。 今日からVCF formatの連載が始まります。 さて、VCFとは (Variant Call Format)の略で、次世代シーケンサー解析に用いられるformatの一つです。 samtoolsを用いて抽出した多型情報が、VCFファイルに格納されて出力されます。 まず、VCFファ…

Perl デバッグ

さて、あなたがPerlでプログラムを作成し、use strict や use warnings で怒られないところまで進んだとします。 次に、やることはプログラムを実際に動かすところですね。 ところが、実は、ここでも上手くいかないことが多々あります。 出るはずのない数字…

第13回バイオインフォマティクス勉強会「RNA-seqデータ解析入門」は定員に達しました

第13回バイオインフォマティクス勉強会「RNA-seqデータ解析入門」は お申込みが定員に達したため、現在キャンセル待ちとさせていただいております。 たくさんのお申込み、ありがとうございました!

5/18(金)は全社員研修のため営業は休止させていただきます

本日5月18日(金)は、全社員研修のため営業はお休みをさせていただいております。 伊豆のホテルに缶詰になって、新入社員もベテランも一緒になって知的ワークに励んでおります。 週明けからは、よりスキルがアップした状態で業務に取り組んで参りますので、よ…

fastq format①

今日から次世代シーケンサー解析で使われているformatについて書いていきたいと思います。 まず、今回はfastq formatについてです。 ・構成 塩基配列と各塩基に対するquality valueの情報が書かれているテキストファイルです。各リードは4行で構成されていま…

【バイオインフォマティクス勉強会】RNA-seqデータ解析入門

バイオインフォマティクス勉強会のお知らせです。 6月2日(土)に第13回バイオインフォマティクス勉強会 「RNA-seqデータ解析入門」を開催します。 ご要望の大変多かったRNA-seqデータ解析につきまして、 データ解析の手法やノウハウをご紹介したいとおもいま…

仕事の効率化

仕事の効率化 akbです。 通勤電車でよく目にするのは英会話やパソコンスキル向上の広告です。 インターネットで"仕事の効率化"を検索しても、やはり、コミュニケーション能力やパソコンスキルの向上が上位にヒットします。 限られた時間の中で高い成果を出す…

Perl プログラムの性能解析(NYTProf)

こんにちは。detです。 少々複雑なPerlプログラムを組んだ時に、 どの部分にどれだけ時間がかかっているか、 知りたいことがあると思います。 そんな時は、プログラムの各処理ごとに時間や実行回数などを計測し、 出力してくれるプロファイラを使うと便利で…

意外なモデル生物

tokunagaです。 前回のhatさんに続いて 私の大好きなゼブラフィッシュについて紹介します。 大学の研究で使用していました。 ペットとしてもお馴染みですね。 実験魚としても有名で、 世代交代が早く、大量飼育が可能、飼育が簡単、そしてすでにゲノムが読ま…

小さな彼らの恋愛事情

卒業研究のテーマが「ショウジョウバエの求愛行動」だったhatです。 ショウジョウバエの仲間には多数の近縁種がいますが、それぞれオスの求愛行動が微妙に異なります。 この求愛行動の違いが種分化に関係していると考えられています。 「交尾をしなくなる」→…

ゆとりの時間

誰も教えてくれない 一流になれる仕事術 (アスカビジネス) 浜口 直太 akbです。 本日は最近読んだ書籍のご紹介です。 著者である浜口直太さんは、経営コンサルタントでありながらビジネス作家でもあり、100冊以上の本を執筆されています。 本書には、仕事に…

いとおかし

こんにちは。detです。 少し、プログラムから離れて会社のことでも書いてみましょう。 弊社内ではお菓子がよく出没します。 社員数が少ないにもかかわらず、 謎のお土産が毎日のように出現し、 その消費に追われる毎日です。 (もちろんうれしい悲鳴です) …

Microarray解析

tokunagaです。 今回は、遺伝子発現変動を網羅的に調べたいときに使われているmicroarrayのデータ解析について流れを簡単にご紹介します。 生データ 発光強度をスキャナーの画像から数値化する ↓ バックグラウンド補正 出力された時点で補正されている場合も…

「環境変数PATH」と「アクセス権限」

以前、Linux入門者がとまどいがちなものの一つが「ディレクトリ間の移動」であると書きましたが、今回は残りの二つ「環境変数 PATH」と「アクセス権限」について書きます。 先週の土曜日は、弊社のバイオインフォマティクス・スクール「Linux基礎」第二回で…

BIO tech2012

akbです。 4/25〜27の日程で『BIO tech2012』が開催されました。 今回、弊社は特別な出展を行いませんでしたが、勉強のために参加してきました。 興味深い研究や企業ブースを拝見することができ、また社会人として初めて参加したイベントということもあって…