読者です 読者をやめる 読者になる 読者になる

アメリエフのブログ

Amelieff Staff Blog

がん免疫治療に関するデータ解析(序)

ブログを移転いたしました。 新しいブログでも、アメリエフをどうぞよろしくお願いいたします。 さてもう二月になってしまい、時流に遅れている感満載ですが、年末年始は、それまでの一年を振り返り、これからの一年を考える機会ですね。2016年を振り返るとN…

誰でもわかる(と思う!)LTR解析 その2

LTR解析について連載するとか言っておきながら何ヶ月たったことか・・・ どうもmisawatです。大丈夫です。生きてます。 さて、期間が大分空いてしまいましたが、第二回として 「LTRの研究事例」 について紹介していきたいと思います。 やはり「どんなことが…

ASHG2016でgnomADが公開

10/18~22はアメリカ人類遺伝学会(ASHG)2016がバンクーバーで開催されていました。 その中でBroad Institueから発表されたGenome Aggregation Database (gnomAD)について紹介したいと思います。 次世代シーケンサー(NGS)を使っている人にはお馴染みの図です…

データ解析トレンド

現在、アメリエフはNGSデータを中心に解析を行っています。 しかし、もともと起業した社長は遺伝統計学のバックグラウンドがあり、最初はSNPアレイデータ解析の会社でした(そもそも、創業当時はNGSが今ほど普及していませんでした)。 とはいえ、ここ数年ず…

誰でもわかる(と思う!)LTR解析 その1

〜前置き〜 だんまりを決め込んでいました。 どうもmisawatです。 たまにはInputだけではなくOutputせねば!と謎の義務感にかられたので記事を書きにきました。 テーマは「LTR (Long Terminal Repeat)」の解析です。 ・・・。 はい。 「繰り返し〜」とか「リ…

第46回バイオインフォマティクス勉強会「10x Genomicsによるロングリード解析@東京」開催のお知らせ

9月9日(金)に開かれるバイオインフォマティクス勉強会のご案内です。 《内容》10x Genomicsが開発したGemCodeシステムは、ショートリードから擬似的にロングリードを生成する革新的な技術です。 本勉強会では、日本で10x Genomicsのサービスを提供する3社を…

ヒトデータのセキュリティ

今夏は慎重に行動していたおかげでほとんど蚊に刺されていなかったのですが、お盆休みで実家に帰ったところ、寝ている間に10箇所も刺されてしまいました。 せっかく気を付けていたのに、台無しです。 無理やりこじつけますが、気を付けるといえば、ヒトのシ…

夏の風物詩

先週開催されたNGSハンズオンの第2部が無事?終わり、社内の関係者一同、ほっと一息ついています。 そろそろ、アメリエフの夏の風物詩となりつつあります。 昨年から、科目も内容も増やしたこともあり、準備に大わらわでしたが、講習後に、わかりやすいと多…

今年もNGSハンズオン講習会

去年、講師・TAを担当させていただいたNGSハンズオン講習会で、今年もNGS解析を担当させていただきます! (平成28年度NGSハンズオン講習会) 去年担当させていただいた科目は、PythonやPerlなどのプログラミングとNGS解析の一部(NGS基礎・Reseq解析)でし…

7周年記念

みなさまのご支援を賜りまして、今年の7月1日でアメリエフは設立7周年を迎えました。 今後とも、アメリエフをどうぞよろしくお願いいたします。 アメリエフ社員にとっては、7月1日はおいしいものを食べられる日ということになっています。 今年はウナギを食…

はじめまして

5月からアメリエフに入社しましたhachikuboです。 アメリエフでは、総務、経理、人事などのバックオフィス全般を担当します。 10年以上前に大学の生物学科を卒業しましたワーキングマザーです。 大学卒業後、営業、研究補助、経理、労務など様々な仕事に携わ…

HISAT2

RNA-seqのアライメントツールHISAT2についてご紹介します。 HISAT2は、当ブログ内でもたびたびご紹介してるTopHat2開発グループが作った、TopHat2の後継ソフトです。 TopHat2より速いしメモリもそんなに使わないとアピールしています。 ゲノムに対して小さな…

◆データサイエンティストを目指す学生必見! インターン Meetup 2016年夏◆

アメリエフでは、7月8日(金)に「データサイエンティストを目指す学生必見! インターン Meetup 2016年夏」を開催いたします。 夏休みにインターンに参加したい学生さんをはじめ、バイオ業界、 バイオベンチャーに興味がある方を対象に、バイオ業界について…

Copy as MarkdownでMarkdown形式のリンクURLを取得する

こんにちは、先日、桔梗屋信玄餅を買いに初めて三越に行きました、@kuborです。 WEBサイトを見ている時にリンクを右クリックしてURLをコピーし、Slack、esa.io、もしくはGitHubなどで共有することが多いのですが、プレーンなURLを貼るだけではなんのURLかわ…

10x genomicsのGemCode技術

去年、The Scientist誌が選んだ革新的技術トップ10(Top 10 Innovations 2015)の1位を飾った技術、それが、スタートアップ企業10x genomicsが開発した、「GemCode」と呼ばれる次世代シーケンサーの新しい前処理技術です。GemCodeの技術を簡単に説明すると、…

Vagrantを用いた仮想環境構築

バイオインフォマティクス初心者が勉強を始める際に、最初に立ちはだかる壁は、Linuxという未知のOSとの相対だと思います。 最近はVirtualBoxなどの仮想化ソフトもネットにたくさんありますので、導入すること自体は皆さんできるかと思います。しかし、もし.…

Cytoscapeによるネットワーク図示

Cytoscapeは、複雑なネットワークおよびその属性の図示、統合、分析に用いられるオープンソースのソフトウェアです。 遺伝子ネットワーク、ソーシャルネットワーク、路線図など、点(node)と線(edge)で構成されるデータセットを可視化することができます。 デ…

10x Genomics Long Rangerのご紹介

前回のブログでも少し触れましたが、10x Genomicsが開発したGemCodeシステムは、ショートリードから擬似的にロングリードを生成する革新的な技術です。 今回はそのGemCodeシステムに対応したゲノム解析パイプラインLong Rangerのご紹介をしたいと思います。 …

Yet Another Bioinformatics Library

バイオ分野で使われているプログラミング言語には、バイオインフォマティクス向けのライブラリが用意されており、BioPerlやBioPythonなどをご存知の方は多いかもしれません。 最近注目されているGoogleによって開発されたGO言語にも、バイオインフォマティク…

フリーソフトで始める融合遺伝子解析入門

2016年5月20日に開催した第44回、および27日に開催した第45回バイオインフォマティクス勉強会の 「フリーソフトではじめるNGS融合遺伝子解析入門」の資料を、一部修正してSlideShareに公開いたしました。 RNA-seqの基本的な解析方法にはじまり、融合遺伝子解…

新入社員のmisawatです。

2016年4月18日より、こっそり入社していましたmisawatと言います。 出身は神奈川ですが、相模原に住んでいるのでアメリエフのオフィスは少し遠いです。 大学では医療、大学院では分析科学をやってきました。 最近の分析機器は高性能なので簡単にビッグデータ…

オフィスが田町に移転しました

新年度となり気持ちも新たに新オフィスで業務を開始いたしました。 オフィスの広さは約2.5倍になり新メンバーを迎え入れてのスタートです! たくさんの方々から、引っ越し祝いを頂きました。 さらに身を引き締めて取り組んでまいります。

第44回・第45回バイオインフォマティクス勉強会「フリーソフトではじめるNGS融合遺伝子解析入門」開催のお知らせ

5月20日、5月27日に開かれるバイオインフォマティクス勉強会のご案内です。 (東京開催、大阪開催とも同様の内容となります。) 《講師》 山口 昌雄 (アメリエフ株式会社 代表取締役社長) 尾上 広祐 (バイオインフォマティクス事業部データ解析担当) 《…

新卒入社して1年後のバイオインフォマティシャンからみたアメリエフ

こんにちは、onouekです。私はバイオインフォマティクスエンジニア(遺伝子データ解析のエンジニア)として昨年の4月に入社しました。入社して1年経った今、データ解析エンジニアの自分にとってアメリエフという会社がどういう環境なのかということを自分な…

STARとCufflinks

RNA-seq解析におけるマッピングソフトウェアの選択肢は、TopHat一強から、STARもずいぶん多く使われるようになってきました。 性能や速度から、STAR一択! と言い切る人もいますが、まだ根強くTopHatユーザもいるという印象です。 マッピングは解析の中でも…

本社移転のお知らせ

この度、業務拡大に伴い、2016年4月18日(月)より下記の通り本社を移転する運びとなりました。つきましては、移転に伴い、住所、電話番号、FAX番号が変更となりますので、恐れ入りますが、お取り計らいの程よろしくお願い申し上げます。 なお、現住所、電話…

日本経済新聞に掲載されました

2016年2月17日の日本経済新聞にて、「ユーグレナ、遺伝子解析のベンチャーに出資 」という見出しで記事が掲載されました。 ●記事はこちらよりご覧いただけます http://www.nikkei.com/article/DGXMZO97328210W6A210C1000000/ 専門性の高い解析技術を持つ弊社…

毎日新聞「経済プレミア」に弊社代表 山口と、経営顧問 丸との対談連載記事第一弾が掲載されました

毎日新聞社のビジネスサイト「経済プレミア」に、代表取締役社長CEO 山口 昌雄と経営顧問 丸 幸弘 (株式会社 リバネス 代表取締役CEO)の対談記事「第一弾」が掲載されました。 「経済プレミア」は「政治・経済」「IT・テクノロジー」「社会・カルチャー」…

新規メンバー募集!

アメリエフは、基礎研究を支援した6年間の実績をもとに、 “生命を理解し豊かな社会を実現する”というビジョンを掲げ、 「健康」「医療」分野のサービスをより充実させ 「遺伝情報と健康を結びつけるプラットフォーム」の実現を目指します。 そこで、事業拡大…

稼働中のタスクをtopコマンドで!

サーバで動いているタスクを「top」コマンドで確認してみましょう。 コマンドはとてもシンプルです。$ top システムのCPU使用率順に、稼働中のプロセスが表示されます。図ではpsiblastとvimが一番プロセスを使用していますね。プロセスを稼働しているユーザ…

AWKでフィルタリング

以前の記事(TopHat-Fusionの結果の見方)で、 「Linuxコマンドのawkを使ってfusions.outをフィルタリングする方法もあります」と書いたので、 今回はawkコマンドのご紹介をしたいと思います。 AWKコマンドは主に、テキストファイルから要素を抜き出したりする…

snpEffのアノテーション書式

たびたびブログでもご紹介している、アノテーションソフトsnpEff、一年前の9月にバージョン4.0になったとご紹介しましたが、2015年1月現在のバージョンは4.2です。 snpEffで付与されるアノテーションの書式は、以前は下記のような「EFF=...」でした。 ##INFO=

ファイルのコピーに失敗するときは転送速度を落としてみる

こんにちは、久保(kubor)です。 少し前からオフィスの近くで大阪風のお好み焼きを提供するお店を探しているのですが、どうも広島風の赤いお店が多い気がします。外付けHDDからのコピーに失敗することがある ところで、弊社では日々お客様からのデータを受け…

Chromeで開いてる全てのタブのタイトルとURLをMarkdown形式で取得する

こんにちは、雪のようなくちどけを経験できなかった青春時代は、アニメや漫画で上書きすればいいと思っている久保(kubor)です。 メルティーキッス くちどけラム&レーズンすごく美味しい! いつのまにかChromeのタブが増えるさて、バイオインフォマティシャ…

Google日本語入力なら矢印の入力が簡単

こんにちは、久保(@kubor_)です。 スマートフォンのバイブモーターが経年劣化のためか、軸ブレしており、ギュイーンギュイーン鳴ってしまうんですが、買い替えどきでしょうか。ウェイトの偏りが振動を生みます正常なバイブモーターであれば、軸がブレず、…

バイオインフォマティシャンでも、pecoがしたい!

先日、ついに日比谷線を利用しました、久保(kubor)です。 先日pecoが話題になっていた傍ら、社内ではなかなか広まらずに、寂しい思いをしているので、バイオインフォマティシャンにもおすすめの使い方を紹介いたします。 0. pecoってなに 標準入力で受け取…

IGVから配列を取得する

IGVのちょっと便利な機能に気づいたのでご紹介します。 ゲノム上の目的の領域の配列を、IGVだけを使って取得してみましょう。 IGVのバージョンは2.3.3で確認しました。 1. BEDで指定したfeatureの配列を取得する ChIP-seq解析で出力したピーク(BED形式)上…

TopHat-Fusionの結果の見方

TopHat-Fusionは、マッピングソフトのTopHatから派生した機能で、融合遺伝子を検出するのに広く使われています。 TopHat-Fusionを実行すると、fusions.outという候補となるポジションやリード数などの情報が出力されます。fusion.outの説明は、NGS Surfer's …

cpコマンドの進捗状況をチェックする

コピー中にあとどれくらいか知りたい時があるんです、 特に`cp -v`を忘れた時に有用 Xfennec/progress 調べたら、こちらのprogressを使うと簡単にできますダウンロード$ git clone https://github.com/Xfennec/progress.git Initialized empty Git repositor…

ヘビーな夏

弊社が一部講義を担当した平成27年度NGSハンズオン講習会のアンケート結果を、事務局のかたから送っていただきました。 私が担当したSh、Perl、Pythonに関しては、「易しいと思っていたらいきなり最終課題が難しくなった」というご意見が多かったです。 実は…

どの括弧が閉じているのかよく分かるVimの設定

京都支店に居た頃、鴨川でサンドウィッチを食べているところをトンビに襲われ、出血したことがある久保(kubor)です。 Vimを使っていて、コーディング中、 括弧が重なって困るなら、対応する括弧をハイライトしましょう。 もしくは対応する括弧へカーソルを…

どんな改行コードでも・後

前回に引き続き改行コードの処理の話です。 今回はPerl・Pythonのなかでどう扱うか、コード例を挙げて説明します。 perlの例 行末の「¥n」はchompで取り除くことができます。それ以外は正規表現を使うと簡単と思います。 open IN,"file.txt" or die "$!";whi…

どんな改行コードでも・前

弊社のトレーニングやNGSハンズオン講習会などでPerlやPythonに触れた方は「『¥n』で行の末尾を示す」と聞いたことがあると思います。 『¥n』はLine Feed、LFとも呼び、LinuxまたはMac OS Xで使われる改行コードです。改行コードはOSの種類やバージョン、ソ…

Somatic SNV検出編

2014年6月21日に開催した、アメリエフ株式会社・第33回バイオインフォマティクス勉強会の「フリーソフトではじめるがん体細胞変異解析入門」のスライドをSlideShareにて公開いたしました。 主に、ブログでもご紹介したことがあるソフトウェアSomaticSniperを…

Pythonでgzipされたテキストファイルをcsvモジュールで読み込む

gzip圧縮されたファイルをPythonで読み込むときには、少し注意が必要です。 例として、手元に偶然あった魔法の言葉が書かれたタブ区切りテキストファイルを使用してみます。 zcat supercalifragilisticexpialidocious.txt.gzsuper cali fragilistic expia li…

シェル芸

hatです。 先日、jus & USP友の会さんのシェル芸勉強会に参加してきました。 シェル芸は、USP友の会会長上田さんのブログで次のように定義されています。 「マウスも使わず、ソースコードも残さず、GUIツールを立ち上げる間もなく、あらゆる調査・計算・テキ…

Pythonを書くときに、タブじゃなくてスペースでインデントする

こんにちは。 先日、金さん(kimk)がお土産で買ってきてくださった栗羊羹があまりに美味しかったので、いっそ羊羹をまとめ買いするかどうか、悩んでいる久保(kubor)です。 羊羹のまとめ買いで悩む方が読者にいるかどうかはわかりませんが、プログラムを書…

Pythonでタブ区切りテキストの読み込み

世の中には、2種類の人間がいる。 タブ区切りテキストを使う人と、使わない人だ。 こんにちは、タブ区切りテキストを使う人、久保(kubor)です。 Pythonでタブ区切りテキストを読み込むときは、csvライブラリが便利です。 標準ライブラリなので環境依存をそ…

重複値の削除や抽出

Rで、ベクトルなどに含まれる重複した値をユニークにしたいとき、unique()を使用します。 > a [1] "AAA" "BBB" "CCC" "AAA" > unique(a) [1] "AAA" "BBB" "CCC" linuxコマンドの、隣り合っている重複行をユニークにするuniqコマンドとよく混同して、uniqと書…

Excelの1セルにコンマ区切り文字列を入れる

解析結果を出力する際、複数の数値をコンマで結合して羅列したいことがあります。 例えばBEDフォーマットでは、エクソンの長さや開始位置を示すblockSizesやblockStartsには「468,69,147,159」や「0,608,1434,2245」のような値を入れることになっています。 …