アメリエフのブログ

Amelieff Staff Blog

「博士号取得支援」制度開始で、社員のスキルアップを後押し!

アメリエフでは今年6月より「博士号取得支援」制度を開始いたしました! 詳細は下記の記事をご覧ください。 www.wantedly.com

第三回アメリエフオープンセミナー開催!!

はじめに どうもおひさしぶりです。misawatです。 いつの間にか「取締役 CTO」になってました。 僕のCTOとしての初業務は・・・、 CTOってなに?ってのをググることでした! そんなこんなで、ガラリと仕事内容も変わっ・・・てない。 解析はやってるけど、仕…

less一回で複数のファイルを開く

こんにちは。lessのオプションの連載をしている人、miyatakeyです。 いやあ、便利ですから。どんどん活用していきましょう。 とはいえ今回ご紹介するのは、これまでのようなコマンドラインオプションとは異なります。 less自体の便利機能のご紹介です。 皆さ…

pythonの辞書型の使い方

こんにちは、hr-kです。今回はpythonで多用する「辞書(dict)型」の使い方を簡単にご紹介します。 pythonで辞書は以下の形で定義できます。 # {key1:value1, key2:value2, ...} >>> test = {'A': 'Archaeology', 'C': 'Cosmology', 'G': 'Geology', 'T': 'Top…

実はアウトローだった!経歴よりポテンシャル重視の採用

「就活アウトロー採用2018」という面白い採用イベントに、弊社の代表山口とCTO三澤が参加しました! 詳細は下記の記事をご覧ください。 www.wantedly.com

(Rで)VCFの読み込み "VariantAnnotation" ①

VCF(Variant Call Format)をRで読みましょう! Rパッケージ "VariantAnnotation" をご紹介します。 VariantAnnotationはVCFを読み込み、更にアノテーションパッケージを利用してアノテーションを付与することが可能です。 列の分類やPOS表記に少しクセがあり…

第3回アメリエフオープンセミナー開催!!

2012年に東北メディカル・メガバンク計画が開始され、岩手医科大学いわて東北メディカル・メガバンク機構(IMM)および東北大学東北メディカル・メガバンク機構の連携により、2017年3月に宮城県、岩手県の15万人を対象とした国内最大のゲノムコホートが構築…

創立記念ランチ会を開きました!

創立記念ランチ会 おかげ様で、7月1日でアメリエフは創立9周年を迎えることができました。 毎年、普段はなかなか食べられない「うな重」を社員で囲み、英気を養っています。 今年は暑さが続いているので、アイスクリームも出ました!写真は9周年の「9」を手…

cronを用いたコマンドの定期実行

こんにちは、hr-kです。今回はcronを用いたコマンドの定期実行について書いていきます。 「毎週このサーバの容量のログをとりたい」、「10分置きにこのコマンドを実行したい」ということがよくあります。 こんなとき、よく使われるのがcronと言うシステムで…

性染色体のgenotype

こんにちは。 VCF(variant call format)ファイルにおける、性染色体のgenotype表記についてご紹介します。 下に、VCFの例を示します。father、つまり男性の情報を見てみます。 fatherの列の左端に、それぞれの変異のGT(genotype、遺伝型)が載っています…

less画面上での文字列検索を楽に ~大文字小文字を区別させない~

lessで開いたファイル内での特定文字列(ex. hoge)の検索は、' /hoge 'と打てば可能です。 便利なのですが、queryの大文字小文字がきっちり区別されてしまうことには少々不便さを感じていました。 例えば、アノテーション情報付きVCFから特定データベース由…

vimを使いながらlsする。vimtutor先生より

コマンドラインで使えるテキストエディタ、 vim 。 使い方は色々なWebサイトや本でも学ぶことができますが、お手軽なチュートリアルが、コマンドライン上にも存在します。 それが vimtutor 。 コマンドライン上に、vimの使い方が表示され、 実際に表示された…

pythonでキャッシュをとる

こんにちは、hr-kです。今回はpythonで、同じ関数を使い倒す時に、より早く計算する手法をご紹介します。 pythonで以下のようなコード(test.py)を書くとします。 import time def test(text): # なんか重たい処理 texts = '' for i in range(1000): texts = …

「QMerge」 VCF統合、アノテーション、テキスト出力ソフトウェア

弊社が販売しておりますソフトウェア「QMergepy」のご紹介です。 「QMergepy」は、以下の機能を備えたソフトウェアです。 VCFファイルの統合 データベースのアノテーション タブ区切りテキストファイルに出力 これが こうなる → QMergepy → タブ区切りテキス…

ツールの出力をまとめてレポートに! MultiQC ②

前回に引き続きMultiQCの実装を行います。 必要環境 適当なブラウザ (Chrome, Firefox, Safari) 今回は仮想環境を入れて実装するのでOSは何でもよいです。 事前準備 minicondaを入れましょう。 詳しくはググりましょう。親切な方が紹介しています。 インスト…

ベンチャーピッチイベント

こんにちは、hr-kです。今回は先日参加させてもらったベンチャーピッチイベントについて書きたいと思います。 ベンチャーピッチイベントは株式会社リバネスさんの16周年記念と同時に行われたイベントです。 リバネスさんが支援する様々なベンチャー企業が…

昨日できた計算が今日できない

パソコン苦手な人の「何もしてないんですけどぉ」は、絶対何かしてる ーーコンピューターの不具合あるある よく聞きますね。 ついに自分でもやってしまった新入社員です。 エラー対処の試行錯誤を少しでも減らせればと思い、対策をブログに書いておきます。 …

less画面をすっきり見やすく

バイオインフォマティクス業界に飛び込んでもうすぐ3カ月のmiyatakeyです。最近大いに思うことがあります。 VCF等をlessで見る時、画面端で行が折り返されて見にくい。INFO列は親の仇。 見やすくできないかと思い調べてみました。lessのオプションで解決です…

ツールの出力をまとめてレポートに! MultiQC ①

kimotonです。 今回はMultiQCを紹介します。 その名の通りマルチなQCツールです。 論文はこちら マルチなQCツールなんて言いましたが、要するにバイオインフォマティクス系ツールの結果ファイル、ログファイルをまとめていい感じにレポートにしてくれるツー…

データ移行やバックアップ

こんにちは、hr-kです。今回はデータの移行を行う際によく使われている便利なコマンドをご紹介します。 サーバ間でのデータ移行やバックアップを取るときによく使われるコマンドがrsyncというコマンドです。 使い方は $ rsync 同期元 同期先 としてファイル…

pythonのゲノム解析で有用物質を発見?

こんにちは。新入社員のFukuです。 アメリエフでPythonを使うんだよ、と情報系でない人に話すと、「水牛?」といわれます。ニシキヘビです。 さて、Python(ニシキヘビ)& インフォマティクス な論文をひとつご紹介します。 Genomewide Analysis of the Anti…

東京バイオベンチャーズ主催「2019年新卒&インターン学生MeetUp_vol.2」に参加しました!

こんにちは、miyatakeyです。 去る5/29、「 IT x バイオ」を掲げるベンチャー5社と学生さんとの出会いイベント、東京バイオベンチャーズ主催「2019年新卒&インターン学生MeetUp vol.2」に参加しました。 前半は企業からの情報提供のターン。各社代表により…

ファイルの絶対パスを取得する

こんにちはkubo改めkubo-mです。地図アプリがないと目的地にたどり着けない方向音痴です。 家族にある場所への道順を「北に向かって進んでから〇〇で東に折れて……」と説明されて、「歩いている最中に方角なんてわからないから、右に曲がるか、左に曲がるかで…

CentOSでスペックを確認

こんにちは、hr-kです。今回はコマンドラインからCentOS系のマシンでスペックを確認する方法について書きたいと思います。 様々なサーバにログインして計算をする際や、サーバの中で計算を並列化したい時、サーバのスペックを調べる必要があります。 この時…

ピカピカの新入社員、会社説明会に参加しました

ピカピカ新入社員のFukuです✨ アメリエフでは、4月以前から少人数向けの会社説明会が開催されています。 私も、昨年就職活動をした者として会社説明会・懇談会に参加いたしまして、学生さんとお話ししております。 学生さん「Fukuさんは、どうしてアメリエフ…

データ解析プログラムが本当に稼働しているか、リアルタイム監視したい

ゲノムの解析においては、snpEffによるannotateなど時間のかかる計算というのがしばしばでてきます。その最中、プログラムが本当に走ってくれているかリアルタイムに監視したい、ということがままあります。topコマンドをはじめプロセス監視用コマンドは数種…

並列化可能性

こんにちは、hr-kです。 今回は計算プログラムの高速化、特にプログラムの並列化可能性に着目した話をしたいと思います。 計算を高速化する方法は大まかに3通りあります。 各CPUを上手に使う(CPU内部でのスレッド構造や型などをうまく利用) 単純にCPUの性能…

カーソルキーからの卒業~コピペを添えて~【ショートカットキー】

入社し日常的にlinuxを使い始めて1カ月半が経ちました、miyatakeyです。 目下の目標は「カーソルキーからの卒業」です。コマンドラインやvimで、カーソル移動にはついカーソルキーを触ってしまいます。ですが一行が長いことはざらですから、効率アップにショ…

カラフルなマンハッタンプロットを描く

SNP解析、GWASの結果の図示に広く使われるマンハッタンプロット。 これをカラフルにする方法、色の例をご紹介します。 マンハッタンプロットの作図には、統計解析ソフトRの、CRANパッケージ qqmanを利用すると簡便です。 install.packages("qqman") #パッケ…

宇宙物理からバイオインフォマティクスへ

こんにちは。hr-kです。今回は私の博士課程時代の専門である宇宙物理とアメリエフで取り扱っているバイオインフォマティクスの分野についてプログラミングの観点から少しお話ししたいと思います。 「宇宙物理とバイオインフォマティクスだと全く違いそう」と…