アメリエフのブログ

Amelieff Staff Blog

創立記念ランチ会を開きました!

創立記念ランチ会 おかげ様で、7月1日でアメリエフは創立9周年を迎えることができました。 毎年、普段はなかなか食べられない「うな重」を社員で囲み、英気を養っています。 今年は暑さが続いているので、アイスクリームも出ました!写真は9周年の「9」を手…

cronを用いたコマンドの定期実行

こんにちは、hr-kです。今回はcronを用いたコマンドの定期実行について書いていきます。 「毎週このサーバの容量のログをとりたい」、「10分置きにこのコマンドを実行したい」ということがよくあります。 こんなとき、よく使われるのがcronと言うシステムで…

性染色体のgenotype

こんにちは。 VCF(variant call format)ファイルにおける、性染色体のgenotype表記についてご紹介します。 下に、VCFの例を示します。father、つまり男性の情報を見てみます。 fatherの列の左端に、それぞれの変異のGT(genotype、遺伝型)が載っています…

less画面上での文字列検索を楽に ~大文字小文字を区別させない~

lessで開いたファイル内での特定文字列(ex. hoge)の検索は、' /hoge 'と打てば可能です。 便利なのですが、queryの大文字小文字がきっちり区別されてしまうことには少々不便さを感じていました。 例えば、アノテーション情報付きVCFから特定データベース由…

vimを使いながらlsする。vimtutor先生より

コマンドラインで使えるテキストエディタ、 vim 。 使い方は色々なWebサイトや本でも学ぶことができますが、お手軽なチュートリアルが、コマンドライン上にも存在します。 それが vimtutor 。 コマンドライン上に、vimの使い方が表示され、 実際に表示された…

pythonでキャッシュをとる

こんにちは、hr-kです。今回はpythonで、同じ関数を使い倒す時に、より早く計算する手法をご紹介します。 pythonで以下のようなコード(test.py)を書くとします。 import time def test(text): # なんか重たい処理 texts = '' for i in range(1000): texts = …

「QMerge」 VCF統合、アノテーション、テキスト出力ソフトウェア

弊社が販売しておりますソフトウェア「QMergepy」のご紹介です。 「QMergepy」は、以下の機能を備えたソフトウェアです。 VCFファイルの統合 データベースのアノテーション タブ区切りテキストファイルに出力 これが こうなる → QMergepy → タブ区切りテキス…

ツールの出力をまとめてレポートに! MultiQC ②

前回に引き続きMultiQCの実装を行います。 必要環境 適当なブラウザ (Chrome, Firefox, Safari) 今回は仮想環境を入れて実装するのでOSは何でもよいです。 事前準備 minicondaを入れましょう。 詳しくはググりましょう。親切な方が紹介しています。 インスト…

ベンチャーピッチイベント

こんにちは、hr-kです。今回は先日参加させてもらったベンチャーピッチイベントについて書きたいと思います。 ベンチャーピッチイベントは株式会社リバネスさんの16周年記念と同時に行われたイベントです。 リバネスさんが支援する様々なベンチャー企業が…

昨日できた計算が今日できない

パソコン苦手な人の「何もしてないんですけどぉ」は、絶対何かしてる ーーコンピューターの不具合あるある よく聞きますね。 ついに自分でもやってしまった新入社員です。 エラー対処の試行錯誤を少しでも減らせればと思い、対策をブログに書いておきます。 …

less画面をすっきり見やすく

バイオインフォマティクス業界に飛び込んでもうすぐ3カ月のmiyatakeyです。最近大いに思うことがあります。 VCF等をlessで見る時、画面端で行が折り返されて見にくい。INFO列は親の仇。 見やすくできないかと思い調べてみました。lessのオプションで解決です…

ツールの出力をまとめてレポートに! MultiQC ①

kimotonです。 今回はMultiQCを紹介します。 その名の通りマルチなQCツールです。 論文はこちら マルチなQCツールなんて言いましたが、要するにバイオインフォマティクス系ツールの結果ファイル、ログファイルをまとめていい感じにレポートにしてくれるツー…

データ移行やバックアップ

こんにちは、hr-kです。今回はデータの移行を行う際によく使われている便利なコマンドをご紹介します。 サーバ間でのデータ移行やバックアップを取るときによく使われるコマンドがrsyncというコマンドです。 使い方は $ rsync 同期元 同期先 としてファイル…

pythonのゲノム解析で有用物質を発見?

こんにちは。新入社員のFukuです。 アメリエフでPythonを使うんだよ、と情報系でない人に話すと、「水牛?」といわれます。ニシキヘビです。 さて、Python(ニシキヘビ)& インフォマティクス な論文をひとつご紹介します。 Genomewide Analysis of the Anti…

東京バイオベンチャーズ主催「2019年新卒&インターン学生MeetUp_vol.2」に参加しました!

こんにちは、miyatakeyです。 去る5/29、「 IT x バイオ」を掲げるベンチャー5社と学生さんとの出会いイベント、東京バイオベンチャーズ主催「2019年新卒&インターン学生MeetUp vol.2」に参加しました。 前半は企業からの情報提供のターン。各社代表により…

ファイルの絶対パスを取得する

こんにちはkubo改めkubo-mです。地図アプリがないと目的地にたどり着けない方向音痴です。 家族にある場所への道順を「北に向かって進んでから〇〇で東に折れて……」と説明されて、「歩いている最中に方角なんてわからないから、右に曲がるか、左に曲がるかで…

CentOSでスペックを確認

こんにちは、hr-kです。今回はコマンドラインからCentOS系のマシンでスペックを確認する方法について書きたいと思います。 様々なサーバにログインして計算をする際や、サーバの中で計算を並列化したい時、サーバのスペックを調べる必要があります。 この時…

ピカピカの新入社員、会社説明会に参加しました

ピカピカ新入社員のFukuです✨ アメリエフでは、4月以前から少人数向けの会社説明会が開催されています。 私も、昨年就職活動をした者として会社説明会・懇談会に参加いたしまして、学生さんとお話ししております。 学生さん「Fukuさんは、どうしてアメリエフ…

データ解析プログラムが本当に稼働しているか、リアルタイム監視したい

ゲノムの解析においては、snpEffによるannotateなど時間のかかる計算というのがしばしばでてきます。その最中、プログラムが本当に走ってくれているかリアルタイムに監視したい、ということがままあります。topコマンドをはじめプロセス監視用コマンドは数種…

並列化可能性

こんにちは、hr-kです。 今回は計算プログラムの高速化、特にプログラムの並列化可能性に着目した話をしたいと思います。 計算を高速化する方法は大まかに3通りあります。 各CPUを上手に使う(CPU内部でのスレッド構造や型などをうまく利用) 単純にCPUの性能…

カーソルキーからの卒業~コピペを添えて~【ショートカットキー】

入社し日常的にlinuxを使い始めて1カ月半が経ちました、miyatakeyです。 目下の目標は「カーソルキーからの卒業」です。コマンドラインやvimで、カーソル移動にはついカーソルキーを触ってしまいます。ですが一行が長いことはざらですから、効率アップにショ…

カラフルなマンハッタンプロットを描く

SNP解析、GWASの結果の図示に広く使われるマンハッタンプロット。 これをカラフルにする方法、色の例をご紹介します。 マンハッタンプロットの作図には、統計解析ソフトRの、CRANパッケージ qqmanを利用すると簡便です。 install.packages("qqman") #パッケ…

宇宙物理からバイオインフォマティクスへ

こんにちは。hr-kです。今回は私の博士課程時代の専門である宇宙物理とアメリエフで取り扱っているバイオインフォマティクスの分野についてプログラミングの観点から少しお話ししたいと思います。 「宇宙物理とバイオインフォマティクスだと全く違いそう」と…

色々なプログラミング言語

こんにちは。hr-kです。今回の記事ではプログラミング言語の向き不向きの話をしたいと思います。 私はこれまでに学生時代を含めるとC言語, Fortran, Python, Rなど、複数の言語を用いてソースを書いてきました。 私の主観ではありますが、初学者向けにC言語,…

globでパスのリストを取得

kimotonです。 RのカテゴリーはあるのにPythonのカテゴリーないのですね、、勝手に作りました。 パスの取得は、パイプライン開発なんかの際によく必要になります。 Pythonの標準ライブラリglob を使えば、正規表現を使ってパスのリストが取得できちゃいます…

vcfファイルの読み出し(python)

こんにちは。hr-kです。今回は、前回の記事で書いたRでの方法に続いてpythonでvcfファイルを扱う方法を書きたいと思います。 pythonでvcfを開くときには、pyvcfが非常に便利です。 コマンドライン上でpipを通してインストールできますpip install pyvcf。 イ…

お手軽!「上手い文章」お役立ち本

こんにちは。「自分の知識や主張を、知らない人に説明する」ということに学生時代から四苦八苦しているmiyatakeyです。 極めようとすれば一生モノのこのテーマ、お悩みの方は多いのではないでしょうか。 今回はそんな人々で上達法を共有すべく、私の思うお役…

CRANって。。

kimoton です。 皆様休日は何をされてますかね。 わたくしkimoton、最近料理をしているのですが、書店でこのようなものを見つけてしまいました。 週末2時間で作れる! 1週間分のおかず (ei cooking)作者: 結城寿美江,ei cooking編集部出版社/メーカー: エイ出…

vcfファイルの読み出し

hr-kです。今回はRでvcfファイルを扱う時の話題で書きたいと思います。 Rでvcfファイルを扱うソースを書いており、気付いたことが一点。 Rでvcfを開くとき、vcfR(説明書のリンク)というライブラリにあるread.vcfRを使うのがすごく便利です。 具体的な使用方…

おまじない #linuxコマンド #初心者

アメリエフブログをご覧の皆さま、こんにちは。 新入社員のFukuです。最近好きなフラグは --help。 毎日、Linuxのコマンドを打っています。 すると、正しいコマンドを打ったつもりなのに、見本をコピー&ペーストしたのに・・・うまく動かない。赤文字のリン…