アメリエフの技術ブログ

Amelieff Staff Blog

Python

【機械学習】乳がんのデータセットから悪性か良性か予測する【Python】

必要最小限の Python スクリプトで、乳がんのデータセットから悪性か良性か予測する機械学習モデルを構築!

Nextflowで始めるNGSデータ解析ワークフロー(4/4)

nf-coreで公開されているNextflowパイプラインをカスタマイズする方法について解説

Nextflowで始めるNGSデータ解析ワークフロー(3/4)

Nextflowを利用して、RNA-seqパイプラインを実行する方法について解説

Nextflowで始めるNGSデータ解析ワークフロー(2/4)

Nextflowの基本的な使い方について解説

Nextflowで始めるNGSデータ解析ワークフロー(1/4)

バイオインフォマティクス解析で使用されるNextflow言語について解説

Reactome において第二階層のパスウェイを検索する方法

Reactome のデータを使うことで、第二階層のパスウェイを検索する方法を紹介!

Linux R Python入門におすすめの本

Linux、R、Pythonのおすすめ入門書です。新入社員も読んでいます!

Seleniumでスクレイピング

PythonライブラリのSeleniumでスクレイピングを行う方法を細かく解説します。情報収集や業務効率化に役立ちます!

venvでPython仮想環境を構築

venvで仮想環境構築

Pythonで配列アライメントおよび分子系統樹を書く

Biopythonを使った「配列アライメントの実行」と「分子系統樹の描画」を紹介します💫

VCFファイルをPythonで扱う(cyvcf2の紹介)

VCFを分析できるPythonモジュール・cyvcf2の紹介です⭐️

python : importで自分で書いたプログラムを使おう

pythonの`import`を用いると、パッケージを読み込んで様々な関数を使えます。 自分で定義した他のpythonプログラムもimportできます。長いプログラムを書くときや、機能別にファイルを分けたいときに便利!

Pythonで全ゲノムFASTA=>染色体毎FASTAを作成してみた

全ゲノムFASTAだけでなく、染色体ごとのFASTAの入力が必要な解析ツールってありますよね🥺全ゲノムFASTAならある、、、そんな時はpythonですぐに作れます💫

pythonで重い計算の実行時間を減らす発想

pythonでloopのご利用は計画的に!

バイオインフォマティシャン的視点でPythonの組み込み関数について考えてみた

Pythonコーディング新2年生のアメリエフ社員が厳選する、Python組み込み関数3選✨

読みやすいPythonコーディングを心がける

コーディング規約に従って、誰でも読みやすく理解しやすい、美しいコードを書きたい...!今日は、Pythonのコーディング規約「PEP8」について学びます👀💡

pythonで連番の関数実行や呼び出し

こんにちはーhr-kです。pythonで、同じような関数を100回書かないといけないこと、ないですか?? 「括弧内の文字列をpythonのコードとして実行する」`exec`という関数で解決!コード例付き!

第49回バイオインフォマティクス勉強会を開催しました

7月の勉強会の模様をお届けします(^-^) 東京では久しぶりの晴れ空となったこの日。 テーマは 1. NGS解析頻出データフォーマット解説 2. Pythonを使ってNGSデータを自分好みのExcelにまとめる。

pythonの辞書型の使い方

こんにちは、hr-kです。今回はpythonで多用する「辞書(dict)型」の使い方を簡単にご紹介します。 pythonで辞書は以下の形で定義できます。 # {key1:value1, key2:value2, ...} >>> test = {'A': 'Archaeology', 'C': 'Cosmology', 'G': 'Geology', 'T': 'Top…

pythonでキャッシュをとる

こんにちは、hr-kです。今回はpythonで、同じ関数を使い倒す時に、より早く計算する手法をご紹介します。 pythonで以下のようなコード(test.py)を書くとします。 import time def test(text): # なんか重たい処理 texts = '' for i in range(1000): texts = …

globでパスのリストを取得

kimotonです。 RのカテゴリーはあるのにPythonのカテゴリーないのですね、、勝手に作りました。 パスの取得は、パイプライン開発なんかの際によく必要になります。 Pythonの標準ライブラリglob を使えば、正規表現を使ってパスのリストが取得できちゃいます…

vcfファイルの読み出し(python)

こんにちは。hr-kです。今回は、前回の記事で書いたRでの方法に続いてpythonでvcfファイルを扱う方法を書きたいと思います。 pythonでvcfを開くときには、pyvcfが非常に便利です。 コマンドライン上でpipを通してインストールできますpip install pyvcf。 イ…

どんな改行コードでも・後

前回に引き続き改行コードの処理の話です。 今回はPerl・Pythonのなかでどう扱うか、コード例を挙げて説明します。 perlの例 行末の「¥n」はchompで取り除くことができます。それ以外は正規表現を使うと簡単と思います。 open IN,"file.txt" or die "$!";whi…

どんな改行コードでも・前

弊社のトレーニングやNGSハンズオン講習会などでPerlやPythonに触れた方は「『¥n』で行の末尾を示す」と聞いたことがあると思います。 『¥n』はLine Feed、LFとも呼び、LinuxまたはMac OS Xで使われる改行コードです。改行コードはOSの種類やバージョン、ソ…

Pythonでgzipされたテキストファイルをcsvモジュールで読み込む

gzip圧縮されたファイルをPythonで読み込むときには、少し注意が必要です。 例として、手元に偶然あった魔法の言葉が書かれたタブ区切りテキストファイルを使用してみます。 zcat supercalifragilisticexpialidocious.txt.gzsuper cali fragilistic expia li…

Pythonを書くときに、タブじゃなくてスペースでインデントする

こんにちは。 先日、金さん(kimk)がお土産で買ってきてくださった栗羊羹があまりに美味しかったので、いっそ羊羹をまとめ買いするかどうか、悩んでいる久保(kubor)です。 羊羹のまとめ買いで悩む方が読者にいるかどうかはわかりませんが、プログラムを書…

Python デバッグ

Pythonに限った話ではありませんが、一生懸命プログラムを書いて、いざ実行すると、いくつものバグに遭遇します。エラーが出る、あるいは、エラーは出ないのに、プログラムが意図したとおりに動いてくれないということも。 こういう場合、きっとどこかで条件…

Pythonの19のおきて

温泉街などに行くと「長生きの心得 10訓」や「夫婦円満の秘訣 20条」などを湯飲みやペナントに書いたものが売られているのを目にすることがあります。 箇条書きなので一見説得力がありますが、良く読むとそれほど実のあることを言っていなかったりして、その…

数値をカンマで3ケタ区切りにする

先日、数年ぶりに同い年の従兄弟に会いました。彼は正規表現の研究をしています。具体的にどんな研究をしているのか想像できないのですが、日頃からお世話になっている技術なので、お礼を言っておきました。 ということで、正規表現を使って、数値を3ケタの…

Pythonでグラフを書こう その3

Pythonでグラフを書こう、の第3回です。 前回の記事では、matplotlibを使用して円グラフを描いてみました。今回はそのプログラムのソースを見ていきたいと思います。 前回の記事でダウンロードした pie_chart.py をテキストエディタなどで開くと以下のよう…