こんにちは、バイオインフォマティクス実践ラボ管理者のnomura-yです。
バイオインフォマティクスに関心があるものの、独学では不安を感じる方を対象に、「バイオインフォマティクス入門」を長期連載としてお届けします。
まずは初回から3回にわたって、データ解析に広く利用されているプログラミング言語「R」の基礎を解説します。
【BI入門①】R入門:環境構築と基本操作 ←本記事
【BI入門②】R実践:データの可視化と関数活用
【BI入門③】Rによる生物データハンドリング
【BI入門④】Python入門:Windows上でのPython・Jupyter実行環境構築
R実行環境構築
Rは、Windows、Mac、Linuxといった様々なOSで動作します。
- Windows: ユーザー数が多く情報が充実しており、PCの種類が豊富です。
- Mac: Appleシリコン(M1/M2など)とIntel製CPUで一部動作が異なることがありますが、Rの基本的な動作に大きな違いはありません。
- Linux: コマンドラインでの操作が基本となります。大容量メモリや高いCPUパワーが必要な大規模データ解析(例:シングルセルRNA-seqデータの統合解析、主成分分析、クラスター解析)では、Linuxサーバー上でのRが非常に強力な選択肢となります。
また、Rの実行環境は、主に以下の3つがあげられます。
- 純正Rソフト: CRAN (Comprehensive R Archive Network)の公式サイトからダウンロードできます。Windows版、Mac版、Linux版が用意されており、マウスクリックで簡単にインストール可能です。
- RStudio Desktop: Posit(旧RStudio PBC)が提供しているRの統合開発環境(IDE)です。個人利用やアカデミック用途では無償で利用でき、Rのインストール後にRStudioをインストールします。変数やテーブルの確認など、Rの作業を直感的に行え初学者の方におススメのツールです。
- Jupyter Notebook: 解析の自動化やワークフロー化、実験ノート作成などを考える場合に活用されることがあります。RだけでなくPythonなどにも対応しており、対話的な解析やバッチ処理に適しています。
Rでの基本的なデータ操作
今回は、純正Rソフトを使って基本的なデータ操作を紹介します。
<コマンドテスト環境>
- R version 4.5.1
<インストール方法>
公式サイトからお使いのOSにあったバージョンをダウンロードしてください。
本記事ではWindows版をダウンロードし、インストーラーをダブルクリックして画面の指示に従ってインストールしました。
Rは基本的な四則演算(足し算、引き算、掛け算、割り算)に利用できます。
> 3 + 4 [1] 7 > 3 * 4 [1] 12 > 3 / 4 [1] 0.75 > 3 - 4 [1] -1
変数への代入も可能です。
> a <- 3 > b <- 4 > a + b [1] 7
今回は純正Rソフトを使用しましたが、RStudioを使用すると、右上の環境ペインで変数とその値を確認できるため、非常に便利です。

次回予告
第2回では、Rの強力な可視化機能に焦点を当てます。Rを関数電卓として使ったり、散布図やヒストグラムといった基本的なグラフ作成を手軽に行う方法を解説します。
▼第2回はこちら▼ staffblog.amelieff.jp
※本記事は、2023年3月6日開催の第81回バイオインフォマティクス勉強会「バイオ研究者のためのR入門」講演内容をベースに作成しております。
動画で本記事の内容を視聴したい、講演資料PDFをダウンロードしたい方は、アメリエフの運営する会員制動画サイト「バイオインフォマティクス実践ラボ」にご登録ください。

