読者です 読者をやめる 読者になる 読者になる

アメリエフのブログ

Amelieff Staff Blog

統計解析ソフトR

重複値の削除や抽出

Rで、ベクトルなどに含まれる重複した値をユニークにしたいとき、unique()を使用します。 > a [1] "AAA" "BBB" "CCC" "AAA" > unique(a) [1] "AAA" "BBB" "CCC" linuxコマンドの、隣り合っている重複行をユニークにするuniqコマンドとよく混同して、uniqと書…

seq2pathwayでアノテーション(後)

Bioconductorのseq2pathwayパッケージを使ってパスウェイのアノテーションを行います。 ※seq2pathwayのインストールはこちらの記事をご覧ください。 seq2pathwayパッケージに含まれているテストデータを使ってテストしてみましょう。 library(seq2pathway) d…

seq2pathwayでアノテーション(前)

ChIP-seqやRIP-seqでピークが得られた後は、遺伝子をアノテーションしたり、それらの遺伝子がどんなパスウェイに関連するか調べたりしたいですね。 Bioconductorのパッケージseq2pathwayを使って、ゲノム領域に遺伝子をアノテーションしたり、遺伝子にパスウ…

ヘッダに注意

バイオインフォには関係ないのですが、少しつまづいたことです。 ReactomePAを使っています。 hatさんがかかれた紹介記事では、enrichPathway()でエンリッチされているパスウェイを取得した結果を棒グラフに描画していますが、summary()することでデータフレ…

paste関数を使う

短い間ですが、弊社のトレーニングのTAを担当させていただいていた時期があります。 RのTAをやるなかで、とても便利なのに、初めてRに触れる方が戸惑われることが多いと感じたポイントのひとつに paste 関数があります。 今回は paste 関数をあれこれいじく…

heatmapの横に色をつけるオプション

heatmap関数のRowSideColors/ColSideColorsオプションの紹介です。 gplotsパッケージのheatmap.2やheatmap3パッケージでも同様の機能があります。 ヒートマップのデンドログラムの横に、カラフルなサイドバーを付ける機能です。 テスト用のマトリクスを作り…

一部のデータだけ抜き出す

Rで解析をしていると、データフレーム(やマトリクスやベクトル)から、条件を満たすデータだけを抜き出したいことがよくあります。 そんなときはsubset関数を使います。 例として、みんな大好きirisを使います。 > head(iris) Sepal.Length Sepal.Width Pet…

heatmap.2のlmatオプション

Rにはデフォルトでもヒートマップを作成するheatmap関数がありますが、私はheatmap関数より多機能なgplotsパッケージのheatmap.2関数をよく使います。 基本的な使い方はheatmap関数と同じです。 gplotsパッケージをインストールしていない場合はインストール…

RSQLite依存パッケージインストールのエラーについて

ある環境で使用していたとあるBioconductorパッケージを、別の環境でも使うためインストールしようとしたらエラーが出ました。 具体的にはggbioとbiovizBase、他にもhatさんご紹介のReactomePAもダメでした。 エラー文を見てみると、「RSQLite」パッケージの…

続・Rでgrep

以前、Rのgrep()についての記事で、grep()は文字列のベクトルにのみ使えるとご紹介しましたが、今回はマトリクスやデータフレームではどうしたらよいか?という記事です。 例として以下のような文字列のマトリクスを用意しました。 1列目が季節、2列目が英語…

Rでgrep

Rのオブジェクトから、特定のキーワードを含む要素だけ抜き出したいときはどうしたらいいでしょうか。 ベクトルの場合はgrep()関数が使用できます(grepの仲間にgrepl、regexpr、gregexpr、regexec、検索後に置換を行うsub、gsubがあります)。 このgrepは文…

遺伝子にGeneOntologyのアノテーションをつける(2)

前回はbiomaRtパッケージを使って、「ADH1B」「ALDH2」遺伝子にGeneOntologyのアノテーションをつけました。 今回は、RamiGOパッケージを使って、それらのGeneOntologyIDがどのような関係にあるか、図示してみたいと思います RamiGOパッケージをインストール…

遺伝子にGeneOntologyのアノテーションをつける(1)

_★ _▲ ▲▲▲ R Advent Calendar 2013に参加させていただいております。 _■ Bioconductorは、バイオ解析関連のRパッケージを集めたサイトです。 750個以上(2013年12月時点)の有用なパッケージが登録されています。 複数の遺伝子の特徴の傾向を見たい時に、…

特定の列をキーに行列を並び替える

ベクトルやリストを並び替えるときはsort()関数を使いますが 行列(マトリクス)やデータフレームを、特定の列をキーにして 並び替える場合はorder()という関数を使います。 同じジュースが、250ml・100円、350ml・120円、180ml・80円で 売られています。 1…

Rで家系図描画

家系解析を行っている方は、家系図を描く機会が多いのでは ないでしょうか。 kinship2というパッケージを使うと、Rで家系図を描くことができます。 (1)家系図情報ファイルの作成 以下の内容のテキストファイルを作成します。 id father mother sex name 1…

あの花はどんな花

Rの非常に有名なテストデータの一つ「iris」は、 アヤメの花弁の長さ・幅、ガクの長さ・幅のデータです。 ※アヤメのガクは、黄色い筋が入っていて外に垂れ下がっている部分です。 setosa(セトサ)種、versicolor(バージカラー)種、 virginica(バージニカ…

SRAをRで検索

毎日寒いですね。 家ではこたつから出られなくなって、こたつの中で生活している方もいらっしゃるのではないでしょうか。 今日は、RでNCBI SRAのデータを検索するRパッケージ「SRAdb」をご紹介します。 最近出たばかりのSRAdbの論文はこちらです。 Zhu Y, St…

Rユーザ会に参加してきました

hatです。 先週土曜日、2012年度統計数理研究所共同研究集会「データ解析環境Rの整備と利用」の「国内ユーザーによる報告」に参加してきました。 普段はバイオの話ばかりなので、疫学やTwitter解析や感染症シミュレーションなど、他分野のお話がたくさん伺え…

Rでつなぐ次世代オミックス情報統合解析研究会

明日、理化学研究所で開催される “Rでつなぐ次世代オミックス情報統合解析研究会” に参加してきます! (詳細はコチラ) NGSの解析に特化したRを学べる事は、大変嬉しいです。 パワーアップをめざします!

ご指摘ありがとうございます!(箱ひげ図)

箱ひげ図の概念に対し、ご指摘いただきました。 誠に申し訳ありません。訂正し、御詫び申し上げます。 またご指摘いただきまして、誠にありがとうございます。 下記に訂正、追加説明を行います。 箱ひげ図の概念図(訂正版)をFigure1に示します。 Figure1 …

中央値と箱ひげ図

昨日は、中央値について記述しました。 本日は、Rを用いた中央値の算出方法と箱ひげ図の作成について記述します。 よろしくお願いいたします。 例としまして 21歳, 23歳, 23歳, 25歳, 22歳, 60歳の方々の中央値を算出します。 中央値を算出する際は、median(…

夏といえば!

最近鼻血がよく出るタノです。 先日Rスクリプトを作成するためのツール“Tinn-R”を紹介しました(参照)。 本日は、“Tinn-R”とRを用いてちょっと簡単なグラフ作成をしてみたいと思います。 よろしくお願いします。 突然ですが、夏といえば・・・・ダイエット…

Rでスクリプトを書くときは!!

こんにちは。 本日より、R漬けの日々を過ごします、タノです。 学生時代にやっていたとはいえ、大量のデータに四苦八苦しております。というわけで、本日は、私が愛用しているRスクリプトを書くためのR code editor、“Tinn-R”を紹介します。 Tinn-Rは、R言語…

R 「関数textとlegend 5」

R 「関数textとlegend」では、文字列と凡例を書き込みました。 書きこんだ文字列が見にくいようなので、位置を調節します。 太字の部分を書き足しました。 # デバイス領域 png("110131_iris.png", height=700, width=500) # 作図領域 par(mar=c(4,4,2,6),xpd…

R 「関数textとlegend 4」

前回のおさらいとして、関数textで「○」をプロット領域に書きます。 次に、プロット領域の外に凡例を書き込みます。 前回のプログラムに、太字の部分だけ追加しました。 # デバイス領域 png("110114_iris.png", height=700, width=500) # 作図領域 par(mar=c…

R 「関数textとlegend 3」

集団から外れている個体番号を目で確認したい場合など、関数textを使うと便利です。昨日のプログラムに、太字の部分だけ追加しました。 # 散布図 png("110113_iris.png", height=600, width=400) plot(iris[,1], iris[,3], xlab="iris[,1]", ylab="iris[,3]"…

R 「関数textとlegend 2」

まず、irisデータの散布図を描きます。 speciesデータ(5列目)ごとに、記号の形と色を変えます。 次に、関数legendで凡例を書き加えます。 # 読込 data(iris) # 散布図 png("110112_iris.png", height=600, width=400) plot(iris[,1], iris[,3], xlab="iris[,…

R 「関数textとlegend 1」

関数textを使って、作図領域に文字列を描画する。 text(x, y, labels, ...) 関数legendを使って、凡例を追加する。 legend(x, y, legend, ...) 今週は、ふたつの関数を使用して、図の中に文字を入れていきたいと思います。

R「グラフィックス参考実例」

Rで作図する際、見やすい図にこだわり始めると、結構な時間がかかってしまいます。日頃からRwikiに大変お世話になっていますが、とっても素晴らしいページを発見したのでメモします。 グラフィックス参考実例集 プログラムの実例が沢山載ってます

Rを使って図を描こう5

今日は、研究対象の集団の特性を見ていきたいと思います。 ここでの臨床データは、測定数値などの連続変数を対象にします。 臨床データのファイル名は「clinical.txt」にしました。 number Age HT BW BMI Waist HbA1c Adiponectin IL.6 Leptin 1 51 169.5 5…

Rを使って図を描こう4

昨日は、Rで図を描くために 1.データファイルの準備 2.データファイルの読み込み の2ステップを行いました。 今日は、3ステップ目の「グラフの描画」です。 作図ドライバを起動して、PNG形式の画像ファイルに書き込んでいきます。 「''」の中でファイ…

Rを使って図を描こう3

ここでは、Expression-QTL解析により示唆された複数のeQTL候補のうち、ひとつだけを選び出して、図を作成し保存すると想定して作業していきたいと思います。 Rで図を描くための簡単な手順は以下の通りです。 1.データファイルの準備 2.データファイルの…

Rを使って図を描こう2 -Rの準備-

RをCRAN(The Comprehensive R Archive Network)からダウンロードします。OSによってダウンロードするファイルが違うのでご注意ください。 次に、インストールします。 Macintosh の場合は、http://aoki2.si.gunma-u.ac.jp/R/begin.html Windows・Linux の場…

Rを使って図を描こう1

キムです。 先週は、PLINKを用いたQTL解析やGWAS、Expression QTL解析を紹介してきました。 今日からは、ExpressionQTL解析で有意差が確認されたSNPのデータから、 Rを使って箱ひげ図を作成する作業をしていきたいと思います。 Rは統計計算とグラフィック機…