アメリエフのブログ

Amelieff Staff Blog

統計解析ソフトR

R, Rstudioでスクリプト読み込みは文字コードに気を付けて

今日のテーマはRでスクリプトの読み込み&実行 です。エラーについて聞かれたので、原因である文字コード対策を紹介します(*^ー^*)

手っ取り早くRをビルドしてインストールする

Rをソースからビルドしてインストール!! (語感がルー◯柴感ある)

Rのpchの種類

グラフのマーカーの色と形、使いこなしてみましょう

pca, tsne, umapの座標を書き出す

シングルセルRNA解析ソフトSeuratで、UMAP, tSNEなどのX, Y座標を取り出す方法です。書き出せばLoupe Browserなど他のソフトでも使えるようになります。

2遺伝子を重ねて発現プロット 〜シングルセル Seurat〜

シングルセル RNA解析パッケージ Seuratの便利機能。FeaturePlotで、2つの遺伝子発現を重ねて可視化することができます。

RでXMLパッケージがインストールできない時の意外な落とし穴

R環境だけで解決する問題ではなかったんです。

バリアフリー

ソフトウェアの警告メッセージに教わった話です。作図のときは、色盲の人にも見分けやすいように色分けしよう。

Rスクリプトの使い方 ②Rスクリプトで図を描画

Rで作図するとき、コマンドを一つ一つ打つと出来るのに、Rスクリプトを実行するとうまく描画できないこと、ないですか? Rスクリプトでも問題なく描画するルール2選!

Rスクリプトの使い方

長いコマンドを打つときや、 同じコマンドを繰り返し実行するときは、スクリプト(ファイルに書いておいたコマンド)を使うと便利です。 Rでスクリプトの使い方、2選!

(Rで)VCFにアノテーション "VariantAnnotation" ②

Rに読み込んだVCFに、アノテーションを付加しましょう。 staffblog.amelieff.jp VariantAnnotationの公式説明書はこちらです。 アノテーションの付加には、Bioconducterのアノテーションデータパッケージを利用します。 パッケージ一覧はこちらから見られま…

(Rで)VCFの読み込み "VariantAnnotation" ①

VCF(Variant Call Format)をRで読みましょう! Rパッケージ "VariantAnnotation" をご紹介します。 VariantAnnotationはVCFを読み込み、更にアノテーションパッケージを利用してアノテーションを付与することが可能です。 列の分類やPOS表記に少しクセがあり…

カラフルなマンハッタンプロットを描く

SNP解析、GWASの結果の図示に広く使われるマンハッタンプロット。 これをカラフルにする方法、色の例をご紹介します。 マンハッタンプロットの作図には、統計解析ソフトRの、CRANパッケージ qqmanを利用すると簡便です。 install.packages("qqman") #パッケ…

CRANって。。

kimoton です。 皆様休日は何をされてますかね。 わたくしkimoton、最近料理をしているのですが、書店でこのようなものを見つけてしまいました。 週末2時間で作れる! 1週間分のおかず (ei cooking)作者: 結城寿美江,ei cooking編集部出版社/メーカー: エイ出…

vcfファイルの読み出し

hr-kです。今回はRでvcfファイルを扱う時の話題で書きたいと思います。 Rでvcfファイルを扱うソースを書いており、気付いたことが一点。 Rでvcfを開くとき、vcfR(説明書のリンク)というライブラリにあるread.vcfRを使うのがすごく便利です。 具体的な使用方…

重複値の削除や抽出

Rで、ベクトルなどに含まれる重複した値をユニークにしたいとき、unique()を使用します。 > a [1] "AAA" "BBB" "CCC" "AAA" > unique(a) [1] "AAA" "BBB" "CCC" linuxコマンドの、隣り合っている重複行をユニークにするuniqコマンドとよく混同して、uniqと書…

seq2pathwayでアノテーション(後)

Bioconductorのseq2pathwayパッケージを使ってパスウェイのアノテーションを行います。 ※seq2pathwayのインストールはこちらの記事をご覧ください。 seq2pathwayパッケージに含まれているテストデータを使ってテストしてみましょう。 library(seq2pathway) d…

seq2pathwayでアノテーション(前)

ChIP-seqやRIP-seqでピークが得られた後は、遺伝子をアノテーションしたり、それらの遺伝子がどんなパスウェイに関連するか調べたりしたいですね。 Bioconductorのパッケージseq2pathwayを使って、ゲノム領域に遺伝子をアノテーションしたり、遺伝子にパスウ…

ヘッダに注意

バイオインフォには関係ないのですが、少しつまづいたことです。 ReactomePAを使っています。 hatさんがかかれた紹介記事では、enrichPathway()でエンリッチされているパスウェイを取得した結果を棒グラフに描画していますが、summary()することでデータフレ…

paste関数を使う

短い間ですが、弊社のトレーニングのTAを担当させていただいていた時期があります。 RのTAをやるなかで、とても便利なのに、初めてRに触れる方が戸惑われることが多いと感じたポイントのひとつに paste 関数があります。 今回は paste 関数をあれこれいじく…

heatmapの横に色をつけるオプション

heatmap関数のRowSideColors/ColSideColorsオプションの紹介です。 gplotsパッケージのheatmap.2やheatmap3パッケージでも同様の機能があります。 ヒートマップのデンドログラムの横に、カラフルなサイドバーを付ける機能です。 テスト用のマトリクスを作り…

一部のデータだけ抜き出す

Rで解析をしていると、データフレーム(やマトリクスやベクトル)から、条件を満たすデータだけを抜き出したいことがよくあります。 そんなときはsubset関数を使います。 例として、みんな大好きirisを使います。 > head(iris) Sepal.Length Sepal.Width Pet…

heatmap.2のlmatオプション

Rにはデフォルトでもヒートマップを作成するheatmap関数がありますが、私はheatmap関数より多機能なgplotsパッケージのheatmap.2関数をよく使います。 基本的な使い方はheatmap関数と同じです。 gplotsパッケージをインストールしていない場合はインストール…

RSQLite依存パッケージインストールのエラーについて

ある環境で使用していたとあるBioconductorパッケージを、別の環境でも使うためインストールしようとしたらエラーが出ました。 具体的にはggbioとbiovizBase、他にもhatさんご紹介のReactomePAもダメでした。 エラー文を見てみると、「RSQLite」パッケージの…

続・Rでgrep

以前、Rのgrep()についての記事で、grep()は文字列のベクトルにのみ使えるとご紹介しましたが、今回はマトリクスやデータフレームではどうしたらよいか?という記事です。 例として以下のような文字列のマトリクスを用意しました。 1列目が季節、2列目が英語…

Rでgrep

Rのオブジェクトから、特定のキーワードを含む要素だけ抜き出したいときはどうしたらいいでしょうか。 ベクトルの場合はgrep()関数が使用できます(grepの仲間にgrepl、regexpr、gregexpr、regexec、検索後に置換を行うsub、gsubがあります)。 このgrepは文…

遺伝子にGeneOntologyのアノテーションをつける(2)

前回はbiomaRtパッケージを使って、「ADH1B」「ALDH2」遺伝子にGeneOntologyのアノテーションをつけました。 今回は、RamiGOパッケージを使って、それらのGeneOntologyIDがどのような関係にあるか、図示してみたいと思います RamiGOパッケージをインストール…

遺伝子にGeneOntologyのアノテーションをつける(1)

_★ _▲ ▲▲▲ R Advent Calendar 2013に参加させていただいております。 _■ Bioconductorは、バイオ解析関連のRパッケージを集めたサイトです。 750個以上(2013年12月時点)の有用なパッケージが登録されています。 複数の遺伝子の特徴の傾向を見たい時に、…

特定の列をキーに行列を並び替える

ベクトルやリストを並び替えるときはsort()関数を使いますが 行列(マトリクス)やデータフレームを、特定の列をキーにして 並び替える場合はorder()という関数を使います。 同じジュースが、250ml・100円、350ml・120円、180ml・80円で 売られています。 1…

Rで家系図描画

家系解析を行っている方は、家系図を描く機会が多いのでは ないでしょうか。 kinship2というパッケージを使うと、Rで家系図を描くことができます。 (1)家系図情報ファイルの作成 以下の内容のテキストファイルを作成します。 id father mother sex name 1…

あの花はどんな花

Rの非常に有名なテストデータの一つ「iris」は、 アヤメの花弁の長さ・幅、ガクの長さ・幅のデータです。 ※アヤメのガクは、黄色い筋が入っていて外に垂れ下がっている部分です。 setosa(セトサ)種、versicolor(バージカラー)種、 virginica(バージニカ…