アメリエフの技術ブログ

Amelieff Staff Blog

ヘッダに注意

バイオインフォには関係ないのですが、少しつまづいたことです。

ReactomePAを使っています。
hatさんがかかれた紹介記事では、enrichPathway()でエンリッチされているパスウェイを取得した結果を棒グラフに描画していますが、summary()することでデータフレームにも変換できます。
> library(ReactomePA)
> library(DOSE)
> data(geneList)
> de <- names(geneList)[abs(geneList)>1]
> require(ReactomePA)
> x <- enrichPathway(gene=de, pvalueCutoff=0.05, readable=T)
> pathway.df <- summary(x)


データフレームはパスウェイ上にエンリッチされている遺伝子やp値などがまとめられている一覧表になっています。
> names(pathway.df)
[1] "ID" "Description" "GeneRatio" "BgRatio" "pvalue"
[6] "p.adjust" "qvalue" "geneID" "Count"


エクセルで開いてみたらわかりやすそうですので、データフレームをタブ区切りのテキストファイルに書き出しました。
> write.table(pathway.df, file = "reactomepa.txt", quote = FALSE, sep="¥t", col.names=TRUE)

このファイルをエクセルで開こうとするとエラーが起きてしまいます。
どうやら、ヘッダーが「ID」で始まるファイルを、エクセルは別のフォーマットのファイルだと判断することが理由のようです。

エクセルで開く前にヘッダを書き換えるか、最初からxlsxパッケージなどを使ってエクセル形式で出力したほうが良いようです。