前回は、ChemmineOBというパッケージを使って化合物のPubChem fingerprintを取得しました。
今回では、そのfingerprintを使って、類似比較・クラスタリング解析を行います。
fingerprintによる類似検索
fpset[1]と類似したものをfpset全体から検索します。
fpSim(fpset[1], fpset, method="Tanimoto", cutoff=0.4, top=4)化合物のIDと類似度が出力されます。今回解析した10サンプル中に、cutoff以内で類似している化合物がなかったようです。
650001
1
fingerprintを用いたクラスタリング解析
simMA <- sapply(cid(fpset), function(x) fpSim(fpset[x], fpset, sorted=FALSE))
hc <- hclust(as.dist(1-simMA), method="single")
plot(hc,hang=-1)
ヒートマップの作成
クラスタリングまでしたら、ヒートマップだって描きたいですよね。
library(gplots)
heatmap.2((1-simMA), Rowv=as.dendrogram(hc), Colv=as.dendrogram(hc), col=bluered(256), density.info="none", trace="none")
これで化合物間の類似関係が視覚的にわかりますね!
(10サンプルなので少々つまらない結果になりましたが……)
非常に簡単な紹介となりましたが、以上でChemmimeRに関する連載は終了です。
私にとって、あまり触れたことのないケモインフォマティクス解析の良い勉強となりましたが、皆様の研究の一助にもなれば幸いです。