前回までで、SDFデータの読み込みと、データのvalidationをご紹介しました。
今回は、読み込んだ化合物のfingerprint/atom pair descriptorを取得する方法です。
SDFsetからfingerprint/atom pair descriptorへの変換には、ChemmineOBという新しいパッケージをインストールします。
Open Babelというツールを扱うためのRインターフェースです。
biocLite("ChemmineOB")
library(ChemmineOB)
※ Open Babelのデータベースの関係で、OSによって挙動が違うようです。詳細はChemminOBのREADMEをご覧ください。
化合物のFingerprintの取得
fingerprintを取得します。
fpset<-fingerprintOB(sdfset,"FP2")
fpset
An instance of a 1024 bit "FPset" of type "FP2" with 10 molecules
fingerprint以外にもatom pair descriptorでも解析できます。
apset <- sdf2ap="" sdfset="" br=""> apset
An instance of "APset" with 10 molecules
次回では、fingerprintを使った類似検索・比較を行います。