アメリエフの技術ブログ

Amelieff Staff Blog

CRANって。。

kimoton です。

皆様休日は何をされてますかね。 わたくしkimoton、最近料理をしているのですが、書店でこのようなものを見つけてしまいました。

週末2時間で作れる! 1週間分のおかず (ei cooking)

週末2時間で作れる! 1週間分のおかず (ei cooking)

「週末2時間で作れる! 1週間分のおかず 」

これすごいんです。書いてある材料を買って必死に2時間手を動かしてたら1週間分のおかずが出来上がるらしいんです。

騙されたと思ってやってみたら、4時間かかりました!(スゴイ!!
でもでも達成感は素晴らしいのでチャレンジングな皆さんは是非!

CRANのお話

今回はCRANについてのお話。 CRANとは!

CRAN (Comprehensive R Archive Network)は、R本体や各種パッケージをダウンロードするためのWebサイトで、 全世界にミラーサイトが存在する。適切なミラーを選べば利用者の側には高速で快適なダウンロードが、サーバ管理者の側には負荷の軽減が期待できる。
引用元:CRAN国内ミラーの使い方 - RjpWiki

そうです。適切なCRANミラーサイトを選択しておくことは積もり積もって大きな時間の節約となるのです。

ということで、あるパッケージを対象に、各ミラーサイトからのダウンロード時間についてベンチマークをとってみました!
ちなみに、CRANミラーサイトを指定してインストールするには以下のようにします。

install.packages(pkgName, repos="http://cran.ism.ac.jp/")

ミラーサイトの一覧はここから。

Japanの項目には以下の3つのミラーサイトが書かれてます。
統計数理研究所(http)(http://cran.ism.ac.jp/)
統計数理研究所(https)(https://cran.ism.ac.jp/
山形大学(https://ftp.yz.yamagata-u.ac.jp/pub/cran/)

日本だけじゃつまらないので、
カナダのトロント大学(http://cran.utstat.utoronto.ca/)、
アメリカのカリフォルニア大学(https://cran.cnr.berkeley.edu/
も一緒に計測してみました。

結果は!!

f:id:kimo-n:20180418074440p:plain

Tokyo_http Tokyo_https Yamagata Toronto California
2.21228 2.30206 2.45060 3.92136 4.01916

はい。
統計数理研究所(http)が一番早かったです。 次いで統計数理研究所(https)、山形大学、その他海外のミラーという結果になりました。

距離が影響しているのは間違いないようですね。

毎回指定するのめんどくさい

そんなあなたに。

options()コマンドにより、ミラーサイトを指定できます。 このコマンドをホームディレクトリに置いたRの初期化ファイル(.Rprofile)に書くことで、R起動時に毎回実行、指定することができます。

options(repos="http://cran.ism.ac.jp/")

自分の場合、ミラーサイトだけでなくライブラリの読み込み先なんかもここで定義してます。 ライブラリ読み込み先を追加するコマンドはこちら

.libPaths("/home/kimoton/R/library/")

CRANって。。

クランなの?シーランなの?

なんかどっちでもいいみたいですよ。 かわいいので自分はクランと呼んでます。