R言語のデータ分析ツール:data.tableとdplyrの比較、そして私の挑戦

Rやdata.tableを日本で広めるには?

七月も終わりそうな頃、やや遅れて振り返ると、data.tableをちょっと触ってみた。SQL使いには最初ピンとこない「i, j, by」構文だけど、数日で何となく慣れる感じ。二百数十万行くらいのデータを処理したら一瞬で終わって驚いた記憶がある(dplyrより数倍速い)。けど、「i, by」だけの操作はどうもうまくいかなかったな。dplyrのtidy evaluationにも手を出してみたり、seplyrというパッケージが話題になってて、自分みたいにRオンリーじゃない人には良さそうだと思った。

普段はVBAとかQlikViewも使うから、ツール間の切り替えコストに悩むことも多い。例えばエクセル添付ファイルをネットワークに移す作業から始めて、Rでマクロ付きファイルまとめたり、その後またSSISとSQL動かして分析結果はggplot2で静的可視化、とかそんな流れがよくある。スムーズな日は十分足らずで全部片付くこともあれば…まあ波はある。

Qlik Sense初挑戦ではメタリカのBPM調べたけど情報ばらつき激しかったし、Excel以前のボックスプロット作成なんて今考えると地獄みたいだったなと思うことも。SSD新調してPC爆速になったので今後更新頻度…上げるつもりだった気がする

本段の参照元: https://www.johnmackintosh.net/blog/2017-07-27-July_Roundup/

新しいツールに挑戦する勇気を持とう

生命の本質とは、絶え間ない探索と適応だ。あらゆる生き物が、それぞれに独特な迷路のようで、未知と可能性に満ちている。この世界は複雑に見えて、実はどこかリズムを感じさせる。生命は掴みどころがない方法で進んでいて、ある時はゆっくりと、またある時は一気に駆け抜けるように動くけれど、いつでも何か言葉にできない一定のテンポを保っている。そのリズムは個々の人生だけでなく、生態系全体の動きにも現れている。生命とはまるで終わりのない即興演奏のようなもので、一瞬一瞬が予想外の驚きと新たな発見にあふれているのだ。

新しいツールに挑戦する勇気を持とう

Related to this topic:

Comments