NHSデータ分析の衝撃…日本で再現したら起こりそうな3大壁
NHSRdatasetsパッケージって、あれ、CRANに載ったのってそんなに昔じゃなかったと思うんだよね。いや、自信ないけど。なんとなく最近だったような記憶がある。えっと、このパッケージはNHSのデータアナリスト向けらしい、という話を聞いたことがある。でも、いざ自分で触れてみたら案外手軽でびっくりした。ま、そういうものか。
実際、runcharterという別のパッケージも併用することが多いらしいし——ああ、ここで思い出したけどdplyrだけでも何とかなることが多い気もするんだよね。まあ全部dplyrでやろうとすると無理が出る場合もあるけど、それはそれとして……。
ae_attendancesっていうデータセット、中身をぱっと見た限りでは数千行ちょっとだった気がするし、変数も七つに満たない印象だったかな。正確な数は今ここには出てこないんだけど。日付や数字がずらっと並んでいて、全体像を掴むのには少しコツが要るかもしれない、とふと思ったりもした。
あとdata.tableについてはね、苦手意識ある人多いイメージだけど、一度慣れると作業スピード何倍にもなるって話を聞いたこともある。いや、本当に誰でもすぐ理解できるかどうかは微妙だと思うけどさ……まあ、人によるってことでしょう。
結局、その人の環境や好みによってツール選びも違ってくるから、「これしかない!」みたいに決めつけなくてもいいんじゃないかなと感じる。「選択肢のひとつ」くらいの立ち位置なのかもしれないね。ま、いいか。
実際、runcharterという別のパッケージも併用することが多いらしいし——ああ、ここで思い出したけどdplyrだけでも何とかなることが多い気もするんだよね。まあ全部dplyrでやろうとすると無理が出る場合もあるけど、それはそれとして……。
ae_attendancesっていうデータセット、中身をぱっと見た限りでは数千行ちょっとだった気がするし、変数も七つに満たない印象だったかな。正確な数は今ここには出てこないんだけど。日付や数字がずらっと並んでいて、全体像を掴むのには少しコツが要るかもしれない、とふと思ったりもした。
あとdata.tableについてはね、苦手意識ある人多いイメージだけど、一度慣れると作業スピード何倍にもなるって話を聞いたこともある。いや、本当に誰でもすぐ理解できるかどうかは微妙だと思うけどさ……まあ、人によるってことでしょう。
結局、その人の環境や好みによってツール選びも違ってくるから、「これしかない!」みたいに決めつけなくてもいいんじゃないかなと感じる。「選択肢のひとつ」くらいの立ち位置なのかもしれないね。ま、いいか。
本段の参照元: https://www.johnmackintosh.net/blog/2019-12-03-plotting-nhsrdatasets-with-runcharter/
もし日本に医療オープンデータがあったら?妄想が止まらない現実
NHSRdatasetsのae_attendancesデータセットを初めて開いたとき、ぱっと見は日付や数字がずらっと並んでいて「シンプルそう…?」って思った。でも実際は全体像を掴むにはなんだかひと工夫要るな、と話す人もいる。ま、私も最初そんな感じだったし。えーと、変数名だけざっと見ても、それぞれの意味とか単位って案外すぐにはピンと来ないことが多い気がする。特に日付カラムと数字カラムの違いとか、集計単位? そのあたりでちょっと引っかかる場面があるらしいんだよね。……うーん、途中でふと思ったけど、「直感的」って本当に存在するのかな、データにおいて。まあ戻ろう、自分で触るなら一度head関数とかstr関数みたいなので中身を確認しつつ進めたほうが、余計な混乱は少なくなる——たぶんだけど。それにしても、この手順、本当に毎回守れてる人どれくらいいるんだろう…。
