イギリスの双子データで見えた「増加」の事実と、その背景にあるもの
双子って、どこに行ってもけっこう話しかけられることが多い気がする。似てないし性格も全然違うのに、なぜか周りは「同じだろう」みたいな反応をしてくる。ヒーローの好みだってばらばら。最近イギリスで双子や多胎児が増えているという噂をちょこちょこ聞く。でもスコットランドの細かいデータはあまり見つからず、イングランドとウェールズの統計を何となく参考にした感じ。ただ、その数字も七十前後とか結構幅があるし、年によって変動しそうだったかな。tidyr::gather というR言語の関数についてSNSで迷う人が意外と多いようで、自分でも使うたびに「あれ?どうだったっけ?」となった記憶がある。専門的な話だけど、説明するとき急に手順を忘れたりすることも。それくらいデータ集計まわりには小さな落とし穴が転がってる印象。全部把握している人は少ないかもしれないと思ったりする。
本段の参照元: https://www.johnmackintosh.net/blog/2018-12-13-meet-the-twins/
日本で双子データを調べる難しさと、気になる文化の違い
「`その関数、どうやって使うんだっけ?`」みたいな場面、スクリーンの前で固まってしまい、手が止まる瞬間があるよね。R言語でデータを縦方向に整形するための `tidyr::gather` は便利なツールだけど、実際にコードを書く時はカラム名や引数の順番など混乱しがち。例えばワイドなテーブルをロング形式に変換したい時、本来は `gather(データ, キー, 値, …)` の形なのに、ついキーと値を逆に書いてしまうことも多いんだ。それと最近では `pivot_longer` という新しい関数も登場してきて、「どっちを使えばいいんだろう」と迷う人もいる様子。
SNS上でも「エラーになった」とか「思った通りにならなかった」といった声が時々流れてくる。自分でもミスした時には毎回検索して確認した記憶がぼんやりある。正しい手順ならほんの一瞬で済む作業なのに、小さな指定ミスひとつで全体の流れがおかしくなるなんて不思議だよね。正しい例を書き留めておく人も多いみたいだけど、それでも完璧にすぐ思い出せる日は少ない気がする…。
