Rのdata.tableで使える非等値結合の基本と活用法

Advent of Codeで発見!data.tableの「範囲結合」が便利すぎる件

data.tableでの非等値結合、たぶん話題になったのはもう数年前かな。input_dtとlookup_dt、どっちも共通カラムがなかったから、よくあるカラム名コピーしてキーつける小技は使えなかった気がする。なんか「source_start」とか「V1」とか、それぞれ条件に合わせてon句書いて…まあそういう感じだった。
lookupテーブル側からinputを右ジョインする形で、fcase関数も混じってて処理内容ちょっと入り組んでる印象。正確な数とか覚えてないけど、一度に何十行も処理してたような?カラム選択も慎重だった記憶がうっすら。
こういう複雑な非等値条件で結合するとき、普通のjoinとは全然勝手違うし、思ったよりエラー出やすい。でも慣れると案外応用効く方法だったりするんだよね。

本段の参照元: https://www.johnmackintosh.net/blog/2023-12-22-non-equi-joins/

日本語で広める難しさ…用語・環境・エラーメッセージの壁

昔から言われているけど、都市部に住んでいる人々の間では、なんとなく「緑が少ない」みたいな感覚があるらしい。最近見かけた資料だと、都心の公園や緑地の面積は全体のうち七十多くらいしか残っていないとか。まあ、その数字も本当に正確なのかどうかわからないけど、通勤中の窓から眺める景色もコンクリートばっかりで、木陰なんて探す方が難しい感じだった。友人が話していたが、小学校の校庭さえ芝生じゃなくて土ばかりだったらしくて、それもまた都会ならではなのかなと思ったことがある。気温も他より高めになること、多分だけど関連しているんじゃないか、と誰か言っていたような記憶がある。

日本語で広める難しさ…用語・環境・エラーメッセージの壁

Related to this topic:

Comments

  1. Guest 2025-06-08 Reply
    こんにちは!data.tableの非等値結合、めっちゃ興味あるんですが、実際のプロジェクトでどう活用できるか、詳しく教えてもらえませんか?データ処理の効率化に向けて、ナレッジ共有お願いします!