データテーブルの「.I」活用法：行インデックスで効率的にデータを選択する方法

データテーブルの「.I」を日本語で解説する時のジレンマあれこれ

SIMD2020データのごく一部を使い、data.tableの.Iという特別な演算子について調べていたことがあった。何年か前の話で、細かい部分は曖昧だが、githubにファイルやコードを置いてた気がする。高data.csvと呼ばれるCSVから読み込んだテーブルと、どこかネット上にあるlookup用のデータを組み合わせる工程だったと思う。キーを設定して結合すると順序が変わりそうなので、その時は手作業でon句を使ったjoin方法を選んだ…この辺りは少し面倒だった記憶。順位で並び替えつつ列名も七つ八つまとめて書き換える必要もあり、全部一度にやるとうまくいかないこともあったような。 .I自体は要するに、現在の行番号っぽい役割だけど、状況によって微妙に挙動が異なるらしいという印象だけ残っている。全体的には手順より試行錯誤や細部へのこだわりの方が頭に残っている感じだった。

本段の参照元: https://www.johnmackintosh.net/blog/2024-01-03-dot-I/

技術記事の日本語表現で悩むトーンとニュアンスの話

「最近、誰かが“この方法をちょっとだけ変えたら全然違う効果になる”って話していた。たとえば、工程の順番を入れ替えるだけで結果が見えやすくなる場合もあるらしい。実際に現場でも、大まかに三つくらいの手順で進める人が多いようだが、一部ではその流れを意識的に省略したり追加したりしているケースも見受けられる。手元の資料を見ると、細かなコツはあまり表には出てこない。でも慣れている人ほど『まず全体像をぼんやり思い浮かべてから』『次に一つずつ分解する』みたいな順序で動いている印象が強い。そこまで厳密じゃなくても、ときどき意図せず正解に近づいてしまうこともあるから不思議だ。」