普段さ、なんだかんだで日本と海外両方の案件やってるとExcelのデータ整理、本当に頭痛くなる日が多い。各国の人たちが持ってきたファイル、フォーマットばらっばらで、しかも言語も英語だけじゃないんだよね。あとセル結合とか変な飾りとか…一個ずつ地味に直していくと本当に終わり見えなくなる瞬間ある。 だけど最近R使い始めてから、「あれ、これ全部自動でやれちゃうじゃん」みたいな発見あった。dplyrパッケージ超便利で、無駄な列とか一発で消せるし、そのままスクリプトシェアすればみんな同じ処理できるし。それのおかげなのかわかんないけどミス明らかに減ったし、もう手作業には絶対戻りたくないなぁ…。 でもさ、ときどきExcelちょっと懐かしい時あるんだよね。不便だったけど、不思議とそれも楽しかった気がする。でも今はやっぱり効率大事かな。

最近リモートで他の国のエンジニアたちとコード書いてる。うん、まあ、自分だけかなと思ってたけどIDEのテーマカラーについて話が出た。特にシンガポールの人、「ライトモード一択だよ、朝はそれじゃないとボーッとする」みたいなことを普通に言うんだよね。ちょっとびっくりした。本音言うと自分ずっとダークモード以外無理派だったからさ。 あと、その人は「明るい画面じゃないと目覚め悪くて、昼間作業できない」とも言ってて、…あーでも確かに生活時間とかそういうので違い出るよなって急になんか納得してしまった自分がいる。でも自分夜型だから暗い色じゃないとうまく集中できなくてさ。逆パターンってこういうことなんだろうね。 あとはこれ、国ごとの気候とか光の入り方も関係ある?なんかオフィス明るさとか天気?いや考えすぎかも。でも実際どうなの。他の場所で人気あるテーマカラーとか流行り知りたいし。みんな結局効率的に仕事できるカラー探してるっぽいけど、本当にベストな答えってまだ見つからなくて毎回議論ループして終わってる感じ。ぶっちゃけ正解あるんかな……ちなみにあなたはどっち派?

うーん、去年のコロナ授業でプレゼン担当した時、データを見やすくするのがこんなに厄介だとは思わなかったな。グラフ作って「これイケてる!」って思ったけど、テレビみたいなニュース用だと逆にわかりづらい感じ?色たくさん使ったら教授から「あれ何でそんなカラフル?」ってツッコミ入るし…いや、自分的にはまあまあ頑張ったつもりなのに。あーでも結局、ちゃんとしてる感出すなら、それっぽいテンプレとかいいソフトとか欲しくなるよね。学部長に追加予算お願いするか悩む…。そういえば前にクラブ用PC交渉成功した先輩いたよね?今度一緒について来てもらったらいけるかな。てか、本音で言うと本当に必要。でもまあ今できること考えるしかないか…どうしよ。

最近さ、インヴァネスのストリートマップをダークテーマで作ってるんだけど、うーん…なんか思ったより楽しくてハマっちゃってる。あー、黒一色じゃつまらないからさ、夜景っぽい青とか適当に紫をアクセントに入れたりしてみてる。うまくいくか微妙な時もあるけど。 正直ね、一人だとアイデア出尽くしそうで困ってて…。もし図書館とかで配色の本借りれたら最高だなぁってずっと考えてる。そんな都合よく見つかればいいけど…。 あ、それから友達に話してみたら意外とみんな暗めのトーンが好きだったっぽい。なんか、「そっちの方がおしゃれ!」とか言われたし。でも自分でももっと変わったやり方できそうな気がする…うん、情報集めってホント大事だと思ったよ。

あのさ、うちの息子が「Metallicaめっちゃ好きなんだよ」って急に言い出してさ、いや本当に最初は「え?マジで?」みたいな気持ちだった。自分も昔ちょっと聴いたことあるけど、本格的に歌詞を一緒に読み込んでみるなんて思ったことなかったし。でもやってみたら意外とびっくり、あれただの爆音ロックかと思いきや、人生とか社会についてモヤモヤ考える系の話が多くて。全然イメージ変わったんだよね。 そうそう、日本語で訳したり自分たちなりに意味を探したりするとまた違う深みが出るというか…まあうまく説明できないけど、とりあえず親子トークが止まらなくなる感じ。ご飯食べながら「このフレーズどういう意味かな」とか話し合っちゃって、なんか気づけば毎日Metallica談義になってるという謎現象発生中。 あー、音楽ってほんと年齢とか関係なく盛り上がれるんだなぁと実感する。正直こういう時間すごい大事だと思った。

うちの子、今ほんとにメタリカばっか聴いてる。いや、びっくりするぐらい。正直さ、親としては「その歌詞けっこうヤバいとこあるよ?」って心配になるやつ。でも聞いてみた。「なんでこんな好きなの?」って。返事が、「スカッとする」「勇気わく」…そういう感じだって。 そういえばこの前、sentimentrっていう感情分析ツールを一緒に試してみたんだ。英語の歌詞読み込ませてグラフとか出るやつ。でもふと思った、日本語の歌でもできる?仕組み的に難しいのかな?詳しくないから全然分かんなかったけど。 歌詞分析とか普段絶対やんないし、最初めんどくさいな〜って思ったけどさ、実際やってみたら子どもとの会話増えた。不思議と面白かった。音楽の好みとか、その時どう感じてるかとか知れる時間、大事だなーって改めて思った日だった。

いや、あのさ、data.tableって噂で「とにかく速い」って聞くじゃん。でも実際のところ、そこまで便利なの?ぶっちゃけdplyrとかtidyverse系で十分なんじゃないかなって最初は思っちゃうんだよね。特に書き方というか、文法覚えるの面倒そう…あれ独特すぎて、一回詰まると全然読めなくなることあるし。 あとローリング結合みたいなやつ?それやろうと思ったら、公式ドキュメントもなんかゴチャゴチャしてるし、自分以外が後で見ても「あれ?」ってなりそうというか。メンテナンスとか考えるとさ…自分もたまにコピペした後で何書いてるかわからなくなることあるんだけど。 周りは結構data.table推してる感じあるよね。「これ最高!」みたいな。でも本当に現場で使ってて「おお!これが欲しかった!」みたいなシーンどれぐらい多いんだろう?正直まだ体感できてなくて、モヤっとしてる。まあそのうち慣れるのかな、それとも慣れる前にギブアップするタイプなのか…気になるわ。

うん、ちょっとこれについて思ってることある。PythonでLaTeX数式を表示するって話になると、みんなすぐmatplotlibとかSymPyとか使う流れだけど、ぶっちゃけそこまでしなくても良くない?例えば、一回手元でLaTeXで数式作って、それをスクショ撮って画像として貼るとか…そういう力技でも意外と十分だったりするし。 まあJupyter Notebook使ってる人は、確かにその場で数式がリアルタイムに見れるの便利なのわかる。でも、じゃあ最初からLaTeXで資料書いちゃえばいい気もしてきて…。そもそもコード増やしたくないんだよなぁ。下手に設定間違えるとフォント崩れるとか変なトラブル起きたりして逆に面倒になる時もあって。 あと他にももっと簡単なやり方あったら普通に知りたい。他の人たちどうしてんだろう?割と悩ましい問題だと思う。

なんかさ、最近また思い出したんだけど、私みたいにバタバタしてる親でも、データの整理とかちょっと触ってみたくなる時があったりする。エクセルで子どもの身長とか記録してて…いや正直、それ結構ぐちゃぐちゃでしんどかった。ある日もう無理!ってなって、何か楽になるやつないかなーってスマホいじってたら、ふとdata.tableが目に入った。最初、名前だけ聞いて「うーん…?」みたいな。でも試しに触ったら思ったよりすごい。 ローリング結合?あれ初めて見た時はちょっと笑っちゃうくらい楽だった。「今月はこの習い事の日、この週身長どうだった?」みたいなのも一発で分かるようになったし。あと家計簿ね、これも使えた!レシート見て「あー無駄遣い」ってパッと出せるから…。まあ旦那ともそのおかげで小言減った気がする。ほんと? そうだ、友達にも話したことある。「それ便利すぎ」って盛り上がっちゃって…なんとなく気づいたらプチ勉強会になっちゃってた。その代わり最初ちょっと手こずるけど、一回使えるようになるとほんと景色変わると思うよ。うまく説明できてない気もするけど、とにかく助かった感じがすごい強い…。

実はさ、最近ちょっと学費とか子どものこれからのこと考えてて。なんかぼんやりだけど、データ分析できたらいいな~ってふと。会社にRじゃなくてSQL Server使ってる同僚がいて、「DATEADD関数さー、R経由でも日付うまく動く?」って聞いてみたんだよね。でも、その人いわく意外とクセ強めだった…。特に“interval”どう渡すかでつまずくらしくて。「month」みたいな文字列そのままだとうまく反応しないパターン、多いっぽい。手作業なら一瞬なのにな…って、えっ…地味にストレスじゃない?しかも日本語でコメント書いたSQL文も何か挙動ヘンになったりして、あーもうって感じ。 まあでも、まだ子どもには教える気ないけど(難しいし)、逆にこういう「わかった気がしたのに罠あるぞ」的なやつを親子で話せるようになれたら、それ面白そうだな、とか思ったりして…。データ扱える力、大切だよね。改めて実感。

最近、学校からもらう保健だよりをぼーっと読んでてさ、「患者の流れ」って話が出てた。別に病院だけじゃなくて家でも気になるテーマだなあ…ってなんとなく思ってしまった。そういえばこの前、子どもがちょっと熱出して小児科行ったとき、受付から診察室行って、そのあと会計済ませて帰るまでの一連の動きとか頭ん中で勝手に再生されてて。 それで、もしその流れをgganimateみたいなやつでパッと見てわかるようになったら、お医者さんも親もラクかな~?いや、たぶん見やすいはず!とか、一人で考えてニヤけたりして。でも正直言うとパソコン苦手だから自分にはムリっぽい…。誰か詳しい人いたら一緒にやろうよ~ってガチで頼みたい感じ。子どもも「あれどうやって動いてるの?」とか食いついてくれてさ、質問止まんないし。 アニメーションで目に見えるってだけで、不思議とテンション上がるよね。何なんだろうねあのワクワク感。

最近、うちの子がRにやたら熱中してて、「パッケージ作る!」ってすごい勢いなんですよ。でも…CRAN?初めて聞いた単語。自分も全然ついていけてない、というか公開までどうするかとか手順すら分からん。審査?エラー対応?きつそうで思わず腰引けてる。 実際、誰か経験ある人いたらどうやって乗り越えたのかちゃんと聞きたいな、と。公式ページ見ても日本語だと説明あっさりしすぎて混乱するし、細かいとこがピンと来ないこと多くて困る。「ここ罠だった」みたいな生々しい話もありがたい。 おすすめリソースとか、自分でやった時の流れ・トラブル事例とか - あと、ここ気を付ければ詰まらなかった!的なポイント知りたいです。どこ探したらいいかわからなくてちょっと疲れてきた。本音言うと、人間味ある体験談が一番刺さるんだけどな…。

正直言うとさ、当時Excelだけでデータ分析やってたとき、本当に…毎晩エラーに振り回されて全然終わんなくて。コロナの関係で急にデータまとめる案件とか降ってきて、気づいたら自分のヒューマンエラーもめっちゃ増えてて…いやーこれはもう手作業ダメだろって。その時けっこう悩んだけど思い切ってR使おうって話を上司に出したんだけど、最初はやっぱすごい渋かった。勉強しないといけないし、お金もかかるじゃん?まぁ、その気持ちも正直わかる。だけど一回ちゃんと動かして見せたら「え、これマジで自動化できるの?」みたいな感じで、一気に顔色変わった瞬間まだ結構覚えてる。 データが多くなればなるほどExcelとの差がなんていうか…目に見えてヤバいぐらい出てきた。で、予算申請する時、「前あったあのエラー事件」持ち出すと説得力がまじですごくて、それは今後も普通に使わせてもらうと思う。とはいえ現場によって向き不向きあるから、「全部Rで!」みたいにはならないけど、少なくともウチでは乗り換えてほんと正解だったなーと、この前また実感したとこです。

あー、そういえば前に自分でPython使って、多項式回帰のコードを一から書いたことあるんだよね。業務で予測モデル触ってると、どうしてもscikit-learnとかのライブラリ頼りになっちゃうから、本当に自分の中で仕組み理解できてるのか…なんとなく不安になる時ない?手計算で重回帰とかやってみると、「あーなるほど、パラメータってこう決まるのか」みたいな感覚が腑に落ちてくる。ちなみに注意点というか、次数を上げすぎるとマジで過学習になりやすいし、あとデータのスケーリングもなんか地味に面倒。まあでも、自分でゼロから作ると絶対バグったり想定外の動きしたりするから、そのたび「え?なんで?」って止まって考えるしかなくてさ、現場感的にはそういうトラブル込みで結構いい経験だったんじゃないかなと思うんだよね。

去年のあれ、SQL Serverの品質チェックで…ほんときつかった。手作業で頑張ってたけど、全然追いつかなくて、うん。なんかもう、やってもやっても終わらない感じ?その時ふと思ったんだけど、R使って動的SQL組めばいけるんじゃないかな…みたいな。正直、「えっRでSQLまわすの?」って最初は自分もちょっと疑ってたし、社内でも変な顔された。でもサンプルコードひとつ見せたら、意外に「これ便利そう」みたいな反応多くて。 例えばパラメータ動的にしておけばさ、全部テーブル回して、それぞれの項目ごとに異常値とか一気に拾える。あとロジックも後から差し替えできるし、そのへんラクだったな…。属人化も減るし、新しい人にもさっと共有できる。あ~ただ環境設定とかアクセス権限とか、その辺はIT部門ちょっと巻き込まないと無理だったかも。でもそれクリアしたらメンテナンスめちゃくちゃ楽になったから…このバランスどう思う? 他部署巻き込んでワークショップやろうよ、とか言いたくなるぐらい個人的には良かった。まあ実際そこまで話盛り上げてもいいかわからないけど…。現場では本当助かった。今度よかったらデモ一緒に触ります?

最近ずっと考えてたんだけど、海外でデータサイエンス案件ばっかやってて、もうdata.tableの.Iと.Nが便利すぎて笑う。なんで今までちゃんと使いこなしてなかったんだろ…? 例えばさ、顧客ごとの注文履歴見たい時あるじゃん。「この人何回目の注文?」って数えたい時に.Iあると一撃なんだよね。カウントも.N叩けばグループごとに勝手に出るからマジで助かるし…作業スピード全然違くない?ランキング作りとかでも国別とか秒殺できちゃうし。 いやほんとRユーザーってdplyr派多めなんだろうけど、この爆速さ知ったらみんな絶対一度はdata.table試してほしい。本気で切り替える人とか結構いると思うけど…どうなの実際。てかみんなはどっち派?わたし最近完全に沼ったタイプ😂

あのさ、去年ちょうどうちもニュースレターの配信システム変えたんだけど、まあ色々バタバタしてて…正直、リストの引っ越しとか思ったより面倒だったし、デザインもなんか崩れたりしてさ。あとから思うと「もっと早く誰かに聞けばよかった」ってめちゃ後悔したし。でもね、新しいツールに慣れてきたらレポートとかも見やすくなったし、開封率もちょっと上がってて、「あーやっぱ変えて良かったな」って今は思ってる感じ。 だから、もしそっちでも同じような切り替え検討してるならぜひ共有できることあると思うし、一緒に「これ困るよね」とか整理できたら助かるなと本気で思ってます。ちなみに次何する予定?それとも、その前になんか困りごと出てきたりしたら、本当なんでも遠慮せず話しかけてください!

最初に触った時、正直何すればいいか全然わからなかった。visNetworkって名前だけ聞いて「なんだこれ?」みたいな。でも、とりあえずコロナの感染経路データをつっこんで動かしてみたら、一気に「人と人がどう繋がるのか」グラフィックで出てきて、めちゃくちゃ分かりやすい。ほんとに思ったより便利だったんだよね。 ノード多いと画面は結構ごちゃっとするし、正直見づらい瞬間もある。でも、そのカオスの中で逆に気になる繋がりとか発見したくなるというか、無駄にズームしたりクリックしまくって変なところ探し始める感じ。あーそうだ、友達にも使わせてみたけど案外盛り上がってちょっと得意げになった。あと、「こういうツール他でも使える?」とかぼんやり考え出したりする。 可視化ツール自体、「数字だけだと見る気失せる」派としては本当ありがたい存在。このおかげでグラフ苦手でも一歩踏み込めたな…ちょっと話逸れてきたけど、とりあえず触れてよかった!

最近、仕事も家のことも同時進行してる毎日で、子供二人に囲まれて結構バタバタ。そういえばこの前SQL ServerのDATEADD関数をRから叩きたくてやってみたんだけど、パラメータの型がうまくハマらなくて、何回やってもエラーばっか出て焦ったんだよね。夜中なのにPC相手に格闘してる自分見て、子供たちは「またパパ怒ってる」みたいな目で冷めた感じ(笑)。結局as.characterでごまかしたらなんとか通ってホッとしたけど、RとSQL Serverつなげる時は本当イレギュラー多すぎ、こういう泥臭いトラブル体験いっぱい増える気しかしない…。さすがにちょっと疲れたわ。でもやれるとちょっとだけ嬉しいっていう、不思議な感じあるよね。

正直ね、dplyrめっちゃ好きだし、見た目もスッキリしてるから普段はつい使っちゃうんだけど…あれ、ほんとにNHSみたいな桁違いの大きさのデータ処理で、本当にSQLより速いってことあるのかな?てよく考えるんですよ。なんか前に数百万件ぐらいあるやつをdplyrで回したことがあって、それ思ったよりずっと遅くて「あれ…?」って。途中でやっぱりDB側で直接SQL書いた方が圧倒的に早かった記憶がまだ残ってるんだよね。もちろん、その時その時で全然違う場合も多いけど、自分は結局「これなら戻ろう」ってSQLに逃げた感じ。その辺のみんなの感覚どうなのかな?結局現場では二刀流というか、いいところ両取りしてお互いうまく行き来するしかないのかな~とか、最近また迷子になり気味です…。

最近、医療データの可視化について色々やってるんだけど、gganimateがついにCRANに入ったって話を聞いて思わず声出た。患者さんの動きとか時間軸で見るとき、静止画じゃ絶対伝わりづらい場面多すぎるし。Rでデータまとめてgganimateでアニメ作ると、不思議なくらい現場の人たちも「あーそういうことか!」って顔になるんだよね。 会議でもそのスライド見せた瞬間、「これ分かりやすっ」て言われて妙に嬉しかった。その裏ではめちゃくちゃ地味な前処理作業してたりするんだけどさ…正直エクセル地獄。でも完成イメージ浮かぶとモチベ上がるから何とか耐えれる。 今度は院内の物流(物品運搬とか)の流れにも応用したくて少し準備中。実際グラフとか表だけより、動きが見えると単純に面白いし伝達力バツグンだと思う。あーやっぱ可視化沼から抜け出せない感じするな。

最近あんまり元気ないんだけど、ふと思ったので書いとくね。家で子どもとゴロゴロしながら、副業の合間にちょっとデータ分析とかやることがあるんだよね。それで…いや、何ていうか、SQLクエリをRスクリプトから外に出して管理するやつ?あれ、意外と大事だなってしみじみ思ったことがあって。小学校のプリントの山を整理する感じにすごく似てる。探したい時に「はいこれ」ってサッと出せるし、ごちゃごちゃにならない。でも実際には「あれ…このクエリどこ行っちゃった?」って謎の行方不明事件も起きがちでさ。 そういう時はフォルダちゃんと分けたり、ファイル名考えるのって大事なんだなーって実感する。息子によく「片付けろ」って言いまくるわりに、自分こそできてなくて苦笑い。結局、人に手伝ってもらう時もあるから、そのほうが楽なのかもしれないけど、その分ミスにも気をつけないとなんだよね。家事もコード管理もわりと似たような面倒さというか、まあ…そんなこと考えてました。ただそれだけ🙃

大学生になって、はじめて日本語でブログ書いたことあるんだけど…あの時ほんと緊張したわ。自分の考えとか人前に出すの、日本だとちょっとためらう感じしない?いや、自分が心配性なだけかもだけど。「これ読んだ人にどう思われるかな…」って気になっちゃって、下書きばっかり増えていくやつ。ぶっちゃけ何個もお蔵入りしたし。 でもさ、一回勇気出して投稿してみたら、「役に立った!」みたいなコメントもらえて地味に嬉しかったんだよね。びっくりした。あれ見て、なんかちょっとだけ報われた気分。 こういう発信、他にも苦手な人いる?それとも意外とガンガン投稿できるタイプ多いんかな。SNS強者とか尊敬するわ、マジで。 最近またネタ探してる最中でさ、自分語り続けても大丈夫なんかなーとか思いつつ…でもやっぱ表現できる場っていいよね。次何書くかまだノープランだけど、そのうち何かまた投下するかも。