うん、ちょっとこれについて思ってることある。PythonでLaTeX数式を表示するって話になると、みんなすぐmatplotlibとかSymPyとか使う流れだけど、ぶっちゃけそこまでしなくても良くない?例えば、一回手元でLaTeXで数式作って、それをスクショ撮って画像として貼るとか…そういう力技でも意外と十分だったりするし。 まあJupyter Notebook使ってる人は、確かにその場で数式がリアルタイムに見れるの便利なのわかる。でも、じゃあ最初からLaTeXで資料書いちゃえばいい気もしてきて…。そもそもコード増やしたくないんだよなぁ。下手に設定間違えるとフォント崩れるとか変なトラブル起きたりして逆に面倒になる時もあって。 あと他にももっと簡単なやり方あったら普通に知りたい。他の人たちどうしてんだろう?割と悩ましい問題だと思う。

なんかさ、最近また思い出したんだけど、私みたいにバタバタしてる親でも、データの整理とかちょっと触ってみたくなる時があったりする。エクセルで子どもの身長とか記録してて…いや正直、それ結構ぐちゃぐちゃでしんどかった。ある日もう無理!ってなって、何か楽になるやつないかなーってスマホいじってたら、ふとdata.tableが目に入った。最初、名前だけ聞いて「うーん…?」みたいな。でも試しに触ったら思ったよりすごい。 ローリング結合?あれ初めて見た時はちょっと笑っちゃうくらい楽だった。「今月はこの習い事の日、この週身長どうだった?」みたいなのも一発で分かるようになったし。あと家計簿ね、これも使えた!レシート見て「あー無駄遣い」ってパッと出せるから…。まあ旦那ともそのおかげで小言減った気がする。ほんと? そうだ、友達にも話したことある。「それ便利すぎ」って盛り上がっちゃって…なんとなく気づいたらプチ勉強会になっちゃってた。その代わり最初ちょっと手こずるけど、一回使えるようになるとほんと景色変わると思うよ。うまく説明できてない気もするけど、とにかく助かった感じがすごい強い…。

実はさ、最近ちょっと学費とか子どものこれからのこと考えてて。なんかぼんやりだけど、データ分析できたらいいな~ってふと。会社にRじゃなくてSQL Server使ってる同僚がいて、「DATEADD関数さー、R経由でも日付うまく動く?」って聞いてみたんだよね。でも、その人いわく意外とクセ強めだった…。特に“interval”どう渡すかでつまずくらしくて。「month」みたいな文字列そのままだとうまく反応しないパターン、多いっぽい。手作業なら一瞬なのにな…って、えっ…地味にストレスじゃない?しかも日本語でコメント書いたSQL文も何か挙動ヘンになったりして、あーもうって感じ。 まあでも、まだ子どもには教える気ないけど(難しいし)、逆にこういう「わかった気がしたのに罠あるぞ」的なやつを親子で話せるようになれたら、それ面白そうだな、とか思ったりして…。データ扱える力、大切だよね。改めて実感。

最近、学校からもらう保健だよりをぼーっと読んでてさ、「患者の流れ」って話が出てた。別に病院だけじゃなくて家でも気になるテーマだなあ…ってなんとなく思ってしまった。そういえばこの前、子どもがちょっと熱出して小児科行ったとき、受付から診察室行って、そのあと会計済ませて帰るまでの一連の動きとか頭ん中で勝手に再生されてて。 それで、もしその流れをgganimateみたいなやつでパッと見てわかるようになったら、お医者さんも親もラクかな~?いや、たぶん見やすいはず!とか、一人で考えてニヤけたりして。でも正直言うとパソコン苦手だから自分にはムリっぽい…。誰か詳しい人いたら一緒にやろうよ~ってガチで頼みたい感じ。子どもも「あれどうやって動いてるの?」とか食いついてくれてさ、質問止まんないし。 アニメーションで目に見えるってだけで、不思議とテンション上がるよね。何なんだろうねあのワクワク感。

最近、うちの子がRにやたら熱中してて、「パッケージ作る!」ってすごい勢いなんですよ。でも…CRAN?初めて聞いた単語。自分も全然ついていけてない、というか公開までどうするかとか手順すら分からん。審査?エラー対応?きつそうで思わず腰引けてる。 実際、誰か経験ある人いたらどうやって乗り越えたのかちゃんと聞きたいな、と。公式ページ見ても日本語だと説明あっさりしすぎて混乱するし、細かいとこがピンと来ないこと多くて困る。「ここ罠だった」みたいな生々しい話もありがたい。 おすすめリソースとか、自分でやった時の流れ・トラブル事例とか - あと、ここ気を付ければ詰まらなかった!的なポイント知りたいです。どこ探したらいいかわからなくてちょっと疲れてきた。本音言うと、人間味ある体験談が一番刺さるんだけどな…。

正直言うとさ、当時Excelだけでデータ分析やってたとき、本当に…毎晩エラーに振り回されて全然終わんなくて。コロナの関係で急にデータまとめる案件とか降ってきて、気づいたら自分のヒューマンエラーもめっちゃ増えてて…いやーこれはもう手作業ダメだろって。その時けっこう悩んだけど思い切ってR使おうって話を上司に出したんだけど、最初はやっぱすごい渋かった。勉強しないといけないし、お金もかかるじゃん?まぁ、その気持ちも正直わかる。だけど一回ちゃんと動かして見せたら「え、これマジで自動化できるの?」みたいな感じで、一気に顔色変わった瞬間まだ結構覚えてる。 データが多くなればなるほどExcelとの差がなんていうか…目に見えてヤバいぐらい出てきた。で、予算申請する時、「前あったあのエラー事件」持ち出すと説得力がまじですごくて、それは今後も普通に使わせてもらうと思う。とはいえ現場によって向き不向きあるから、「全部Rで!」みたいにはならないけど、少なくともウチでは乗り換えてほんと正解だったなーと、この前また実感したとこです。

あー、そういえば前に自分でPython使って、多項式回帰のコードを一から書いたことあるんだよね。業務で予測モデル触ってると、どうしてもscikit-learnとかのライブラリ頼りになっちゃうから、本当に自分の中で仕組み理解できてるのか…なんとなく不安になる時ない?手計算で重回帰とかやってみると、「あーなるほど、パラメータってこう決まるのか」みたいな感覚が腑に落ちてくる。ちなみに注意点というか、次数を上げすぎるとマジで過学習になりやすいし、あとデータのスケーリングもなんか地味に面倒。まあでも、自分でゼロから作ると絶対バグったり想定外の動きしたりするから、そのたび「え?なんで?」って止まって考えるしかなくてさ、現場感的にはそういうトラブル込みで結構いい経験だったんじゃないかなと思うんだよね。

去年のあれ、SQL Serverの品質チェックで…ほんときつかった。手作業で頑張ってたけど、全然追いつかなくて、うん。なんかもう、やってもやっても終わらない感じ?その時ふと思ったんだけど、R使って動的SQL組めばいけるんじゃないかな…みたいな。正直、「えっRでSQLまわすの?」って最初は自分もちょっと疑ってたし、社内でも変な顔された。でもサンプルコードひとつ見せたら、意外に「これ便利そう」みたいな反応多くて。 例えばパラメータ動的にしておけばさ、全部テーブル回して、それぞれの項目ごとに異常値とか一気に拾える。あとロジックも後から差し替えできるし、そのへんラクだったな…。属人化も減るし、新しい人にもさっと共有できる。あ~ただ環境設定とかアクセス権限とか、その辺はIT部門ちょっと巻き込まないと無理だったかも。でもそれクリアしたらメンテナンスめちゃくちゃ楽になったから…このバランスどう思う? 他部署巻き込んでワークショップやろうよ、とか言いたくなるぐらい個人的には良かった。まあ実際そこまで話盛り上げてもいいかわからないけど…。現場では本当助かった。今度よかったらデモ一緒に触ります?

最近ずっと考えてたんだけど、海外でデータサイエンス案件ばっかやってて、もうdata.tableの.Iと.Nが便利すぎて笑う。なんで今までちゃんと使いこなしてなかったんだろ…? 例えばさ、顧客ごとの注文履歴見たい時あるじゃん。「この人何回目の注文?」って数えたい時に.Iあると一撃なんだよね。カウントも.N叩けばグループごとに勝手に出るからマジで助かるし…作業スピード全然違くない?ランキング作りとかでも国別とか秒殺できちゃうし。 いやほんとRユーザーってdplyr派多めなんだろうけど、この爆速さ知ったらみんな絶対一度はdata.table試してほしい。本気で切り替える人とか結構いると思うけど…どうなの実際。てかみんなはどっち派?わたし最近完全に沼ったタイプ😂

あのさ、去年ちょうどうちもニュースレターの配信システム変えたんだけど、まあ色々バタバタしてて…正直、リストの引っ越しとか思ったより面倒だったし、デザインもなんか崩れたりしてさ。あとから思うと「もっと早く誰かに聞けばよかった」ってめちゃ後悔したし。でもね、新しいツールに慣れてきたらレポートとかも見やすくなったし、開封率もちょっと上がってて、「あーやっぱ変えて良かったな」って今は思ってる感じ。 だから、もしそっちでも同じような切り替え検討してるならぜひ共有できることあると思うし、一緒に「これ困るよね」とか整理できたら助かるなと本気で思ってます。ちなみに次何する予定?それとも、その前になんか困りごと出てきたりしたら、本当なんでも遠慮せず話しかけてください!

最初に触った時、正直何すればいいか全然わからなかった。visNetworkって名前だけ聞いて「なんだこれ?」みたいな。でも、とりあえずコロナの感染経路データをつっこんで動かしてみたら、一気に「人と人がどう繋がるのか」グラフィックで出てきて、めちゃくちゃ分かりやすい。ほんとに思ったより便利だったんだよね。 ノード多いと画面は結構ごちゃっとするし、正直見づらい瞬間もある。でも、そのカオスの中で逆に気になる繋がりとか発見したくなるというか、無駄にズームしたりクリックしまくって変なところ探し始める感じ。あーそうだ、友達にも使わせてみたけど案外盛り上がってちょっと得意げになった。あと、「こういうツール他でも使える?」とかぼんやり考え出したりする。 可視化ツール自体、「数字だけだと見る気失せる」派としては本当ありがたい存在。このおかげでグラフ苦手でも一歩踏み込めたな…ちょっと話逸れてきたけど、とりあえず触れてよかった!

最近、仕事も家のことも同時進行してる毎日で、子供二人に囲まれて結構バタバタ。そういえばこの前SQL ServerのDATEADD関数をRから叩きたくてやってみたんだけど、パラメータの型がうまくハマらなくて、何回やってもエラーばっか出て焦ったんだよね。夜中なのにPC相手に格闘してる自分見て、子供たちは「またパパ怒ってる」みたいな目で冷めた感じ(笑)。結局as.characterでごまかしたらなんとか通ってホッとしたけど、RとSQL Serverつなげる時は本当イレギュラー多すぎ、こういう泥臭いトラブル体験いっぱい増える気しかしない…。さすがにちょっと疲れたわ。でもやれるとちょっとだけ嬉しいっていう、不思議な感じあるよね。

正直ね、dplyrめっちゃ好きだし、見た目もスッキリしてるから普段はつい使っちゃうんだけど…あれ、ほんとにNHSみたいな桁違いの大きさのデータ処理で、本当にSQLより速いってことあるのかな?てよく考えるんですよ。なんか前に数百万件ぐらいあるやつをdplyrで回したことがあって、それ思ったよりずっと遅くて「あれ…?」って。途中でやっぱりDB側で直接SQL書いた方が圧倒的に早かった記憶がまだ残ってるんだよね。もちろん、その時その時で全然違う場合も多いけど、自分は結局「これなら戻ろう」ってSQLに逃げた感じ。その辺のみんなの感覚どうなのかな?結局現場では二刀流というか、いいところ両取りしてお互いうまく行き来するしかないのかな~とか、最近また迷子になり気味です…。

最近、医療データの可視化について色々やってるんだけど、gganimateがついにCRANに入ったって話を聞いて思わず声出た。患者さんの動きとか時間軸で見るとき、静止画じゃ絶対伝わりづらい場面多すぎるし。Rでデータまとめてgganimateでアニメ作ると、不思議なくらい現場の人たちも「あーそういうことか!」って顔になるんだよね。 会議でもそのスライド見せた瞬間、「これ分かりやすっ」て言われて妙に嬉しかった。その裏ではめちゃくちゃ地味な前処理作業してたりするんだけどさ…正直エクセル地獄。でも完成イメージ浮かぶとモチベ上がるから何とか耐えれる。 今度は院内の物流(物品運搬とか)の流れにも応用したくて少し準備中。実際グラフとか表だけより、動きが見えると単純に面白いし伝達力バツグンだと思う。あーやっぱ可視化沼から抜け出せない感じするな。

最近あんまり元気ないんだけど、ふと思ったので書いとくね。家で子どもとゴロゴロしながら、副業の合間にちょっとデータ分析とかやることがあるんだよね。それで…いや、何ていうか、SQLクエリをRスクリプトから外に出して管理するやつ?あれ、意外と大事だなってしみじみ思ったことがあって。小学校のプリントの山を整理する感じにすごく似てる。探したい時に「はいこれ」ってサッと出せるし、ごちゃごちゃにならない。でも実際には「あれ…このクエリどこ行っちゃった?」って謎の行方不明事件も起きがちでさ。 そういう時はフォルダちゃんと分けたり、ファイル名考えるのって大事なんだなーって実感する。息子によく「片付けろ」って言いまくるわりに、自分こそできてなくて苦笑い。結局、人に手伝ってもらう時もあるから、そのほうが楽なのかもしれないけど、その分ミスにも気をつけないとなんだよね。家事もコード管理もわりと似たような面倒さというか、まあ…そんなこと考えてました。ただそれだけ🙃

大学生になって、はじめて日本語でブログ書いたことあるんだけど…あの時ほんと緊張したわ。自分の考えとか人前に出すの、日本だとちょっとためらう感じしない?いや、自分が心配性なだけかもだけど。「これ読んだ人にどう思われるかな…」って気になっちゃって、下書きばっかり増えていくやつ。ぶっちゃけ何個もお蔵入りしたし。 でもさ、一回勇気出して投稿してみたら、「役に立った!」みたいなコメントもらえて地味に嬉しかったんだよね。びっくりした。あれ見て、なんかちょっとだけ報われた気分。 こういう発信、他にも苦手な人いる?それとも意外とガンガン投稿できるタイプ多いんかな。SNS強者とか尊敬するわ、マジで。 最近またネタ探してる最中でさ、自分語り続けても大丈夫なんかなーとか思いつつ…でもやっぱ表現できる場っていいよね。次何書くかまだノープランだけど、そのうち何かまた投下するかも。

えっとね、ちょっと前なんだけど、ドイツの同僚とガッツリ顧客データ分析やっててさ。あー、その時Rのdata.table使ってたんだよね。で、「.I」とか「.N」って見たことある?あれ、本当に便利すぎてびっくりしたんだよ…。いや、例えばグループごとに一番新しいデータだけ取りたい時とか、「.N」でそのグループが何件あるかすぐわかるし、「.I」でその場所ピンポイントで掴めちゃう感じ。なんかPythonしか触らないメンバーも「えっ、はや!」って言い出して、処理速度マジですごいなーって。 あ、ちなみに国とか文化とか全然関係なく、このスピード感にはみんな思わず反応するっぽい。カフェで雑談してても「あの時の.Rどう書いた?」とか聞かれるし、自分もちょこちょこ説明し直してたり…。ただまあ最初は正直data.tableクセ強くて慣れるまで難しかったというか…はい。でも慣れた今となっては他になかなか戻れなくなるやつ。 そうそう、それから最近アジア圏でもじわじわ流行り出してる雰囲気あって、情報シェアも前より増えてきた感じするんだよね。これからどう盛り上がるのかな~とかちょっと楽しみにしてたりします。

なんかさ、昔でっかいECサイトの負荷テストやった時のこと、まだちょっと引っかかってて。実際、「これだけテストして、本当に安定って言えるのかな?」みたいな疑い…ずっと消えなかったんだよね。シナリオ通りでピーク時アクセス真似してみるじゃん?でもさ、本番のユーザー動きってまじで想像外すぎてさ。決めた同時接続数、正直それ意味あんの?とか上司にも何回も聞いた記憶ある。 メトリクスで見ると、一応CPUの使用率とかレスポンスタイムは全部基準値内になるんだけど、現場では急にAPI飛んできたりバッチ走ったり…もう普通に起きるし。それこそ一回、お昼休みに謎のトラフィック急増でアラート発生、はいパニック。それがきっかけで「これ性能評価の指標自体ダメじゃない?」みたいな流れに変わって。なんというかさ…

いやー、ぶっちゃけLAMBDA関数についてさ、そんな必須?みたいな感覚ちょいちょい湧くんですよ。なんか「自作関数で超効率化!」みたいなノリは耳にするけど、正直IFとかVLOOKUPだけでだいたい済んじゃう瞬間多すぎて… わざわざ新しい使い方覚えるのも腰が重いというか。結局「あー今日も使わなかった」ってなるパターンばっかり。 社内でもね、「めちゃくちゃ便利!」って人と「まぁ別になくてもよくない?」みたいな空気が混在しててさ。その空気も妙にリアル。でも、一番気になるのは共有ファイルに知らんLAMBDA仕込まれてた時!誰かが開いたとき絶対「これ何?」ってなるやつ。コミュニケーションコスト爆上がりな未来しか見えない。 この辺どうしてるのかなぁ…。やっぱレクチャーするとか運用ルール決めてる?いやでもそもそも、それってそこまでしてまで導入したい機能なんだろうか、とまた考え込む自分…。

最近さ、SQLとR、それからShinyでダッシュボード作ってたんだけど…なんか日本の現場って、どうしてもシステム間連携とかセキュリティの壁がやたら分厚い気がする。あ、接続設定も地味に面倒だし、細かいけど毎回「あれ?また…?」みたいな。で、一番時間取られるのがIT部門とのやり取りだったりして。「これここからアクセスできるようにしたいんですけど」「いや、その申請出してください」みたいな流れで何回もメール往復する感じ。これ、自分だけなのかな? あとさ、「もうちょっとグラフ大きくできない?」とか「このボタン位置変えてよ」とか、ユーザー側のリクエストが突然飛んでくること多すぎて…正直「今それ言う!?」みたいなタイミングもある。自分はとりあえず「検討します」って一旦預かるんだけど、結局そのまま難航したりすること結構多い…。 みんなこういう時どうしてる?融通効かせたいけど現実的に厳しいとこも多いし…。失敗談とか「こうしたらちょっと楽になったよ」とかあれば本当に知りたい。それとも単純に自分が不器用なだけなんかなぁ?