PowerBIで悪戦苦闘した1ヶ月~タイポ修正からDAX地獄まで
PreppinDataというのは、Tidy Tuesdayに少し似ているものらしいけど、可視化よりデータ加工寄りの内容みたい。Tableau用という話もあるが、RやPowerBIなど他ツールで挑戦する人も見かける。SQLばかり触っていた時期だったので、Rの勘が鈍らないよう毎週何問か試してた記憶がある。実際にやってみると、簡単な作業もあれば意外とつまずく部分もあった気がする。年末年始に自己学習サイトでPowerBI講座をいくらか消化したこともあり、その流れでこのチャレンジに手を出した感じ。ただPowerBI自体はほぼゼロからだったので、大枠だけ掴んだつもりが細かい部分は曖昧なまま進めてた印象。全体の八割近くはデータ整形に時間を取られるなんて言われたりするし、この練習方法がどこまで役立ったかは分からないけど、ときどき新しい発見があったのは確かだったと思う。
本段の参照元: https://www.johnmackintosh.net/blog/2021-01-31-preppin/
日本語で伝える壁と可能性~データ可視化の楽しさを日本へ
「PowerBI の初期設定が意外と手間取るって聞いたことがあるんだけど、私も最初はソフトを立ち上げてすぐに分析できるイメージだった。でも実際やってみたら、データの取り込み方法とか `テーブル結合` にかなり混乱した記憶が今でも残っている。特に自動でのデータ型認識については、それを鵜呑みにした結果、思いもよらないエラーになる場面もあった。たとえば CSV ファイルをインポートする時、日付フィールドが文字列扱いのままで計算処理から抜け出せず詰まったことも…。こういう細かい落とし穴、本当に多い。逆に言えば、「最初から明示的にデータ型を指定しておけば」作業効率が七割くらい変わった感覚さえあった。
それから `Power Query エディター` で不要なカラムを削除したり並び替えたりしておくことで、その後の工程がグッと楽になる。この段階で雑に済ませてしまうと、後になってビジュアライズ修正地獄に陥るなんてことも珍しくない。本来なら各プロセスごと一つずつちゃんと確認して進めれば良かったんだろうけど、不慣れな時期だとなかなかそこまで気が回らないものだよね。」
それから `Power Query エディター` で不要なカラムを削除したり並び替えたりしておくことで、その後の工程がグッと楽になる。この段階で雑に済ませてしまうと、後になってビジュアライズ修正地獄に陥るなんてことも珍しくない。本来なら各プロセスごと一つずつちゃんと確認して進めれば良かったんだろうけど、不慣れな時期だとなかなかそこまで気が回らないものだよね。」
