データビジュアライゼーションを変える!{headliner}パッケージの活用法と日本語での挑戦

{headliner}で切り開く、データストーリーテリングの未来

グラフ作成の仕事が続いててさ、毎回タイトルは説明的に付けるんだけど、どうしても「何が本当に目立つか」がうまく伝わらないことが多かったんだよね。あー、こういう地味な作業って意外と消耗するものだな…まあ仕方ないか。でも細かな分析まで手を伸ばす余裕なんてほとんどなくて、動的に要点を抽出できる仕組みとか一度考えた記憶はある。ま、その時も結局後回しになっちゃった気がするけど。

で、ふと思い出したようにheadlinerっていうRパッケージに出会って、「これ何?」ってノリで使い始めてみたら予想以上に便利だった。誰か親切な人がGitHubで公開してるやつなんだけど、こういう小さな発見ってちょっと嬉しい。不思議と嬉しかったりするんだよね…。えっと例えば人口予測データ(確かインバネス周辺だったかな)使ってテストしてみた時、自動で「あそこよりここが多い」みたいなタイトルを勝手につけてくれる。

でも全部自分好みにカスタマイズできるわけじゃない感じもあるし、本格的に運用するなら色々調整必要そう…いや、それとももう少し工夫すれば案外うまくいくのか?うーん、自信ないけど可能性はあるかも。ただブログには細かい前処理とか載せてなかった気がするから、その辺含めてまだ完全に手探りの状態なのかな、とぼんやり思う今日この頃。

本段の参照元: https://www.johnmackintosh.net/blog/2023-01-26-headlines/

日本語圏での挑戦:文法、文化、技術の壁を超えて

headlinerの使い方なんだけど、まずRでデータフレームを用意するところから始まるんだよね。えっと、それで関数を呼び出せばいいっていう、まあ本当に単純な仕組みになってる。ああ、こうやって書いてると、「本当に簡単なのかな?」とか一瞬疑いたくなるんだけど…うん、実際はシンプルだと思う。たとえば人口データの場合なら、主要な列名とか、グループ化したい指標をちょこっと指定するだけで、自動的に要点が抽出されて短いタイトル案まで生成されちゃうから驚きだ。

でもさ、話が逸れるけど——日本語のデータになるとうまく機能しない場合も時々あったりしてさ…。それで「またか」と思いつつも必要に応じて各列名の前処理をしたり、ごく簡単な翻訳作業も手間ながら発生することになったりするんだよね。なんかこういう細かい部分では毎回試行錯誤が避けられないという印象だった。ま、いいか。それでも便利なのは確かだから結局使っちゃうんだけどさ…。

日本語圏での挑戦:文法、文化、技術の壁を超えて

Related to this topic:

Comments