Summary
この文章では、Juliaを使ったデータ分析の入門として、COVID-19の統計データを通じて、日本語環境における特有の課題とその克服方法について探求します。私自身もこのプロセスで多くの発見があり、読者にも貴重な洞察を提供できることでしょう。 Key Points:
- 日本語環境でのデータ分析には和暦対応が必須であり、`Dates.jl`などを活用した効率的な日付変換が重要です。
- 可視化ライブラリは日本語ラベルへの対応が不十分なので、文字化け対策やフォント指定に注意しながらカスタマイズする必要があります。
- Juliaコミュニティへの参加は情報収集に役立ち、自らのスキル向上にも繋がります。英語文献も積極的に活用しましょう。
Juliaでデータいじってみたら、英語圏との「環境差」がジワリ来た話
So, I finally decided to give Julia a proper go after having it installed for ages. My goal was simple: download some open data, do a bit of wrangling, and maybe plot something. I ended up using the daily Covid-19 stats from Public Health Scotland, which are updated daily.
First step? Open the REPL, install some packages (like DataFrames, CSV, and Downloads), and load them up. The data came in as a CSV, and I realized the date column was an integer, so I had to convert it to a proper date format. Once that was done, I used VegaLite to plot the data—nothing fancy, just a quick line chart with some small multiples.
I also stumbled upon a few useful things, like joinpath for building OS-independent file paths, and tried out Gadfly for plotting, though I couldn’t quite get small multiples to work there.
It’s far from polished, but for a first attempt, I’m pretty chuffed. There’s a lot to learn, but this was a fun little dive into Julia!
First step? Open the REPL, install some packages (like DataFrames, CSV, and Downloads), and load them up. The data came in as a CSV, and I realized the date column was an integer, so I had to convert it to a proper date format. Once that was done, I used VegaLite to plot the data—nothing fancy, just a quick line chart with some small multiples.
I also stumbled upon a few useful things, like joinpath for building OS-independent file paths, and tried out Gadfly for plotting, though I couldn’t quite get small multiples to work there.
It’s far from polished, but for a first attempt, I’m pretty chuffed. There’s a lot to learn, but this was a fun little dive into Julia!
本段の原文をご参照ください: https://www.johnmackintosh.net/blog/2022-03-08-julia/
和暦・日本語可視化…壁を楽しむのがJulia流?
Juliaでデータ分析を始めてみたときの話、すごく楽しかったんですよね。でも、これがもし日本語圏で同じことをやろうとしたら、ちょっとした壁にぶつかりそうな気がしてます。
まず、パッケージのドキュメント。英語だと公式ドキュメントやStack Overflowの情報が豊富なんですが、日本語の情報はまだ少ない。特にJuliaみたいなニッチな言語だと、検索しても日本語の解説ブログがヒットせず、結局英語を読むハメになるかも…。
あと、日付の扱い。英語圏だと「YYYY-MM-DD」が標準だけど、日本だと「令和5年12月31日」みたいな和暦表記もよく使われるよね。CSVデータが和暦混じりだと、Date型への変換で一苦労しそうで怖い。
可視化ツールも微妙にクセがありそう。VegaLiteのラベルを日本語にすると文字化けしたり、Gadflyで「都道府県別」みたいな細かい条件分けが英語圏より複雑だったり。地図データも国勢調査のShapefileを日本語環境で読み込むの、想像しただけで頭が痛い…。
でもまあ、こういう障害も「へー、日本ならではだな」って楽しみながら解決していけたらいいんですけどね。Juliaの日本語コミュニティ、実は意外と活発らしいし、ゆっくり挑戦してみようと思います!

Reference Articles
コース: 6NC:データサイエンス研修(NCCHD)
ここでは、Pythonのデータ解析ライブラリであるPandasを使ってデータを整える練習をしてみました。この動画はNCCHD第74回データサイエンス研修にて発表された内容を再 ...
Source: ICR臨床研究入門(ICRweb)2024 ASCENT-6E
ASCENT-6Eは、次世代の科学技術を担う中高校生を育成することを目指した取り組みです。このプログラムでは、. 「コネクション力(仲.
Source: ASCENT-6E
Related Discussions