R から「政府の統計窓口 e-Stat 」を使う
ネットで記事を漁っていると、数値が怪しいものが話題になることが多い気がします。
そんな時にオリジナルの数字が欲しい、自分なりに解釈を変えて再解析したいと思うことがあります。 省庁が調査しているデータであれば「政府の統計窓口 e-Stat」なるものがあることを知りました。 メールアドレスがあれば誰でも使え API でのデータ取得も可能で便利です。
RStudio, Jupyter などと連携すればかなり強力ではないでしょうか。
政府の統計窓口 e-Stat
最近リニューアルされたそうです。
ちょっと戸惑う部分もありますが比較的分かり易いのではないでしょうか。 昔から、お役所の窓口は庶民に優しくないので仕方がないと諦めましょう。
アカウントを作成
- web page に移動 政府統計の総合窓口
- 新規登録をクリック メールアドレスを入力し仮登録後、メールを受け取り本登録をすれば完了。 Google アカウントなどをリンクさせることもできるので便利です。
API の利用
デザインがある意味よろしくないと思うのですが、”API 機能”という右ペインのボタンは説明のみです。 API の利用手続(appId 発行)はマイページで行います。
- マイページ -> アプリケーションIDの取得
- 名称任意 必須
- URL ネット上に公開しないのであれば http://localhost/ でよい
- 右側の発行ボタンを押す
- appId が発行される 16進数の羅列
フォーマットは XML, JSON 一部 CSV が可能なようです。
R から使う
R では検索と取得を行ってくれる library がCRANに登録されています。 作者様に感謝。 以下のリンクにインストール法及び使用法が書かれています。 https://github.com/yutannihilation/estatapi/blob/master/README.md
ここでは最低限の紹介にとどめます。
インストールは以下のように入力するか、お好みで RStudio を利用しても良いです。
install.packages("estatapi")
利用は先ほど e-Stat で取得した appId があれば使えます。 DB にアクセスする関数は appId を引数にとるので予め変数を用意しておくと便利です。
library(estatapi) appId <- XXXXX # 取得した appId
RStudio から使えばデータの検索、取得、加工、閲覧( View )、プロットが一つの環境で行え便利です。 難点は日本語入力か……(linux)
Jupyter lab がいい感じだったので乗り換えようかな(irkernel の動作確認中。rstan などを使わなければ充分かも)
まとめ
個人が政府などの統計を解釈して意見がネット上で述べられるのは意義が大きいと思います。 官僚の皆さんが優秀で沢山の仕事してくれているのは重々承知しているつもりですが、時々誤りではと思うものも見つかります。 ネットに上がっている分析でかなり優秀なものも見かけますので、政府で報奨金をだすような制度があっても良いような……官製アフィリエイト(笑)
編集ログ
2022/02/12 リンク切れを修正