Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

各自治体ごとの貧困関連ニュースの頻出語・特徴語を分析する #23

Open
yuiseki opened this issue Aug 15, 2021 · 1 comment

Comments

@yuiseki
Copy link
Member

yuiseki commented Aug 15, 2021

なぜこのデータ分析をやるのか

  • crisis.yuiseki.net では貧困関連ニュースを収集してAPIを提供している
  • また、ニュース記事本文から市区町村レベルで位置情報を推定して保存している
  • 各自治体ごとのニュース記事の頻出語を分析することで、自治体ごとの傾向がわかるのではないか
  • 特定のキーワードが極端に多い自治体では異常な事態が起きている可能性が考えられる

類似の分析事例

  • おそらく存在しない

必要なデータとその入手方法、入手可能性

  • crisis.yuiseki.net のAPIでデータを取得可能

データの分析方法の案

  • 全ニュース記事を取得し、タイトルと本文を形態素解析して、キーワードの出現回数をカウントする
  • 各自治体ごとのニュース記事を取得し、タイトルと本文を形態素解析して、キーワードの出現回数をカウントする
    • 単純に最も頻繁に出現するキーワードが頻出語
    • 全ニュース記事のキーワード出現回数と比較してその地域だけ出現回数が多いキーワードが特徴語

データの可視化方法の案

  • 自治体ごとの表にする
  • 地図上でキーワードをオーバーレイして可視化する
@yuiseki yuiseki self-assigned this Aug 15, 2021
@yuiseki
Copy link
Member Author

yuiseki commented Aug 15, 2021

これは自分が実装できそうなのでやってみます

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

1 participant