カテゴリ:データ分析
R言語のパッケージに「rtweet」というものがあり、使ってみました。Twitter社にAPIの使用申請をすることは不要で、単に自分のツイッターアカウントを登録するだけで利用を始められます。
データを取得できるのは直近の6~9日間限定ですが、1回の操作で最大18000件のデータを取得できます。 「新型コロナ」という言葉を含むツイート5000件を今朝取得してみました。 このキーワードで5000件だと午前2時(UTC)から午前3時(UTC)までの1時間分くらいのデータでしかありません。 最大18000件では、ほんの数時間ほどの傾向しかわからないことになるので、ビッグワードの分析は難しいようです。 逆に件数が少ないキーワードの場合は、18000件取得しようとしても6~9日間以上さかのぼらないので8000件しか取得できない場合もあります。 とりあえず、R言語でワードクラウドと感情分析のグラフを作成してみました。 感情分析は、単語のポジネガ得点一覧表とツイートに使われている単語表を結合し、合致している単語の得点を集計したものです。なお、単語のポジネガ得点一覧表の平均値は0ではなく、-0.32と元々ネガティブ寄りです。 「新型コロナ」というキーワードを含むツイートなので、圧倒的にネガティブな内容が多いようです。 KH Coder3.0に読み込ませると、ツイート単位のクラスター分析(文書のクラスター分析)ができ、クラスターそれぞれに特徴語や共起語ネットワーク分析ができるようになります。どのような話題があるのかを簡単に分析できるのですごいです。KH Coderは進化を続けているようです。 ↓取得したデータでのハッシュタグクラウドです。元旦の未明は、「渋谷」が最も多くなっています。 ↓「新型コロナ」を必ず含むツイートなので、「新型」「コロナ」は除外しています。「ウイルス」も除けばよかったようです。 R言語を3.6.1から4.0.3にしてみました。パッケージのアップグレードが結局再インストールになったので大変でした。 -----------------------------------------------------------------------
----------------------------------------------------------------------------------
------------------------------------------------------------------------- -------------------------------------------------------------------------- ------------------------------------------------------------------------- 【ダッシュボード「COVID-19 Transition Graphs」を試作】 こちらは、ジョンズ・ホプキンス大学のデータを利用したダッシュボードです。 中国本土以外の地域への感染が拡大しているため、国別、地域別の感染者数の推移を簡単に確認できるダッシュボードを試作しています。 随時、ページを追加しています。グラフのデータは、右上部分の操作でダウンロードすることができます。 アメリカの「地域別の変数」を前処理して、「州別」での推移をグラフ化できるようにしました。 また、州コードのフィールドを作成してコロプレス地図も作成しています。 楽天ブログでは「iframe」タグが使えないので、Bloggerのページから利用できるようにしています。 無料で利用できる、グーグルの「データポータル」のダッシュボードです。データさえあれば、簡単に作成できます。「国」別、「地域」別に日ごとの感染者数の推移を見ることができます。 ↓ダッシュボードの試作です。下記リンクのページから利用できます。 ジョンズ・ホプキンス大学の「JHU CSSE」の「Covid19 Daily Reports」のデータを利用しています。 EdgeブラウザやIEブラウザなど、Chromeブラウザ以外での利用の場合はうまく表示されないことがあるようです。 ↓上記のダッシュボードのデータの出所のサイトです。マップがメインのダッシュボードです ----------------------------------------------------------------------------------------- ↓日本のインフルエンザの「定点当たり報告数」をグラフ化できるダッシュボードを試作。都道府県別にグラフ化可能です。 -------------------------------------------------------------------------- ★おすすめの記事 ◆How Windows Sonic looks like.:Windows Sonic for Headphonesの音声と2chステレオ音声の比較:7.1.2chテストトーンの比較で明らかになった違い:一目で違いがわかりました ---------------------------------------------------------------------------------------------------------- お気に入りの記事を「いいね!」で応援しよう
Last updated
2021.01.02 06:44:22
コメント(0) | コメントを書く
[データ分析] カテゴリの最新記事
|
|