2686368 ランダム
 HOME | DIARY | PROFILE 【フォローする】 【ログイン】

One of my favorite things is ...

【毎日開催】
15記事にいいね!で1ポイント
10秒滞在
いいね! --/--
おめでとうございます!
ミッションを達成しました。
※「ポイントを獲得する」ボタンを押すと広告が表示されます。
x
2021.01.01
XML
カテゴリ:データ分析
R言語のパッケージに「rtweet」というものがあり、使ってみました。Twitter社にAPIの使用申請をすることは不要で、単に自分のツイッターアカウントを登録するだけで利用を始められます。

データを取得できるのは直近の6~9日間限定ですが、1回の操作で最大18000件のデータを取得できます。

「新型コロナ」という言葉を含むツイート5000件を今朝取得してみました。

このキーワードで5000件だと午前2時(UTC)から午前3時(UTC)までの1時間分くらいのデータでしかありません。

最大18000件では、ほんの数時間ほどの傾向しかわからないことになるので、ビッグワードの分析は難しいようです。

逆に件数が少ないキーワードの場合は、18000件取得しようとしても6~9日間以上さかのぼらないので8000件しか取得できない場合もあります。


とりあえず、R言語でワードクラウドと感情分析のグラフを作成してみました。

感情分析は、単語のポジネガ得点一覧表とツイートに使われている単語表を結合し、合致している単語の得点を集計したものです。なお、単語のポジネガ得点一覧表の平均値は0ではなく、-0.32と元々ネガティブ寄りです。

「新型コロナ」というキーワードを含むツイートなので、圧倒的にネガティブな内容が多いようです。

KH Coder3.0に読み込ませると、ツイート単位のクラスター分析(文書のクラスター分析)ができ、クラスターそれぞれに特徴語や共起語ネットワーク分析ができるようになります。どのような話題があるのかを簡単に分析できるのですごいです。KH Coderは進化を続けているようです。

↓取得したデータでのハッシュタグクラウドです。元旦の未明は、「渋谷」が最も多くなっています。


↓「新型コロナ」を必ず含むツイートなので、「新型」「コロナ」は除外しています。「ウイルス」も除けばよかったようです。



R言語を3.6.1から4.0.3にしてみました。パッケージのアップグレードが結局再インストールになったので大変でした。

-----------------------------------------------------------------------


​ついに、AQUOS sense3 liteも高額ポイントの対象になりました。マイナンバーカードの読み取りに対応している機種です。​

----------------------------------------------------------------------------------
​​​​​​

↑楽天市場店で購入すればよかったと思います:アマゾン・プライム・ビデオはHD 1080Pで視聴できます:有機ELなので、黒がきれいです:ヘッドホンでのドルビーアトモスに対応しています。

​​
-------------------------------------------------------------------------

↓楽天市場以外の有名ストアの利用でも楽天ポイントが貯まります。
Rebatesお友達紹介キャンペーン

-------------------------------------------------------------​
​​



--------------------------------------------------------------------------​​​​



-------------------------------------------------------------------------​
​【ダッシュボード「COVID-19 Transition Graphs」を試作】​​
こちらは、ジョンズ・ホプキンス大学のデータを利用したダッシュボードです。

中国本土以外の地域への感染が拡大しているため、国別、地域別の感染者数の推移を簡単に確認できるダッシュボードを試作しています。​

随時、ページを追加しています。グラフのデータは、右上部分の操作でダウンロードすることができます。

アメリカの「地域別の変数」を前処理して、「州別」での推移をグラフ化できるようにしました。

また、州コードのフィールドを作成してコロプレス地図も作成しています。

楽天ブログでは「iframe」タグが使えないので、Bloggerのページから利用できるようにしています。

無料で利用できる、グーグルの「データポータル」のダッシュボードです。データさえあれば、簡単に作成できます。「国」別、「地域」別に日ごとの感染者数の推移を見ることができます。

↓ダッシュボードの試作です。下記リンクのページから利用できます。
​​

ジョンズ・ホプキンス大学の「JHU CSSE」の「Covid19 Daily Reports」のデータを利用しています。
 
EdgeブラウザやIEブラウザなど、Chromeブラウザ以外での利用の場合はうまく表示されないことがあるようです。

上記のダッシュボードのデータの出所のサイトです。マップがメインのダッシュボードです


-----------------------------------------------------------------------------------------




↓日本のインフルエンザの「定点当たり報告数」をグラフ化できるダッシュボードを試作。都道府県別にグラフ化可能です。



​--------------------------------------------------------------------------

★おすすめの記事 ​​







​​◆How Windows Sonic looks like.​​:Windows Sonic for Headphonesの音声と2chステレオ音声の比較:7.1.2chテストトーンの比較で明らかになった違い:一目で違いがわかりました




----------------------------------------------------------------------------------------------------------









お気に入りの記事を「いいね!」で応援しよう

Last updated  2021.01.02 06:44:22
コメント(0) | コメントを書く


PR

Recent Posts

Free Space







Rebatesお友達紹介キャンペーン

​​​​

Category

Archives

Comments

digital_21@ Re[1]:◆【新型コロナ】やっぱり、PCR検査(08/02) 背番号のないエース0829さんへ すてきな内…
背番号のないエース0829@ Re:◆【新型コロナ】やっぱり、PCR検査 「日本一遅い成人式が、無事終了 !!」に、…

Keyword Search

▼キーワード検索

Rakuten Card


© Rakuten Group, Inc.