テーマ:パソコンを楽しむ♪(3519)
カテゴリ:データ分析
Google トレンドのデータを簡単にグラフ化することができるR言語のパッケージ「gtrendsR」がとても便利です。
下記の例のように、2行の簡単なコードでトレンドワードの推移をグラフにすることができます。 もちろん、Google トレンドのページでグラフを作成したり、関連ワードのデータをダウンロードできますが、R言語を使うと、得られたデータの詳細分析への利用が簡単になります。 例えば、新型コロナウイルス関連のトレンドワードの推移グラフの画像ファイルを簡単に得ることができます。 ただし、Windows PCの場合は、日本語のトレンドワードだと、「invalid multibyte string 2」といったエラーになる場合が多くあります。これは、日本語に限らず、中国語や韓国語などのマルチバイトの言語に共通の問題のようです。 例えば、「マイナポイント」ではエラーが出てしまいました。「マイナ ポイント」のように半角の空きを入れるとエラーが出なかったりします。また、同じ単語でも2回目にエラーが出たりして、日本語の場合は不安定です。 →LinuxやMacの環境では問題が生じないようです。とりあえず、Rstudio.Cloudを使うことによって、文字化けのない出力結果を得ることができました。しかし、グラフは文字化けしていました。 グラフの文字化けを解消する方法があったので、とりあえずGoogleトレンドのRでの分析はRstudio.Cloudで何とかなりそうです。Rstudio.Cloudは、グーグルのアカウントでログインして利用できます。ちょっとした利用の仕方であれば、無料利用の範囲で可能です。 なお、グラフは絶対数の推移ではなく、最大値を100とした相対値の推移になっています。 Googleの資料によると、「水準が低下していても必ずしも絶対数が低下しているとは限らない」というような記述がありました。 グラフは、各時点における検索全体に占める割合を示している、ということのようです。 最近、感染確認者数が再び増加している米国ですが、「corona virus」の検索は低調のようです。関心が低下しているのかもしれません。もちろん、あまり何度も検索しない類の言葉なのかもしれませんが。 ↓日本での「コロナ ウイルス」の検索の推移 ↓米国での「corona virus」の検索の推移。 ↓日本での「テレワーク」の検索の推移 ↓米国での「remote work」の検索の推移。最近は、少し増加傾向にあるようです。 【Rのコード例】 install.packages("gtrendsR") library(gtrendsR) TREND1 <- gtrends(keyword = "コロナ ウイルス", geo = "JP",time = "2020-01-01 2020-06-30") plot(TREND1) TREND2 <- gtrends(keyword = "corona virus", geo = "US",time = "2020-01-01 2020-06-30") plot(TREND2) TREND3 <- gtrends(keyword = "テレワーク", geo = "JP",time = "2020-01-01 2020-06-30") plot(TREND3) TREND4<- gtrends(keyword = "remote work", geo = "US",time = "2020-01-01 2020-06-30") plot(TREND4) ---------------------------------------------------------------------------------- ↓Googleトレンドでの「Galaxy A7」の推移です。楽天モバイルの値下げ、ポイントアップのタイミングで人気化した様子がわかります。
------------------------------------------------------------------------- -------------------------------------------------------------------------- ↓実効再生産数を計算できるWebアプリがあります。 ↓倍加時間についてです。 -------------------------------------------------------------------------- ↓ECDCデータ版ダッシュボードはこちらからアクセスできます。 ------------------------------------------------------------------------- 【ダッシュボード「COVID-19 Transition Graphs」を試作】 こちらは、ジョンズ・ホプキンス大学のデータを利用したダッシュボードです。 中国本土以外の地域への感染が拡大しているため、国別、地域別の感染者数の推移を簡単に確認できるダッシュボードを試作しています。 随時、ページを追加しています。グラフのデータは、右上部分の操作でダウンロードすることができます。 アメリカの「地域別の変数」を前処理して、「州別」での推移をグラフ化できるようにしました。 また、州コードのフィールドを作成してコロプレス地図も作成しています。 楽天ブログでは「iframe」タグが使えないので、Bloggerのページから利用できるようにしています。 無料で利用できる、グーグルの「データポータル」のダッシュボードです。データさえあれば、簡単に作成できます。「国」別、「地域」別に日ごとの感染者数の推移を見ることができます。 ↓ダッシュボードの試作です。下記リンクのページから利用できます。 ジョンズ・ホプキンス大学の「JHU CSSE」の「Covid19 Daily Reports」のデータを利用しています。 EdgeブラウザやIEブラウザなど、Chromeブラウザ以外での利用の場合はうまく表示されないことがあるようです。 新型コロナウイルス(2019-novel coronavirus)対策もインフルエンザ対策と同じで、手洗い、うがい、マスク着用(咳エチケット)、免疫力アップなどが対策になるようです。↓上記のダッシュボードのデータの出所のサイトです。マップがメインのダッシュボードです ----------------------------------------------------------------------------------------- ↓WHOのサイトでも、感染者数、地域などの「Situation Report」が日々更新されています。関心がある場合は、一日に一度見るといいのではないかと思います。 ↓日本のインフルエンザの「定点当たり報告数」をグラフ化できるダッシュボードを試作。都道府県別にグラフ化可能です。 ------------------------------------------------------ ---------------------------------------------------------------------------- ★おすすめの記事 ◆How Windows Sonic looks like.:Windows Sonic for Headphonesの音声と2chステレオ音声の比較:7.1.2chテストトーンの比較で明らかになった違い:一目で違いがわかりました ---------------------------------------------------------------------------------------------------------- お気に入りの記事を「いいね!」で応援しよう
Last updated
2020.07.09 19:38:58
コメント(0) | コメントを書く
[データ分析] カテゴリの最新記事
|
|