テーマ:パソコンを楽しむ♪(3519)
カテゴリ:データ分析
ジョンズ・ホプキンス大学やECDCのデータを利用して、新型コロナウイルスの感染確認者数や死亡者数のデータを可視化しています。
グーグルのデータポータルで、グーグルスプレッドシートのデータを読み込んでレポートを作成しています。 非常に簡単そうに思えるのに、実はできないのが、データポータルのスコアカードに最新の日付の感染確認者数や死亡者数の累計を表示することです。 ↓感染確認者数と死亡者数の累計は、9月24日に更新した、最新のデータ(9月23日のデータ)を表示しています。各国の累計値を日付で絞り込み、合計したものが表示されています。 1日に一度データを更新しているのですが、例えば9月24日にデータを更新すると、9月23日のデータが最新のものになっています。 この場合、データポータルのスコアカードで、「今日マイナス1日」と指定すれば、9月24日のうちはいいのですが、日付が変わって9月25日になると、9月24日のデータが更新されるまでスコアカードに表示するデータがないことになってしまいます。 随時データが自動更新されるデータソースでない場合、最新のデータが表示されるようにするには工夫が必要になります。 「今日マイナス2日」という運用にしておけば、9月24日時点では9月22日のデータがスコアカードに表示され、9月25日には9月23日のデータが表示されるので、表示するデータがないという事態は防ぐことができます。このような形で運用している場合もありますが、単純な累計値は最新のデータを表示させたいと思っています。 最新のデータをスコアカードに表示させることができれば、それに越したことはありません。「最新のデータ」の指定の仕方として、日付に順位を付ける方法が考えられます。 これまで、グーグルのスプレッドシート上の関数で日付に順位を付けて、データポータルのフィルタで日付の順位が1位のものに絞り込むことによって、スコアカードに表示させるデータを最新のものにしていました。 データ量が増えてきたせいで、グーグルのスプレッドシートでの関数の計算にも時間がかかるようになり、データポータルでもエラーが出るようになってきました。 少しでもスプレッドシートの負担を軽くするために、下記のRのコードで日付の順位付けをRの前処理で行うようにしました。下記の2行で日付の順位の列「Drank」が作成されます。なお、df_ECDCは、ECDCから読み込んで前処理をしたデータです。 df_ECDC$Drank <- rank(df_ECDC$Date1, ties.method = "min") df_ECDC$Drank <- max(df_ECDC$Drank)-df_ECDC$Drank+1 あとは、データポータルに読み込んだデータに対して、スコアカードの設定で「Drank=1」というフィルターを追加しておくだけで、最新のデータをスコアカードに表示させることができます。 なお、上記のコードは、最新の日付の順位が1になればいいというもので、それぞれの日付にわかりやすく順位付けをする場合は、下記のようなコードを用いることになりますが、ループ処理なので時間がかかってしまいます。 for(i in 1:length(df_ECDC$Date1)){ df_ECDC$Drank[i] <-which(unique(df_ECDC$Date1)==df_ECDC$Date1[i]) } df_ECDC$Drank <- length(unique(df_ECDC$Drank))-df_ECDC$Drank+1 ------------------------------------------------------------------------------------------- ---------------------------------------------------------------------- 楽天市場で「マスク」を検索する 楽天市場で「ポビドンヨード」を検索する 楽天市場で「イソジン うがい薬」を探す 楽天市場で「うがい薬」を検索する 楽天市場で「マウスウォッシュ・洗口液」を探す ----------------------------------------------------------------------- 楽天市場で「フコイダン」を探す -----------------------------------------------------------------------
----------------------------------------------------------------------------------
------------------------------------------------------------------------- -------------------------------------------------------------------------- ------------------------------------------------------------------------- 【ダッシュボード「COVID-19 Transition Graphs」を試作】 こちらは、ジョンズ・ホプキンス大学のデータを利用したダッシュボードです。 中国本土以外の地域への感染が拡大しているため、国別、地域別の感染者数の推移を簡単に確認できるダッシュボードを試作しています。 随時、ページを追加しています。グラフのデータは、右上部分の操作でダウンロードすることができます。 アメリカの「地域別の変数」を前処理して、「州別」での推移をグラフ化できるようにしました。 また、州コードのフィールドを作成してコロプレス地図も作成しています。 楽天ブログでは「iframe」タグが使えないので、Bloggerのページから利用できるようにしています。 無料で利用できる、グーグルの「データポータル」のダッシュボードです。データさえあれば、簡単に作成できます。「国」別、「地域」別に日ごとの感染者数の推移を見ることができます。 ↓ダッシュボードの試作です。下記リンクのページから利用できます。 ジョンズ・ホプキンス大学の「JHU CSSE」の「Covid19 Daily Reports」のデータを利用しています。 EdgeブラウザやIEブラウザなど、Chromeブラウザ以外での利用の場合はうまく表示されないことがあるようです。 ↓上記のダッシュボードのデータの出所のサイトです。マップがメインのダッシュボードです ----------------------------------------------------------------------------------------- ↓日本のインフルエンザの「定点当たり報告数」をグラフ化できるダッシュボードを試作。都道府県別にグラフ化可能です。 -------------------------------------------------------------------------- ★おすすめの記事 ◆How Windows Sonic looks like.:Windows Sonic for Headphonesの音声と2chステレオ音声の比較:7.1.2chテストトーンの比較で明らかになった違い:一目で違いがわかりました ---------------------------------------------------------------------------------------------------------- お気に入りの記事を「いいね!」で応援しよう
Last updated
2020.09.28 05:25:02
コメント(0) | コメントを書く
[データ分析] カテゴリの最新記事
|
|