1247162 ランダム
 HOME | DIARY | PROFILE 【フォローする】 【ログイン】

One of my favorite things is ...

2020.09.25
XML
カテゴリ:データ分析
ジョンズ・ホプキンス大学やECDCのデータを利用して、新型コロナウイルスの感染確認者数や死亡者数のデータを可視化しています。

グーグルのデータポータルで、グーグルスプレッドシートのデータを読み込んでレポートを作成しています。


非常に簡単そうに思えるのに、実はできないのが、データポータルのスコアカードに最新の日付の感染確認者数や死亡者数の累計を表示することです。

↓感染確認者数と死亡者数の累計は、9月24日に更新した、最新のデータ(9月23日のデータ)を表示しています。各国の累計値を日付で絞り込み、合計したものが表示されています。


1日に一度データを更新しているのですが、例えば9月24日にデータを更新すると、9月23日のデータが最新のものになっています。

この場合、データポータルのスコアカードで、「今日マイナス1日」と指定すれば、9月24日のうちはいいのですが、日付が変わって9月25日になると、9月24日のデータが更新されるまでスコアカードに表示するデータがないことになってしまいます。

随時データが自動更新されるデータソースでない場合、最新のデータが表示されるようにするには工夫が必要になります。

「今日マイナス2日」という運用にしておけば、9月24日時点では9月22日のデータがスコアカードに表示され、9月25日には9月23日のデータが表示されるので、表示するデータがないという事態は防ぐことができます。このような形で運用している場合もありますが、単純な累計値は最新のデータを表示させたいと思っています。

最新のデータをスコアカードに表示させることができれば、それに越したことはありません。「最新のデータ」の指定の仕方として、日付に順位を付ける方法が考えられます。

これまで、グーグルのスプレッドシート上の関数で日付に順位を付けて、データポータルのフィルタで日付の順位が1位のものに絞り込むことによって、スコアカードに表示させるデータを最新のものにしていました。

データ量が増えてきたせいで、グーグルのスプレッドシートでの関数の計算にも時間がかかるようになり、データポータルでもエラーが出るようになってきました。

少しでもスプレッドシートの負担を軽くするために、下記のRのコードで日付の順位付けをRの前処理で行うようにしました。下記の2行で日付の順位の列「Drank」が作成されます。なお、df_ECDCは、ECDCから読み込んで前処理をしたデータです。

df_ECDC$Drank <- rank(df_ECDC$Date1, ties.method = "min")   
df_ECDC$Drank <- max(df_ECDC$Drank)-df_ECDC$Drank+1

あとは、データポータルに読み込んだデータに対して、スコアカードの設定で「Drank=1」というフィルターを追加しておくだけで、最新のデータをスコアカードに表示させることができます。

なお、上記のコードは、最新の日付の順位が1になればいいというもので、それぞれの日付にわかりやすく順位付けをする場合は、下記のようなコードを用いることになりますが、ループ処理なので時間がかかってしまいます。

for(i in 1:length(df_ECDC$Date1)){
df_ECDC$Drank[i] <-which(unique(df_ECDC$Date1)==df_ECDC$Date1[i])
}
df_ECDC$Drank <- length(unique(df_ECDC$Drank))-df_ECDC$Drank+1

-------------------------------------------------------------------------------------------​

----------------------------------------------------------------------​​
楽天市場で「マスク」を検索する

楽天市場で「ポビドンヨード」を検索する


​楽天市場で「イソジン うがい薬」を探す​

楽天市場で「うがい薬」を検索する

楽天市場で「マウスウォッシュ・洗口液」を探す
​-----------------------------------------------------------------------

楽天市場で「フコイダン」を探す

​-----------------------------------------------------------------------


​ついに、AQUOS sense3 liteも高額ポイントの対象になりました。マイナンバーカードの読み取りに対応している機種です。​

----------------------------------------------------------------------------------
​​​​​​

↑楽天市場店で購入すればよかったと思います:アマゾン・プライム・ビデオはHD 1080Pで視聴できます:有機ELなので、黒がきれいです:ヘッドホンでのドルビーアトモスに対応しています。

​​
-------------------------------------------------------------------------

↓楽天市場以外の有名ストアの利用でも楽天ポイントが貯まります。
Rebatesお友達紹介キャンペーン

-------------------------------------------------------------​
​​



--------------------------------------------------------------------------​​​​



-------------------------------------------------------------------------​
​【ダッシュボード「COVID-19 Transition Graphs」を試作】​​
こちらは、ジョンズ・ホプキンス大学のデータを利用したダッシュボードです。

中国本土以外の地域への感染が拡大しているため、国別、地域別の感染者数の推移を簡単に確認できるダッシュボードを試作しています。​

随時、ページを追加しています。グラフのデータは、右上部分の操作でダウンロードすることができます。

アメリカの「地域別の変数」を前処理して、「州別」での推移をグラフ化できるようにしました。

また、州コードのフィールドを作成してコロプレス地図も作成しています。

楽天ブログでは「iframe」タグが使えないので、Bloggerのページから利用できるようにしています。

無料で利用できる、グーグルの「データポータル」のダッシュボードです。データさえあれば、簡単に作成できます。「国」別、「地域」別に日ごとの感染者数の推移を見ることができます。

↓ダッシュボードの試作です。下記リンクのページから利用できます。
​​

ジョンズ・ホプキンス大学の「JHU CSSE」の「Covid19 Daily Reports」のデータを利用しています。
 
EdgeブラウザやIEブラウザなど、Chromeブラウザ以外での利用の場合はうまく表示されないことがあるようです。

上記のダッシュボードのデータの出所のサイトです。マップがメインのダッシュボードです


-----------------------------------------------------------------------------------------




↓日本のインフルエンザの「定点当たり報告数」をグラフ化できるダッシュボードを試作。都道府県別にグラフ化可能です。



​--------------------------------------------------------------------------

★おすすめの記事 ​​







​​◆How Windows Sonic looks like.​​:Windows Sonic for Headphonesの音声と2chステレオ音声の比較:7.1.2chテストトーンの比較で明らかになった違い:一目で違いがわかりました




----------------------------------------------------------------------------------------------------------










Last updated  2020.09.28 05:25:02
コメント(0) | コメントを書く


PR

Recent Posts

◆【foltia Anime Locker】Plexへの録画ファイルのコピーとファイル名変更をバッチファイルで実行するようにしました
◆【foltia Anime Locker】録画はアニメロッカーで、視聴はPlexで行うことにしてみました:Plexのプレーヤーにはレジューム機能や「30秒早送り」「10秒巻き戻し」機能、チャプター機能があるので快適です:robocopyコマンドでファイルコピーの自動実行を試してみます
◆【新型コロナ】ヨーロッパ各国の実効再生産数は?:ヨーロッパに第2波到来
◆【新型コロナ】ヨーロッパに第2波?:感染確認者数は急増し、死亡者数も増加傾向にあります
◆【Google アナリティクス】IPアドレスから推定されている市区町村は、全国で827:地図上にプロットしてみました
◆【foltia Anime Locker】録画用HDDの容量はほどほどにすることにしました:バックアップ用のHDDを大容量にしたほうがよさそうです
◆8月の国内パック旅行への支出は、まだ低水準のようです:総務省「家計調査」から
◆【新型コロナ】いつの間にか、日本の感染確認者数の累計が中国に迫っています
◆【nasne】なんと、ソニーの「nasne」が、バッファローの「nasne」として復活するそうです
◆【新型コロナ】欧州では感染確認者数が急増中です:10月に入って加速しています

Free Space

Category

Archives

Comments

ベイズ統計(事前確率→事後確率)を学んでください@ Re:◆【新型コロナ】九州大の小田垣名誉教授が提言:「検査数拡大と隔離」で早期収束の可能性(05/08) 参考URL https://qiita.com/oki_mebarun/i…
Tetsuo Kimura@ Re:◆ECDC ダッシュボード 疾病診断確認と死亡のタイムラグ たいへん有意義な統計グラフィックスをご…

Keyword Search

▼キーワード検索

Rakuten Card


Copyright (c) 1997-2020 Rakuten, Inc. All Rights Reserved.