ホームCovid-19東京の実効再生産数は、果たしていくらなのか。
2020年5月09日

東京の実効再生産数は、果たしていくらなのか。

toilet paper

こんにちは、筋肉めがねです。

Covid-19の影響により、3月の始めから在宅勤務をしており、それに伴い、家でも仕事に集中できるようにデスク周りの環境を少しずつ整えてきました。モニターを買い、ワイヤレスマウスを買い、キーボードを買い、それなりに形になってきました。

あとは、どこかのタイミングで昇降式のデスクを買いたいと考えています。

さて、ここ数日、日本のCovid-19関連のニュースを見ていると、実効再生産数、という言葉が多く出てくるようになってきました。

実効再生産数を深掘りする前に、基本再生産数と実効再生産数との違いをおさらいしておきます。

基本再生産数、とは、例として、ある疫病にかかった患者が、全く感染症にかかっていない集団の中に放り込まれた時に、新たに何人に感染させるか、という事を示した指標です。ただ、Covid-19の市中感染が確認されている現状では、使用されない指標です。 そこで、基本再生産数とは違い、既に不特定多数の方が感染している環境で、感染者が新たに何名の方に感染させるか、を示した指標が、実効再生産数です。

基本再生産数はR0(ゼロ)で表記され、実効再生産数はRで表記されます。
この記事では、これ以降、実効再生産数をRと表記します。

5月4日に放送されたワイドショーで、4月10日時点での日本全国のRは0.7で、東京では0.5であった、と放映されました。

元データはこちらですね。
新型コロナウイルス感染症対策の状況分析・提言(2020年5月1日)

ドイツにおいては、R、というのは、規制を緩和していく際の一つの指標として使われる重要な数値です。
それで、Rって、一体全体どういう方法で算出されているのか気になったので、勉強を兼ねて、東京都の公式データを使用して、東京都のRをシミュレーションしてみました。

なお、この記事で示す算出過程、算出された結果、それに対する考察は、全て僕自身の個人的な見解であり(もちろん、算出方法については偉人たちの知識・経験を参考しております。)、この記事の内容は参考程度に留めていただきますようお願いいたします。ただ、記事内に明らかな間違いがある場合には、ご連絡をいただけますと大変助かります。

以下、目次です。

実効再生産数の求め方

京都大学、山中先生によっても紹介されていたCoriらの論文にて提唱されている手法を用います。

山中先生の記事
実効再生産数(Rt)算出を試みました

Coriらの論文 A New Framework and Software to Estimate Time-Varying Reproduction Numbers During Epidemics

Abstractの一部より抜粋すると、

Several methods have been proposed to estimate R over the course of an epidemic; however, they are usually difficult to implement for people without a strong background in statistical modeling. Here, we present a ready-to-use tool for estimating R from incidence time series, which is implemented in popular software including Microsoft Excel (Microsoft Corporation, Redmond, Washington). This tool produces novel, statistically robust analytical estimates of R and incorporates uncertainty in the distribution of the serial interval (the time between the onset of symptoms in a primary case and the onset of symptoms in secondary cases).

最近、google translaterよりも質が良い、とされているDeepLを用いた翻訳によると、

伝染病の過程でRを推定するためにいくつかの方法が提案されているが、これらの方法は通常、統計モデリングに強いバックグラウンドを持たない人にとって実装するのは困難である。ここでは、Microsoft Excel(Microsoft Corporation, Redmond, Washington)を含む一般的なソフトウェアに実装されている、発生時系列からRを推定するためのすぐに使えるツールを紹介する。このツールは、統計的にロバストなRの新しい分析的推定値を生成し、系列区間(一次症例の症状発症から二次症例の症状発症までの時間)の分布に不確実性を組み込んでいる。

ざっくり言うと、統計に関する深い知識がなくとも、Rを算出するために役に立つツールを紹介する、ということである。そして、“Serial interval”、一次患者が発症してから二次患者が発症するまでの期間がポイントであるようなので、これは気に留めておきましょう。

論文を読み進めて行くうちに分かりますが、Rの算出根拠、考え方を理解するためには統計学の知識が多いに必要です。

参考までに、以下に、「Rの算出方法」の詳細が記載されたファイルをダウンロードできるリンクを貼っておきます。

注意:以下の「Rの算出方法」リンクをクリックすると、zipファイルのダウンロードがはじまります。zip内にRの算出方法が細かく記載されたwordファイルが入っております。ダウンロードに不安のある方は、こちらのページ「A New Framework and Software to Estimate Time-Varying Reproduction Numbers During Epidemics」の「Supplementary Data」リンクから個別にダウンロードしていただければと思います。

Rの算出方法

数日前のワイドショーにて、Rの数値は出ているけれども、ある専門家が「分析に手いっぱいな状態で、近日中にうまく計算方法が伝わる方法を検討。」というコメントを拝見しました。その時は、このコメント自体がとても怪しく感じられ、Rの結果は出ているのに、Rの算出方法が定まっていないのか、と勘違いをしておりました。実のところは、そうではなくて、Rの算出方法・根拠はきちんとあるんだけれども、大衆に分かりやすい形でどのように伝えることがベストなのか、そこがはっきりとは定まっていないのかもしれませんね。だって、こんなに複雑な数式を見せられても分かりませんよね。大衆にも「うまく計算方法が伝わる方法」が早く確立されることを願います。

さて、Rの算出方法がとても難しいことを理解したところで、実際に東京都のRを算出していきましょう。算出方法が理解できなくても、算出はできるんですね。それを助けてくれるのが、Coriらの論文で紹介されているツール「EpiEstim」です。

Excelツールの使い方

Excelツールのtop pageは以下です。

EpiEstim

このツールの”Data”タブに必要なデータを入れていけば、Rが算出される、という優れものです。 早速、ツールを使っていきましょう。

先ず、以下のリンクから東京都の日別の感染確認者数の数値をダウンロードします。
東京都_新型コロナウイルス陽性患者発表詳細

すると、このようなcsvで感染者確認の時系列データが出て来るので、そこからピボットで、日付毎の感染確認者数を表示させましょう。  

DataInTokyo

InfectedPeopleByDate

得られたピボットテーブルのデータを、toolのDataタブのIncidence sectionに記載していきます。

Min Timeは1です。 1月24日から、5月8日までに、数値が公表されたのは、80日間ですので、Max Timeは80です。 Timeは1から80までを記載し、Incidenceに先ほどのピボットテーブルで得られた感染確認者数を入れます。

  • ちなみに、最終結果であるRのグラフにおいて、横軸を日付としたい場合には、Timeに日付を入れていく必要があります。

Incidence

これで、Incidence sectionは完了です。

続いて、“Serial Interval” sectionです。上にも書きましたが、これは、一次患者が発症してから二次患者が発症するまでの期間です。現実には、この期間に不確実性が存在します。ここで言う不確実性とは、一次感染者から二次感染者に対して、感染するかどうか、定かではない、ということです。

統計学では、とても大事な概念だとは思いますが、簡便化のため、ここでは、不確実性はないものとして、進めていきます。

ツールのDataタブにて、Serial interval sectionで、“Account for uncertainty”をNとします。不確実性はないものとみなします。
そして、ParametricはYとします。Serial intervalの平均値と標準偏差は、それぞれ山中先生のページを参考に、6.3日、4.2日とします。

参考されている論文はこちらです。
Epidemiology and transmission of COVID-19 in 391 cases and 1286 of their close contacts in Shenzhen, China: a retrospective cohort study

Serial interval

続いて、“Time step choice” sectionです。

Aimed posterior CV (coefficient variant)は、Coriらの論文でデフォルトで使用されている0.3に設定します。
また、“Custom time steps”はNとします。“Length of time steps”と”No. of steps at which estimation is performed”はデフォルトで設定されている通り、7と1とします。

Time step choice

最後に、“prior distribution”です。
平均値、標準偏差、ともにデフォルトで設定されている5を使います。

Prior distribution

最後に、ツールの左端にある、“Estimate R”ボタンを押しましょう。

Estimate button

Excelファイルの最後のタブ”Figures”に結果がグラフとして表示されます。

得られた実効再生産数に対する考察

結果はこちらです。

Result of R

主な出来事とその時のRは以下の通り。

  • 2月27日(政府が学校に臨時休校を要請した日):R = 0.97
  • 3月5日(第17回新型コロナウイルス感染症対策本部が開催されマスク転売禁止へ):R = 1.19(上のグラフで3月以降にはじめてRが1を超えた日)
  • 3月10日(政府10日間の自粛延長要請):R = 1.68
  • 3月14日(政府が「オリンピックは予定通り」と発表):R = 1.39
  • 3月24日(オリンピックの延期が決定):R = 1.56
  • 3月25日(都知事が「週末の外出自粛要請、解除は4月12日までに判断」):R = 2.12
  • 3月27日(大阪府が週末の外出自粛を要請):R = 2.79
  • 3月29日:R = 3.21(上のグラフでRのMax値)
  • 4月7日(緊急事態宣言が出された日):R = 1.71
  • 4月21日:R = 0.97(上のグラフで4月にはじめて1を下回った日)
  • 4月30日:R = 0.65(上のグラフでのRのMin値)
  • 5月8日:R = 0.72

5月8日時点では、R=0.72で、この数値だけを見れば収束に向かっていると言えるかもしれません。ただ、規制を緩和すればすぐにでもRはあがると思います。

この記事を書いている5月9日時点で、ドイツではRが1.1にあがりました。今週水曜日の時点では0.65であったにも関わらず、わずか3日間で1を超えるところまできました。ドイツでは4月20日から、数週間かけて少しずつ規制を緩和してきました。はじめは、床面積が800平方メートルに満たないお店の営業再開がはじまり、そして遊び場や、博物間などの営業がはじまり、と少しずつ少しずつ規制が緩和されてきました。それで、本日5月9日にRが1を超えた、ということでドイツでは大きなニュースになっております。

Rの算出方法は様々あるようです。この記事では、専門外の僕が、ツールを使って東京都のRを算出したに過ぎないので、専門家の方であればもっと信頼できるシミューレーションができるのだろうと思います。

引き続き、僕自身は在宅勤務をしながら動向を見守っていきたいと考えています。

シェアする