remcat: 研究資料集

(TANAKA Sigeto)

「8割は人にうつさない」は嘘? (4): 答え合わせ

COVID-19感染のほとんどは super-spreading event (SSE) で生じるという説について、6月に Emerging Infectious Diseases サイトで公表された Furuse et al (2020) 論文を中心に検討した。

目次

[「8割は人にうつさない」は嘘? シリーズ:第1弾 | 第2弾 | 第3弾

「日本モデル」の根拠

COVID-19に対する日本のいわゆる「クラスター対策」(あるいは「日本モデル」) は、「3密」の状況での大量感染がCOVID-19感染のほとんどを占める、という特殊な前提に依存している。このことに対する批判は、一連の記事

でおこなってきたので、そちらを読んでいただけるとだいたいわかると思う。

これらの記事に書いてきたことを書き直して、雑誌『世界』934号 (2020年7月号) に 「感染症対策「日本モデル」を検証する: その隠された恣意性」というタイトルで寄稿した。執筆は5月中頃で、出版されたのは6月8日なのだが、その最後のほうにこんなことを書いた。

その後、三月、四月を通じて感染が拡大し、一万五千人を超える感染者が五月上旬までに国内で確認されている。二月二六日当時の百倍をこえる量のデータを蓄積できているのだ。また、春をむかえて人々の行動も変化している (たとえば屋外での活動が増え、そこで接触する人の数も増える) から、それによる変化があるかもしれない。新しいデータによって分析をおこなえば(限界はあるにせよ)「答え合わせ」ができる可能性があるが、そういう分析結果も公表されてこなかった。
―――――
田中重人 (2020)「感染症対策「日本モデル」を検証する: その隠された恣意性」『世界』934: 97-104.

http://tsigeto.info/20b

「二月二六日」のデータというのは、クラスター対策を正当化するために政府と専門家によって使われてきたものを指している。このデータ自体の性質がよくわからないという話は、4月3日の記事「「8割は人にうつさない」は嘘? (1): Nishiura et al (2020) 論文をどう読むか」などで書いてきた。このデータは、感染者が全部で110人なのに対して、大量感染 (下記でいう「Bゾーン」) による感染者は21人しかいない。したがって感染者の8割は大量感染によるものではない、と本来は読むべきものである。ところが専門家たちはこのデータに大量感染ケースを大量に追加したグラフをつくり、あたかも多くの大量感染事例が存在することが実証的に裏付けられているかのような宣伝をおこなってきた。


―――――
新型コロナクラスター対策専門家 @ClusterJapan 2020-04-11 のツイートの画像

https://twitter.com/ClusterJapan/status/1248884086581514242

このグラフは、「3密」の環境条件のもとで、ひとりの感染者が8以上の2次感染を引き起こすという想定になっている。元々のデータでは、8以上の2次感染を起こすケース (グラフでは「Bゾーン」と書かれている) に該当するのは2人だけで、そこからの2次感染は21しかなかった。これに対し、上のグラフではBゾーンに該当する感染者を14人に増やし、その人たちから142の2次感染が起きたことにしている。つまり7倍に水増ししているわけである。2次感染の総数は206で、その約3分の2がBゾーンで起きたという設定である。

特定の環境条件がそろった場所・イベントにおいてひとりの感染者から大量の2次感染が生じる事態のことを、super-spreading event による感染、すなわち SSE感染 と呼ぶことにしよう。COVID-19はSSE感染を主体として広まるため、SSE感染を防ぐか早期に察知して対応することが感染拡大回避に重要である――逆にいえば、SSE感染の対策さえうまくいけば、それ以外の感染は放置してかまわない――という命題が、専門家会議のいう「日本モデル」を支えるドグマとなっている。

このドグマには実証的根拠がない、ということがまずは重要である。これに加えて不可解なのは、2月26日時点のわずか110人のデータがいつまでも使われていて、その後のあたらしい情報がまったく出てこなかったことである。政府と専門家は最新のデータにアクセスできる立場にあるのだから、「日本モデル」を支持するあたらしいデータがえられたなら、すぐにそれを使うであろう。そうしたデータが公表されなかったこと自体が、日本モデルの無根拠性を傍証している。

4月4日までのクラスターの規模と感染者中の比率

Furuse et al (2020) について

というようなことを考えて『世界』記事を書いていたのが5月中旬。それが出版された直後の6月10日になって、アメリカ合衆国CDC (Centers for Disease Control and Prevention) の雑誌 Emerging Infectious Diseases サイトにつぎの論文が載った。

  • Furuse Y, Sando E, Tsuchiya N, Miyahara R, Yasuda I, Ko YK, Saito M, Morimoto K, Imamura T, Shobugawa Y, Nagata S, Jindai K, Imamura T, Sunagawa T, Suzuki M, Nishiura H, Oshitani H (2002) "Clusters of coronavirus disease in communities, Japan, January-April 2020". Emerging Infectious Diseases. 26(9) (September) http://doi.org/10.3201/eid2609.202272 (Early Release)

この論文は、4月4日までの日本のCOVID-19感染状況のデータを記述している。約3千件の感染例をあつかっているので、2月26日のデータの30倍近い量である。また、冬から春にかけての傾向の変化も観察できる。残念ながら、1人の感染者から何件の2次感染が起きたかということの報告はないので、直接的な「答え合わせ」はできない。しかし、何件のクラスタがいつ発生したかということはわかるので、そこから間接的に「日本モデル」の前提――COVID-19感染の大部分はSSEで発生する――を検証することが可能である。

データの概要

まず、データの概要を確認しておこう。

We analyzed COVID-19 cases in Japan reported during January 15-April 4, 2020. All COVID-19 cases confirmed by reverse transcription-PCR in Japan must be reported to the Ministry of Health, Labour and Welfare. Through case interviews, local health authorities collected demographic and epidemiologic information, such as possible source of infection and contact and travel history. During the study period, a total of 3,184 laboratory-confirmed COVID-19 cases, including 309 imported cases, were reported. Among cases of local transmission, 61% (1,760/2,875) had epidemiologic links to known cases (Figure 1, panel A). We excluded 712 cases detected on a cruise that was anchored at Yokohama Port, Japan, from February 3 through March 1 (7)
―――――
Furuse et al (2020) Clusters of coronavirus disease in communities, Japan, January-April 2020. Emerging Infectious Diseases. 26(9) Early Release.

http://doi.org/10.3201/eid2609.202272

分析の対象は2020年1月15日から4月4日までに日本国内で確認され、厚生労働省に報告されたすべてのCOVID-19症例 (横浜港でのクルーズ船事例のぞく) であることがわかる。総数は3184件であり、そのうち輸入例が309件で、国内での感染が2875件。他の感染例からの疫学的リンク (epidemiologic links) があったケースが1760件 (2875件中の61%) ということである。

なお、東洋経済新報社のサイト「新型コロナウイルス国内感染の状況」(荻原和樹 制作) では厚生労働省の公表情報をもとに作成したデータを公表している (https://raw.githubusercontent.com/kaz-ogiwara/covid19/master/data/summary.csv 2020-06-25ダウンロード)。このデータでは、4月4日までの累積の感染者数は3044人となっており、Furuse et al (2020) の報告より140人すくない。あとで説明するように、この差は3月29日から4月4日までの1週間で生じているようなのであるが、詳細は確認していない。

クラスターの定義、規模、感染者中の比率

さて、感染例のうち、「クラスター」(cluster) に属するものは、つぎの基準で同定されている

We defined a cluster as ≥5 cases with primary exposure reported at a common event or venue, excluding within-household transmissions. Our definition also excluded cases with epidemiologic links to secondary transmission. For example, in the following scenario we would exclude cases A and B: boy A is a friend of boy B whose grandmother C contracted nosocomial COVID-19 in a nursing home from which ≥5 cases were reported; although all 3 have symptoms develop and are diagnosed with COVID-19, we would consider only grandmother C part of a cluster from the nursing home.
―――――
Furuse et al (2020) Clusters of coronavirus disease in communities, Japan, January-April 2020. Emerging Infectious Diseases. 26(9) Early Release.

http://doi.org/10.3201/eid2609.202272

共通の場所またはイベントでの一次的な曝露 (primary exposure) が報告されている感染例が5以上ある場合、それらの感染例を「クラスター」という、ということである。ただし世帯内での感染はふくまない。

これは厚生労働省が従来使ってきた基準とは微妙にちがっている。

クラスターは、現時点で、同一の場において、5人以上の感染者の接触歴等が明らかとなっていることを目安として記載しています。家族等への二次感染は載せていません。また、家族間の感染も載せていません。
―――――
厚生労働省 (2020-03-31) 「全国クラスター マップ」

https://www.mhlw.go.jp/content/10900000/000618504.pdf

この基準では「5人以上の感染者の接触歴等」となっている。すでに感染していてその場所にウイルスを持ち込んだ人をふくめて、5人以上の感染者が確認できれば「クラスター」として認定するということだ。つまりその場所で感染した人は4人以下であっても、厚生労働省の従来基準では「クラスター」として認定されうる。一方、上記論文ではその場所 (またはイベント) でウイルスに「曝露」した者が5人以上いないといけないという基準をとっているので、認定がややきびしいことになる。

さて、論文によれば、4月4日までのデータで61のクラスターを同定できたという。

By investigating the epidemiologic links among cases, we identified 61 COVID-19 clusters in various communities. We observed clusters of COVID-19 cases from 18 (30%) healthcare facilities; 10 (16%) care facilities of other types, such as nursing homes and day care centers; 10 (16%) restaurants or bars; 8 (13%) workplaces; 7 (11%) music-related events, such as live music concerts, chorus group rehearsals, and karaoke parties; 5 (8%) gymnasiums; 2 (3%) ceremonial functions; and 1 (2%) transportation-related incident in an airplane. Most (39/61; 64%) clusters involved 5-10 cases (Figure 1, panel B).
―――――
Furuse et al (2020) Clusters of coronavirus disease in communities, Japan, January-April 2020. Emerging Infectious Diseases. 26(9) Early Release.

http://doi.org/10.3201/eid2609.202272

先にみたように、4月4日までの国内での感染例 (輸入例のぞく) は2875人であった。もし、クラスター対策専門家の主張するように、この3分の2がSSEによって発生したのだとすると、1917人ということになる。SSEでは、共通のイベントで8人以上の感染者が出るので、この論文の意味でのクラスターとして必ずカウントされるはず。61のクラスターで1917人以上の感染者が出たのであれば、クラスターの平均規模は31.4人以上ということになるが、これは多すぎないだろうか。実際、上の引用では、ほとんどのクラスターは10人以下と書いてある。

残念ながら、61件のクラスターを合計して何人の感染者がいたのかの精確な情報は論文中にはない。ただ、規模をあらく区切った度数分布が提示されている (Figure 1B)。それによると、クラスターの規模の分布はつぎのとおりである:

  • 39 (64%): 5-10人規模
  • 16 (26%): 11-20人規模
  • 2 ( 3%): 21-30人規模
  • 4 ( 7%): 30人以上規模

それぞれ 7.5, 15.5, 25.5, 35.5 をあてはめて人数合計を推計してみると、39×7.5 + 16×15.5 + 2×25.5 + 4×35.5 = 733.5 となる (平均規模は12.0人)。これは国内感染例2875人のうちの25.5%に過ぎない。

結果の解釈

もっとも、現実に発生していた感染者やクラスターをすべて厚生労働省が把握していたとは考えにくい。見落としが発生していた可能性を探る必要がある。

まず、手掛かりとなるのは、疫学的リンクありの感染例が61% (1760人) しかないことだ。クラスターが同定できたケースは、いつどこで誰から感染したのかの見当がつかないといけないわけだから、すべてこの1760人のうちに入っているはずだ。1760人のうちで733.5人がクラスターで感染したのだとすると、その比率は41.7%となる。

一方、疫学的リンクのない1115人は、いつどこで誰から感染したのかが、分析の時点で不明ということである。彼らについても、もしリンクが判明すれば、そこからクラスターがみつかるのかもしれない。ただし、その比率は、疫学的リンクありの (つまり感染源がさかのぼれている) 感染者の中でのクラスターの比率よりはずっとすくないと予測できる。クラスターでの感染者は多数いるので、さかのぼることが容易だからだ。また、日本でのCOVID-19感染者の調査では「クラスター対策」に力を入れてきたので、その点から考えても、クラスター以外で感染したケースのほうが見落としの確率が高そうである。

実際、厚生労働省クラスター対策班を率いてきた押谷仁は、日本のとってきたCOVID-19対策についてつぎのように説明している。

日本の戦略の肝は、「大きな感染源を見逃さない」という点にあります。われわれがクラスターと呼ぶ、感染が大規模化しそうな感染源を正確に把握し、その周辺をケアし、小さな感染はある程度見逃しがあることを許容することで、消耗戦を避けながら、大きな感染拡大の芽を摘むことに力を注いできたのです。そのような対策の背景には、このウイルスの場合、多くの人は誰にも感染させていないので、ある程度見逃しても、一人の感染者が多くの人に感染させるクラスターさえ発生しなければ、ほとんどの感染連鎖は消滅していく、という事実があります。
―――――
押谷仁 (2020)「感染症対策「森を見る」思考を: 何が日本と欧米を分けたのか」(インタビュー) 『外交』61: 6-11.

http://web.archive.org/web/20200531102340/http://www.gaiko-web.jp/test/wp-content/uploads/2020/05/04_Vol.61_P6-11_Infectiousdiseasemeasures.pdf

このような戦略のもとでは、クラスターでの感染は優先的に発見される。したがってクラスターでの感染者はみつかりやすく、それ以外の感染者はみつかりにくいはずである。

また、ことさら「クラスター対策」を標榜しなくても、多くの人が1か所で感染したとなれば、それらの多数の情報を総合して感染源を探索できるのであるから、発見の確率が高くなるのが道理というものである。

大量感染を引き起こしたケースでは、当然、そこから生じた二次感染者数が多い。彼らのうちだれかひとりを糸口としてまずみつけ、その人と過去に接触した人をさかのぼって感染源が特定できれば、芋づる式に接触者を探していける。それに対して、二次感染者数が少ないケースでは、糸口となる感染者自体が少ないため、見逃しの可能性はむしろこちらのほうが高そうだ。Bゾーンにおいて感染者見逃しの確率がことさら高いと仮定するのは、理屈にあわない。
―――――
田中重人 (2020)「感染症対策「日本モデル」を検証する: その隠された恣意性」『世界』934: 97-104.

http://tsigeto.info/20b

したがって、感染者を発見できていなかったり、疫学的リンクを追えていなかったりするケースにおいては、クラスター以外での感染が、より高い濃度でふくまれていると考えることができる。つまり、全感染者中のクラスター感染者の比率を推測する場合、疫学的リンクありの感染者だけを分母に計算した41.7%より低いことはあっても、高いことはないだろう。

もうひとつ考えておかなければならないのは、クラスターが発生したからといってそこにSSEがあったとはかぎらないということだ。Furuse et al (2020) で報告されているクラスターの発生場所の種類を、件数が多い順に並べると、つぎのようになる。

  • 18 (30%): 医療 (healthcare facilities)
  • 10 (16%): ケア (care facilities of other types, such as nursing homes and day care centers)
  • 10 (16%): 飲食 (restaurants or bars)
  • 8 (13%): 職場 (workplaces)
  • 7 (11%): 音楽 (music-related events, such as live music concerts, chorus group rehearsals, and karaoke parties)
  • 5 ( 8%): ジム (gymnasiums)
  • 2 ( 3%): 儀式 (ceremonial functions)
  • 1 ( 2%): 交通 (transportation-related incident in an airplane)

これらのうち、飲食 (レストランやバー)、儀式 (結婚式や葬式?)、交通 (飛行機)、コンサート (「音楽」クラスターの一部) は、おそらく一回きりでせいぜい数時間程度のイベントである。そこで大量の感染があったとすれば、ひとりの感染者から多数への感染すなわちSSE感染があった可能性が高い。しかし、それ以外の、医療・介護施設、職場、ジムなどにおいては、おなじメンバーがおなじ場所で何度も顔をあわせる。ひとりの感染者から2-3人程度にうつる小規模な感染が複数回、長期間にわたって起これば、SSE抜きでクラスターができる。このようなメンバー固定型の場におけるクラスターが、61件中すくなくとも41件 (67%) を占めている。

さらに、5人以上の感染者が出ればそれで「クラスター」認定されてしまうので、クラスター対策専門家のいう「Bゾーン」(ひとりから8人以上への2次感染) にくらべ、基準が甘い。上でみたように、クラスターのうち39件は、5-10人規模であった。仮にこの階級のなかで一様に分布しているとすれば、半分 (19.5件) は7人以下規模である。

以上のことを考えあわせると、クラスター対策専門家が想定していたような「Bゾーン」のSSEによる感染者数は (19.5×7.5 + 16×15.5 + 2×25.5 + 4×35.5) × 0.33 = 193.8 程度しかない可能性がある。これは国内感染例2875人のうちの6.8%に過ぎない。疫学的リンクありの1760人のなかで考えても11.0%である。

ということで、Furuse et al (2020) の4月4日までのデータに基づいて推測するかぎり、日本国内の全感染者中のSSE感染者の比率は、多く見積もっても4割、少なければ1割以下、ということになる。

時期による変化

ここまでは、4月4日までのデータを全部使っての推論であった。つぎは時期による変化に注目して分析しよう。

データの準備

論文では、クラスタの種類別に、発見時期 (クラスタからの感染者が最初に感染確定した週) のグラフが載っている。そのグラフ (Figure 1C) に定規をあてて測り、件数を再現したのがつぎの表である。

週* 日付 医療 職場 儀式 ケア 音楽 交通 飲食 ジム 合計
7 2月9-15日 1 1 1 3
8 2月16-22日 1 1 1 3
9 2月23-29日 1 2 1 4
10 3月1-7日 1 1 1 1 4
11 3月8-14日 3 2 1 1 7
12 3月15-21日 2 2 1 1 1 7
13 3月22-28日 3 2 1 1 2 1 5 15
14 3月29日-4月4日 6 3 6 2 1 18
合計 18 8 2 10 7 1 10 5 61

(*: Epidemiologic week. Source: http://doi.org/10.3201/eid2609.202272 Figure 1C)

これで、2月9日以降、毎週いくつのクラスターが発見されてきたかがわかる。当初は週に3件の発見だったのが、最後の週 (3月末から4月頭) には18件発見しており、2か月弱の間に6倍になっている。

これに対して、感染者数のデータは……論文では Figure 1A に載っているのだが、これは輸入例をふくめた累積の人数であり、国内感染者の数がわからない。国内感染の確定数を週別に得るには、別のところからデータをとってこなければならない。

ここでは、つぎの記事の使用データを2次利用する。

このデータは、都道府県が公表したデータに基づいて公開日や感染経路情報などをまとめた、3月末までの陽性確定者リストである (ファイル名:3月末までのデータ.csv; ダウンロード:2020-04-20)。

このリストの3月28日までの分について、「推定される検査理由」が2 (渡航歴) になっているものを輸入例としてカウントした。それ以外 (「不明」をふくむ) は国内感染例と考えてカウントする。その結果、3月28日までに、輸入例が212人、国内感染例が1437人となった。

日付 渡航歴 その他 合計
-6 2月8日まで 12 3 15
7 2月9-15日 5 23 28
8 2月16-22日 1 72 73
9 2月23-29日 2 105 107
10 3月1-7日 4 214 218
11 3月8-14日 20 305 325
12 3月15-21日 55 198 253
13 3月22-28日 113 517 630
合計 212 1437 1649

この合計数を、Furuse et al (2020) で報告されている4月4日までの累積の人数 (それぞれ309人と2875人) から引くと、97人と1438人になる。これが3月29日から4月4日までの1週間の数字だと考えよう。このようにして求めた数値を累積して論文 Figure 1A に重ねてプロットするとつぎのようになる。毎週の合計の感染者数の累積はほぼ一致していることがわかる。


―――――
Furuse et al (2020) http://doi.org/10.3201/eid2609.202272 Figure 1A に国内感染例・輸入例の累積人数を加筆。図を縦方向に拡大してある。

なお、国内感染と輸入例の合計の数値は、3月28日までは東洋経済新報社サイトのデータとほぼ一致しており、最大で5人の差しかない (下記 R スクリプトを参照)。ただし3月29日から4月4日に関しては、東洋経済新報社サイトのデータのほうが137人すくない。Furuse et al (2020) と東洋経済新報社のデータに140人分の齟齬があることは前述したとおりであるが、この齟齬は最後の1週間で生じていたことがわかる。

あと必要なのは疫学的リンクの有無の比率である。これも Figure 1A からわかる。把握しやすいように、90%, 85%, 80%, 75% のところと、全体の平均である61%をあらわすラインを追加してみた。


―――――
Furuse et al (2020) http://doi.org/10.3201/eid2609.202272 Figure 1A に横線を加筆。

この図の点線が疫学的リンク「あり」の比率であるが、これは

  • 国内感染事例に対する比率である
  • その日付までの累積の数値である

ことに注意されたい。感染者数 (No. cases) として表示されているのは輸入例をあわせた感染者数 (の累計) なので、それとは対応していない。また、累積のデータで計算した数値なので、大きな変化が起こっている期間の解釈は要注意である。たとえば3月28日の疫学的リンクありの比率は70%台後半であるが、そこから大きく低下して、4月4日には61%まで低下する。3月28日までの感染者の合計と、3月29日から4月4日までの1週間に発見された新たな感染者はほぼ等しいので、疫学的リンクありの比率をこの1週間だけでみる場合には、約45%だと考えなければならない。同様に、2月15日 (それまでに26人を発見) には約80%だった比率が翌週の2月16-22日 (72人を新規発見) には約90%まであがっているので、この週単独での疫学的リンクあり比率は94%程度であろう。その後、2月23-29日の週には107人を発見しているが、ここで疫学的リンクあり比率が80%弱まで落ちるので、この週単独では約66%である。同様に考えていくと、3月1-7日は83%、8-14日は90%、15-21日は75%、22-28日は70%程度という目算になる。

週別の状況

以上を総合して、2月から4月までの感染状況の変化を再現してみよう。以下の計算ではRを使用する。

まず、クラスターの平均規模を計算しておこう。

# http://tsigeto.info/covid19/remcat20200705answer.r.txt
# For https://remcat.hatenadiary.jp/entry/20200705/answer
cluster.n <- 61
cluster <- data.frame(
	size = c( "5-10", "11-20", "21-30", "31-"),
	n    = c(  39,      16,       2,      4 ),
	mid  = c(   7.5,    15.5,    25.5,   35.5 )
)
cluster.case <- sum(cluster$mid * cluster$n)
cluster.size.av <- cluster.case / cluster.n
cluster.size.av

結果はつぎのとおり。

[1] 12.02459

ついで、各週の感染者数等のデータを作成する。

byweek <- data.frame(
	epiweek = 7:14,
	date = c( "-Feb15", "Feb16-22", "Feb23-29", "Mar1-7", "Mar8-14", "Mar15-21", "Mar22-28", "Mar29-Apr4") ,
	cluster.n = c(     3,  3,   4,   4,   7,   7,  15,   18 ),
	link.ratio= c( 0.80,0.94,0.66,0.83,0.90,0.75,0.70, 0.45 ),
	import.case=c( 12+ 5,  1,   2,   4,  20,  55, 113,   97 ),
	local.case= c(  3+23, 72, 105, 214, 305, 198, 517, 1438 ),
	all.case  = c( 15+28, 73, 107, 218, 325, 253, 630, 1535 ), 
	toyo.case = c( 16+30, 68, 110, 215, 323, 253, 631, 1398 ) 	# From ToyoKeizai data
)

toyo.case = の行は東洋経済新報社のデータとの相違をチェックするためのものである。all.case との差を確認しておこう。

byweek$all.case - byweek$toyo.case

結果はつぎのようになる。最終週のみ大きくずれていることがわかる。

[1]  -3   5  -3   3   2   0  -1 137

本題にもどって、クラスターでの感染、クラスター以外での感染、リンクなしのそれぞれの人数を求めよう。

byweek$cluster.case<- byweek$cluster.n * cluster.size.av
byweek$link.case   <- byweek$local.case* byweek$link.ratio
byweek$nolink.case <- byweek$local.case   - byweek$link.case
byweek$noncluster.case <- byweek$link.case- byweek$cluster.case

case.byweek <- data.frame (
	epiweek = byweek$epiweek,
	date = byweek$date,
	cluster = byweek$cluster.case,
	noncluster = byweek$noncluster.case,
	nolink = byweek$nolink.case
)

ただし、このとおり計算すると、2月15日までの数値がおかしくなる。国内感染者が26人しかおらず、リンクありの感染者はそのうち8割 (つまり20.8人) しかいないのに対し、クラスターが3件発見されているため、これにクラスター平均規模の12人をかけると36人となって、総数を上回ってしまうのである。ここは、国内感染者のうちリンクありの者は全員クラスターでの感染と考えるべきであろう。というわけで、cluster と noncluster の数を修正する。

case.byweek$cluster[1] <- 20.8
case.byweek$noncluster[1] <- 0

case.byweek$total <- case.byweek$cluster + case.byweek$noncluster + case.byweek$nolink
case.byweek

結果はつぎのようになる。2月前半は確かにクラスターでの感染がほとんどを占めていたが、2月後半になるとクラスター以外での感染者が増加し、3月に入ると逆転する。3月15-21日の週をのぞき、3月-4月はクラスター外での感染のほうが多い。

  epiweek       date   cluster noncluster nolink total
1       7     -Feb15  20.80000    0.00000   5.20    26
2       8   Feb16-22  36.07377   31.60623   4.32    72
3       9   Feb23-29  48.09836   21.20164  35.70   105
4      10     Mar1-7  48.09836  129.52164  36.38   214
5      11    Mar8-14  84.17213  190.32787  30.50   305
6      12   Mar15-21  84.17213   64.32787  49.50   198
7      13   Mar22-28 180.36885  181.53115 155.10   517
8      14 Mar29-Apr4 216.44262  430.65738 790.90  1438

グラフにするとこんな感じ。全体的な状況としては、クラスターでの感染の増えかたがゆるやかなのに対し、クラスター以外での感染は2月末から3月頭に大きく増加している。3月22日以降はリンクのない感染者が急激に増加しており、これは感染者の増加が調査能力を凌駕したことをおそらく示しているが、それまでの期間については、感染者の増減はクラスター外での感染者の増減によってほぼ規定されている。

国内感染者の中での比率 (%) についてもみておこう。

pct.byweek <- case.byweek
pct.byweek$cluster   <- round( 100 * case.byweek$cluster    / case.byweek$total , 1)
pct.byweek$noncluster<- round( 100 * case.byweek$noncluster / case.byweek$total , 1)
pct.byweek$nolink    <- round( 100 * case.byweek$nolink     / case.byweek$total , 1)
pct.byweek$total    <- round( 100 * case.byweek$total     / case.byweek$total , 1)
pct.byweek
  epiweek       date cluster noncluster nolink total
1       7     -Feb15    80.0        0.0     20   100
2       8   Feb16-22    50.1       43.9      6   100
3       9   Feb23-29    45.8       20.2     34   100
4      10     Mar1-7    22.5       60.5     17   100
5      11    Mar8-14    27.6       62.4     10   100
6      12   Mar15-21    42.5       32.5     25   100
7      13   Mar22-28    34.9       35.1     30   100
8      14 Mar29-Apr4    15.1       29.9     55   100

3月初旬にクラスター外での感染の比率が大きく増えている。注目すべきは、この期間に疫学的リンクなしの比率が下がっていることである。2月末には、3割以上の感染者について、いつどこで誰から感染したのかわからない状態であった。この比率には3月の最初の2週間で著しく改善があり、3月8-14日の週には10%まで減らしている。この週には、感染経路を突き止めたけれどもクラスターではなかった、というケースが6割を占めていて、クラスターでの感染は3割程度であった。3月後半になると疫学的リンクをつかめないケースが増加し、クラスターでの感染の比率も4割まで上がっている。

疫学的リンク「あり」の人だけに限定したときのクラスターでの感染の比率 (%) も示しておこう。

日付
-7 2月15日まで 100.0
8 2月16-22日 53.3
9 2月23-29日 69.4
10 3月1-7日 27.1
11 3月8-14日 30.7
12 3月15-21日 56.7
13 3月22-28日 49.8
14 3月29日-4月1日 33.4
合計 40.6

こまかい増減はあるのだが、おおむね、2月→3月→4月と比率が下がっていく傾向にみえる。2月分、3月分をそれぞれまとめて計算すると、つぎのようになる。

cluster <- sum( case.byweek$cluster[c(1:3)] )
noncluster <- sum( case.byweek$noncluster[c(1:3)] )
cluster / (cluster + noncluster)

cluster <- sum( case.byweek$cluster[c(4:7)] )
noncluster <- sum( case.byweek$noncluster[c(4:7)] )
cluster / (cluster + noncluster)
[1] 0.665307

[1] 0.4122631

興味深いことに、1-2月に発見された国内感染について、疫学的リンクがたどれる者だけを取り出して計算すると、約66.6%すなわち3分の2がクラスターで感染していたことになる。だから、2月末の時点では、日本のCOVID-19感染の3分の2はクラスターだ、ということもそれほど無茶な主張ではなかったのかもしれない。

しかしその後この比率は急速に低下し、3月のデータ (28日まで) では41.2%となっている。この記事の前のほうで説明したとおり、感染者や感染経路を発見できていないケースでは、クラスターの比率はこれより落ちるであろう。Furuse et al (2020) におけるclusterはかなり小規模なものをふくむこと、さらにクラスターの全部がSSEで形成されるわけではないことを考えあわせると、3密の環境で起こるSSEが感染の大部分を占めることを前提とする「日本モデル」は、3月中にはすでに支持できなくなっていたはずである。

その後のデータ

Furuse et al (2020) は4月4日までのデータしかあつかっていない。これ以降はどうなっているだろうか?

4月5日から5月10日まで: 厚生労働大臣国会答弁による

入手できるデータは限定的であるが、まず、5月11日国会 (衆議院予算委員会) での厚生労働大臣の答弁をみよう。

○後藤祐一 〔……〕
三月三十一日時点、もうはるか昔ですよ、全国クラスターマップというのがあって、二十六のクラスターについて、こういったものがあります。そこから後どうなっているんですかと事務方に聞いたら、ありませんと。
 これだと、どういう施設でどれだけクラスターが起きて、どういう施設でどの程度の感染が起きているのかというデータは、施設ごとにないんですか。厚労大臣、お答えください。

○加藤国務大臣〔……〕
現在、これは内部の資料でありますけれども、五月十日現在で二百五十件あるのではないか。
 ただ、これまた一個一個やると、都道府県と協議をしなければ、これまでもそうなんですが、公表できないものなのでありますが、だから、こういった数字で押さえさせていただいて、内訳を申し上げますと、医療機関が八十五件とか、福祉施設が五十七件、飲食が二十三件、そういった中身を、これも全てということではないと思いますけれども、こうした情報を拾いながら、それぞれの状況、それからもう一つは、クラスター班の先生方が、これは独自に、例えば都とか、お話をされながら、なかなか公表の情報では得がたい、内々に得た情報、これらも含めて分析をされているというのが実態であります

○後藤(祐)委員 先ほど、玉木委員のときに、総理、客観的なデータに基づくコロナ対策をお願いしますという話をされました。東京の死者数の数が違っていたという話ですね。
 このクラスターについて、個別具体的にそことかいうことをどの程度公表するかについては、確かにいろいろなケアをしなきゃいけない面はあると思いますが、例えば、今、飲食店のクラスターが二十三件、初めてこれは知った情報じゃないですか。何の問題があるんですか、それを出すことに。
―――――
第201回国会 衆議院 予算委員会 会議録 第22号 (2020-05-11) p. 17-18

https://kokkai.ndl.go.jp/#/detail?minId=120105261X02220200511

「クラスター対策」を謳いながら、どれくらいの規模のクラスターがいつどこでいくつ発生したのかという情報をほとんど出してこなかったというのは、これはこれで大問題なのだが、いまは措いておこう。

ここで重要なのは、5月10日までに250件という情報である。Furuse et al (2020) によれば4月4日までに61件みつかっていたわけだから、差し引き189件ということになる。クラスターの規模には残念ながら言及がないが、上で計算したのとおなじ12.0人だとすると、2272.6人がこれらのクラスターで感染したことになる。一方、この期間 (4月5日から5月10日まで) の新規感染者数は12713人 (東洋経済新報社サイトの情報による) なので、2272.6 / 12713 = 0.179 となる。やはりかなり低い比率である。

5月25日から6月24日まで:読売新聞報道による

その後、緊急事態が解除された5月25日以降の状況については、6月25日の読売新聞が報じている。

新型コロナウイルスの感染拡大に伴う政府の緊急事態宣言が全面解除されて25日で1か月となる。この間(5月25日~6月24日)の全国の新規感染者は1397人で、半数以上にあたる748人を東京都が占めた。クラスター(感染集団)とみられる事例は全国27か所で発生しており、引き続き封じ込め対策と感染防止策の徹底が求められる。
〔……〕
 特定の場所や会合で5人以上の感染者が確認され、自治体が「クラスターが発生した可能性が高い」とみている事例は、6月24日までに東京や北海道など5都道府県で27か所に上った。
―――――
読売新聞「全面解除1か月、27か所でクラスター…新規感染の半数は東京」2020/06/25 00:15

https://www.yomiuri.co.jp/national/20200624-OYT1T50302/

やはりクラスターの規模はわからないのだが、先ほどとおなじく12.0人という平均値をあてはめて考えると、27件×12人 = 324.7人である。新規感染者数1397人で割ると、0.232。約4分の1ということになる。

なお、この記事の末尾には、舘田一博・東邦大教授からの「3密(密閉、密集、密接)の状況で声を出すことのリスクが改めて浮かび上がっている」というコメントがあるのだが、このデータを前にして専門家が話すべきことはそんな内容だろうか? むしろ、「クラスター以外での感染のほうが主流なのだから、大量感染事例やその要因としての「3密」に過剰に注目するのは止めるべき」という警告をこそ、専門家から発するべきなのではないだろうか。

まとめ

以上、「日本モデル」の前提となってきた、COVID-19感染のほとんどはSSEで生じるという命題について、Furuse et al (2020) による4月4日までのデータを中心に、その後の情報もふくめて検討した。その結果、いずれのデータでもSSEによる感染の比率は低いことがわかった。クラスター対策専門家の想定するような、感染者の3分の2以上がSSEで生じるということはまずなさそうである。

ただ、Furuse et al (2020) に依拠する限り、この比率には時期によって大きなちがいがあり、2月末までは、疫学的リンクのある感染者に限れば、その3分の2程度をクラスターでの感染が占めているという数値を出すことはできる (クラスターでの感染のうちどの程度の割合をSSE感染が占めていたかは問題であるが)。政府と専門家がクラスター対策を中心とするCOVID-19対応を打ち出したこの時期には、「日本モデル」の前提も、データに照らしてそれほど荒唐無稽なものとは思われなかったのかもしれない。

しかし、3月に入るとクラスターでの感染者の比率は減少する。感染の大半はクラスター以外で起きている (したがってSSE感染が多数を占めることはありえない) という事実は、3月中旬までにははっきりとみえるようになっていたはずである。しかし、その事実は、当時公表されることはなかった。事実が開示されたのは3か月近くたってから。しかも外国の機関の発行する雑誌に大雑把なグラフが何枚か載っただけなのである。

最後に、「感染症対策「日本モデル」を検証する: その隠された恣意性」(『世界』934号) 終盤の文章から引用しておこう。

新型コロナウイルス感染症に関するデータが、その性質や限界についての議論がほとんどおこなわれないまま政策判断に使われているのは、図1に限ったことではない。専門家が現状を説明したり、都道府県や国への提言をおこなったりするたび、どんなデータにどういう計算を施したのか、結果の解釈に際して何に注意しなければならないか、といった基本的な説明がなかったせいで、ネット上ではさまざまな憶測が飛び交ってきた。本来なら、何か提言が出るごとに、その基となった解析について、方法と結果と解釈を詳述した報告文書を政府が受け取り、ウェブサイト等で公開して批判的な議論の対象とするのが健全なやりかただっただろう。残念ながら、現在の「日本モデル」はその対極にある。専門家の恣意的な意見に基づくモデルが、真実であるかのように政府広報やマスメディアやSNSで拡散される。
―――――
田中重人 (2020)「感染症対策「日本モデル」を検証する: その隠された恣意性」『世界』934: 97-104.
(注番号を省略した)

http://tsigeto.info/20b

資料

使用した R スクリプト: http://tsigeto.info/covid19/remcat20200705answer.r.txt