remcat: 研究資料集

(TANAKA Sigeto)

「8割は人にうつさない」は嘘? (3): 数字の盛りかた指南

「8割は人にうつさない」に飽き足らず、さらに誇張したグラフが使われている問題について。

「新型コロナクラスター対策専門家」による「例示」グラフ

Twitterに 「新型コロナクラスター対策専門家」というアカウント ができていて、「クラスター対策」に関する知識を伝えようとしているようである。そのツイートのなかに、つぎのような画像が出ていた。

こちらの画像を使用して説明しています

―――
新型コロナクラスター対策専門家 @ClusterJapan 2020-04-04 11:54 のツイート

https://twitter.com/ClusterJapan/status/1246269915314577408

これは、「クラスター対策について、西浦より解説します。」(https://twitter.com/ClusterJapan/status/1246260779541655553) という動画ツイートへのリプライとしておかれているもので、動画に出てくる (ホワイトボードに貼ってある) グラフを単独で提示したものである。動画のなかでは、このグラフを、新型コロナウイルス感染症の2次感染に関する分布を「例示」したものと紹介している (書き起こしは 当記事の最後 を参照)。

これは何のデータだろうか? 動画では「例示」といっているから、クラスター対策を支える理論的な前提を説明するために創った架空例のようにも聞こえる。

手掛かりとなるのは、このあとさらにリプライとして示される、つぎのツイートである。

【訂正】
フォロワーさんからご指摘を頂き、このグラフ内の数値に、計算間違いがあったことが発覚しました。申し訳ありませんでした。以後このようなことがないように注意します。


誤:この例における平均 1.9人

正:この例における平均 1.49人
―――
新型コロナクラスター対策専門家 @ClusterJapan 2020-04-06 18:23 のツイート

https://twitter.com/ClusterJapan/status/1247092596830138373

これはどういうことかというと、グラフの数値にあわせて計算すると2次感染者の合計は206人で、これを1次感染者の人数合計138で割ると 206/138=1.49 になるはずなのである。これを1.9と間違えていたというところから推測するに、138の代わりに110で割って 206/110 = 1.87 としたのではないか*1

110というのは、前々回の記事 でとりあげた、厚生労働省による「8割は人にうつさない」言説の根拠である、「一人の感染者が生み出した2次感染者数 (2月26日時点の国内発生110例の分析結果)」の人数である。ここから、クラスター対策専門家が動画で使った「例示」のグラフは、この厚生労働省のデータをもとに加工を加えたものだと推測できる。

厚生労働省のデータと、「クラスター対策専門家」の「例示」を数値比較してみよう。

2次感染者数 厚労省データ 専門家例示 水増し数
0 83 90 7
1 16 20 4
2 4 5 1
3 4 4 0
4 1 3 2
5 0 2 2
6 0 0 0
7 0 0 0
8 0 2 2
9 1 3 2
10 0 1 1
11 0 7 7
12 1 1 0
13 0 0 0
合計 110 138 28

厚生労働省データでは110だった人数が、クラスター専門家の「例示」では138に増えている。28人増やしているわけである。2次感染者数「0人」と「11人」の2か所にそれぞれ7人が追加されており、増やした28人のうちの半分 (14人) をこれらが占めている。

動画の主張の要点は、いわゆる「3密」で発生するクラスターを防げばCOVID-19の感染を少なくできる、ということであった。根拠をこの「例示」のグラフがあたえている。その特徴は3つある。

  1. 分布のピークが左右2か所にあること (双峰性)
  2. 左側の山のほとんどを「0人」が占める
  3. 右側の山は特定の条件 (「3密」) で発生したクラスターでの感染である

「3密の接触が防がれた場合」においては右側の山が消失するので、左側の山の部分だけで再生産数を計算すればいいことになる。「例示」のグラフでいうと、2次感染者数が0-5人の範囲に入る1次感染者数は124人であり、そこから64の2次感染が生じている。したがって、 64/124 = 0.52 となる。この値を導くのに必要なのは左側の山だけである ことに注意しておこう。

厚生労働省 Q&Aのグラフ では、これらの3つの特徴ははっきりとはしていなかった。「例示」のグラフは、この3つの特徴が視覚的に認識しやすいようにつくられているのであり、そのためにデータが追加されている。

これはいくらなんでも露骨すぎないだろうか。前々回の記事 で批判したように、厚生労働省のこの110例のデータ自体が、多くの感染者を捕捉できていないという限界を持つ。「8割は他人に感染させていない」ようにみえるのは、単に2次感染に暗数が多いせいである可能性が高い。「クラスター対策専門家」は、そのようなデータをさらに加工し、自説に都合のよいグラフを創って説明しているのである。

暗数を補正する

もっとも、厚生労働省のグラフをそのまま使うわけにもいかない。捕捉できていない (したがってデータ上にあらわれない) 暗数があるのは確かなのだから、なんらかの方法で推測して補正しなければならない。

とりあえず、つぎのように考えてみた:

  • 2次感染ケースを見落としている量は、1次感染1ケースあたり平均して1件程度である
  • どの1次感染ケースにおいても、この見落としが起こる確率の分布は変わらない

具体的には、つぎのように仮定する:

  • 2次感染の見落としなし: 25%
  • 2次感染を1人見落とす: 50%
  • 2次感染を2人見落とす: 25%

厚生労働省 Q&Aのグラフ をもとに、この仮定で暗数を補正した結果を示す。小数部分については、1人見落とし、見落としなし、2人見落とし、の優先順で割り振った。

たとえば元のデータでは「0人」のところの頻度は83であるが、このうち21が見落としなし、42が1人見落とし、20が2人見落とし、となる。「1人」のところも同様に、16を4, 8, 4と割り振る。「2人」のところは4を1, 2, 1と割り振る。

これらを集計すると、「0人」のところに残るのは、見落としなしと推測された21のみ。「1人」のところは、もと「0人」であったが2次感染を1人見落としたと推測された42と、もと「1人」で見落としなしと推測された4を足して46である。「2人」のところは、もと「0人」であったが2次感染を2人見落としたと推測された20と、もと「1人」で2次感染を1人見落としたと推測された8と、もと「2人」で見落としなしと推測された1を足して29である。同様の計算を順次適用した結果が、つぎの表である。

1人当たり2次感染者数 1次感染者数
0 21
1 46
2 29
3 7
4 3
5 2
6 0
7 0
8 0
9 0
10 1
11 0
12 0
13 1
合計 110

棒グラフであらわすと、つぎのようになる。

1人に感染させるケースがいちばん多く、2人に感染させるケースもそこそこある。2次感染数は全体としては170なので、170/110 = 1.55 である。右側の山をのぞいて二次感染数0-5の範囲で計算すると、147/108 = 1.36 となる。つまり、6人以上に感染させるような場を完全になくしたとしても、再生産数は1を超えており、じわじわと感染が拡大することになる。

「3密」クラスターの見落としがある場合

上記では、1-2人程度の2次感染が見落とされる場合だけを想定していた。しかし、もっと大量に2次感染が発生した場 (いわゆる「クラスター」) を見逃していることも当然ありうる。クラスター対策専門家の「例示」は、そのような状況を想定して補正したものだと考えることもできる。

クラスター対策専門家「例示」グラフの右側の山とおなじものを、上のグラフに書きくわえてみた。追加される1次感染者数は12である。

この場合でも、実は結論は変わらない。全体では2次感染数は289で再生産数は 289/122 = 2.37 とかなり大きくなるが、右側の山をのぞいた場合には、147/108 = 1.36 のままである。先に確認しておいたように、左側の山だけをとりだしたときの再生産数は、左側の山の分布だけで決まるからである。したがって、大規模クラスターの発生をすべて防いだとしても、感染は拡大しつづける。

どうなれば終息するのか

逆に、どういう分布であれば感染が拡大しなくなるのか。適当に数字をいれて計算してみた。

1人当たり2次感染者数 1次感染者数
0 41
1 38
2 21
3 5
4 2
5 1
合計 108

たとえばこのような分布であれば、2次感染者の数が108 (= 38 + 2×21 + 3×5 + 4×2 + 5) となって1次感染者と等しくなり、感染者数が増えなくなる。「0人」「1人」がだいたい拮抗しており、「2人」もそれなりにいるが、「3人」以上はあまりいない状態。これくらいの分布が、流行の拡大が防げるかどうかの分水嶺ということである。これよりも右に偏れば流行は拡大し、左に偏れば終息していく。

これに、右側の山として先ほどとおなじ数値を入れてグラフを描くと、つぎのようになる。

この場合、全体での再生産数は 250/122 = 2.05 だが、左側の山だけで計算すると、108/108 = 1 になる。つまり、このような状況であれば、スーパースプレッダー (右側の山) の出現を防止できれば、感染拡大しなくなる。

クラスター対策専門家が「例示」すべきだったのは、このようなグラフであろう。これであれば、「クラスター対策」の前提がきちんと説明できるうえに、それほど現実離れした印象は受けない。このようなグラフを (もちろん現実のデータに基づいたものではないことを注記したうえで) 提示し、

  • もし現実の感染状況がこのようになっていれば、右側の山を取りのぞくことで感染の拡大を防ぐことができる
  • しかし左側の山がこのような分布になっているかはよくわからない
  • 現実がこれよりも右に偏っていると、そこは「クラスター対策」ではどうしようもない
  • したがって「クラスター対策」だけに頼るのは危険であり、左側の山を左側に寄せていくような方策をあわせてとったほうがいい

といった説明をすればよかったのである。

おわりに

さて、実際にクラスター対策専門家のツイッターアカウントでこのグラフを「例示」した動画に戻ろう。実は、この動画では、 クラスター対策で流行を終息させられるとはいっていない。

クラスター対策では、おもにふたつのことをしています。ひとつが、接触者の追跡調査。感染者に接触をした、曝露をした、という人たちをリストしていて、監視下に置くものですね。もうひとつが、「行動変容」と私たちがよんでいるもので、危険な環境での行動にメスを入れる、というものです。
で、そのふたつで対策ができるということには根拠があります。これはあの、新型コロナウイルス感染症の2次感染に関する分布を、まあ例示したものなんですけども、横軸はひとりあたりがうみだす2次感染者数を示しています。それぞれの数に相当する人数を縦軸にとってますね。これをみるとすぐわかるんですけど、ほとんどの感染者っていうのは、2次感染者をうみだしてないんですよ。ゼロ人。あるいは、うみだしてもせいぜいひとりかふたりなんですよ。
ところが、この右裾の部分に、たくさんの2次感染者をうみだしてる人がいます。こういった人たちが、クラスターを形成するんですね。で、その人たちに共通することで、いままでわかってきたのは、「3密」って私たちがよんできたもので、まあ、密接な空間であったり、密集したところで*ったり、あるいは密閉されて換気が悪いところにいる、ということなんですけど、接触者追跡調査をすることで、この2次感染ていうのをできるだけ早くにみつけることで、〔分布を〕左にずらします。数を減らす、っていうこと。で、行動にメスをいれるっていうのは、まあその「3密」の環境というのにいくことをひかえてもらうことによって、この頻度を減らします。それによって、全体の2次感染者数というのが減るようにするものですね。
で、こうしたクラスター対策というのは、感染者数が少ない間、つまり接触者を追跡することができるあいだで役に立つ感染症対策だと考えています。
―――
新型コロナクラスター対策専門家 @ClusterJapan 2020-04-04 11:18 のツイート動画より書き起こし。
*は聞き取れなかった箇所を示す。

https://twitter.com/ClusterJapan/status/1246260779541655553

クラスターを形成した感染者の接触者を追跡することで2次感染を減らせるというのは、理屈がよくわからない。すでにクラスターは形成されているのだから、2次感染は起きてしまっているわけだ。いまさら追跡したところで、それが取り消せるわけではない。追跡して防ぐことができるのは3次感染である。それは、クラスターでの感染であろうとそれ以外の感染であろうとおなじはずではないか。

それはともかく、クラスター対策によって流行を終わらせることができるという発言は、すくなくともこのインタビューにはない。単に2次感染を減らせる、といっているだけだ。それなら、感染者分布の左側の山はどうでもよいのであって、右側の山だけが重要である。ほとんどの感染者が2次感染者をうみだしていない、というような眉唾物のグラフを出す必要は別にない。上で私がつくったような、暗数を (適当に) おぎなったグラフでよかったんじゃないか。