remcat: 研究資料集

(TANAKA Sigeto)

「8割は人にうつさない」は嘘? (1): Nishiura et al (2020) 論文をどう読むか

新型コロナウイルス感染者の8割は人にうつさない、という言説とその根拠とされる論文についての検討。

厚生労働省の謎情報とメディア言説

新型コロナウイルス感染症 (COVID-19) について、感染者の8割は人にうつさない、という言説が広まっている。

これまでの研究で、新型コロナウイルスでは、感染した人のおよそ8割は、誰にも感染を広げていなかったことが分かっています。
――――
「【記者解説】東京での急増「爆発的な感染拡大」の兆しなのか?」 NHKニュース 2020年3月26日 7時52分

https://www3.nhk.or.jp/news/html/20200326/k10012350801000.html

このような主張の根拠となっているのが、厚生労働省がばらまいている次のような言説である。

問14 集団感染を防ぐためにはどうすればよいでしょうか?
〔……〕
これまでの感染発生事例をもとに、一人の感染者が生み出す二次感染者数を分析したところ、感染源が密閉された(換気不十分な)環境にいた事例において、二次感染者数が特徴的に多いことが明らかになりました。(下のグラフ)
 こうしたことから、これまで集団感染が確認された場に共通する「1.換気の悪い密閉空間、2.人が密集している、3.近距離での会話や発声が行われる」という3つの条件が同時に重なった場所(換気が悪く、人が密に集まって過ごすような空間(密閉空間・密集場所・密接場所))に集団で集まることは避けてください。
~ 皆さんが、「3つの条件を同時に重なった場所」を避けるだけで、多くの人々の重症化を食い止め、命を救えます。 ~


――――
厚生労働省「新型コロナウイルスに関するQ&A(一般の方向け)」令和2年4月1日時点版 (2020-04-02 閲覧)
※強調は原文通り

https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/kenkou_iryou/dengue_fever_qa_00001.html#Q14

この引用文中で根拠として示されているグラフは、「一人の感染者が生み出した2次感染者数」というタイトルで、カッコ内に「2月26日時点の国内発生110例の分析結果」と注意書きがある。また、グラフ中に「感染者の8割は他人に感染させていない」と書き込みがある。ここから、

  • 2月26日時点のデータである
  • 110例しか分析していない

ということがわかる。つまり、2月26日までの少ない事例で計算してみたところこうなりました、という報告に過ぎない。数が少ないということもあるし、データや分析方法についてなにも説明がないし、その後のデータを加えて情報を更新するわけでもなく、いつまでも1か月以上前の古い分析結果を載せつづけているというのもあやしい。

さらに、これを拡大解釈したバージョンがつぎのようなもの。

専門家会議によると、これまでに明らかになったデータから、集団感染が確認された場に共通するのは以下の3つの条件が同時に重なった場であることが分かっている。

(1)換気の悪い密閉空間だった
(2)多くの人が密集していた
(3)近距離(互いに手を伸ばしたら届く距離)での会話や発声が行われた
――――
鶴岡 弘之「新型コロナ、日本はどれだけぎりぎりの状態なのか 危機感を抱く専門家会議、感染ルートを追えない感染者が増えている」 JBPress 2020.3.29

https://jbpress.ismedia.jp/articles/-/59930?page=5

上の 厚生労働省Q&A に分析結果として書いてあるのは、「感染源が密閉された(換気不十分な)環境にいた事例において、二次感染者数が特徴的に多い」である。「多くの人が密集していた」とか「互いに手を伸ばしたら届く距離での会話や発声が行われた」とは書いていない。これらが同時に重なった場であったとも書いていないのである。

実際、厚生労働省のおこなう調査では、密閉空間での密接したやりとり以外で集団感染がおこることが想定されている。

大分市の国立病院機構大分医療センターで発生した新型コロナウイルスの集団感染について、センターを調査している厚生労働省のクラスター対策班が感染拡大の原因の一つに、カルテなどを介した「接触感染」を挙げていることが26日、県への取材で分かった。
〔……〕
県によると、対策班は、医師や看護師が扱うカルテや電子機器にウイルスが付着し、受け渡す際に感染が広がった可能性を指摘。
――――
岩谷 瞬「大分「接触感染」で拡大か 医療センター、カルテや電子機器介して」 西日本新聞 2020/3/27 6:00

https://www.nishinippon.co.jp/item/n/595419/

カルテや電子機器の受け渡しで感染するのであれば、野外レストランのメニューや町内会の回覧板でも同様のことがおこりうる。密閉空間である必要はないし、多くの人が同時に集まる必要もない。ひとりしかいない場所で、無言のままであっても、置いてある物を触るだけで感染は広がる。

Nishiura et al (2020) 3月3日版

さて、この「8割は人にうつさない」説の根拠は何だろうか? 厚生労働省のQ&A ではグラフ下部に「新型コロナウイルス厚生労働省対策本部クラスター対策班」と書いてあるだけで、データについても分析法についても説明がない。これでは何が何だかわからないではないか。

ちょっと調べてみると、これは上記の「クラスター対策班」で分析をおこなったものであり、その結果を記した論文が投稿中であることがわかる*1。投稿前の原稿 (preprint) がプレプリントサーバ medRxiv にアップロードされている。日付は桃の節句、2020年3月3日である。

  • Hiroshi Nishiura, Hitoshi Oshitani, Tetsuro Kobayashi, Tomoya Saito, Tomimasa Sunagawa, Tamano Matsui, Takaji Wakita, MHLW COVID-19 Response Team, Motoi Suzuki. Closed environments facilitate secondary transmission of coronavirus disease 2019 (COVID-19). doi:10.1101/2020.02.28.20029272 (Posted March 03, 2020)

これをダウンロードして読んでみたのだが……いや、これはちょっと衝撃的である。まともな学術論文としての内容をほとんど備えていない。

まず、データの説明はつぎのようになっている。

As of 26 February 2020,3 we examined a total of 110 cases among eleven clusters and investigated who acquired infection from whom. The clusters included four in Tokyo and one each in Aichi, Fukuoka, Hokkaido, Ishikawa, Kanagawa and Wakayama prefectures. All clusters were associated with close contact in indoor environments, including fitness gyms, a restaurant boat on a river, hospitals, and a snow festival where there were eating spaces in tents with minimal ventilation rate.
――――
Nishiura et al. Closed environments facilitate secondary transmission of coronavirus disease 2019 (COVID-19). medRxiv 2020-03-03
※注3は、厚生労働省のページ「新型コロナウイルス感染症について」のURL: https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/0000164708_00001.html

http://doi.org/10.1101/2020.02.28.20029272

2月26日までの感染例をすべて使ったのではなく、11の「クラスター」(clusters) からの110例を対象としたことがわかる (クラスターの内訳を見ると東京4, 愛知1, 福岡1, 北海道1, 石川1, 神奈川1, 和歌山1の合計10のはずで、数があわないのだが、それはまあいい)。これらのクラスターはすべて屋内環境での濃厚接触と関連している (associated with close contact in indoor environments)。

データの性質についてはこれ以上の説明はない。2次感染の判断についても、次の段落に「calculated using contact tracing data」とあるだけ。そもそも全体としてはどれだけのデータがあってクラスターはいくつあるのか、そのなかで「屋内環境での濃厚接触と関連」したクラスターがいくつか、それぞれのカバー範囲はどの程度か、なぜそれらだけを取り出したのか、といった重要な情報が何もない。

さらに、分析のキーとなる変数が closed environment (閉鎖環境) なのであるが、これについては全く説明がないので、データからどうやって判定したかがわからない。前述の close contact in indoor environment と関係があるのかどうかも不明である。

で、分析結果のグラフであるが、前述の厚生労働省サイトのQ&Aとは数値が微妙にちがう (各自で比較されたい)。


Figure. Number of secondary cases per single primary case
――――
Nishiura et al. Closed environments facilitate secondary transmission of coronavirus disease 2019 (COVID-19). medRxiv 2020-03-03

http://doi.org/10.1101/2020.02.28.20029272

厚生労働省サイトは4月1日に更新されているので、Q&A に載っているグラフのほうが、厚生労働省として内容を保証している最新の情報ということであろう。つまり、Nishiura et al (2020) は古い情報に基づいて書かれた可能性がある。

さて、この論文では、3人以上の2次感染を起こした場合を superspreading event と定義している。これは個々の感染者 (case) ではなくて出来事 (event) を指しているようなのだが、グラフでカウントされているのは case であり、このあたりの整合性が保たれているのかどうかも不明である。

ともかく、3人以上の2次感染を起こしたケースをグラフから数えてみると、

  • 閉鎖環境では 6
  • 非閉鎖環境では 1

となるはずである (各自グラフに定規を当てて確認されたい)。ところが、論文では「eleven of the 110 cases (10.0%) were involved in such events. Nine of these events (81.8%) took place in closed environments」となっている。つまり、閉鎖環境では9, 非閉鎖環境では2ということであり、グラフの数値より多い。そしてこの数値からオッズ比が計算されて、閉鎖環境のほうが superspreading event が起こりやすい、という結論になっている。

この結論は、ふたつの意味でおかしい。ひとつは上で見たように数値がおかしいこと。もうひとつは、分析対象を「屋内環境での濃厚接触と関連」したクラスターだけに限定したこととの関連が考察されていないことである。閉鎖環境 (closed environment) の定義がわからないので何ともいいようがないのだけれど、仮に、屋内環境での濃厚接触と関連したクラスターにおいては閉鎖環境での大量感染を起こしやすい条件がそろっていたというのであれば、それは今回対象としたクラスター (屋形船宴会やフィットネスジムなど) ではたまたまそうであったというだけで、ちがう環境 (たとえば屋外でのスポーツや公園での花見宴会など) にはあてはまらない可能性がある。あたたかくなって屋外での活動が増えるようになれば、状況はちがってくるのではないか。

改訂版

というようなことを考えているうちに訳がわからなくなってきたので、著者代表の西浦博氏に直接メールを送ったところ、改訂版のPDFファイルが返送されてきた。上記の問題のいくつかはすでに認識されていたようで、改訂版では解決されていた:

  • クラスターを選択したという記述はなくなり、クラスターであるかないかにかかわらずデータを分析したことになっている
  • superspreading event の数は、閉鎖環境で6, 非閉鎖環境で1に訂正。それにしたがって、オッズ比の値も変わっている。

ただ、現在でも medRxiv 上のプレプリントは従前のままである。これは非常にまずいと思うのだが、3月3日版のまま、更新されていない。きわめて多忙であることはわかるのだが、判断の根拠となる文献を最新のものにしておくことは科学的な議論にとって不可欠のことなので、できるかぎり早く新バージョンがアップロードされることを期待したい。

感染例のデータ構造と感染源不明例

Nishiura et al (2020) のこの改訂版においても、実はデータは3月3日版と同一のようである。感染例は合計110であり、クラスター数も11。グラフにプロットされた度数もおなじにみえる。そして、データそのものについての説明は特に増えておらず、どういう範囲をカバーしていて、そこから2次感染をどうやって検出したのかなどはよくわからない。注3には厚生労働省の「新型コロナウイルス感染症について」のURL が載っているが、このページを見ても、この感染症についてのさまざまな情報が集積しているだけであり、この論文で使ったデータについての解説があるわけではない。

ただ、このページからたどれる情報のなかに「新型コロナウイルス感染症の現在の状況と厚生労働省の対応について」という一連の文書があり、その2月26日版 https://www.mhlw.go.jp/stf/newpage_09770.html に、「国内事例(チャーター便帰国者を除く)2月26日12:00現在、確認されている国内の発生状況」がある*2。 この資料には136例の感染者が番号付きであがっており、それ以外に13例の「無症状病原外保有者」が確認されているとの注釈がある。つまり、2月26日正午までに149例の感染が確認されていたということである。Nishiura et al (2020) が使っている110例よりも39多い。またこの資料から見る限り、ひとりから12人に感染させたなどという報告がされているわけでもないようなので、これとは別の資料が厚生労働省内にあり、それをクラスター対策班で分析したということであろう。ということで、やはり詳細は不明である。

分析に利用したデータとプログラムが手に入れば、このあたりのこともわかるかもしれない。そこで、代表著者にくわしいデータを請求してみたのだけれど、返事がこない状態である。まあ忙しいのであろう。

だからデータの詳細はわからないのだけれど、2次感染数のグラフを見ているだけで、すごく変な感じはするわけである。端的にいうと、感染力が弱すぎるようにみえる。110人の感染者がいて、そこからの2次感染が61しかないので、55%に減っていることになる。おなじ比率で感染がつづくとすると、3次感染は30%、4次感染は17%、5次感染は9%……とどんどん減っていってすぐに終息してしまう。COVID-19の感染力がそんなに弱いのだとすれば、どうしてわたしたちはこんなに騒いでいるのだろうか?

まず考えつくのは、検査体制が弱体であったために、感染者のほとんどを見逃している、ということだ。実際、厚生労働省は、3月初旬にCNNに対して「検知できていない人がいる」「日本国内の症例は合計3000例前後だと思われる」(https://www.cnn.co.jp/world/35150399-2.html) と述べ、大量の見落としがあったことを認めている。そうだとすると、「8割は人にうつしていない」というのは、日本の当時の検査体制では2次感染をほとんどみつけられなかった、というだけなのかもしれない。

もっとも、この命題を直接検証することはむずかしい。何人の感染者が国内にいたかの数値は正確にはわからないのだから、どの程度見逃しているのかも結局のところよくわからないからだ。しかしそこを推定する方法はいろいろある。

ここでは、Nishiura et al (2020) のグラフ自体からデータ構造を復元することによって、この問題にアプローチしてみよう。

まず、110例のデータは完結しているものと仮定しよう。ここで「完結」というのは、これら110例の感染者からの2次感染者としてみつかった者は全員この110例のデータの中に記録されている、という意味である。

この場合、110例の中で誰から誰に感染が広がったかの構造を表すと、たとえばつぎの図のようになる (これはひとつのありうる例ということであり、Nishiura et al (2020) のグラフを再現できる図の描きかたはほかにもある)。矢印は感染を表す。矢印の下に o がついているのが非閉鎖環境での感染であり、ついていないのが閉鎖環境での感染。数字は感染者の数である。丸で囲んだ数字は誰から感染したかが不明のもの、四角で囲んだ数字は誰から感染したかが特定できているものである。後者のほう (四角の中の数値) が、Nishiura et al では「2次感染」としてカウントされていることになる。


※Nishiura et al. (2020) のグラフから、データ構造を再現したもの。汚い手書きで申し訳ない。

左側の赤枠部分が、1人の感染者から2人以上の2次感染が起こった場合を示している。これが11件あるので、この部分が「クラスター」であろう。それ以外は、1人から1人への感染が16件。誰からも感染せず、誰にも感染させなかったのが22人となる。

丸で囲んでいる数字の合計が、感染源不明の感染者の数である。これが110例のうちの49を占めているので、45%は誰から感染したのかわからないということだ。もちろん、実際には誰かから感染しているはずなのだから、感染源がいないはずはない。つまり、必ず存在するはずの感染源を、半分近くの感染者については捕捉できていないのである。

この率は、クラスターとそれ以外では大きくちがう。図の左側のクラスター部分 (赤枠) には56例が入るが、そのうち感染源不明なのは11であり、のこりの45人については感染源が特定できている (ので、Nishiura et al (2020) で2次感染としてカウントされている)。11/56 = 0.196 なので、約2割。これに対して、クラスター外では、54例中の38が感染源不明なので、38/54 = 0.704 となり、7割で感染源不明である。

このようなちがいが出るのは、「クラスター」というものの性格上、当然のことといえる。本来、クラスターとは「一定の期間の一定の場所での発症者の集積」(吉田 眞紀子 + 堀 成美 (編) (2015)『感染症疫学ハンドブック』医学書院 ISBN:9784260020732 p. 292) のように定義される*3 もので、時期と場所を区切って状況を把握するための概念である。Nishiura et al (2020) は「発症」の話はしていないので、この定義をそのまま採用はしていないはずであるが、基本的な発想はおなじであろう。屋形船やフィットネスジムを一定の期間に利用した人だけ調べればいい、というのであれば、調査の範囲は非常に狭く設定できるわけである。これに対して、ひとりの人の行動の履歴を3週間ずっとたどって接触した人や物を全部調べる、ということになると桁外れの膨大な作業が必要になり、おそらく実行は不可能である。クラスターでないということは、感染経路の特定が困難であることを意味するのである。

なぜデータ上の2次感染数がすくないのか

この当時 (2月下旬) に何が起こっていたか。新型コロナウイルス感染症対策専門家会議の尾身茂副座長は、4月2日の記者会見で、つぎのように説明している。

2月の13日ぐらいになるとリンクの追えないものが急に増えてきて、いろんな複数から。そういう中で、リンクが途中で追えたり追えなかったりというのがあって。
――――
「新型コロナ専門家会議が会見 (全文4) 全世代で互いを守る行動を」 The Page 2020-04-02 13:29
(新型コロナウイルス対策専門家会議 2020-04-01 記者会見での尾身発言)

https://headlines.yahoo.co.jp/hl?a=20200402-00010008-wordleaf-soci

2月26日までには、すでに感染経路のわからない感染例が多発していたということだ。

また、日本公衆衛生学会サイトに掲載されている「クラスター対策研修会」(3月29日) の資料「COVID-19への対策の概念」(押谷仁 https://www.jsph.jp/covid/files/gainen.pdf)では、1月18日の東京の屋形船でのクラスターからのn次感染が、東京都台東区の病院での集団感染 (3月24日発見) を引き起こした可能性を指摘している。この場合、クラスターからの感染の連鎖でありながら、2か月間気づかれずに拡大していたわけである。

2月下旬までには、日本国内の感染状況のかなりの部分は把握できなくなっていたのだ。したがってデータにあらわれる感染の数は、実態をあらわさなくなっていたと考えるべきであろう。Nishiura et al (2020) が報告した2次感染数の異様な少なさは、このような捕捉率の低下を反映しているだけという可能性がある。

もっとも、データ中に感染源不明のケースが多いことについては、別の可能性もある*4。たとえば、外国から日本に入国したあと発症した人の場合、感染したのが国外であれば、日本国内での調査では、感染源はわからないわけである。これは調査体制の問題ではないから、これをもって調査能力が低いと評価するのは不当である。

実際、厚生労働省による過去の発表資料 https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/0000121431_00086.html をみていくと、1月16日以降しばらくの間、中国湖北省からの帰国者の発症例がいくつも報告されている。こうしたケースが感染源不明としてデータ上あつかわれることになってしまうのは、しかたないことであろう。Nishiura et al (2020) のデータでクラスター外で感染源不明ケースのうち20名程度がこれにあたるとすると、これらをのぞいて18/34 = 0.529 が感染源不明ということになり、かなり低くはなる。ただ、それでも半分以上は、国内で感染したにもかかわらず感染源を特定できていないことになる。また、中国 (武漢近辺) からの入国者は当時は特に厳しくマークされており、優先的に検査に回されていた (というかそれ以外のケースではほとんど検査がおこなわれていなかった) ことを考えると、これらの感染例は早期に発見して隔離する体制が確立していた特異な事例であり、2次感染者が少ないのは当然ともいえる。武漢近辺からの入国者やその濃厚接触者でないかぎり、肺炎が重症化するまでCOVID-19の検査はおこなわれていなかったのだから、一緒に分析するのはまずいだろう。

この読みが正しいかどうかはわからない。Nishiura et al (2020) には何の説明もないからである。上記のように、2月26日までに感染例として報告されていながらデータにふくまれていないケースが相当数あるので、外国で感染した (と想定できる) ケースについては、データからのぞいたのかもしれない。

ほかにも、何らかの理由によって、分析対象からのぞかれたデータがあるのかもしれず、それによってカウントされる2次感染の数が少なくなっている可能性はある。データは上記の意味で「完結」していないのかもしれない。いずれにしても、そうしたデータ選択の手続きは、論文においては克明に書いて再現可能にしておかなければならないはずのことである。

議論

以上のように、Nishiura et al (2020) のデータ分析は、内容がいろいろ不明である。ここから何か信頼できる結論を引き出せるかのように読むのはまずい。いえそうなことは、せいぜい、日本では1-2月に屋形船宴会やフィットネスジムで大量感染が起きたので、これらに類似の環境は避けたほうがいいのではないか、という程度である。

この記事の最初にとりあげた例でいうと、「感染者の8割は人にうつさない」というような主張の根拠に使うことはできない。それはたまたまデータがそうなっていたというだけの話であり、ここまで検討してきたように、それは単に感染者を捕捉できていなかったせいだとみておいたほうがいい。

また、Nishiura et al (2020) は「密閉空間」「密集場所」「密接場所」のような具体的な条件はあつかっていない。分析したのは closed environment 対 open-air environment の比較である。それらの定義が書かれていないので、何をどう分類しているのかということ自体が不明であるが、すくなくとも、換気が十分だったかとか、人と人の間隔が何mとか、会話や発声があったかといったようなことの検討はない。

そして、特に2次感染の多い superspreading environment さえ避ければ新規感染者数の減少に持っていける、というような理屈も成り立たない。おそらくは、感染者の多くは複数の2次感染を引き起こしている (しかし検査体制の不備によりそれらをほとんどとらえられていない) というのが実態であろう。そうとすれば、1人から1-3人にうつすようなケースは相当の厚みで存在しているはずだ。Superspreading を抑えることは感染拡大の速度を抑えることには貢献するだろうが、それで拡大を止めて終息させられるという根拠はないのである。