remcat: 研究資料集

(TANAKA Sigeto)

「統計コミュニティは統計不正にどう対応したか: 毎月勤労統計調査問題における政府・専門家・非専門家のはたらき」出版のお知らせ

『東北大学文学研究科研究年報』73号に、論文「統計コミュニティは統計不正にどう対応したか: 毎月勤労統計調査問題における政府・専門家・非専門家のはたらき」を掲載した。

  • 田中 重人 (2024)「統計コミュニティは統計不正にどう対応したか: 毎月勤労統計調査問題における政府・専門家・非専門家のはたらき」『東北大学文学研究科研究年報』73:198-169. http://tsigeto.info/24a

東北大学の機関リポジトリ TOUR には2024年3月13日に掲載 (http://hdl.handle.net/10097/0002000821)。

2022年5月14日の社会政策学会第144回大会での報告「毎月勤労統計調査問題における政府と専門家: データに基づく批判の不在」(http://tsigeto.info/22y) が、この論文の原型である。その後、改稿したものをプレプリントとして https://osf.io/wdj9e で公表している (2023-11-05)。この間、総務省統計研究研修所の雑誌『統計研究彙報』に投稿してリジェクトされているが、その際の匿名査読者のコメントが内容の改善に役立ったことをここに記して感謝する。

論文の主要部は、厚生労働省「毎月勤労統計調査」における母集団労働者数推計の問題について、政府、専門家、そして非専門家 (公的統計に興味を持ち、あつかう能力をもつこれらの人々を、本論文では「統計コミュニティ」と呼ぶ) が2019年以降何をやってきたのかを整理して示すことである。が、その前に、毎月勤労統計調査における母集団労働者数推計とはどういうもので、そこにどういう問題があるかを説明しておかなければならない。2節がこれにあたる。かなり長く、論文全体の約3割を占めるうえに、技術的にも複雑な内容となっているが、おおむねつぎのようなことである:

  • 毎月勤労統計調査における母集団労働者数推計の方法には 以前からおかしなところがあった が、特に 2018年から抽出率逆数の扱いを変更した ことで、事業所規模別の労働者数の推計値が実態から大きく乖離するようになり、平均賃金などの集計に影響を与えている。
  • さらに、 2019年におこなわれた再集計で、2012-2017年のデータにもこの方法が遡って適用された ため、この期間の集計結果もおかしい値になっている。この再集計は、東京都における事業所不正抽出による歪みを是正して正しい方法で集計しなおしたという触れ込みで公表されたものだが、実際にはこのような間違ったやり方での集計だったため、間違った値である。
  • 毎月勤労統計調査の母集団労働者数推計のこの変更は秘密裡におこなわれていた。変更内容があきらかになったのは、2021年11月の「毎月勤労統計調査の改善に関するワーキンググループ」会議以降のことである。

2021年から2023年にかけて当ブログで書いてきたこととおよそ対応しているが、当時は不明で後になってわかった情報も盛り込んでいるので、論文の記述を先に読んでいただくのがよいと思う。データ分析過程と使用したスクリプトは、 https://remcat.hatenadiary.jp/entry/20210911/gap 以降のブログ記事から入手できる。また、本論文の原稿を書いたあとの2024年1月30日に厚生労働省「毎月勤労統計調査の改善に関するワーキンググループ」報告書 (https://www.mhlw.go.jp/stf/newpage_37679.html) が出ているので、その2.(2)「母集団労働者数の推計」(27-64頁) を併読していただくといいかもしれない。

毎月勤労統計調査のなにがまずかったのかがわかったところで、では統計コミュニティはそれにどう対応したかを見ていくのが、3-5節。3節では非専門家、4節では専門家、5節では政府の対応をそれぞれとりあげていく。

問題を指摘したのは、まずデータを独自に分析した非専門家達であった。これに対して、政府やその周囲にいる専門家はデータを独自に分析して問題を突き止めるという姿勢がそもそもなく、それどころか調査の詳細を書いた毎年の報告書を読むことすらしなかった。厚生労働省が都合の悪い情報を隠蔽しているのではないかという当然の疑問も持たなかったので、問題に気づくことはなかった。そのような状況で、せっかく早期に問題を指摘した非専門家の活動は当初無視され、2年以上かかってやっと政府内の会議でとりあげられるようになった。

このように、統計コミュニティがこの問題に取り組む動きは不十分なものであった。毎月勤労統計調査に関しては、周知のように、2018年末に東京都での対象事業所の不正抽出が発覚し、大きな話題となった。これは公的統計への信頼を傷つけるものであり、他に問題が隠れていないかを徹底的に洗うことが、統計コミュニティに期待される役割だったはずである。しかし、実際には、統計コミュニティの中核を占める政府や専門家は、そのような役割を果たそうとはしなかった。コミュニティ周辺部にいた非専門家の幾人かがたまたま興味をもって散発的に分析していたものの、統計コミュニティ中心部への影響力はなかなか持てなかった。

日本の公的統計には、担当部局がその内部に囲い込んで私物化する傾向があり、そのことが統計不正を誘発したり、それを隠蔽したりする原因になっている、ということがこれまでにも指摘されてきた。本論文で明らかになったのは、個別担当部局を超えた政府全体の統計機構 (たとえば統計委員会) や政府から独立しているはずの統計専門家やその団体 (日本統計学会) も、担当部局の不正隠蔽に協力してきたということである。そのため、統計不正の内実を明らかにするためのデータ分析が担当部局の外でおこなわれることはほとんどない。不正をはたらいた当の部局がデータとプログラムを独占して再集計をおこなったり不正の経過について報告したりして、それが批判的な検証作業をくぐることなく「正しい」ものとして承認されるというのが、毎月勤労統計調査の不正発覚以降に起こったことであった。