remcat: 研究資料集

(TANAKA Sigeto)

統計委員会への手紙「毎月勤労統計調査で2018年1月から採用されている誤った推計法について」

統計委員会メンバー のうち、メールアドレスが公開されている方々にあてて、本日つぎのようなメールを発送しました。


Subject: 毎月勤労統計調査で2018年1月から採用されている誤った推計法について

統計委員会委員の先生方
(BCCでお送りしています。)

東北大学文学部の田中重人と申します。
毎月勤労統計調査について、2018年以降、文献とデータを集めて検討してきました。
このほど、同調査の母集団労働者数推計の仕組みに重大な欠陥があることを
確認しましたので、情報提供いたします。

ご存知のとおり、毎月勤労統計調査では、比推定に使用する「推計比率」を求める
ため、層別の母集団労働者数の推計を毎月おこないます。その手続きの中に、
労働者数の変化などで所属層を移した事業所の分の労働者数を加減する操作が
あります。その際は、移動した事業所の人数に抽出率の逆数をかけて加減します。
この「抽出率」は、本来は、事業所の【サンプリング時の】抽出率であるべき
ものです。2017年までの毎月勤労統計調査 (現在「従来の公表値」として
公開されている) は、その方法で推計をおこなってきたはずでした。

ところが2018年1月以降は、【集計時の】所属層の抽出率逆数を使うよう変更
されており、そのために推計母集団労働者数の分布が歪んで、経済センサス等の
労働者数から乖離しています (30-99人規模事業所の労働者が過少、500-999人
規模事業所の労働者が過大です)。

たとえば、ある産業において、100-499人規模事業所は 1/144 の抽出率、
500-999人規模事業所は 1/1 の抽出率だとします。当初は499人規模だった事業所が
労働者1人を新しく雇い、500人規模になったとすると、これに相当する労働者数を、
100-499人の層から500-999人の層に移動させることになります。
このとき抽出率逆数として144をかけるので、これに相当する労働者数は
500×144=7万2000人です。しばらくして、おなじ事業所が労働者を1人減らし、
499人規模になったとすると、500-999人から100-499人への移動が発生します。
このときは抽出率逆数として1をかけるので、相当する労働者数は499人です。
この間に起こったことは、あるひとつの事業所が労働者数を1人増やし、
しばらくして1人減らして、元に戻っただけなのですが、推計母集団労働者数は
100-499人規模の層で大きく減り、その分500-999人規模の層で増えることになる
のです (このときに「補正の適用度合い」という係数 (0.5に設定されています)
もかけるので、実際に移動させる労働者数は半分になりますが)。

100人、500人などの規模境界付近に位置する事業所が労働者数を少し減らしたり
増やしたりを繰り返すと、抽出率の小さい層から大きい層に向かって推計母集団
労働者数が大量に移動してしまいます。毎月勤労統計調査の抽出率は、おおむね、
小規模事業所で小さく、大規模事業所で大きくなるよう設定されていますので、
時間の経過とともに、相対的に大規模な事業所の重みを大きくするバイアスが
かかることになります。

このように推計方法を変更したという事実は、昨年11月5日の厚生労働省「毎月勤労
統計調査の改善に関するワーキンググループ」第3回会議において、はじめて報告
されました。私自身はこの会議は傍聴できなかったのですが、後日公表された
議事録 https://www.mhlw.go.jp/stf/newpage_22422.html で、2018年1月から
【集計時の】所属層の抽出率逆数を使うように変更したとの説明があったことがわかります。

この新事実は、統計委員会のこれまでの審議の前提を覆すものです。
2018年1月におこなわれた集計プログラム改修については2019年1月17日の第130回
統計委員会で基本的な確認をしていますが、その際の議事録に、層間移動事業所の
扱いを変更したとの説明はありません。その後もこの事項についての報告はなかった
ため、2018年1月のプログラム改修は妥当な内容だったと統計委員会では判断
されたものと思います。しかし実際には、大規模事業所の重みが過大になる
バイアスが持ち込まれていたわけです。この改修は不適切だったことを確認し、
正しいプログラムに修正するとともに、2018年以降のデータを計算しなおすべきです。

さらに重大な問題は、2012-2017年のデータを再集計した際も、これとおなじ集計法
が使われたということです。これは「毎月勤労統計調査の改善に関するワーキング
グループ」会議では明言されていませんが、再集計値の挙動と2018年1月以降の値の
挙動とが共通であることから、そのように推測できます。従来、再集計によって
「きまって支給する給与」平均が約0.6%上昇したと説明されており、それは東京都と
それ以外の事業所の抽出率のちがいを反映するように正しく計算しなおした結果だと
理解されてきました。しかし実際には、層間移動事業所の扱いを改悪したことで
大規模事業所を過大に代表させるバイアスが持ち込まれていますから、そのせいで
平均給与を過大に推計しているはずです。これについても、正しいプログラムに
修正して再集計を再度やり直し、正しいデータに差し替えるべきと思います。

なお、2011年から2004年までさかのぼって推計した「時系列比較のための推計値」
の変動には、不審な点はありません。この期間については正しい推計法がとられて
いるのかもしれませんが、この点も確認が必要です。

以上の結論に至ったデータと分析結果は、個人ブログの記事として公表しています:

毎月勤労統計調査、今後のベンチマーク更新で大きなギャップ発生のおそれ
https://remcat.hatenadiary.jp/entry/20210911/gap (2021-09-11)
母集団労働者数推計の謎:毎月勤労統計調査とセンサスはなぜ乖離しているのか
https://remcat.hatenadiary.jp/entry/20210920/workerpop (2021-09-20)
毎月勤労統計調査、2018年の集計方法変更で何か間違えた模様
https://remcat.hatenadiary.jp/entry/20211009/maikinold (2021-10-09)
層間移動事業所と抽出率逆数:毎月勤労統計調査問題の死角
https://remcat.hatenadiary.jp/entry/20211014/samplingrate (2021-10-14)
「毎月勤労統計調査の改善に関するワーキンググループ」参加者への手紙
https://remcat.hatenadiary.jp/entry/20211017/wgletter (2021-10-17)
毎月勤労統計調査、抽出率逆数の扱いを2018年1月から改悪していたことが判明
https://remcat.hatenadiary.jp/entry/20211229/wg3 (2021-12-29)
毎月勤労統計調査、不正な結果を是正したはずの2019年再集計値も間違っていた
https://remcat.hatenadiary.jp/entry/20220102/rev2019 (2022-01-02)

毎月勤労統計調査の母集団労働者数推計法については、今後、厚生労働省の
上記ワーキンググループで検討されるとのことですが、
現在の調査だけでなく、2012年までさかのぼる過去データもふくむ問題であり、
またこの3年間の統計委員会での決定事項の前提に関わる問題でもありますので、
やはり統計委員会で扱われるべき議題であろうと思っております。

以上、公的統計への信頼に関する重大な疑義と考え、お伝えさせていただきました。
適切な対処がなされるよう、祈念しております。

2022年1月22日


署名省略