remcat: 研究資料集

(TANAKA Sigeto)

「毎月勤労統計調査の改善に関するワーキンググループ」参加者への手紙

「毎月勤労統計調査の改善に関するワーキンググループ」参加者のうち、メールアドレスが公開されている方にあてて、本日つぎのようなメールを発送しました。


Subject: 毎月勤労統計調査の母集団労働者数推計に関する情報提供

毎月勤労統計調査の改善に関するワーキンググループご参加の先生方
(BCCでお送りしています。)

東北大学文学部の田中重人と申します。
この3年ほど、毎月勤労統計調査の問題について検討しており、先々月の
第2回ワーキンググループ会議もオンラインで傍聴させていただきました。

会議の際に報告のあった、毎月勤労統計調査調査の推計母集団労働者数と
経済センサス等の労働者数との乖離について、
政府統計の総合窓口 (e-Stat) で公開されている「毎勤原表」データを
分析した結果、つぎのような結論に至りました。

(1) 現在公開されている「本系列」データでは、労働者数が
 30-99人規模事業所では減少、500-999人規模と5-29規模事業所では増加する
 傾向にある。そのためにセンサスの労働数から乖離していく。
(2) 第一種事業所 (30-99人規模、500-999人規模) で生じる乖離は、
 事業所規模区分を超えて移動した事業所の分の労働者数を母集団労働者数から
 増減させるときに、抽出率逆数のあつかいを間違えて計算しているためである。
(3) 第二種事業所 (5-29人規模) ではそのような間違いの徴候はみられない。

これらのうち、(2) は、毎月勤労統計調査の労働者数推計が間違っている
ということですから、過去にさかのぼって正しい値を集計しなおして
訂正すべきということになります。
現在のワーキンググループ (あるいは厚生労働統計の整備に関する検討会)
の議論では、毎月勤労統計調査とセンサスとの乖離はベンチマーク更新によって
調整すればよいとの前提で試算をおこなっていますが、
現状の推計方法自体がまちがっていたとなれば、そのような議論は無意味です。
早急に方向転換を図る必要があると思います。

この結論に至ったデータと分析結果は、個人ブログの記事として公表しています:

毎月勤労統計調査、今後のベンチマーク更新で大きなギャップ発生のおそれ
 https://remcat.hatenadiary.jp/entry/20210911/gap (9月11日)
母集団労働者数推計の謎:毎月勤労統計調査とセンサスはなぜ乖離しているのか
 https://remcat.hatenadiary.jp/entry/20210920/workerpop (9月20日)
毎月勤労統計調査、2018年の集計方法変更で何か間違えた模様
 https://remcat.hatenadiary.jp/entry/20211009/maikinold (10月9日)
層間移動事業所と抽出率逆数:毎月勤労統計調査問題の死角
 https://remcat.hatenadiary.jp/entry/20211014/samplingrate (10月14日)

データ分析にあたっては、労働者数の「前月末」→「本月末」の変化と、
「本月末」→「前月末」の変化を区別し、
前者を「毎勤推計」、後者を「雇用保険等補正」と呼んでいます。
「雇用保険等補正」は、さらに、毎月勤労統計調査による事業所層間移動を反映
する部分と、雇用保険による事業所新設・廃止等を反映する部分にわかれます。

分析結果から、第一種事業所の推計母集団労働者数とセンサスの労働者数との
乖離は「雇用保険等補正」によって生じていること、2017年12月までの
「従来の公表値」にはそのような乖離がなかったことがわかります。
そこからつぎの結論が導けます。

(a) センサスとの乖離は、2018年1月の集計方法変更に起因するものであり、
(b) 2019年の再集計作業で、2012年1月以降の「本系列」データに持ち込まれた。
(c) この変化は、層間移動事業所の数値が変わったことによる
 (「従来の公表値」と「本系列」で使用した雇用保険データは共通なので)。

そして、公開されている文書から層間移動事業所に関する記述を探すと、
つぎのことがわかります。

(d) 2019年4月の時点で、層間移動事業所の労働者数に抽出率逆数をかけて
 当該層から増減させるという説明がなされている
(e) その際の「抽出率逆数」は産業・事業所規模等に基づいて割り当てるので、
 層間移動した事業所については正しい値にならない
(f) 2011年以前にさかのぼっての「時系列比較のための推計値」の説明では、
 抽出率逆数を使わずに単に合計することになっている
(g) 過去の集計方法については説明が見当たらないが、
 「時系列比較のための推計値」による労働者数は「従来の公表値」とほぼ
 同じなので、同じ方法を使ったものである可能性が高い

層間移動した事業所の労働者数はその移動直前に所属していた層の抽出率逆数
をかけて合計される (e) のだとすると、抽出率の低い層からの移動は大きく
カウントされ、高い層からの移動は小さくカウントされます。
規模区分の境界に近い (たとえば500人前後の) 事業所が労働者数の増加・減少
を繰り返すと、そのたびに境界をまたいだ移動が起き、
抽出率の低い層から高い層に向かって労働者が流出します。

実際、データからは、年度初めの雇用保険等補正によって、500-999人規模
事業所(抽出率が大きい) で労働者が増えるという動きがみられます。
このような季節的な増加を毎年繰り返して、この事業所規模の労働者数は
センサスを大きく上回って増えています。
30-99人規模事業所 (抽出率が小さい) では、
雇用保険等補正によって年度初めなどに労働者数が大きく減る現象が
繰り返し起き、センサスの数値を下回るようになります。
1000人以上規模 (500-999人規模と共通の抽出率) では
そのような増減がみられません。
これらは、移動前の所属層の抽出率の逆数をかけて事業所層間移動による
労働者数を増減させているせいで、抽出率の低い層から高い層への
過大な移動が起きてしまうのだと考えると、整合的な説明が可能です。

以上の推測が正しければ、毎月勤労統計調査の第一種事業所の労働者数が増減
してセンサスから乖離していくのは、サンプリングの時の抽出率とは別の値を
「抽出率」逆数としてかけるという、筋の通らないことをやっているからです。
各種文書を読む限り、毎月勤労統計調査には抽出率を事業所ごとに記録する
仕組みが存在せず、所属層によって割り当てる簡易な方法をとっているようです。
事業所が層間を移動せず、調査期間の最初から最後までおなじ層にとどまる
ならこれでもよいのですが、実際には移動する事業所があるのですから、
これでは駄目です。

本来であれば、事業所ごとに抽出率を記録する変数を持たせ、それを使って
計算するようプログラムを改修すべきです。そのような大規模な改修は、
すぐにはむずかしいのかもしれません。また、もし抽出時の記録が廃棄されて
いれば、過去に戻っての再適用ができないこともありえます。
そのような場合には、層間移動事業所の労働者数の補正自体をやめてしまう
のが現実的な解であろうと思います。

なお、以上の推測は、第一種事業所に関するものです。
第二種事業所 (5-29人規模) については、このような集計方法変更の影響が
みられません。また、雇用保険等補正の効果がなくとも、
毎勤推計の効果だけで労働者数がセンサスを上回って増加しているので、
別のメカニズムを考えるべきところです。
センサスのほうが労働者数増加をとらえそこなっており、毎月勤労統計調査の
とらえている労働者数のほうが真の値に近い、ということもありえます。
その場合には、センサスの値に基づいてベンチマークを更新する
根拠がそもそもないことになります。

以上、長文になりましたが、公的統計の正確性と透明性に
重大な疑義が生じる内容ですので、お伝えさせていただきました。
厚生労働省のほうでは非公開情報も使って分析できるはずですので、
以上の推測について検証するよう働きかけていただけると幸甚に存じます。

2021年10月17日


〔署名省略〕

その後

この手紙を送ったあと、11/5の第3回会議で、この件が言及されました (議事録: https://www.mhlw.go.jp/stf/newpage_22422.html)。これについての記事: 「毎月勤労統計調査、抽出率逆数の扱いを2018年1月から改悪していたことが判明」(12月30日)

履歴

2021-10-17
記事公開
2021-12-30
「その後」を追記