remcat: 研究資料集

(TANAKA Sigeto)

第8回「毎月勤労統計調査の改善に関するワーキンググループ」資料解釈

厚生労働省「厚生労働統計の整備に関する検討会」の下に設置されている「毎月勤労統計調査の改善に関するワーキンググループ」の第8回会議が2023年7月21日に開催されたので、その様子を傍聴した (オンライン)。その際の資料と議事録が、厚生労働省ウエブサイトで公開されている:

会議では、毎月勤労統計調査における母集団労働者数推計についての検討結果が報告されたのだが、ひとことでいえば、これまで私が指摘してきたことがほぼ正しかった という内容であった。ただし、こまかいことについてはこれまで不明だったことが新しく公表された部分や、断片的な情報から推測していたことにはっきりと裏付けがとれた部分もある。また出席の各委員からの意見にも、注目すべき内容がふくまれている。

本記事では、毎月勤労統計調査の母集団労働者数推計における層間移動事業所のあつかいについて、この会議での資料と議事録からわかることをまとめておきたい。なお、母集団労働者数推計に関してはもうひとつ、雇用保険データのあつかいも同会議で議論されているのだが、そちらはとりあげない。

目次

  • 前回までのあらすじと今回の焦点
    • 母集団労働者数推計の仕組みと層間移動事業所
    • 過去のワーキンググループ会議でわかったこと
      • 抽出率逆数について
      • 「集計に用いる層は変更しない」という原則
  • 今回の会議での説明内容
    • 母集団労働者数のシミュレーションの方法
    • 規模境界を超える労働者数変化があった事業所数
    • シミュレーション結果
      • 1000人以上規模
      • 500-999人規模
      • 100-499人規模
      • 30-99人規模
      • 5-29人規模
      • ウエイト設定による差
  • 総括

前回までのあらすじと今回の焦点

母集団労働者数推計の仕組みと層間移動事業所

毎月勤労統計調査では、調査対象となる事業所を、産業分類と事業所規模によって細かい層にわけている。この層ごとに、母集団の労働者数を推計した値を毎月求め、この値から作成したウエイト (「推計比率」と呼ぶ) を使って各層調査結果の数値を重みづけて集計することで、全体の平均給与などを算出する仕組みである。つまり、事業所ごとに毎月の賃金等を調査して集計するプロセスとならんで、母集団労働者数を毎月推計するプロセスが、毎月勤労統計調査の重要な柱となっている。

この母集団労働者数推計は、4つの要素からなっている:

  • [A] 既存事業所の労働者増加/減少を毎月勤労統計調査データから推計
  • [B] 事業所の新設/廃止などを雇用保険データから推計
  • [C] 規模区分が変わった事業所の労働者数を毎月勤労統計調査データから推計
  • [D] 経済センサス等による母集団労働者の全数調査データによって推計結果を調整 (これを「ベンチマーク更新」と呼ぶ)

これらのうち、[B] と [C] が今回のワーキンググループ会議での検討対象である。

この毎月の母集団労働者数推計について従来どのように説明されてきたかと、毎月勤労統計調査の公表データ (「毎勤原表」と呼ばれるもの) とそれがどう対応しているかは、つぎの記事で説明した:

これらの記事執筆の時点では、『毎月勤労統計要覧』や、統計委員会に厚生労働省が提出した資料 などに記載された内容しか手がかりがなかった。事業所が雇う労働者を増やしたり減らしたりして規模区分の境界 (たとえば500人) を超えた場合のあつかいについて、これらの資料に書いてあることを総合すると、つぎのようになる。

  1. 事業所が雇う労働者の増減によって規模区分を超えた (たとえば労働者数499人だった事業所が500人になった) 場合には、その事業所の所属層を移動させて、そちらの層での集計対象とする
  2. その時点でのその事業所の労働者数にウエイトをかけて、層間移動した労働者数が母集団で何人いるかを推計し、それに所定の「適用度合い」(L) をかけた人数が母集団において層間移動したものとする (これが上記 [C] の作業)
  3. これと上記 [A] [B] による変化をあわせて母集団労働者数の推計値を更新し、そこから作成した推計比率を翌月分調査の集計で使う

これらのうち2番目の手順で使用する「適用度合い」は L=0.5 に固定されているのであるが、そうする根拠は不明であった (本来なら L=1 でよいはず)。

過去のワーキンググループ会議でわかったこと

抽出率逆数について

上記で不明であったことは、まず「ウエイト」がどういう値になっているかである。これについては、2021年10月17日にワーキンググループ参加者に私からメールを送り (https://remcat.hatenadiary.jp/entry/20211017/wgletter)、その内容が 11月5日の第3回会議 において取り上げられた。その際の厚生労働省担当者の説明ではじめて、ウエイトのあたえかたを2017年までと2018年以降で変えていたことが明らかになった。

  • 2017年12月調査までは、事業所をサンプリングした時の抽出率の逆数をウエイトとして使用
  • 2018年1月調査以降は、集計時点の所属層に割り当てられた抽出率の逆数をウエイトとして使用

後者は誤った方法である。

もちろんこれはダメな操作である。調査の結果えられた数値に「抽出率逆数」をかけるのは、サンプリングのときの抽出確率が事業所によってちがうからなので、当然サンプリング時に適用した抽出率から求めるべきもの。同一の事業所に対しては、おなじ値を一貫して使うべきものである。


厚生労働省の担当者は、この理屈を理解していないようだ。
―――――
田中重人 (2021-12-29) 「毎月勤労統計調査、抽出率逆数の扱いを2018年1月から改悪していたことが判明」

https://remcat.hatenadiary.jp/entry/20211229/wg3

後に 厚生労働省に送った質問 (2022年8月8日) に対する回答 (10月4日受領) で、この方法 (集計時点の所属層に割り当てられた抽出率の逆数をウエイトとして使用) が、2019年になってからおこなわれた2012-2018年データの再集計にも使われていたことが判明する。

【御質問】
(5) 2019年1月に公表された再集計(現在「本系列」と呼ばれているものの2012年から2018年分)では、母集団労働者数推計についてどのような方法が使われたのでしょうか?

【回答】
(5)について、
2012年から2018年までの「再集計値」の計算においては、東京都の一部抽出調査分を復元するため集計に抽出率逆数が必要となったことと併せ、現在の方法と同様、母集団労働者数の推計においても集計時点に属する層の抽出率逆数を使用しています。

―――――
田中重人 (2022-10-09) 「厚生労働省からの回答」

https://remcat.hatenadiary.jp/entry/20221009/answer

現在公開されている毎月勤労統計調査のデータのうち、2012年分以降のものは、まちがった方法で母集団労働者数を推計したものになっている。この母集団労働者数をもとにした「推計比率」を使用して賃金・労働時間その他の集計値を求めるので、これらの結果はすべて間違いである。

「集計に用いる層は変更しない」という原則

すこし時間を巻き戻そう。2022年7月22日の第5回ワーキンググループ会議 で、驚愕の事実が判明している。毎月勤労統計調査では、調査対象事業所の規模が変化しても所属する層を変更しない原則で集計している、という説明がはじめて出てきたのである。それまでは「規模変更があった場合には、その都度、集計規模区分を変更」と説明してきた のだから、要するにウソをついてきたということである。

ただし、集計に用いる層自体は変更しないのだが、事業所の規模の変化については一定の基準で評価して、母集団労働者数推計に反映させるという。これについては、2022年7月24日の記事「第5回「毎月勤労統計調査の改善に関するワーキンググループ」資料2の解釈」で説明した。同ワーキンググループ第5回会議資料2 の p. 5 にはつぎのような説明が載っている。


―――――
厚生労働省「毎月勤労統計調査の改善に関するワーキンググループ」第5回会議 (2022-07-22) https://www.mhlw.go.jp/stf/shingi/other-toukei_456728_00007.html
資料2 (p. 5).

https://www.mhlw.go.jp/content/10700000/000966357.pdf

「条件 (A)」に該当する事業所についてのみ、移動した労働者数を母集団労働者数の推計に反映させるというのだけれども、この条件 (A) はかなり奇妙なものである。集計に用いる層は原則として変更しないのに、そこからの流出の人数だけをカウントするという。くわしいことは https://remcat.hatenadiary.jp/entry/20220724/wg5#pop の解説を読んでほしいが、これは要するに、 調査開始時に設定された層からの流出だけを層間移動としてカウントする 原則になっているということである。

需要の季節変動が大きい事業では、忙期に人手を増やし、閑期には減らすことがよくある。そうした理由で毎年おなじような労働者数変動を示す事業所の場合、増加か減少のどちらか一方だけが毎年母集団労働者数推計に反映し、他方はまったく反映しないことになってしまう。どちらが反映するかは、調査開始時点が忙期であるか閑期であるかによるだろう。調査開始はふつう1月 (第二種事業所の一部は7月) だから、それが忙期にあたる産業では小規模事業所が過大に、閑散期にあたる産業では大規模事業所が過大にカウントされる。
―――――
田中重人 (2022-07-24) 「第5回「毎月勤労統計調査の改善に関するワーキンググループ」資料2の解釈」

https://remcat.hatenadiary.jp/entry/20220724/wg5

これはあまりに不合理な仕様なので、本当にそういう解釈でいいのかどうか、上記の2022年8月8日の 厚生労働省への質問 であわせて訊いたのだけれど、その解釈でまちがいないという回答であった。

【御質問】
(4) 「資料2」 p. 5 の説明では、「集計に用いる層」から別の層に移動した事業所の労働者数だけがカウントされ、それ以外の移動がカウント対象にならないように見えます。その理解で正しいでしょうか?

【回答】
(4)について、
ワーキング資料2P5に記載のとおり、母集団労働者数の補正に計上されるのは、集計に用いる層からの移動に限ります。

―――――
田中重人 (2022-10-09) 「厚生労働省からの回答」

https://remcat.hatenadiary.jp/entry/20221009/answer

なお、この「集計に用いる層は変更しない」方法をいつから採用したのかの詳細は不明である。今年7月20日に受け取った厚生労働省からのメール によれば、「少なくとも平成20年頃から集計に用いる事業所規模の層は原則として変更せず、労働者数が大きく変化する場合に事業所規模の層を変更する取り扱いとしている」とのことなので、これを信用するなら、遅くとも平成20年 (=2008年) ごろまでに、事業所規模変化による層間移動をしない原則になっていたということである。

今回の会議での説明内容

母集団労働者数のシミュレーションの方法

今回 (7月21日) の第8回ワーキンググループ会議では、「母集団労働者数の推計について」という資料が提示され、厚生労働省担当者からの説明があった。その内容は、調査対象事業所の労働者数の増減を母集団労働者数推計に反映させる方法 (上記の [C]) について、いくつかちがう条件を設定して、2014年7月分から2016年5月分までの23か月分の毎月勤労統計調査データを用いたシミュレーションをおこなった結果である (上記 [B] にあたる、雇用保険データを使った母集団労働者数補正についての報告もあるが、そちらはこの記事ではあつかわない)。

2014年7月から2016年5月という設定にしたのは、これら2時点の経済センサスによる母集団労働者数のデータが入手できるからである。2014年の経済センサス-基礎調査の結果によって2014年7月分の産業別・事業所規模別の労働者数を決めてそれを出発点とし、それに毎月勤労統計調査データと雇用保険データによる毎月の母集団労働者数推計を23か月分重ねていき、それでえた労働者数を2016年の経済センサス-活動調査等の結果 (2022年1月のベンチマーク更新に用いた労働者数) とくらべるという段取りになっている。

規模が変化した事業所のあつかいに関しては、ウエイトの設定と「適用度合い」L の値の2種類の組み合わせで5種類の条件がある:

  1. L = 0 (つまり事業所の規模変化を母集団労働者数推計にまったく反映させない)
  2. L = 0.5 で、集計に用いる層の抽出率逆数をウエイトとして使用 (現在の推計方法とおなじ)
  3. L = 1 で、集計に用いる層の抽出率逆数をウエイトとして使用
  4. L = 0.5 で、抽出時の抽出率逆数をウエイトとして使用 (2017年までの推計方法とおなじ)
  5. L = 1 で、抽出時の抽出率逆数をウエイトとして使用

シミュレーションの対象時期 (2014-2016年) に関していうと、2019年におこなわれた再集計は2番目の条件に、それ以前に公表されていたもともとの値 (従来の公表値) は4番目の条件に該当する。再集計値と従来の公表値の間には、不正抽出の結果として表面化した問題である、東京都とそれ以外の地域との500人以上規模事業所の抽出率のちがいを調整したことと、事業所の規模変化にともなう母集団労働者数推計でつかうウエイトの変更という2種類の条件のちがいが重なっている。今回のシミュレーションは、これらのうちのふたつめの条件だけをとりだして、どのような差が生まれるかを観察したものといえる (ただし出発点となる2014年7月の母集団労働者の分布として経済センサスの結果を代入しているため、その点が実際の毎月勤労統計調査のデータとはちがうことになる)。

すでに述べたように、「集計に用いる層は変更しない」原則に基づくとすれば、ほとんどの事業所は調査の最初から最後までおなじ層で集計されるわけである。それなのにどうして「抽出時」の抽出率と「集計に用いる層」の抽出率にちがいが出るのだろうか。

ひとつの理由は、この原則には例外があって、規模区分を2段階以上超えるような労働者数の変動があった事業所については、集計に用いる層を変更することになっているからである (第5回ワーキンググループ会議資料2 p. 6 参照)。

○野口統計管理官

〔……〕

事業所の労働者数が大きく変化した場合、集計においても事業所の層の変更を行っています。具体的には事業所規模が2段階以上変化した場合、その変化が安定したと見込まれた場合に、集計における事業所の層を変更しています。特に事業所規模が大きく増加した場合については、速やかに事業所の層の変更を行っています。
―――――
厚生労働省「毎月勤労統計調査の改善に関するワーキンググループ」第5回会議 (2022-07-22) 議事録

https://www.mhlw.go.jp/stf/newpage_27722.html

もっとも、あとでみるように、データ中にこの条件に該当する事業所はあまりなく、それによる影響は小さい。

もうひとつの理由は、集計に用いる層を変更しないという原則は調査を開始したあとの話であり、抽出時に用いた台帳に記載された労働者数と調査開始時の労働者数がちがっている場合には、調査開始時の労働者数のほうで層を決めているということだ。これに該当するケースはかなり大量にあるらしく、会議資料中 では p. 15 に架空例が提示されている。当日の担当者による説明は、つぎのとおり。

ケースⅡの場合は抽出時点が110人で、そのときの区分は100~499人になりますので、ここは12〔というウエイト〕が付きます。しかし実際に〔初回の〕調査票を配って戻ってきたら、90人になっている場合があります。抽出時点は少し古いデータベースを使いますので、こういう場合が出てきます。では、90人になっている場合はどこに集計されるかと言いますと、100~499人区分ではなく、30~99人区分になります。したがって、ここでの倍率は30~99人の倍率なので、右上に書いてあるように、12ではなくて48が付きます。ただし抽出時点は12が付きます。ここで倍率が変わってくるということになります。
 こういう事業所がN月目でまた110人に戻った場合は、110人が移動しますが、集計に用いる層は30~99人で変わりませんから48です。したがって、110×48×0.5で2,640人が100~499人区分に母集団労働者数が加わります。ただ、抽出時点はと言いますと12のままなので、計算すると660人になりますから、660しか上がりません。したがって、このケースの場合は14ページの表の数字の違いが出てくるところです。
 このケースⅡは規模が上がる場合でしたが、逆に下がる場合も当然あります。下がる場合は抽出率逆数の逆転と言いますか、大きさが逆転しますので、集計時点の方が数字が小さくなる動きになってきます。
―――――
厚生労働省「毎月勤労統計調査の改善に関するワーキンググループ」第8回会議 (2023-07-21) 議事録

https://www.mhlw.go.jp/stf/newpage_35117.html

この例では、100-499人規模の事業所は1/12の抽出率で、30-99人規模の事業所は1/48の抽出率で、事業所母集団データベースから抽出するという設定である。こうして抽出した事業所について実際に調査を開始してみると、データベース記載の労働者数よりも増えたり減ったりしていることがありうる。このような場合には、データベースの記載とはかかわりなく、初回の調査のときの労働者数によって、「集計に用いる層」を割り当てる。この設定で、「集計に用いる層」のウエイトを使うとすると、1/12の抽出率でサンプリングされたのに48のウエイトになる事業所 (これがケースⅡ) とか、その逆に1/48の抽出率でサンプリングされたのに12のウエイトになる事業所とかが出てきてしまうわけである。なお、毎月勤労統計調査の標本設計では、おおむね、事業所規模が小さいほど抽出率が小さくなるようになっている。このため、「集計に用いる層」のウエイトを使うことにした場合、初回調査で労働者数が減っていた事業所は前者 (ケースⅡ) のようにウエイトが過大になる。逆に、初回調査で労働者数が増えていた事業所は、後者のようにウエイトが過少になる傾向を持つことになる。

規模境界を超える労働者数変化があった事業所数

まず、資料の p. 13 から、対象の23か月の間に、「事業所規模間移動により、母集団補正の対象となった事業所数」の類型を確認しておこう。


―――――
厚生労働省 (2023-07-21) 「母集団労働者数の推計について」 (毎月勤労統計調査の改善に関するワーキンググループ」第8回会議 https://www.mhlw.go.jp/stf/newpage_33631.html 資料)
p. 13

https://www.mhlw.go.jp/content/10700000/001122515.pdf

対象となった23か月間に、事業所規模区分を超えて労働者が増減したとカウントされた事例は、累計で1104件あったことがわかる。

規模が上昇した件数を見ると、各規模区分に上昇移動で流入してきた件数と、それぞれの1段階下の規模区分から上昇移動で流出した件数がすべて一致している。上昇移動については、ひとつ上の規模区分への移動に相当する労働者増加しか起こっておらず、2段階以上を一度に移動するケースはなかったことがわかる。

規模が下降した件数については事情が異なる。たとえば1000人以上規模からの下降移動による流出は98件あるが、500-999人規模への下降移動による流入は93件しかないので、2段階以上下降したケースが5件あったことがわかる。100-499人規模への下降移動による流入126件のうち5件はこの1000人以上規模からの下降だと考えると、残る121件が500-999人規模からの1段階の下降移動だということになるが、500-999人規模からの下降移動の総数は123件なので、このうち2件は2段階以上の下降移動だった可能性がある。30-99人規模への下降移動による流入157件のうち2件がこれに該当するとすると、残る155件が100-499人規模からの1段階の下降移動だということになるが、100-499人規模からの下降移動の総数は157件なので、このうち2件は2段階以上の下降移動だった可能性がある。5-29人規模への下降移動による流入は222件あるが、30-99人規模からの下降移動による流出は220件しかないので、プラス2件が100-499人規模から2段階下への下降移動だと考えると、つじつまがあう。このように考えると、5 + 2 + 2 = 9件は、2段階以上の下降移動であった可能性がある。逆にいえば、下降移動598件のうち589件は、隣どうしの規模区分の間での移動だったと考えていいだろう。

シミュレーション結果

これら事業所規模区分を超えて労働者が増減したケースのそれぞれについて、増減後の労働者数がわかるので、それにウエイト (抽出時または集計に用いる層のもの) と適用の度合い L (0, 0.5, 1) をかけた値を計算し、その分を各層の母集団労働者数から増減させる。この手続きを、経済センサス-基礎調査の労働者数による2014年7月分からスタートして、23か月分にわたって繰り返すわけである。

結果のグラフ (ワーキンググループ会議資料 p. 17) は、つぎのような凡例で表示されている。

黒丸で表示されるのが2回のセンサスによる労働者数。左側のほうがシミュレーションの出発点になる2014年経済センサス-基礎調査の値である。ここから23か月にわたって、5種類の条件の下で母集団労働者数の推計をおこない、右側の黒丸 (2016年経済センサス-活動調査等による労働者数) とどれくらいずれるかを評価することになる。

青色のラインのうち、青い丸でマークされている ① が、L=0 の仮定の下での結果である。これはつまり、規模区分を超えて移動する事業所の労働者数をまったくカウントしないことを意味する。ただし、各規模区分内での各事業所の労働者数の増減 (上記の [A]) と、雇用保険データによる新設/廃止事業所等の労働者数の補正 (上記の [B]) は毎月おこなうので、そのことによる増減だけが反映する。

青い三角でマークされている ② が、L=0.5 で、集計に用いる層の抽出率逆数をウエイトとして計算したものである。これは2018年以降の毎月勤労統計調査で使われている方式であるとともに、2012-2018年のデータの再集計値で使われている方式でもある。

一方、赤い三角でマークされている ④ は、L=0.5で、抽出時の抽出率逆数をウエイトとして計算したものである。これは2017年以前の毎月勤労統計調査 (現在は「従来の公表値」として公表されているデータ) で使われていた方式でもある。

つまり、青い三角 (②) と赤い三角 (④) のラインを比較すると、規模区分を超えて移動する事業所の労働者数についての従来の公表値と再集計値の間の計算方式の差異が、母集団労働者数推計にどのような影響をあたえたかがわかることになる。

では、各事業所規模区分について、シミュレーション結果をみていこう。

1000人以上規模

経済センサスによれば、1000人以上規模事業所の労働者数は、2014年と2016年の間で減少している。しかし、毎月勤労統計調査のデータでは、この間の労働者数は減少しておらず、むしろやや増加傾向になる。

ただ、どの条件のシミュレーションでも、この結果はほとんどおなじであり、条件間の差は小さい。センサスとずれが生じているのは、層間移動事業所のあつかいによるのではなく、毎月勤労統計調査のデータ自体がそうなっているのだと考えるべきであろう。

500-999人規模

500-999人規模事業所では、シミュレーション条件によるちがいが明瞭にみられる。この間、センサスによる労働者数は微増しているが、これによく合致しているのは、L=0 (つまり層間移動事業所に関する労働者数の補正をおこなわない) 仮定による ① (青い丸) と、抽出時点の抽出率逆数をウエイトとする ④ ⑤ (赤の三角と四角) である。これらに対して、集計に用いる層について設定された抽出率逆数をウエイトとする ② ③ (青の三角と四角) は、センサスの値をはるかに上回って増加している。特に毎年5月の増加 (つまり4月の労働者数増加を反映したもの) が顕著に出ている。

100-499人規模

100-499人規模事業所でも、シミュレーション条件によるちがいは大きい。この間、センサスによる労働者数は増加しているが、これによく合致しているのは、L=0.5 で抽出時点の抽出率逆数をウエイトとする ④ (赤の三角) である。L=0 とする ① (青い丸) はそれよりやや低い。集計に用いる層について設定された抽出率逆数をウエイトとする ② ③ (青の三角と四角) は、センサスの値よりもかなり上方にある。

30-99人規模

30-99人規模事業所では、ウエイト (抽出率逆数) に関する条件のちがいが明瞭である。この間、センサスによる労働者数は増加しているが、これによく合致しているのは、抽出時点の抽出率逆数をウエイトとする ④ ⑤ (赤の三角と四角) と、L=0 とする ① (青い丸) である。集計に用いる層について設定された抽出率逆数をウエイトとする ② ③ (青の三角と四角) では、労働者数は減少しており、センサスの値よりもかなり下方にある。

5-29人規模

5-29人規模事業所では、シミュレーション条件によるちがいはそれほど大きくはない。この間、センサスによる労働者数自体も増加しているのであるが、それを上回る増加が、いずれの条件のシミュレーション結果でもみられる。L=0 を仮定する ① (青い丸) が最も大きく増加しているのに対して、Lが大きくなると、労働者数増加を若干抑制する傾向がある。

ウエイト設定による差

このような条件のちがいのうち、ウエイト (抽出率逆数) の設定によるちがいでどれくらいの差がつくのかを比較した表も、ワーキンググループ会議資料に載っている。この表は、L=0.5に設定したときの、抽出時点の抽出率逆数をウエイトとする条件 (①) と、集計に用いる層について設定された抽出率逆数をウエイトとする条件 (②) で上記の23か月にわたって計算をつづけたときに結果がどうなるかを表示している。なお、これらの番号は、上記のグラフでいうと ② (青い三角) と ④ (赤い三角) にあたっている。


―――――
厚生労働省 (2023-07-21) 「母集団労働者数の推計について」 (毎月勤労統計調査の改善に関するワーキンググループ」第8回会議 https://www.mhlw.go.jp/stf/newpage_33631.html 資料)
p. 14
〔色枠は引用時に付加したもの〕

ふたつの条件間の差を示した「差分 (①-②)」の表をみると、集計に用いる層について設定された抽出率逆数をウエイトとして使う ① の場合、抽出時点の抽出率逆数を使う ② にくらべて、500-999人規模事業所と100-499人規模事業所の労働者数が、どちらも20万人程度増えることがわかる。これに対して、30-99人規模事業所の労働者数は40万人程度減っている。(紫の色枠部分)

こまかくみると、この動きのかなりの部分は、相対的に小規模な事業所から大規模な事業所への上昇移動が増加することによってもたらされている (緑の色枠部分)。一方で、大規模な事業所から小規模な事業所への下降移動は減少しているので、そのことの寄与もある (橙の色枠部分) が、その人数は多くない。

総括

以上のシミュレーション結果から、毎月勤労統計調査の母集団労働者数推計がセンサスから大きく乖離するのは、層間移動事業所の労働者数を計算するときのウエイトのあたえかたを間違っている (集計に用いる層に設定した抽出率逆数を使っている) せいであった ことがわかる。この乖離は、500-999人規模と100-499規模事業所の労働者数が過大に、30-99人規模事業所の労働者数が過少に推計されることで生じている。特に、500-999人規模事業所の母集団労働者数は250万人程度しかいないので、そこで約20万人 (8%) の過大推計が生じるのは非常に大きなインパクトである。2年弱の期間についてのシミュレーションでこれだけ過大になるのだから、これがさらに長期間累積した場合には、深刻な影響が生じるはずだ (毎月勤労統計調査のベンチマーク更新は、2018年の前は2012年だったから、その6年間は影響が累積していたわけである)。30-99人規模事業所についても、1300万人程度の母集団労働者数に対して約40万人 (3%) の過少推計が2年弱で生じており、無視できる数値ではない。

この結果は、これまで当ブログにおいて、再集計値と従来の公表値との差などから推測してきたこととほぼおなじである。昨年1月2日の記事で書いたことを引用しておこう。

2012年分以降の「本系列」(=再集計値) の推計母集団労働者数は、従来の公表値から大きくはずれており、500-999人規模では増加、30-99人規模では減少する。この動きはセンサスの動きからも乖離しているので、実態を反映したものではなく、層間移動事業所のウエイトが不適切であったために創り出されたものであろう。相対的に規模の大きな事業所のシェアを拡大し、規模の小さな事業所のシェアを縮小させることになるので、この動きは 平均給与を過大に成長させるバイアス を生み出す
―――――
田中 重人 (2022-01-02)「毎月勤労統計調査、不正な結果を是正したはずの2019年再集計値も間違っていた」
〔強調は原文による〕

https://remcat.hatenadiary.jp/entry/20220102/rev2019

ワーキンググループの委員間でも、現行方式が問題だという認識は共有されたようだ。当日の議事録には、つぎのような意見が収録されている。

○樋田委員
〔……〕
三つ目は、ウエイトについてです。ウエイトには抽出率の逆数を使いますが、理論的にはサンプルの抽出時点の抽出率の逆数をウエイトとして使うというのが適当ではないかと考えます。 今回の検証の方法で安全なのかというのは判断が難しいところですが、18ページの計算結果を見ますと、丸4と丸5の方法は抽出時点のものをウエイトとして使っており、丸1~丸3に比べて、ベンチマークに近い結果ということになっています。この結果からも、抽出時点のものに戻すことも視野に入れた検証が、今後必要なのではないかと考えます。
〔……〕
検証の作業は大変だと思いますが、抽出率の逆数は結構大事な問題なので、十分に時間を掛けて検証していただきたいと思います。


○稲葉委員
〔……〕
2点目として、母集団労働者数の推計において、事業所が移転した先の層の乗率を用いているというところに疑問が生じております。なぜ標本抽出時の抽出率の逆数を乗率として用いていないのか といった点です。
 このような2つの疑問点がある中で、母集団労働者数推計において考慮するべき事項について私の考えを申し上げます。これらの事項は3点あり、まず第1点として、母集団労働者数は全ての調査結果に影響を及ぼしているということが挙げられます。これは常用雇用指数だけではなく、賃金指数や労働時間指数のウエイトとしても影響を及ぼしています。
〔……〕
労働時間や賃金については、ベンチマーク更新時のウエイトをそのまま固定して計算を行うという方法もあり、そのほうが労働時間や賃金の変動を捉えられる可能性もあるのではないかと思います。
〔……〕
もう一点付け加えるならば、資料の17ページを御覧ください。これにつきましては、先ほど樋田先生から御指摘がありました事項と同じです。標本抽出時の抽出率の逆数を乗率とするケース、つまり現状の方法を変更したほうが事業所規模別の労働者数のギャップは小さくなるということがわかりました。この事項は、検証結果として追加しておいたほうがよいのではないかと考えます。
―――――
厚生労働省「第8回 毎月勤労統計調査の改善に関するワーキンググループ」(2023-07-21) 議事録
〔強調は引用時に付加したもの〕

https://www.mhlw.go.jp/stf/newpage_35117.html

なお、この後に、担当者 (角井統計管理官) からつぎのような応答がある。

抽出率の倍率を抽出時点のもので推計するかということについてですが、これまでの推計方法は、実査をしながら、長い時間をかけてこういう形になってきたもの ですから、実査でどうなるかといった動きも考慮しながら、さらに理論的な考え方も含めて、両方見ながら考えていかなければと思っていました。
―――――
厚生労働省「第8回 毎月勤労統計調査の改善に関するワーキンググループ」(2023-07-21) 議事録

https://www.mhlw.go.jp/stf/newpage_35117.html

これは奇妙な説明である。2021年11月5日の第3回会議議事録 であきらかになっているとおり、2017年までは「抽出率の倍率を抽出時点のもので推計」してきたはずだからである。集計に用いる層に設定した抽出率逆数を使うように変更したのは2018年のことであり、6年前のことに過ぎない。それまで長い時間をかけて実査をしながら形成されてきた推計方法は、抽出時の抽出率の逆数を使う方法だった。今回のシミュレーションの対象期間であった2014-2016年においても、その方式が本来は使われていたのであった。

次回の同ワーキンググループ会議 (第9回) は今週 (9月22日) 開催予定であり、議題として「毎月勤労統計調査の改善に関するワーキンググループ報告書(案)について」(https://www.mhlw.go.jp/stf/newpage_35052.html) [2023-09-21 URL訂正] があがっている。上記のような委員の意見がある以上、現行の母集団労働者数推計における抽出率の問題が報告書に入る可能性は高い。しかし、具体的にどのような内容が盛り込まれるかについては要注意である。


履歴

2023-09-17
記事公開
2023-09-21
第9回ワーキンググループ会議開催案内のURL、誤って https://www.mhlw.go.jp/stf/newpage_22422.html と書いていたところを https://www.mhlw.go.jp/stf/newpage_35052.html に訂正。