remcat: 研究資料集

(TANAKA Sigeto)

層間移動事業所と抽出率逆数:毎月勤労統計調査問題の死角

これまでの3つの記事で、毎月勤労統計調査の推計母集団労働者数がセンサスの労働者数から乖離している原因を、データ分析によりあきらかにした。

乖離の原因は、第二種事業所 (5-29人規模) と第一種事業所 (30人以上) とで異なる。

第二種事業所では、2段階にわけておこなわれる母集団労働者数推計の両方が乖離を生み出しており、特に2014年以降は、各層内での調査対象事業所の月々の労働者数の増減による推計が乖離を拡大させる度合が顕著である。2018年1月の集計方法変更やそれを過去にさかのぼって適用した再集計の影響はなかったようであり、「従来の公表値」と現在の「本系列」「時系列比較のための推計値」の間には、ほとんどちがいがない。

これに対して、第一種事業所では、2017年12月までにおこなわれた集計 (従来の公表値) では、推計母集団労働者数が大幅な減少・増加をみせること自体がなく、センサスからの大きな乖離もなかった。第一種事業所の推計母集団労働者数がセンサスから乖離するようになったのは、2018年1月に集計方法が変更されて以降のことだ。それは、母集団労働者数推計の第2段階において、層間移動した事業所の労働者数の集計方法を変更したことによるものとみられる。その後、2018年末に発覚した東京都不正抽出問題への対応のため、この新集計方式を適用した再集計が2012年1月分以降についておこなわれた。このため、現在公開されている「本系列」の2012年1月以降のデータに、30-99人規模事業所の労働者数が減少して500-999人規模事業所の労働者が増加するという偏りが生じている。ただし、2011年12月分以前にさかのぼって再集計をおこなった「時系列比較のための推計値」では、このような偏りはみられない。

第二種事業所に関しては、毎月勤労統計調査の母集団労働者推計が誤っているという根拠はないので、センサスのほうが真の労働者数を捕捉しそこねている可能性を考慮しておくべきだろう。これに対して、第一種事業所に関しては、集計方法の変更によってセンサスから乖離しはじめたのだから、その変更のときに何かを間違えた可能性をまず疑うべきである。

というわけで、今回の記事では、毎月勤労統計調査の集計方法変更で何を間違えたのかを、現状で入手可能なデータと文書から推測する。

「本系列」(2012年1月~) の集計における層間移動事業所の扱い

抽出率逆数問題

毎月勤労統計調査の母集団労働者数推計については、くわしい資料が長年公開されておらず、具体的に何をどう計算しているのかわからない状態がつづいてきた。2019年になって、東京都不正抽出事件の真相究明と過去にさかのぼった再集計のために、統計委員会などが厚生労働省に対して説明を求め、それではじめて計算方法の詳細がわかるようになった。

2019年4月18日に統計委員会に提出された資料には、つぎのような記述がある。


―――――
厚生労働省政策統括官 (総合政策、統計・情報政策、政策評価担当)「「統計委員会の意見書についての審議結果を受けた厚生労働省への情報提供の要望」に対する回答」統計委員会 2019-04-18 資料2
p. 3
〔赤下線は引用時に書き加えたもの〕

https://www.soumu.go.jp/main_content/000615414.pdf

層間移動事業所に関連するのは fii(t) と gii(t) である (i は産業、 j は事業所規模区分、 t は調査月をあらわす)。前者 (fii(t)) は「毎月勤労統計データにおける、当該産業・規模への編入事業所における本月末調査労働者数に抽出率逆数を乗じたもの」、後者 (gii(t)) は同様の数値の「転出事業所」についてのものである。

調査対象事業所が、ある月に雇用者数を増やすなどして別の層に移動した場合、その移動分の労働者数が、つぎの月に新しい層に移動する。そのときには、抽出率逆数×0.5で重みづけた労働者数を移動させる (つまり移動前の層から減じて移動後の層に加える)。ここで「0.5」は「補正の適用度合い」と呼ばれ、式中では L で表されている係数で、なんのためのものかよくわからないのだが、ともかくこの数値をかけることになっている。なお、この資料では「現行は0.5で設定」と書いてあって、一見、過去にはちがう数値を使っていたかのようにみえるのであるが、実際にはこの数値は過去もずっと0.5であって、動かしたことはないそうである (2019-08-28 第10回点検検証部会議事録 http://www.soumu.go.jp/main_content/000650927.pdf p. 21)。

ここで、この「抽出率逆数」をどうやって決めているかが問題である。おなじ資料の前のページにはこうある:


―――――
厚生労働省政策統括官 (総合政策、統計・情報政策、政策評価担当)「「統計委員会の意見書についての審議結果を受けた厚生労働省への情報提供の要望」に対する回答」統計委員会 2019-04-18 資料2
p. 2
〔赤下線は引用時に書き加えたもの〕

https://www.soumu.go.jp/main_content/000615414.pdf

「抽出率」というのは、母集団 (の台帳等) から調査対象を選んだときの、その調査対象が選ばれる確率のことである。これは標本抽出の計画によって決まるので、本来は、あとから変更されることはないはずのものだ。しかしこの説明によると、「産業i、規模j、都道府県l、抽出時期m」によって「抽出率逆数」を決めることになっている。これは、調査を開始したあとに産業や規模や都道府県を移動したときには、それ以降は移動先の「抽出率逆数」を使う――したがって値が変わる――ということである。

架空例による考察

例として、2015年1月からの調査対象として抽出された、運輸業・郵便業 (産業分類 H) の500-4999人規模の事業所を考えよう。このときのこの産業の事業所抽出率は、どの都道府県でも1であった (https://www.soumu.go.jp/main_content/000594893.pdf p. 2 など参照)。

2015年1月には、この事業所の労働者数は500人ちょうどだったとしよう。それから2か月たって、3月末には、ひとり減って499人になっていたとする。そうすると、この事業所の規模区分は、500-999人規模から100-499人規模に変更される。

この分の労働者数を500-999人規模から引いて100-499人規模に足すのであるが、その際には、上記のように、抽出率逆数×0.5を掛ける。運輸業・郵便業の500-4999人規模事業所の抽出率逆数は1だったから、 499 × 1 × 0.5 = 245.5人が、この事業所の層間移動にともなって移動する労働者数である。

さて、4月になって、この事業所はあたらしくひとり雇い入れ、500人に戻ったとしよう。そうすると、この事業所はまた層間移動するので、その分の労働者数×抽出率逆数×0.5 を100-499人規模から500人規模に移動させる。このときに適用される運輸業・郵便業の5100-499人規模事業所の抽出率逆数は、24である (https://www.soumu.go.jp/main_content/000594893.pdf p. 2)。したがって、500 × 24 × 0.5 = 6000人が、100-499人規模から500-999人規模に移動することになる。

この間に起こったのは、ある事業所に雇われる労働者がひとり減ってひとり増え、最初とおなじ状態に戻ったということだ。ところが、推計母集団労働者数は、元には戻らない。6000-245.5 = 5754.5人の労働者が、100-499人規模から500-999人規模に移動したことになってしまうのである。

500-999人規模事業所の労働者数は全産業合計で300万人弱なので、5754.5人というのはその約0.2%にあたる。この事業所が規模区分の境界をまたいだ往復移動を5回繰り返せば、この規模区分の推計母集団労働者数が約1%増えてしまう勘定である。同様に移動する事業所が10個あれば、総計で労働者数が約10%増加する。

もちろん、産業と事業所規模によって抽出率がちがうため、層間移動が労働者数にあたえるインパクトは、抽出率の設定如何で異なる。

上でとりあげた「H 運輸業・郵便業」の場合、抽出率逆数は500人以上規模では1なのに対し、100-499人規模では24であった。このため、規模区分の境界を越えての上昇移動と下降移動とでは、移動させる労働者数に約24倍のちがいが出るわけである。ほかの産業をみると、たとえば「Q 複合サービス事業」の場合、500人以上規模では1、100-499人規模では4となっており、4倍しかちがわない。一方、「P83 医療業」の場合は500人以上規模では東京都で12、それ以外の道府県では1なのに対して、100-499人規模ではどの都道府県でも144となっている (つまり、東京以外では上昇移動と下降移動で144倍ちがう)。このように抽出率の設定はさまざまであるが、全体的にみると、事業所規模が小さいほど抽出率逆数が大きい傾向がある (https://www.soumu.go.jp/main_content/000594893.pdf pp. 2, 3 参照)。

500-4999人規模と1000人以上規模の事業所のあいだではおなじ抽出率が適用されている、という点も注意を要する。500人以上の事業所は、東京都以外では抽出率がすべて1である。東京都では産業によっては1以外の場合があるが、その場合でも500-999人規模と1000人以上規模との区別なくおなじ抽出率である。このため、500-4999人規模と1000人以上規模の間での層間移動については、上昇移動でも下降移動でもおなじ係数をかけて移動させるべき労働者数をカウントしているので、層間移動を繰り返す事業所が多数あっても、どちらかの規模区分の労働者数を一方的に増加させるようなことにはならない。

「H 運輸業、郵便業」の場合、500-4999人規模を中心にして考えると、同産業内での規模区分間移動にともなう推計母集団労働者数の増減は、

  • 1000人以上規模への流出 → 労働者数 × 0.5 だけ減少
  • 1000人以上規模からの流入→労働者数 × 0.5 だけ増加
  • 100-499人規模への流出 → 労働者数 × 0.5 だけ減少
  • 100-499人規模からの流入→労働者数 × 12 だけ増加

のようになっている。最後の「100-499人規模からの流入」のみ、ほかとはケタのちがうインパクトを持つことがわかる。

500-999人規模事業所の労働者数変動

以上の考察は架空の事例に基づくものだが、ここで実際のデータを確認してみよう。グラフ1は、2012年以降の「本系列」のデータから、500-4999人規模事業所の労働者数の各月の変動を、推計のふたつの段階に分解して示したものである。「毎勤推計」(第1段階) はその月の「前月末」から「本月末」への変化を、「雇用保険等補正」(第2段階) は前の月の「本月末」からその月の「前月末」への変化を示す (いずれも増加率の自然対数)。

グラフ1: 毎月勤労統計調査「本系列」による500-4999人規模事業所の各月の母集団労働者数変化


「前月末」→「本月末」の変化 (毎勤推計) と「本月末」→「前月末」の変化 (雇用保険等補正) について、増加率の自然対数を示す。データは https://remcat.hatenadiary.jp/entry/20211009/maikinold#monthly のグラフ3(d) 4(d) とおなじ。「前月末」「本月末」の労働者数については、 https://remcat.hatenadiary.jp/entry/20210911/gap#method 参照。

「毎勤推計」は、産業と事業所規模によって設定された「層」の内部での調査対象事業所の月間の労働者数変動を重み付きで合計したものである。毎年4月に上方へのスパイクがあって労働者数が増え、2-3月はマイナスになって労働者が減るという規則的な変動を示している。年度末に減った人員を年度はじめにまとめて補充する慣行は広くみられるが、それを反映しているのだろう。このように調査対象事業所の労働者数は周期的に増減しており、年間を均してみるとやや増加気味である。

これに対して、事業所の新設、廃止、層間移動などによる労働者の増減を補正する「雇用保険等補正」(新設/廃止事業所等は雇用保険事業所データによるが、層間移動事業所は毎月勤労統計調査による: 補正方法はややこしいので、http://hdl.handle.net/10097/00127285 の198-197ページを参照) のほうは、ほとんど常に増加率がプラスである。上方への大きなスパイクがいくつもみられるが、下方へのスパイクはなく、労働者数を増大させていく効果を持っていることがわかる。

「雇用保険等補正」のスパイクの多くは5月に記録されている。これは4月中の事業所の新設・廃止・層間移動などによる労働者数変動分を4月の「本月末」母集団労働者数に足して5月の「前月末」母集団労働者数とする、という操作に対応する。つまり、これらのスパイクがあらわしているのは、4月中の労働者数の変動である。年度はじめに新しく労働者を雇い入れて事業所規模区分が変わったとすると、それによる推計母集団労働者数の変化は、5月の「前月末」母集団労働者数にあらわれる。このとき、上でみたように、500-999人規模から1000人規模への流出にくらべ、100-499人規模から500-999人規模への流入が過大にカウントされる。このために母集団労働者数が大きく増えるものと解釈できる。最大のスパイク (2014年5月) は0.05を超えているが、これを指数変換して増加率に戻すと、5%を超える増加である。実際の増加人数は約12万人。9月11日の記事 のグラフ8では、この月に500-999人規模の母集団労働者数が大きく増えて段差ができていることが確認できる。

2-3月には労働者数が減る事業所が多いので、小さい規模区分への下降移動が起きるはずだが、それは「雇用保険等補正」による労働者数変動にはあらわれない。これは、事業所規模が縮小するために同時に起こる1000人規模からの流入と100-499人規模への流出の両方がおなじ倍率 (東京都以外なら全産業で0.5) であるため、互いに相殺するのだと考えることができる。

上述のように、500-4999人規模区分では、100-499人規模からの流入による労働者数増加だけが大きな倍率で加算される。このため、毎年4月のように、上昇移動が多く起きたときには、労働者数が過大に増えることになる。他方、下降移動が多く起きたときには、流入と流出が同程度にカウントされるため、労働者数の大きな変動は起きないのである。

1000人以上規模事業所の労働者数変動

1000人以上規模事業所ではどうなっているか。グラフ1と同様に、母集団労働者数推計の2段階の効果を分離して示したのがグラフ2である。

グラフ2: 毎月勤労統計調査「本系列」による1000人以上規模事業所の各月の母集団労働者数変化


「前月末」→「本月末」の変化 (毎勤推計) と「本月末」→「前月末」の変化 (雇用保険等補正) について、増加率の自然対数を示す。データは https://remcat.hatenadiary.jp/entry/20211009/maikinold#monthly のグラフ3(e) 4(e) とおなじ。

「毎勤推計」に周期的変動がみられることは500-999人規模事業所と同様である。これに対して、「雇用保険等補正」ではスパイクが上にも下にも伸びており、500-999人規模事業所とは異なった様相を呈している。

上で論じたように、1000人以上規模事業所と500-4999人規模事業所はおなじ抽出率なので、1000人の境界をまたいだ事業所の移動については、上昇移動でも下降移動でも、同一倍率で労働者数をカウントしている。上昇移動が多い月には流入してくる労働者数が上方へのスパイクを生み、下降移動が多い月には流出する労働者数が下方へのスパイクを生む。これらの増加と減少が打ち消しあうため、長期的に均せば労働者数は一定である (https://remcat.hatenadiary.jp/entry/20210920/workerpop#graph1 のグラフ1(e) 参照)。

100-499人規模事業所の労働者数変動

100-499人規模事業所では、「雇用保険等補正」による各月の労働者数増加率は、上下に突き出た箇所がいくつもあるものの、それぞれは大きなものではない (グラフ3)。全体としてみるとゼロより大きいところが多いため、緩やかに増加していく傾向 (https://remcat.hatenadiary.jp/entry/20210920/workerpop#graph1 グラフ1(c) 参照) ではある。しかし、季節的スパイクのたびごとに一気に増えるようなことにはなっていない。

グラフ3: 毎月勤労統計調査「本系列」による100-499人規模事業所の各月の母集団労働者数変化


「前月末」→「本月末」の変化 (毎勤推計) と「本月末」→「前月末」の変化 (雇用保険等補正) について、増加率の自然対数を示す。データは https://remcat.hatenadiary.jp/entry/20211009/maikinold#monthly のグラフ3(c) 4(c) とおなじ。

これは、500-999人規模区分への流出と30-99人規模区分からの流入が相殺する結果だと解釈できる。実際、母集団労働者数の増加分の人数 (比ではなく人数そのもの) をプロットしてみると、500-999人規模の上方スパイクと30-99人規模の下方スパイクがほぼ対応していることがわかる (グラフ4)。

グラフ4: 30-99人規模事業所と500-999人規模事業所の各月の母集団労働者数の増減


毎月勤労統計調査「本系列」(2012年-) データから、推計母集団労働者数の「本月末」→「前月末」の増減 (雇用保険等補正) の人数を示す。

さらに、30-99人規模事業所の労働者減少数と500-999人規模事業所の労働者増加数との差分を求めてみる (グラフ5の赤の×印: 前回記事のRスクリプトを使って、 data.new$size30$worker.diff などを取り出せばよい)。100-499人規模事業所の労働者増加数 (紫の実線) と重ねてみると、スパイクのある月にはそれらがかなりよく一致する。30-99人規模事業所の労働者減少は100-499人規模事業所への流入に、500-999人規模事業書の労働者増加は100-499人規模事業所からの流出に対応すると考えると、流入-流出の差 (の絶対値) が大きい場合に、100-499人規模事業所の労働者数の増加/減少が起きるのだと解釈することができる。

グラフ5: 100-499人規模事業所の労働者数変化と、隣接規模区分の増加・減少数との関係


毎月勤労統計調査「本系列」(2012年-) データから、推計母集団労働者数の「本月末」→「前月末」の増減 (雇用保険等補正) の人数に基づいて計算した。
移動相殺分 = (30-99人規模事業所の労働者減少数) - (500-999人規模事業所の労働者増加数)

「H 運輸業・郵便業」の場合について考えてみると、抽出率逆数の設定は、500-999人規模では1なのに対して、100-499人規模では24であり、30-99人規模では144 である。100-499人規模を中心にして考えると、同産業内での規模区分間移動にともなう推計母集団労働者数の増減はつぎのようになる。

  • 500-999人規模への流出 → 労働者数 × 12 だけ減少
  • 500-999人規模からの流入→労働者数 × 0.5 だけ増加
  • 30 - 99人規模への流出 → 労働者数 × 12 だけ減少
  • 30 - 99人規模からの流入→労働者数 × 72 だけ増加

労働者が増える局面では500-999人規模への流出と30-99人規模からの流入が大規模に起きることになり、そのどちらが大きいかによって100-499人規模の労働者数の増減が決まる、というのが上記のグラフ4, グラフ5の示していることである。

適用される倍率は産業によってちがうが、500-999人規模への流出よりも30-99人規模からの流入のほうが大きく設定されていることが多い。それなのに流入と流出の間にそれほど大きな差が出ないということは、流出事業所の数が流入よりもかなり多かったということであろう。労働者が減る局面において下方へのスパイクがあらわれないのも、同様の理由によって、流入と流出が結果的にほぼ釣り合っているということで説明がつくのかもしれない。

30-99人規模事業所の労働者数変動

グラフ6に示したように、30-99人規模事業所では、「雇用保険等補正」による労働者増加は、ほとんどの月でマイナスとなっており、ゼロを大きく上回る月はない。5月には下方に飛び出るスパイクを生じていることが多い。このため、この規模区分の労働者数は減少傾向にある。「毎勤推計」のほうは2014年以降は横ばいから増加に転じるのだが、「雇用保険等補正」は一貫して労働者数を減少させている (https://remcat.hatenadiary.jp/entry/20210920/workerpop#graph1 のグラフ1(b) 参照)。

グラフ6: 毎月勤労統計調査「本系列」による30-99人規模事業所の各月の母集団労働者数変化


「前月末」→「本月末」の変化 (毎勤推計) と「本月末」→「前月末」の変化 (雇用保険等補正) について、増加率の自然対数を示す。データは https://remcat.hatenadiary.jp/entry/20211009/maikinold#monthly のグラフ3(b) 4(b) とおなじ。

グラフ4で検討したように、30-99人規模事業所の労働者数減少、特に毎年5月の下方スパイクは、100-499人規模へ事業所が上昇移動したことによる労働者数の流出によって起きていると考えることができる。また、労働者数が減少する時期には逆に100-499人規模からの流入があるはずであるが、その時期には5-29人規模へ流出する労働者も増える。結果としてそれらが釣り合っているので、増加がほとんどゼロになっている、と考えることができる。

5-29人規模事業所の労働者数変動

ここで問題なのは、5-29人規模事業所の「雇用保険等補正」による労働者数の増減には、30人以上の規模区分にみられるような季節的変動がほとんどないことである。

グラフ7: 毎月勤労統計調査「本系列」による5-29人規模事業所の各月の母集団労働者数変化


「前月末」→「本月末」の変化 (毎勤推計) と「本月末」→「前月末」の変化 (雇用保険等補正) について、増加率の自然対数を示す。データは https://remcat.hatenadiary.jp/entry/20211009/maikinold#monthly のグラフ3(a) 4(a) とおなじ。

グラフ7からわかるとおり、「毎勤推計」のほうには、2-3月に労働者数が減って4月に増えるという、周期的な変動が毎年みられる。これに対して、「雇用保険等補正」のほうは、ゼロをすこし上回る程度で平坦であり、大きく変化する箇所がない。

5-29人規模事業所には、事業所層間移動に起因すると推測できる労働者数の特徴的変動がないのだ。5-29人規模についてだけ、ほかの規模区分とは集計方法がちがう ことを示唆するデータである。この問題は、あとであらためて取り上げる。

「時系列比較のための推計値」における層間移動事業所のあつかい

2012年1月分以降の毎月勤労統計調査「本系列」データには以上のような特徴があるのだが、このような特徴は2011年12月以前の「時系列比較のための推計値」にはみられない (https://remcat.hatenadiary.jp/entry/20211009/maikinold#monthly 参照)。「時系列比較のための推計値」は、2019年になってから、強引な仮定を置いて必要なデータを逆算するなどして、2012年1月から2004年1月までさかのぼって推計値を算出したものである (後述)。この推計の際の方法が、「本系列」の (再) 集計とはちがっていたのだろう。

「時系列比較のための推計値」については、「政府統計の総合窓口」(e-Stat) に「「時系列比較のための推計値」作成方法の概要」(https://www.e-stat.go.jp/stat-search/file-download?statInfId=000031972600&fileKind=2 ファイル名:suikei-manual.pdf) がある。その3ページにはつぎのように書かれている:


―――――
政府統計の総合窓口「「時系列比較のための推計値」作成方法の概要」 p. 3
〔2021-08-14ダウンロード〕

https://www.e-stat.go.jp/stat-search/file-download?statInfId=000031972600&fileKind=2

層間移動事業所の労働者数のあつかいについて説明しているところ、「毎月勤労統計データにおける、当該産業・規模への編入事業所における本月末調査労働者数」までは 2019年4月18日の統計委員会の資料2 とおなじであるが、そのあと「に抽出率逆数を乗じたもの」という部分がなく、単に「の合計」となっている。「転出事業所」に関する説明も同様である。

つまり、この「時系列比較のための推計値」の計算に際しては、抽出率逆数をかけるステップがなくなり、調査対象事業所の労働者数をそのまま使っている ということである。「補正の適用度合い」L が0.5だというところはおなじなので、結局、移動した事業所の労働者数の半分だけを移動させていることになる。

この方法であれば、「本系列」のように上昇移動と下降移動とで移動する労働者数が大きく異なる事態は起きない。労働者数500人の事業所でひとり辞めて499人になった場合に移動する労働者数は249.5人、そのあとひとり雇い入れて500人に戻った場合には移動する労働者数は250人なので、推計母集団労働者数もほぼもとに戻るわけである。

「従来の公表値」における層間移動事業所のあつかい

2017年12月まで使われていた集計方法で層間移動事業所がどのようにあつかわれていたかはわかっていない。前述のとおり、層間移動事業所のあつかいがきちんと説明に出てくるようになったのは2018年末に東京都での不正抽出が発覚して以降なのだが、そのあとも、従来どのように計算していたのかは説明されていないのである。

しかし、上でみたとおり、2011年12月までの「従来の公表値」の第一種事業所の推計母集団労働者数は「時系列比較のための推計値」と一致するのだから、おなじ方法――つまり抽出率逆数をかけない――だったものと推測できる。2018年1月以降は「本系列」と一致するので、「本系列」とおなじ方法――抽出率逆数をかける――だろう。なお、第二種事業所に関しては、「従来の公表値」「本系列」「時系列比較のための推計値」はすべてほぼ一致する。

2018年1月の集計方法変更で何が起こったか

以上の知見を総合すると、毎月勤労統計調査の母集団労働者数推計における層間移動事業所のあつかいの変遷は、概略つぎのような感じである:

  • 2017年までは、抽出率逆数は使っていなかった
  • 2018年1月の集計方法変更時に、第一種事業所のみ、抽出率逆数で重み付けする方式を導入
  • 2019年1月の再集計時に、この方法を2012年1月分から適用
  • 2011年分から2004年分までさかのぼって推計した際には、抽出率逆数を使わない方法を採用

結果として、現在公表されているデータの2004年以降では、事業所が層間移動際の労働者数の移動量はつぎのようになっている:

  • 第一種事業所では、「本系列」(2012年1月分以降) のデータと「従来の公表値」の2018年1月分以降のデータのみ、抽出率逆数をかけている。それ以外は抽出率逆数を使わない方式。
  • 第二種事業所では、抽出率逆数はまったく使っていない。

何をどうしたらこんなことになるのか。以下は推測をまじえた考察である。

2017年までの状況

第二種事業所では、2017年以前から同一層内に抽出率のちがう事業所が混在していたので、抽出率逆数で重み付ける仕組みがあった。しかし、これは平均賃金などの算出や、母集団労働者数推計の第1段階 (毎勤推計) にのみ使われていただけであり、層間移動事業所の労働者数の計算には使っていなかったようである。

第一種事業所に関する集計では、そもそも調査対象事業所の抽出率を考慮していなかった。毎月勤労統計調査による最終的な推計値は、「推計比率」(母集団労働者数と調査労働者数との比) をかけて求めるため、同一層内の事業所がすべて同一の抽出率であれば、それで問題は起こらない。*1

2018年の集計方法変更

2018年1月にローテーション・サンプリングを導入した結果、第一種事業所でも層内に抽出率のちがう事業所が混在することになった。これに対応するため、第一種事業所の集計にも、抽出率逆数で重み付けする方式を導入することになった。――というのが、厚生労働省がこれまでおこなってきた説明である (https://www.soumu.go.jp/main_content/000594893.pdf)。今回の記事で検証してきた内容が事実なら、この 2018年1月のシステム改修には、「抽出率逆数で重み付けする方式」を層間移動事業所の労働者数についても適用するという変更をふくんでいた はずだが、そういう説明はおこなわれてこなかった。

この推測が正しければ、この記事で指摘してきたような、事業所が規模区分の境界をまたいでの移動を繰り返すと抽出率逆数の大きい層から小さい層に労働者数が流出してしまうというバイアスは、この2018年1月分からの集計方法変更が創り出した ということになる。

本来なら、サンプリング時の抽出率を事業所ごとに記録し、事業所がどこの層に移動しようとも常にその値を適用するシステムにすべきであった。そうすれば、100人の事業所 (抽出率 1/R) の労働者がひとり減ったときには 99×R×0.5人の移動が生じるが、その後ひとり増えたときには 100×R×0.5人が逆方向に移動するので、ほぼ元の労働者数に戻る。若干の食い違いはのこるものの、現状のように上昇移動と下降移動でちがう抽出率逆数が適用されて大きな非対称性が出るのとはくらべものにならない。

なお、抽出率を考慮しない従来の集計方式というのは、常に R=1 に固定しておくのとおなじである。抽出率が本当に1であった場合以外は移動量が過少になってしまうので、その意味ではバイアスはある。とはいえ、労働者数が過大に増加・減少するよりは、過少なほうがずっとましだっただろう。どうせ数年に一度は、ベンチマーク更新によって直近のセンサスの水準に労働者数を調整するのである。「補正の適用度合い」という謎の係数 L=0.5 をかけているのも、労働者数の増減が過大に出るよりは過少なほうがよい、という保守的な判断によるものではないだろうか。しかし、所属する層によってRを決める方式が2018年1月から採用された結果として、事業所層間移動の労働者数に対するインパクトが巨大なものになってしまった。

システム改修の実態

この2018年1月分からの集計方法変更をどのようにおこなったかについては、あまり情報がない。2019年1月22日の特別監察委員会報告書によると、つぎのようである。

雇用・賃金福祉統計室長(当時)Fは、平成29(2017)年度開始後遅くとも5月以降、当時のプログラム担当者に対し、平成30(2018)年1月調査以降の毎月勤労統計調査におけるローテーション・サンプリングの導入に向けたプログラム改修を指示した。その中で、それまで実施していなかった東京都における規模500人以上の事業所に係る抽出調査の結果及び30人以上499人以下の事業所のうち東京都と他の道府県で抽出率が異なる一部の産業の調査結果についてプログラム上適正に復元されるよう改修がなされた。
―――――
毎月勤労統計調査等に関する特別監察委員会 (2019-01-22)「毎月勤労統計調査を巡る不適切な取扱いに係る事実関係とその評価等に関する報告書」
p. 12

https://www.mhlw.go.jp/content/10108000/000472506.pdf

改修を指示した時期は、2017年の「年度開始後遅くとも5月以降」となっていて、日付が特定されていない。文書が残っていたなら、その日付がわかるはずだ。そうすると、この指示は文書によるものではなかったか、文書があったとしてもそれが保存されていなかったかである。

また、このときの改修に限らず、毎月勤労統計調査のシステム保守作業に関しては、全般的につぎのような状況だったという。

職員・元職員のヒアリング調査によれば、企画担当係とシステム担当係との間の作業発注及び作業のフォローアップの仕組みやシステム改修の進め方については、以下のような供述が見られる。

・ 抽出替え等によりシステム改修の必要性が生じた場合には、企画担当係とシステム担当係が打ち合わせをしながら、必要な作業を進めていくが、その際にはすべての仕様をペーパーで依頼する訳ではなく、口頭ベースで依頼することもあった。なお、毎月勤労統計調査については、具体的なシステム改修関係の業務処理は係長以下で行われ、一般的には課長や課長補佐が関与しない。

・ システム改修の依頼を受けたシステム担当係は外部業者等に委託することなく自前でシステム改修を行うことになるが、毎月勤労統計調査に係るシステムのプログラム言語はCOBOL であり、一般的にシステム担当係で COBOL を扱える者は1人又は2人に過ぎなかった。このため、一般的にシステム改修を行う場合はダブルチェックを行うが、ダブルチェックができない場合も多かった(平成15(2003)年当時は COBOL を扱える者は2人いたが、それぞれが別の仕事を分担して処理していたため、当該者同士でダブルチェックをするようなことはなかった。)。

・ 一度改修されたシステムのプログラムの該当部分は、それに関連するシステム改修がなされない限り、当該部分が適切にプログラミングされているか検証されることはなく、長期にわたりシステムの改修漏れ等が発見されないことがあり得る。
―――――
毎月勤労統計調査等に関する特別監察委員会 (2019-01-22)「毎月勤労統計調査を巡る不適切な取扱いに係る事実関係とその評価等に関する報告書」
p. 17

https://www.mhlw.go.jp/content/10108000/000472506.pdf

これらの供述が2018年1月分からの集計方法変更にもあてはまるとすると、口頭での適当な説明をもとにプログラミング担当者が適当に実装し、その後だれも検証しなかった、という可能性がある。

2018年1月分からの集計方法変更についての指示が「第一種事業所の調査数値を合計する際には抽出率逆数を掛けるよう改修する」というような内容だったとすると、それを聞いたプログラミング担当者が、層間移動事業所の労働者数の処理も「調査数値を合計する」作業であるからこの改修の対象となる、と考えたとしても不思議はない。また、第一種事業所だけが対象であるから、第二種事業所からの層間移動は対象外だ、と考えたかもしれない。そのように想像すると、5-29人規模 (=第二種事業所) だけは変更せずに従来の方式をそのままのこし、それ以外の規模区分 (=第一種事業所) からの層間移動については移動元の抽出率逆数をかけて計算する、というシステム改悪がなされた背景が理解できる。

以上の考察に基づくと、2018年1月のシステム改修の結果として、規模区分間を事業所が移動した場合の労働者数は、下図のようになっているのではないかと想像できる (運輸業・郵便業についての例)。


産業分類H「運輸業、郵便業」の事業所が規模区分を変更した場合に移動する労働者数 (2018年1月以降の毎月勤労統計調査システムについての推測)。Rは抽出率逆数。

500人以上の規模区分 (抽出率1) を起点とする移動は、労働者数の半分だけがカウントされる。100-499人規模 (抽出率 1/24)を起点とする移動は、12倍のカウントである。したがって、たとえば500-999人規模への流入は、1000人以上規模からやってくる場合は0.5倍、100-499人規模からやってくる場合は12倍の係数をかけて計算される。

5-29人規模 (第二種事業所) については、抽出率が公表されておらず、不明である。ただし、抽出率逆数をかける手順自体が採用されていないものと考えると、1000人以上規模と同様に、流出も流入も0.5倍ということになる。

30-99人規模 (抽出率 1/144) に関しては、100-499人規模からの流入は12倍、100-499人規模への流出は72倍で計算される。5-29人規模への流出も同様に72倍。しかし、5-29人規模からの流入については、抽出率逆数自体が利用されないので、0.5倍と考えている。

このシステムにおいては、30-99人規模から5-29人規模への移動以外は、ある層から別の層へ労働者数を移動させるだけなので、全体の労働者数は一定に保たれる。どこかで労働者を減らした分は、別のどこかで増やしているのである。ただし、30-99人規模から5-29人規模へ移動した場合は例外で、移動元 (30-99人規模) ではその事業所の労働者数の72倍の労働者が減るのに、移動先 (5-29規模) では0.5倍分しか増えないので、全体の労働者数が71.5倍分減ることになる。

2018年1月のシステム改修が以上のようなものだったと考えると、

  • 5-29人規模事業所では「雇用保険等補正」による労働者数の増減に季節的変動がみられず、また「従来の集計値」と「本系列」データがほとんど一致すること、
  • 30-99人規模事業所の労働者数が減る一方であること

をふくめ、データの動きを整合的に説明できる。

2019年の再集計作業 (2012年1月分~) について

2018年末に 東京都での不正抽出が発覚 した。これは、2004年以降、東京都の一部の事業所ではほかの地域とちがう抽出率が適用されていたのに、それに対応していない集計を2017年12月までおこなっていたというものである。当時公表されていた毎月勤労統計調査の結果数値は間違いだったということになるので、計算をやりなおして正しい値に差し替える必要があった。

おそらく、当時の担当者は、2018年1月以降に稼働しているプログラムでは問題はなくなっているという認識のもと、2012年1月からの再集計をおこなう際にもおなじプログラムを適用したのであろう。そのようにして、2018年のシステム改修で導入された層間事業所への不適切な抽出率逆数の適用は、2012年1月分からの「本系列」データに持ち込まれることになった。

このときの再集計の適用範囲が2012年1月分以降に限定されたのは、2011年12月分以前の毎月勤労統計調査については、再集計をおこなうための情報が、すでに廃棄されてしまっていたりしていて、じゅうぶんにそろわなかったからである。欠けている情報を強引に推測して集計値を求めた「時系列比較のための推計値」がe-Statに掲載されたのは、2020年8月以降のことになる。

時系列比較のための推計値 (2011年12月分→2004年1月分) について

すでに述べたように、「時系列比較のための推計値」を求める際には、層間移動事業所については、2012年1月以降のデータの再集計とは異なり、従来の公表値とおなじ方式で計算したようだ。すなわち、該当労働者数の半分を増減させるだけで、抽出率逆数による重み付けをおこなわない方式である。

この「時系列比較のための推計値」を求める作業については、統計委員会において、推計の方法についての検討を繰り返しおこなってきた。該当する資料の一覧 を付録に掲げておこう。層間移動事業所データによる推計母集団労働者数の補正の式が何度も出現するが、それらには抽出率逆数をかけるという記述はなく、労働者数を単純に合計することになっている。統計委員会での検討のときには、層間移動事業所の労働者数について抽出率逆数で重みづけるということは、まったく意識されていなかったようなのである。

どうしてこのようなことが起きたのだろうか? 2012年以降についての再集計作業も、2011年からさかのぼっての「時系列比較のための推計値」を求める作業も、東京都不正抽出のためにおかしくなったデータを正しい値に戻すための一連の作業であるから、基本的におなじ方法で進めなければならないはず。ちがう方法で計算してしまったのは、異常な事態といえる。

ひとつの可能性は、2018年1月以降、層間移動事業所の労働者数に抽出率逆数をかける操作が加わった (そして2019年の再集計作業でもおなじ方式を使った) という事実を、担当者が把握していなかった、ということだ。先に述べたように、毎月勤労統計調査のシステム改修の指示事項は、口頭でのあいまいなかたちでしか伝わっていなかった可能性がある。そうとすれば、計算がどのようにおこなわれるかの正確な情報が、担当者間で共有できていなかったとしても不思議はない。

その場合でも、2012年1月以降のデータについての再集計は、通常の時間順にしたがって順次計算していくのだから、通常の集計手順とおなじであり、2018年1月に改修したプログラムをそのまま適用できる。それなら、担当者が処理の詳細を知っていたか否かにかかわらず、おなじ処理がおこなわれる。ところが2011年以前のデータについては、2012年1月を起点として過去にさかのぼっていく作業になるから、プログラムをそのまま使うわけにはいかない。この作業についてあらためて指示を作成し、それにしたがってプログラミングをおこなったとすれば、指示を出した者の認識にしたがったプログラムになるわけである。

もうひとつの可能性としては、層間移動事業所の労働者数に抽出率逆数をかけるのはまずい、ということに担当者が途中で気付いたのかもしれない。「時系列比較のための推計値」算出が難航した理由のひとつは、産業分類の変更が途中でおこなわれていたために、抽出率のちがう事業所が同一層内に混在しており、層別の抽出率逆数が一意に決められない、という問題であった。これは、別の層から移動してきた事業所ともとからその層にいた事業所とでは本来適用すべき抽出率が異なる、というのと性質のおなじ問題である。

不正抽出でなくても、第一種事業所のおなじ層内にちがう抽出率の調査対象が混じっている事態は、毎月勤労統計調査では常に存在しているはずである。なぜなら、調査期間の途中で事業所が別の層に移動することがあるからだ。それ以降、その事業所は移動先の層に属しているものとして集計される〔……〕。しかし、移動元の層と移動先の層で抽出率がちがう場合には、移動した事業所をもともとその層にいた事業所とおなじウェイトで集計してはいけない はずなのである。

 層間移動する事業所の数が少なければこれはあまり問題ではないかもしれない。しかし大量にそうした移動が起こると、当然大問題になる。そして、そういう事態は実際に2010-2011年の毎月勤労統計調査で起きていたようだ。というのは、このときに産業分類が変更されたからである。サンプリング時点では別の産業とみなされて別の抽出率が適用されていた事業所が、分類変更の結果、おなじ層に混在するようになった。

 この問題は2019年1月17日の統計委員会ではじめて報告された。ただし、このときから現在に至るまで、単に「過去にさかのぼった再集計ができない」という問題としてとらえられているようである。

〔……〕

 しかし、この問題は、単に再集計が困難だというにとどまるものではない。第一種事業所では層内に抽出率のちがいはないという前提で集計方法をデザインしていたにもかかわらず、その前提が成り立たない状況を自ら作り出していたことを示している からである。集計数値のずれかたという点からみると、東京都不正抽出よりもインパクトが大きいかもしれない。また、このような 集計方法の制約を理解せずにずっと調査をつづけてきたのだとすると、ほかにも別のかたちで抽出率のちがうサンプルを不適切にあつかった事例が隠れている可能性がある。

 厚生労働省は、2018年以降、第一種事業所にもローテーション・サンプリング (部分入れ替え制) を導入したため、抽出率を考慮した集計方法に変更したと説明している。しかしその方法をよくみると、所在地やサンプリング時期によってちがう抽出率を割り当てるだけ [統計委員会 第135回 資料6-2: 2] であり、個別の事業所について抽出時の抽出率を特定できる仕組みはない ようである。これでは、予期しない要因によって大量の事業所が層間で移動する事態には対処できない。根本的な対策は実はされていないと考えておいたほうがよさそうだ。今後のシステム改修等できちんとした対応がおこなわれるのかどうか注意して見守る必要がある。
―――――
田中 重人 (2020)「毎月勤労統計調査の諸問題」『東北大学文学研究科研究年報』69: 210-168
(pp. 189-188)
強調 は引用時に付加したもの〕

http://hdl.handle.net/10097/00127285

産業分類変更が問題になったのは、旧分類に基づいて決めた抽出率で事業所を抽出したのに、集計は新分類でおこなっていた、ということであった。各事業所の抽出時の産業分類がわかるデータは廃棄されてしまっていたので、旧分類に基づいて抽出率を割り振ることもできない。結局、新分類をもとに抽出率を割り振る――ただし旧分類でわけたときの事業所の割合を推測して、できるかぎりもっともらしい値にする――という手法が採用されている。

そのような問題を検討しているところに、層間移動した事業所の労働者数に抽出率逆数をかけるのです、という資料が出てくれば、「ここでいう「抽出率逆数」は何に基づいて決めるのか?」という議論に当然なる。そして、この議論を突き詰めていけば、すでに公表している再集計値の計算がおかしい――そして、再集計値に基づいて決めた 雇用保険・労災保険・船員保険等の給付金追加 などもおかしいのではないか――という疑問にたどり着く。このような厄介事を避けるために、抽出率逆数をかける手順はなかったことにしたのかもしれない。

毎月勤労統計調査の躓きの石

毎月勤労統計調査が現在のような母集団労働者数推計の仕組みを採用したのは、1990年のことである。

 1990年における大きな変更点としては、それまでの「甲」「乙」調査が統合されたことがある [神代 1995]。調査内容が統一され、調査票もほぼおなじものになった。ただ、これ以降もサンプリングと調査方法のちがいは存続しており、「第一種事業所」「第二種事業所」の区別が維持されている。

 もうひとつの重要な変更点は、母集団労働者数推定の方法〔……〕が改善されたことである [神代 1995]。それまでの「乙」調査の集計では、抽出率逆数による重み付けがおこなわれるのみであり、母集団労働者数を推定して使う方式は採用していなかった。「甲」調査では母集団労働者数推定値を用いていたが、新設事業所等の情報を補完する方法論が弱かった。1990年調査からは、「第一種事業所」「第二種事業所」の両方で、現在とほぼ同様の推定方法が採用されている [要覧 1991年版: 313-314]。
―――――
田中 重人 (2020)「毎月勤労統計調査の諸問題」『東北大学文学研究科研究年報』69: 210-168
(pp. 207-206)
[神代 1995] は 神代和欣 (1995)「毎月勤労統計調査」『日本労働研究雑誌』419: 32-33.
[要覧] は『毎月勤労統計要覧』.

http://hdl.handle.net/10097/00127285

結果からみれば、この変更は「改善」ではなく、むしろ「改悪」だったといえよう。この複雑な母集団労働者数推計方法を正しくあつかうことができず、かえって不正確な母集団労働者数を使った推計結果を出すことになってしまっているからだ。 https://remcat.hatenadiary.jp/entry/20210911/gap#gap で試算したように、月々の労働者数推計をすっぱりやめてしまったほうが、センサスとの乖離はすくない。第二種事業所 (5-29人規模) については センサスのほうが間違っている疑いがある が、第一種事業所に関しては、毎月勤労統計調査のほうが間違っているのだと考えるべきであろう。

こういう変なことが起きてしまう直接の原因は、抽出率を事業所ごとに記録せず、所属層によって割り当てる簡易な方法をとっていることである。この方法をとっていいのは、事業所が層間を異動せず、調査期間の最初から最後までおなじ層にとどまる場合に限られる。調査期間中に事業所の所属層を移動させたり産業分類を組み替えたりするのであれば、抽出率を所属層によって割り当ててはならない のだ。

さらに根本に戻って考えるなら、私がおこなったような反省的なデータ分析を、なぜ厚生労働省自身がやらなかったのか*2 が問題である。「雇用保険等補正」が労働者数にあたえる影響については、2019年2月20日の第132回統計委員会で議論の俎上に出たのだが、このときのやりとりから、母集団労働者数推計による労働者数の増減がどの程度であるかのデータを持たずに議論していることがわかる。

○西村委員長 はい、分かりました。
それから、これは微妙なところですが、資料の21ページの母集団労働者数の補正について、雇用保険データのインパクトはどの程度ですかという質問があったわけですが、こちらについてはいかがですか。一種のSensitivity Analysis(感度分析)みたいな話なのですが。


○瀧原厚生労働省政策統括官付参事官付統計管理官(雇用・賃金福祉統計担当) そうです。これも 今時点でこれにお答えするものは持っていません けれども、実際の具体的な時期というか、計算時点というのはいろいろ動くかもしれませんけれども、多分、大きなものとしてはそんなに……、大体計量可能かと思いますので、そこの部分も併せて検討してお答えさせていただければとは思っています。
―――――
第132回 統計委員会 (2019-02-20) https://www.soumu.go.jp/main_sosiki/singi/toukei/kaigi/kaigi.html 議事録
p. 15
強調 は引用時に付加したもの〕

https://www.soumu.go.jp/main_content/000626211.pdf

このときは、2010年以前の雇用保険事業所データがないためにさかのぼっての推計ができないということが問題となり、統計委員会から「雇用保険データが母集団労働者数の補正に与えるインパクトはどの程度か。小さければ、無視することもできるのではないか。」(https://www.soumu.go.jp/main_content/000601139.pdf) という質問が出ていたわけである。

しかし、そのような質問が出なくとも、補正によって労働者数がどれくらいの影響を受けるのか、真の母集団労働者数を首尾よく追尾できているといえるのかは、通常の統計作成活動の一環として、すくなくともセンサスに基づくベンチマーク更新をおこなった際には常にチェックしていなければならないはずのものである。現に、この補正方法を導入した当時の『毎月勤労統計要覧』は、つぎのように書いていた:*3

(4) 母集団労働者数の補正
 調査事業所は一定期間固定して調査するので,その後に新設された事業所の状況等は反映されず,したがって,推計労働者数は下方バイアスを持つ傾向がある。そこで,全国調査においては,次により,毎月,労働者数の補正を行っている。
イ 全国調査の対象範囲である5人以上事業所の新設,廃止,5人未満からの規模上昇及び5人未満への規模下降について,雇用保険事業所データにより,その補正数を産業,事業所規模別に推計する。
ロ 調査事業所の常用労働者数について,対象範囲の中で規模変更があった場合には,その都度,集計規模区分を変更する。これに伴い変更前・後の産業・規模区分の母集団労働者数に異動分を復元して増減することによって補正する。
ハ 母集団補正の偏りをできる限り小さくするため調整率 (bias adjusting factor) を設け,イ,ロによる補正数に調整率を乗じた値を本月末労働者数に増減し,それを翌月分の母集団労働者数とする。

 調整率は,原則として事業所統計調査の結果に基づいて新たにベンチマークを設定した時に,より正確に事業所数の変動を反映するように設定し直すこととする。その他,推計の偏りが大きくなった場合にも見直しを行う。
―――――
労働省 (1991)『毎月勤労統計要覧』(平成3年版) 労務行政研究所. ISBN:4897644771
pp. 313-314

「調整率」についてこれ以上の説明はないのだが、たぶん今日では「補正の適用度合い」と呼ばれ、KL の記号であらわされているものではないかと思う。いずれにせよ、補正がきちんとした補正になっているかどうかは定期的に見直すことになっていた のである。2018年にはベンチマークの更新をおこない、そのために大きな断層が生まれた (つまり推計の偏りが大きかった) のだから、その時点で補正による偏りが断層発生にどの程度寄与していたかは検討していなければならなかった。

もちろん、2017年までの労働者数の補正においては、今回の記事で問題にしてきたような抽出率逆数の問題は出ていなかったので、そこで検討したからといって、今回の問題が摘発できたわけではない。しかし、推計母集団労働者数の動きを定期的にチェックする体制が整っていたなら、遅くとも ワーキンググループに出す資料作成でセンサスからのずれ具合がわかった その段階で、ずれの原因を探る分析がスタートしていたはずであろう。

集計結果を精査しておかしなところをみつける仕組みがはたらかない組織で、毎月勤労統計調査のような複雑で高度な即時性と精確性を要求するシステムを動かしつづけるのは無理である。組織の抜本的な強化を図るか、別のまともな組織に移管するか、内部文書やプログラムを広く公開して誰でも検証できるようにすべきだ。そうできないのであれば、調査-集計システムのほうをもっと簡略化して、現行の組織でもあつかえる程度にまで複雑さを落とすしかないだろう。

付録:統計委員会で毎月勤労統計調査問題を取り上げた回の資料 (2019年-)

総務省 統計委員会 会議記録: https://www.soumu.go.jp/main_sosiki/singi/toukei/kaigi/kaigi.html

第130回統計委員会

2019-01-17
https://www.soumu.go.jp/main_sosiki/singi/toukei/kaigi/02shingi05_02000273.html

第131回統計委員会

2019-01-30
https://www.soumu.go.jp/main_sosiki/singi/toukei/kaigi/02shingi05_02000276.html

第132回統計委員会

2019-02-20
https://www.soumu.go.jp/main_sosiki/singi/toukei/kaigi/02shingi05_02000286.html

第133回統計委員会

2019-03-06
https://www.soumu.go.jp/main_sosiki/singi/toukei/kaigi/02shingi05_02000291.html

第134回統計委員会

2019-03-18
https://www.soumu.go.jp/main_sosiki/singi/toukei/kaigi/02shingi05_02000295.html

第135回統計委員会

2019-04-18
https://www.soumu.go.jp/main_sosiki/singi/toukei/kaigi/02shingi05_02000312.html

第136回統計委員会

2019-04-26
https://www.soumu.go.jp/main_sosiki/singi/toukei/02shingi05_02000319.html

第149回統計委員会・第8回企画部会(合同開催)

2020-04-30
https://www.soumu.go.jp/main_sosiki/singi/toukei/kaigi/02shingi05_02000410.html

第163回統計委員会

2021-04-22
https://www.soumu.go.jp/main_sosiki/singi/toukei/kaigi/02shingi05_02000481.html

第166回統計委員会

2021-07-30
https://www.soumu.go.jp/main_sosiki/singi/toukei/kaigi/02shingi05_02000509.html

つづき:

「毎月勤労統計調査の改善に関するワーキンググループ」参加者への手紙
https://remcat.hatenadiary.jp/entry/20211017/wgletter

履歴

2021-10-14
公開
2021-10-14
「500-499」と書いていた11カ所を「100-499」または「500-999」に訂正
2021-12-28
「つづき」を追記


*1:実際には層間移動する事業所があるのだし、産業分類の変更によって抽出率のちがう事業所が同一層内に混在していた時期もあるため、この前提は成り立たない。しかしそのことは無視されてきた。http://hdl.handle.net/10097/00127285 の201-197ページおよび189-188ページを参照。

*2:毎月勤労統計調査「再集計値」の労働者数の推移がおかしいことをはじめて指摘したのは、山田正夫による2019年4月22日のブログ記事 http://kagaku7g.g.dgdg.jp/mkt/mkt06sai.htm である。30-99人規模事業所 (山田の表現では「C群」) の労働者数が再集計作業で大きく減ったことを示して「奇妙なのはC群で、129万~159万人の労働者数が減少している。これが「異なる抽出率の復元」の結果であるとはとても考えにくい」と書いている。この奇妙な労働者数減少を引き起こした原因がこの時点で追究されていたなら、その後の展開はずいぶんちがっていただろう。

*3:この『毎月勤労統計要覧』1991年版313ページの説明によれば、規模変更があった場合には、変更前・後の産業・規模区分の母集団労働者数に、「異動分を復元」した増減を加えることになっている。2018年1月の集計方法変更までは抽出率逆数をかけないで移動分の労働者数をそのまま増減していたというのは、この記述どおりの集計になっていなかったということである。なぜそうなったのかは今後あきらかにしていくべき問題のひとつである。