remcat: 研究資料集

(TANAKA Sigeto)

第5回「毎月勤労統計調査の改善に関するワーキンググループ」資料2の解釈

厚生労働省「厚生労働統計の整備に関する検討会」の下に設置されている「毎月勤労統計調査の改善に関するワーキンググループ」の第5回会議が2022年7月22日に開催された。その資料が前日の7月21日から https://www.mhlw.go.jp/stf/newpage_26894.html で公開されている。

これらの資料のうち、資料2「母集団労働者数の推計について」(https://www.mhlw.go.jp/content/10700000/000966357.pdf) があまりにもおかしいので、どこが変なのか、解説しておきたい。

なお、同ワーキンググループと毎月勤労統計調査の母集団労働者数推計の問題については、過去記事を参照のこと。

毎月勤労統計調査、今後のベンチマーク更新で大きなギャップ発生のおそれ
https://remcat.hatenadiary.jp/entry/20210911/gap (2021年9月11日)
母集団労働者数推計の謎:毎月勤労統計調査とセンサスはなぜ乖離しているのか
https://remcat.hatenadiary.jp/entry/20210920/workerpop (2021年9月20日)
毎月勤労統計調査、2018年の集計方法変更で何か間違えた模様
https://remcat.hatenadiary.jp/entry/20211009/maikinold (2021年10月9日)
層間移動事業所と抽出率逆数:毎月勤労統計調査問題の死角
https://remcat.hatenadiary.jp/entry/20211014/samplingrate (2021年10月14日)
「毎月勤労統計調査の改善に関するワーキンググループ」参加者への手紙
https://remcat.hatenadiary.jp/entry/20211017/wgletter (2021年10月17日)
毎月勤労統計調査、抽出率逆数の扱いを2018年1月から改悪していたことが判明
https://remcat.hatenadiary.jp/entry/20211229/wg3 (2021年12月29日)
毎月勤労統計調査、不正な結果を是正したはずの2019年再集計値も間違っていた
https://remcat.hatenadiary.jp/entry/20220102/rev2019 (2022年1月2日)
統計委員会への手紙「毎月勤労統計調査で2018年1月から採用されている誤った推計法について」
https://remcat.hatenadiary.jp/entry/20220122/toukeiiinkai (2022年1月22日)

集計に用いる層は変更しない

同ワーキンググループ第5回会議の資料2には、毎月勤労統計調査の集計の際に使っている産業・事業所規模別の層について、「原則として変更しない」という記述がある。これは驚愕の新情報である。なぜ驚愕なのかというと、これまで公表されてきた同調査の資料では、事業所の労働者数が増減するなどした場合に、それにあわせて層を変更することになっていたからだ。

古くは、『労働統計調査月報』に掲載された1951年の解説記事に、つぎの記述がある。

標本は昭和23年の事業所調査において調査された事業所より、産業別規模別に任意抽出されたものである。〔……〕その爲にともなう抽出誤差が、2年をへた25年9月にどの程度になるものか、製造工業について計算した。


〔……〕


規模の變化した事業所について云えば、抽出は23年10月の規模に於いてなされ、集計の時は現在の規模にいれる から、推計は次の様になる。
―――――
松村 雅央 (1951)「毎月勤勞統計調査の抽出誤差」『労働統計調査月報』3(5): 11-14.
〔p. 11から引用。強調は引用時に付加したもの〕

1979年には、同年4月の抽出替えによって平均給与が低下した原因についての解説記事のなかに、つぎの記述がある。

 ロ 集計上の要因
 抽出替え以後の変動により規模変動した調査対象事業所については6ヵ月ごとに 集計区分を変更している が,一般に大規模ほど抽出間隔が小さく(特に規模500人以上は悉皆調査)小規模ほど抽出間隔が大きくなっているので,規模下降する事業所は規模上昇する事業所に比べて数のうえでより多くは握される。これを,規模100~499人の区分を例にとってみると,規模500人以上から規模450~499人程度に規模下降したものは全数は握されるのに対して抽出替え時からこの区分に属する事業所は,例えば抽出率1/4で抽出されているので,規模450~499人以上へと逆に規模上昇する事業所は全数の1/4しかは握されない。このように規模500人前後の規模異動があると,母集団全体としては互いに相殺するような上昇下降であっても,規模100~499人の区分の中では規模450-499人程度の調査対象事業所のウエイトが相対的に増加する結果となる。また,規模100人前後の規模移動についても,その前後の規模上昇規模下降によって規模100~150人程度の調査対象事業所のウエイトが相対的に低下する傾向になる。
 こうしてひとつの集計区分内においても大規模(又は抽出替え時に大規模であった事業所)に標本が偏る傾向が生じるのであるが,集計上は,前出(1)式のとおり,同一集計区分内ではすべて同等の扱いを受けるので,規模別の賃金格差を反映して推計値は高めにあらわれるのである。


〔……〕


労働者数550人の事業所が規模下降して450人になって〔ママ〕とすると,規模500人以上は悉皆調査だからその間の雇用は100人減と推計される。集計区分の変更では,規模500人以上の労働者数から450人×1倍(抽出率)を減じ,同数を規模100~499人の労働者数に加えるという補正が行われる。その後450人からさらに350人に雇用が減少すれば,この減少分は規模100~499人の推計比率(≒抽出率逆数,したがって1より大)により復元されるので,規模100~499人の区分の減少数は100人よりも大きく推計される。
―――――
等々力 正夫 (1979)「毎月勤労統計調査の標本事業所の抽出替えについて」『労働統計調査月報』31(8): 24-27, 32.
〔pp. 26, 27, 32から引用。強調は引用時に付加したもの〕

この記事は、調査対象事業所の集計区分を変更すると同一区分内に抽出率のちがう事業所が混在すること、にもかかわらず同一区分内では同一の集計方法を一律に適用していること、それらが集計結果に偏りを生じさせることにも言及している。この問題については、2021年12月29日の記事 でも触れた。

毎月勤労統計調査は1990年に調査方法の大きな変更をおこなったが、その際の解説記事にもつぎのようにある。

 (4) このような変更に伴って,サンプルの事業所規模が変わった際の集計上の取扱いなども変更になり,従来明確に区分されていなかった,標本事業所の管理と母集団労働者数の管理をはっきりさせることになった。
 標本事業所の管理については次のとおり。


〔……〕


 ② サンプルの集計区分の変更
 従来,サンプルの集計規模区分は一年間固定し,その間に変更があった場合は中間補正時に変更処理をしていた。改正後は,5人以上の中で 規模変更があった都度,随時,集計規模区分も変更 している。


(注) これに伴い規模別母集団労働者数も修正する。


 ただし,サンプルが規模区分の境界付近で月々変動した場合には,規模別の集計結果の月々の変動が不安定になる恐れがあるので,次のように境界線に一定の幅をもたせ,その幅をこえて別の規模区分に移った時点で集計規模区分の変更を行うこととしている。

規模区分の境界
1,000人 △50人~+50人
500 △50 ~+50
100 △10 ~+ 5
30 △ 5 ~+ 5

 (5) 母集団労働者数の管理については次のとおり。
 ① 新設・規模上昇等による母集団の補正
 毎月,5人以上事業所の新設,廃止,5人未満からの規模上昇及び5人未満への規模下降等を推計して,母集団労働者数の補正を行うこととした。


〔……〕


 ② サンプルの集計区分の変更
 〔……〕(4)の②によって,サンプルの集計規模区分を変更した場合には,推計労働者数の修正を行う。変更前の産業・規模区分の推計労働者数から変更したサンプルの本月末労働者数に抽出率〔ママ〕を乗じた値を差し引き,変更後の産業・規模区分の推計労働者数にその値を足し込む。
 ③ 翌月分の母集団労働者数
 月々,「毎勤」の集計完了後に,上記①,②の処理を施した後の推計労働者数を,翌月分の集計の母集団労働者数として用いる。
 すなわち,5人の境とした事業所の変動は雇用保険のデータを利用してとらえ,5人以上の規模間の変動はサンプルの動きから推計することとしている。
―――――
吉田 裕繁 (1990)「毎月勤労統計調査の改正について (中間報告): 改正毎勤の現状と5人以上接続指数」『労働統計調査月報』42(10): 6-20.
〔pp. 12, 13から引用。強調は引用時に付加したもの〕

現在の『毎月勤労統計要覧』にも、同様の記述がある。[2022-08-06 修正]

調査事業所の常用労働者数が変動したことにより、対象範囲の中で規模変更があった場合には、その都度、集計規模区分を変更 し、その調査事業所の規模変更に伴う規模別労働者数の変動区分を推計する。
―――――
厚生労働省 (2020)『毎月勤労統計要覧』(2019年版) 労務行政. ISBN:9784845204328
〔p. 289から引用。強調は引用時に付加したもの〕
[2022-07-25 引用文を訂正:「集計区分」→「集計規模区分」]

いずれの解説でも、

  1. 調査対象事業所の労働者数が変動した場合は、集計の時に使う規模区分を変更する
  2. その規模区分変更による労働者数の増減を、母集団労働者数の推計値に反映させる

という基本的な方針はおなじである。ただし、変更のタイミング等こまかい方法にはちがいがある。

ところが、今回の「毎月勤労統計調査の改善に関するワーキンググループ」第5回会議資料2では、

  • 調査対象事業所の労働者数が変動した場合でも、集計の時に使う規模区分は、原則として変更しない

という。これまでの公表資料とはぜんぜんちがうのである。過去に公表してきた内容がまちがっていたのだろうか。あるいは最近になって集計方法を変えたのだろうか。

母集団労働者推計の奇妙な条件設定

とりあえず、「集計に用いる層は変更しない」という設定は仮に受け入れたことにして、先に進もう。

同ワーキンググループ第5回会議資料2には、「母集団労働者数の推計は、事業所規模の変化について、可能な限り実態を反映させるよう実施する」(p. 7) とある。ある事業所の労働者数が増減した場合、上記のように、その事業所をどこの層に属するものとして集計に使うかは変更しないのが原則なのだが、しかし、その事業所が層間移動した分の労働者数については、母集団労働者数に反映させるのだ、ということである。

母集団労働者数推計についての説明は、p. 5 にまとまっている。重要なので、ページまるごと画像を掲載しておこう。


―――――
厚生労働省「毎月勤労統計調査の改善に関するワーキンググループ」第5回会議 (2022-07-22) https://www.mhlw.go.jp/stf/shingi/other-toukei_456728_00007.html
資料2 (p. 5).

https://www.mhlw.go.jp/content/10700000/000966357.pdf

この説明によれば、ある事業所 s の労働者数が増減した場合のあつかいは、「集計に用いる層」(k) によって定められた条件にしたがう。すなわち、kの各層について、前月末労働者数と本月末労働者数の条件が決めてあり、これらの条件 (A) に合致した場合に、(本月末労働者×抽出率逆数) 分の労働者が層間移動したものとするのである。これをどのように使うかというと、

  • s の集計に用いる層 k によって
  • 前月末労働者数と本月末労働者数それぞれの条件が決めてあり、
  • これらの条件 (A と呼ぶ) に合致した場合に、
  • (本月末労働者×抽出率逆数) 分の労働者が層間移動したものとする

という感じになる。

条件 (A) はつぎのような表で提示されている (上記画像参照):

増加・減少の対象となる事業所の条件

事業所規模の層 (k)
(集計に用いる層)
前月末労働者数 本月末労働者数
1000人以上 950人以上 949人以下
500~999人 450~1050人 449人以下又は1051人以上
100~499人 90~550人 89人以下又は551人以上
30~99人 25~105人 24人以下又は106人以上
5~29人 35人以下 36人以上

(https://www.mhlw.go.jp/content/10700000/000966357.pdf p. 5)

労働者数499人だった事業所がひとり増やして500人になったとしても、それで層間移動したとみるわけではなく、もっと増えて550人を超えるまでは放置しておくわけである。551人以上になってはじめて、「500~499人」層に移動したとみなして、母集団労働者数をその分だけ変化させる。

ほかの層も同様であり、上限と下限に5-10%程度の余裕を持たせた許容範囲が設定されている。この許容範囲をこえた増減があった場合に、はじめて層間移動を認める仕組みである。この基準は、上記の1990年の『労働統計調査月報』(42巻15号12頁) の「規模区分の境界」の表と同様である。

さて、労働者数499人の事業所 s が、「100人~499人」層で集計されているとしよう。この事業所 s が労働者を52人増やして551人になると、条件 (A) に該当することになり、母集団労働者数に s の移動分が反映される。

このとき、集計に用いる層 k は変更されない――ここが重要である。

翌月、s は労働者を減らし、449人になったとしよう。この場合、条件 (A) は満たされない。なぜなら

  • 事業所 s の集計に用いる層 k は「100人~499人」のままである
  • 「100人~499人」層に設定されている条件は、「前月末労働者数90~550人」「本月末労働者 89人以下又は551人以上」である
  • s の実際の値は「前月末労働者数 551人」「本月末労働者 449人」であり、両者とも条件に該当しない

からである。

このように、この事業所 s については、労働者数が499人から551人に増えたときには、その分の労働者数が「500~999人」層へ上昇移動したものとしてあつかわれるが、おなじ事業所の労働者数がその後449人まで減ったとしても、層間移動したものとはみなされず、母集団労働者数推計に反映されないことになる。

さらにこの翌月、また s の労働者数が増えて、551人になったとしよう。このときは

  • 事業所 s の集計に用いる層 k は「100人~499人」のままである
  • 「100人~499人」層に設定されている条件は、「前月末労働者数90~550人」「本月末労働者 89人以下又は551人以上」である
  • s の実際の値は「前月末労働者数 449人」「本月末労働者 551人」であり、両者とも条件に該当する

ので、「500~999人」層への上昇移動があったものとして、母集団労働者数推計に反映される。

以下、事業所 s が労働者増減を繰り返すたびに、おなじことが起きる。規模間上昇移動のみが母集団労働者数推計に反映し、下降移動は反映しない。長期的にみて s の事業所規模は増える傾向も減る傾向もないにもかかわらず、母集団労働者数においては「100~499人」規模事業所を減らして「500~999人」規模事業所を増やす方向に作用する。

需要の季節変動が大きい事業では、忙期に人手を増やし、閑期には減らすことがよくある。そうした理由で毎年おなじような労働者数変動を示す事業所の場合、増加か減少のどちらか一方だけが毎年母集団労働者数推計に反映し、他方はまったく反映しないことになってしまう。どちらが反映するかは、調査開始時点が忙期であるか閑期であるかによるだろう。調査開始はふつう1月 (第二種事業所の一部は7月) だから、それが忙期にあたる産業では小規模事業所が過大に、閑散期にあたる産業では大規模事業所が過大にカウントされる。それらの集積が、全産業を合計した数値の動きにどんな影響をあたえるかは、相当に複雑なものになっているはずだ。

資料2が説明する母集団労働者数推計の方法は、調査開始時に設定された層 k からの流出だけを層間移動としてカウントする仕様になっているのである。どうしてそんなことになるかといえば、条件 (A) を設定するキーとなる k を変更しないからだ。当該事業所の実際の労働者数が k に対応する労働者数の許容範囲から外れてしまっても、k は変更されないから、その状態でどのように労働者数が増減しても条件 (A) には該当しない。したがって推計母集団労働者数には反映しないのである。

この方法では、「事業所規模の変化について、可能な限り実態を反映させる」ことはできない。たとえば上記のような毎年同様の季節変動を繰り返す産業では、忙期の労働者増または閑期の労働者減のどちらかだけが反映するから、推計母集団労働者数の分布は、時間とともに実態から大きく乖離していくことになる。

資料が間違ってるのでは?

さて、

  • 集計に用いる層は原則として変更しないが
  • 事業所規模の変化は可能な限り実態を母集団労働者数推計に反映させる

という原則を忠実に実現する方法を考えるのであれば、

 「集計に用いる層」とは別に「母集団労働者数推計に用いる層」を設定する

のが自然な発想といえる。

上の例でいうと、「100人~499人」層で集計されている事業所 s の労働者数が551人まで増加すると、「500人~999人」層に移動したものとして母集団労働者数が推計される。しかし「集計に用いる層」(k) は変化しないので、依然として s は「100~499人」層に属しているものとして条件判定される――というのが問題であった。そこで、この時点で s は母集団労働者数推計に関しては「500人~999人」層に移動したものと考え、k とは別の変数にそれを記録する。この変数を「母集団労働者数推計に用いる層」と呼び、h であらわすことにしよう。

資料2 p. 5で「集計に用いる層」(k) を指す部分のうち、右下の点線囲み部分 (【事業所規模の層について】) 以外は、すべてこの「母集団労働者数推計に用いる層」(h) に置き換えることができる。これらを置き換えるほか、<事業所規模の変更手順>の第3段階として、

 ③ 条件 (A) に該当する事業所の「母集団労働者数推計に用いる層」を、当該事業所の本月末労働者数から判定した事業所規模に、翌月から変更する

を追加しよう。

こうすれば、上記のような無茶苦茶さはなくなる。つまり、母集団労働者数推計のために設定した許容範囲 (条件A) をこえて労働者数が増減した事業所については、その分を母集団労働者数に反映するとともに、その事業所の「母集団労働者数推計に用いる層」(h) も変更する。条件 (A) も k ではなく h にしたがって定めるよう置き換えられているとすれば、条件判定は変更された h によることになり、その事業所の労働者数が許容範囲を超えて増減したときには母集団労働者数推計に反映するのである。

このように考えてくると、資料2 p. 5 は単に書き間違えなのではないかと思えてくる。毎月勤労統計調査の集計プログラムは、実はこうして「母集団労働者数推計に用いる層」(h) を管理し、それにしたがって母集団労働者数推計を毎月おこなっているのではないか。ところが資料2の作成者はそれを理解しておらず、「集計に用いる層」と「母集団労働者数推計に用いる層」を混同して頓珍漢なことを書いたのではないか。

とはいえ、資料2の p. 5 に出てくる「集計に用いる層」を全部「母集団労働者数推計に用いる層」に置き換えると、別の問題が出てくる。このページには「抽出率逆数は、事業所sの属する層(集計に用いる層)のものを用いる」とも書いてあるからだ。この「集計に用いる層」(k) を「母集団労働者数推計に用いる層」(h) に置き換えてしまうと、h を変更するたびに、母集団労働者数推計に使うウエイトが変わることになる。

これでは結局、2021年12月29日の記事 で指摘したのとおなじ問題が起きる。隣接する層間で同一事業所が往復移動を繰り返すと、抽出率の低い層から高い層に向かって (データ上の) 労働者数の流出が起き、推計母集団労働者数は実態から乖離していくことになる。

ある産業の500-999人規模事業所は全数抽出 (抽出率=1/1)、100-499人規模事業所は1/4の抽出率だとしよう。抽出されたなかにちょうど500人規模の事業所があったとする。この事業所の抽出率は1/1である。


しばらくして、この事業所の労働者がひとり辞め、499人になったとする。そうすると、この事業所は100-499人の規模区分に移動することになり、その分の労働者数に対応する249.5人を、500-999人規模の推計母集団労働者数から減らして100-499人規模に加える。なぜ499人ではなくその半分の人数になっているかというと、ここで「補正の適用度合い」という謎の係数 L = 0.5 をかけるからなのだが、これについてはここでは突っ込まない。


ここで移動が終わり、この事業所がずっと100-499人規模区分にとどまれば、それでたいして問題はない。問題が大きくなるのは、この事業所が再び人数を増やして500-999人規模に戻ったときである。ひとり増えて500人になったとすると、その分を推計母集団労働者数に反映させるのだが、そこで、4倍のウエイトをかけてしまう。つまり、500×4×0.5 = 1000 人分を、100-499人規模の推計母集団労働者数から減らして500-999人規模に加えている。この間に起こったことは、ひとつの事業所の労働者数が1人減ったあと、1人増えて元に戻ったということである。ところが、推計母集団労働者数は元に戻らない。1000 - 249.5 = 750.5人分が、100-499人規模から500-999人規模に移動してしまっていることになる。


こういうことが起きるのは、移動するたびにウエイトを変えているからだ。500-999人規模にいるときはその規模区分に割り当てられた抽出率逆数=1を使い、100-499人規模にいるときは抽出率逆数=4を使うので、上昇移動のときに移動させる人数は、下降移動のときの4倍になってしまうのである。


正しい推計にする方法は簡単であって、標本抽出時の抽出率を常に使うようにすればよい。
―――――
田中重人 (2021-12-29)「毎月勤労統計調査、抽出率逆数の扱いを2018年1月から改悪していたことが判明」.

https://remcat.hatenadiary.jp/entry/20211229/wg3

今回のワーキンググループ資料2では、層間移動を認める境界に5-10%程度の余裕を持たせた許容範囲を設定しているので、この引用とは条件がちがう。とはいえ、数十人以上の増減が起こった場合には、この引用で描写したのとおなじ現象が起きる。2021年10月9日の記事 以来論じてきた通り、毎月勤労統計調査の推計母集団労働者数にはセンサス・データからの大きな乖離があり、それは層間移動事業所のあつかいに起因するとみられる。抽出率の低い層から高い層に向かって労働者数が流出しているためだと考えると、この乖離をよく説明できる。また各種資料の記述とも矛盾しないのである。

問題点と提言

以上の検討から、第5回「毎月勤労統計調査の改善に関するワーキンググループ」資料2の問題点は、つぎのようにまとめることができよう。問題点に対応するために何をすればよいかもあわせて提言しておく。

  1. 「集計に用いる層は変更しない」という資料2の説明は、毎月勤労統計調査に関する従来の説明と矛盾する。従来の説明が間違っていたのであれば、それらを訂正すべきである。最近になって方法を変えたのであれば、そのことを周知するとともに、いつ変えたのか、そのためにデータにどのような変化が生じているかをあきらかにすべきである。
  2. 母集団労働者数推計の際の層間移動の判定条件を「集計に用いる層」に基づいて定めたのでは、実態を反映した推計にはならない。もし資料2のこの記述が正しいとしたら、推計方法がおかしいのであり、即刻是正すべきである。一方、資料2の記述が間違っているのだとすれば、その記述を訂正した資料を公開すべきである。

つづき:

追記:第5回「毎月勤労統計調査の改善に関するワーキンググループ」資料2
https://remcat.hatenadiary.jp/entry/20220806/wg5plus

履歴

2022-07-24
記事公開
2022-07-25
『毎月勤労統計要覧』(2019年版) からの引用文中で「集計区分」となっていた箇所を「集計規模区分」に訂正
2022-08-06
「現在の『毎月勤労統計要覧』にも、同様の記述がある」となっていた箇所から「現在の」を削除 (この件に関しては 別に説明記事を書きました)。「つづき」 を追記。