remcat: 研究資料集

(TANAKA Sigeto)

毎月勤労統計調査問題 情報アップデート

厚生労働省「毎月勤労統計調査」の問題についての疑問点を1月12日 https://remcat.hatenadiary.jp/entry/20190112/1547294783 に書いたあと、1月17日開催の 第130回統計委員会 資料が公開されました。そのほかの報道や、自分でいろいろ調べた結果も加えると、答えがある程度わかります。

(毎月勤労統計調査のサンプリングや推計の方法については、 1月14日の記事 https://remcat.hatenadiary.jp/entry/20190114/Maikin を参照。)

東京都の500人以上規模の事業所のサンプリングの問題

(A) サンプリングは何度おこなったのか

答: 6回

第130回統計委員会に、厚生労働省が資料2-2「毎月勤労統計において全数調査するとしていたところを一部抽出調査で行っていたことについて (追加資料)」(http://www.soumu.go.jp/main_content/000594893.pdf) を提出しています。この資料 p. 1 によると、東京都の500人以上規模の事業所のサンプリングは、2004、2007、2009、2012、2015、2018年の6回おこなわれたことがわかります。

なお、この資料によれば、500人未満規模の事業所についても、東京都だけ、他の道府県とはちがう抽出率にしていた場合があるそうです。

(A1) 定期的なサンプル入替の際、また昨年からのローテート・サンプリング方式導入の際にはどうしたのか

上記の6回のうち、2015年までの5回は、第一種事業所の定期的なサンプル入替時期と一致しています。ほかの規模の事業所を入れ替えるのとおなじタイミングでサンプリングしていたようです。

2018年からは、第一種事業所 (全数調査層以外) は、毎年一部ずつサンプルを入れ替えていく方式 (ローテーション・サンプリング) に移行しました。2015年に抽出した事業所のうち半分は2018年1月まで、のこり半分は2019年1月まで、という風にして、すこしずつ調査対象を切り替えていく方式です。

東京都の500人以上規模事業所でもおなじ方式なのだろうと想像はできますが、それは明言されていません。またこのローテーション自体、実際にどうやって実施しているのか、実態がよくわかりません。

実は、厚生労働省は2019年1月から、東京都以外に、神奈川県・愛知県・大阪府でも、500人以上規模事業所を一部抽出にしようとしていて、2018年6月にこれらの府県に「指定予定事業所名簿」を送付して調査準備を依頼していました。この名簿そのものは公開されていませんが、その付属文書が http://otsuji.club/blog/?p=976 で公開されています。この文書から判断するに、抽出の作業は厚生労働省で済ませていて、500人以上規模の事業所とそれ以外の規模の事業所の両方の名簿が一緒に送られていたようです。

全体的にこのようなやりかたなのだとすると、

  • すでに調査対象となっていた事業所のうち、どれを2019年1月までで終了する事業所としてどれをそれ以降も継続する事業所とするかを決める
  • 調査を終了する事業所のかわりに2019年1月からあたらしく加える事業所を選ぶ

という作業を厚生労働省でおこない、それを6月になって自治体に通知したわけであり、各自治体がそのあとで各事業所へ連絡したことになります。つまり、2015年1月に調査を開始したときには、調査終了時期が2019年1月なのか2020年1月なのかは、まだわからない状態だったわけです。のこり半年を切る時点まで終了時期を知らせないのは調査協力者への礼儀としてどうなのかという感じがしますが、そういうものなのでしょうか。

(A2) 脱落事業所の補充はどうしていたのか

調査対象の事業所が調査期間内に廃止になってしまった場合、別の事業所を追加することになっているのですが、これをおこなっていたのかも明言されていません。まあふつうに考えれば、ほかの規模の事業所とおなじようにやっていたのでしょうけれど。

(B) サンプリングの具体的な方法

(B1) 無作為抽出だったのか

毎月勤労統計調査の対象となる第一種事業所 (30人以上規模) のサンプリングでは、まず企業規模の3区分と産業分類による区分を掛け合わせて「層」を設定し、これらの層別に設定した抽出率にしたがって抽出をおこないます。このときに各層内で具体的に事業所をえらんでいくやりかたについて、第130回統計委員会 資料2-2 はつぎのように説明しています。

抽出単位となる区分毎に都道府県番号、産業区分(小分類)などの項目順に事業所を並び替えた後、抽出率逆数(R)以下の初期値(z)を無作為に定め、z番目、z+R番目、z+2R番目、z+3R番目、・・・の事業所を抽出している。
※ ただし、抽出事業所が現行の指定事業所である場合は、調査負担の軽減を図る観点から、ソート順において1つ後の事業所に代替する措置を行っている。
-----
厚生労働省 (2019-01-17)「毎月勤労統計において全数調査するとしていたところを一部抽出調査で行っていたことについて (追加資料)」(第130回統計委員会 資料2-2) p.1

http://www.soumu.go.jp/main_content/000594893.pdf

これは一般に「系統抽出」あるいは「等間隔抽出」と呼ばれるやりかたです (https://www.nikkei-r.co.jp/glossary/id=314 など参照)。

  1. まず、抽出元となる事業所をぜんぶならべたリストを用意する
  2. 抽出間隔を決める (上の例では抽出率の逆数にしている。たとえば抽出率 1/4 の層では、4とする)
  3. 最初のひとつを無作為に決める
  4. そこから、リストに並んでいる順に数えていって、抽出間隔ごとに抽出していき、設定した数の事業所が抽出できるまでつづける

これは完全に無作為に選んでいるわけではありませんが、リストの周期性が抽出間隔と同調せず、リストの全体を最初から最後までカバーするように抽出できるなら、実質的に無作為抽出だとみなしてよいものです。

(B2) 産業による層化をおこなっていたのか

答:おこなっていた。

http://www.soumu.go.jp/main_content/000594893.pdf 2ページに抽出率の逆数の表が載っています。これによると、たとえば「P83 医療業」では 1/12 の抽出率になっています。常用労働者が500人を超えるような大病院がたとえば60あったとすると、調査対象とするのはそれらのうち5つだけだということです。一方で、「E22 鉄鋼業」など、多くの産業では抽出率は1となっており、全数を調査するという内容です。

ただしこれは平成27年 (2015年) の調査のためのものであり、2004年や2007年などにも同様の層別で抽出率を設定していたかはわかりません。2019年からの調査のための対象事業所抽出率 (の逆数) は http://otsuji.club/blog/?p=976 の資料にも載っているのですが、そこでは2015年のときとはちがう抽出率になっています。

ここで注意しておきたいのは、事業所規模による層の分割をしていないことです。毎月勤労統計調査で結果を推計 (母集団復元) する際には、事業所規模は

  • 5 - 29人
  • 30 - 99人
  • 100-499人
  • 500-999人
  • 1000人以上

の5つに区分します。つまり、500人以上規模の事業所はふたつに区分 (「500-999人」と「1000人以上」) したうえで産業別にわけて「層」別の推計に使うのですが、この推計方法に対応したサンプリングになっていないのです。このようにして抽出した場合、1000人以上規模の事業所と500-999人規模の事業所それぞれから抽出される割合が (偶然によって) 大きくちがったものになってしまうおそれがあります。

(B3) 抽出率はどのようにして決めたのか

抽出率の決めかたはよくわかりません。おそらくは、産業別の事業所数をにらんで、統計量を推定するときの誤差が小さくなるように決めていると思いますが……

(B4) ずっとおなじ方式でサンプリングしてきたのか

上記の系統抽出のやりかたの説明には年次の限定はついていないので、サンプリングの方式は2004年以降変えてはいないのだろうと思います。ただ、「層」のわけかたや抽出率は変えているはずです。

母集団復元の問題

(C) 母集団の復元は具体的にどのようにおこなったのか

(C1) 2018年1月以降の公表値では東京都の500人以上規模事業所の母集団への復元がなされていたと報じられているが、それは具体的にどういう方法でおこなったのか

答:不明

(C2) それは2012年以降のデータについて今回再集計したのとおなじ方法か

答:不明

(C3) プレスリリース「毎月勤労統計調査において全数調査するとしていたところを一部抽出調査で行っていたことについて」には、2018年の数値についても「再集計値」が載っているが、これはなぜか。

答:不明

これらの問題は、いまのところ答えがわかりません。集計のためのプログラムがどういう処理をするようになっていて、そのためのデータがどういう構造になっていたのかがわからないとなんとも。

共同通信の1月20日の記事 https://this.kiji.is/459621198184596577 によると、「調査結果に統計上の処理を施すプログラムは、厚生労働省の職員が手作業で修正を繰り返していた」とのことです。何十年も前に書かれたプログラムを、その後の担当者がその場しのぎで修正することを繰り返してきたのだとすると、とんでもなく複雑なものになってしまっているのかもしれません。

(D) 平均給与の過小推定の割合が時期によって違うが、これはなぜか

答:不明

毎月勤労統計調査の精度

(E) 今回あきらかになったことに基づいて標本誤差率を計算しなおすとどうなるか

答:不明

http://www.soumu.go.jp/main_content/000594893.pdf 4ページには「公表していた誤差率に影響はない」とあるのですが、これは「調査対象事業所数は公表資料よりも概ね1割少なくなっていた」という、東京都での不正抽出調査とは別の問題についての説明です。「公表していた誤差率」としては、たとえば2016年7月の結果による「きまって支給する給与」の「産業、規模別標準誤差率」の表が https://www.mhlw.go.jp/toukei/itiran/roudou/monthly/dl/maikin-chousa-seido.pdf に載っています。この表には「規模500人以上は全数調査」という注釈がついており、これは、規模500人以上は標準誤差率はゼロである、という意味です。

今回、規模500人以上の事業所も実際には全数調査ではなかったということが発覚したのですから、標準誤差率はゼロではなく、誤差があったものとして計算しなければなりません。さらに、他の事業所規模の層とまとめて「規模30人以上」「規模5人以上」などの誤差率を推定しているところの値もちがうはず。つまり、2003年以降の公表資料における誤差率の表はすべて訂正しなければならないことになります。

(F) 「全数調査にしなくとも精度が確保できる」という手引があったと伝えられているが、この手引きの主張に根拠は示されていたのか

答:示されていなかった

この手引については、共同通信の1月17日の記事 https://this.kiji.is/458315270054233185 に写真が載っています。そこから読みとれる限りでは、単に「全数調査にしなくとも精度が確保できる」と書いてあるだけで、根拠の記述はありません。

(F1) そもそも毎月勤労統計調査に必要な精度はどの程度のものか

答:調査全体についての精度の基準はないようだが、企業規模と産業分類による標本誤差の目標値が「きまって支給する給与」についてあたえられている

具体的には、 https://www.mhlw.go.jp/toukei/list/dl/30-1d-01.pdf によると、

  • 500人以上ではゼロ
  • 5-29人, 30-99人, 100-299人の各区分について、産業大分類で区分した各層で2%、産業中分類で区分した各層で3%

というのが目標精度です。このPDFファイルではこれ以上のことがわからないのですが、厚生労働省が毎年発行する 『毎月勤労統計要覧』 の最新版である平成29年版 (2016年の調査結果) によれば、この目標精度があらわすのは「標本誤差」だということがわかります。

標本設計は、常用労働者一人平均月間きまって支給する給与の標本誤差が、産業、事業所規模別に一定の範囲となるように行っている (第2表)。
-----
厚生労働省 (2018)『毎月勤労統計要覧』(平成29年版) 労務行政. ISBN:9784845282746.
286ページ

このあとに出てくる「第2表 目標精度」は、https://www.mhlw.go.jp/toukei/list/dl/30-1d-01.pdf の「表1」とおなじ内容です。

さて、この「標本誤差」をどうやって計算するかが問題なのですが、実は『毎月勤労統計要覧』には「標本誤差」の計算方法の説明がありません。調査結果の精度を示すのに使っているのは「標準誤差率」であり、こちらは https://www.mhlw.go.jp/toukei/itiran/roudou/monthly/dl/maikin-chousa-seido.pdf にあるのとおなじ定義式が載っています。

ちなみに「標本誤差率」ということばもあり、こちらは2006年までの毎月勤労統計調査で使われていました。当時の『毎月勤労統計要覧』によると、各層の誤差率を求めるところまでは現在使われている「標準誤差率」とおなじ定義 (たぶん) なのですが、複数の層をまとめる場合に、給与のシェアによる重みづけをおこなわないところがちがいます。2006年までは「標本誤差率」が使われていて、0.4%強の値で推移していたのですが、2007年以降は精度の評価に「標準誤差率」が使われることになって、0.2%以下の値に急減しました。どうやら、「標準誤差率」のほうが「標本誤差率」より精度が高く出るらしいのです。

というわけで、いちおう精度の目標はあるようなのですが、それはどう計算するのか、すでに公表されている数値とどう対応させて評価すればいいのかは、よくわからない状態です。