remcat: 研究資料集

(TANAKA Sigeto)

2003年以前の毎月勤労統計調査抽出率偽装問題

2019年1月22日、厚生労働省「毎月勤労統計調査等に関する特別監察委員会」の報告書が提出された。 厚生労働省のウエブサイトで概要と全文が読める。

いろんなことが書いてあるなか、いちばん衝撃的なのは、東京都大規模事業所不正抽出がはじまった2004年よりも前から、同様の手法を全国でとっていたという新事実である。

2003年まで使われていたという「これまでの集計方法」について

この話が載っているのは報告書の15ページ。2004年から東京都の500人以上規模の事業所を一部抽出すると決めた当時の担当係長の、つぎの発言についての説明部分である。

東京都の規模500人以上の事業所について抽出調査が導入された平成16(2004)年頃に担当課である統計情報部雇用統計課の担当係長は、ヒアリング調査において抽出調査の導入の理由について「平成16(2004)年から これまでの集計方法 をやめることとしたが、それだけだと都道府県の負担が増えてしまうので、その調整という意味でも(東京都の規模500人以上の事業所に限り)抽出調査とすることとしたように思う。」旨述べている。
-----
毎月勤労統計調査等に関する特別監察委員 (2019-01-22)「毎月勤労統計調査を巡る不適切な取扱いに係る事実関係とその評価等に関する報告書」 p. 15
強調 は引用者による〕

https://www.mhlw.go.jp/content/10108000/000472506.pdf

この発言中の「これまでの集計方法」なるものについての説明が以下である。

○ なお、これまでの集計方法とは、規模30人以上499人以下の事業所のうち、抽出されるべきサンプル数の多い地域・産業について、一定の抽出率で指定した調査対象事業所の中から、半分の事業所を調査対象から外すことで、実質的に抽出率を半分にし、その代わりに調査対象となった事業所を集計するときには、抽出すべきサンプル数の多い地域・産業について その事業所が2つあったものとみなして集計する 方式であり、全体のサンプル数が限られている中、全体の統計の精度を向上させようとしたものである。
○ この手法により得られる推計結果は、抽出率に基づき復元を行っているのと同程度の確からしいものと考えられ、標準誤差にゆがみが発生する可能性はあるが、平均値に関しては大きな偏りはなく、給付等に影響を及ぼすこともない。しかしながら、こうした手法は当時公表さ れることなく行われており、統計調査方法の開示という観点からは不適切と言わざるを得ない。
-----
毎月勤労統計調査等に関する特別監察委員 (2019-01-22)「毎月勤労統計調査を巡る不適切な取扱いに係る事実関係とその評価等に関する報告書」 p. 15
強調 は引用者による〕

https://www.mhlw.go.jp/content/10108000/000472506.pdf

一部の地域・産業では、調査対象として抽出した事業所のうち半分を捨てて残り半分だけを調査していたという。記述内容から、2003年よりも前からそうしていたことがわかる。いつからはじめたかは報告書には書いていない。

「その事業所が2つあったものとみなして集計する」という手続きの具体的内容はよくわからない。そのあとに「この手法により得られる推計結果は、抽出率に基づき復元を行っているのと同程度の確からしいもの」とあるので、すくなくとも抽出率に基づき復元を行ったのでないことは確かであるが。

たとえば、調査した事業所の労働者数や給与額などの数値を、調査しなかった事業所のところにコピーして、ちがう事業所のデータが2件あったように見せかけたのかもしれない。この場合、実際には調査していない調査対象のデータをつくりあげているわけだから、データの捏造である。

例えば、1万人の状況を知るために1000人を無作為抽出してその1000人に調査する。これは標本調査。統計として普通にあること。
けれど、1000人を無作為抽出して調べたと称しつつ、実際にはそのうち500人だけ調査して、1人の回答を2倍にコピペして1000人調べたかように装う、これは調査不正。
-----
上西 充子 (2019-01-23) 本件に関するツイート

https://twitter.com/mu0283/status/1087840614010433537

あるいは、単純にコピーして2件分に水増しして、計算用にだけ使うデータをつくった可能性もある。

いずれにせよ、公表されている「抽出率」とは実質的にちがう抽出率を適用して調査していたことになる。この調査の結果を報告する『毎月勤労統計要覧』には抽出率の表が毎年載っているのだけれど、この表は実態を反映していない無意味なものだったわけだ。たとえば『要覧』平成14年版の「事業所抽出率表 (第一種事業所)」によると、「不動産業」の規模100-499人の事業所は 1/2 を抽出したことになっている。しかし、実際に調査した事業所の率という意味では、これは本当はもっと小さい値だったかもしれない。


-----
厚生労働省 (2003)『毎月勤労統計要覧』(平成14年版) p. 251. ISBN:4845231492

このように、公表されている抽出率は、本来のものとはちがう。要するに、改ざんした数値を報告していたのである。

この件に関する監察委員会の評価

さて、この件について、監察委員会はどう評価していただろうか? 報告書本文は先に引用したとおりだが、この報告書には1ページの「概要」もついている。この概要の記載内容を読むと、本文とはすこし内容がちがうので、まずそれを紹介しておきたい。

・〔2004年における〕抽出調査の開始時には、規模30人以上499人以下の事業所についての平成15(2003)年までの集計方法の廃止※に伴う調査対象数の増加の抑制に配慮。
※全体のサンプル数が限られている中、標本数の多い特定の地域・産業の実質的な抽出率を半分にし、他を増やすことによって 同程度の確からしさが得られる手法。
-----
毎月勤労統計調査等に関する特別監察委員 (2019-01-22)「毎月勤労統計調査を巡る不適切な取扱いに係る事実関係とその評価等に関する報告書(平成31年1月22日)概要」
〔 〕は引用者がおぎなったもの

https://www.mhlw.go.jp/content/10108000/000472509.pdf

「平成15(2003)年までの集計方法の廃止」というのは、本文中で「これまでの集計方法をやめることとした」と書いていた部分に対応するものだろう。そこに※で注釈をつけ、「特定の地域・産業の実質的な抽出率を半分にし、他を増やす」ことで「同程度の確からしさが得られる」と述べている。これは、地域・産業で細かく設定した層別の標本の割り当てを最適化することで標本誤差の増加を抑制する、という意味にとれる。

一方、本文での説明には、層別の標本の割り当てを最適化する、と解釈できる部分はない。本文に書いていないことが「概要」に書いてあるというのは、こまったものである。また、本文では「全体のサンプル数が限られている中、全体の統計の精度を向上させようとしたものである」とあり、概要での「同程度の確からしさが得られる」よりも積極的な評価になっているように読める。

だいたい、厚生労働省がこの時期にやっていたのは、一部の調査対象について抽出率を実質的に半分にするということなのだから、基本的に標本設計の問題だ。それを「集計方法」などと呼んでいること自体がおかしい。また、そもそもこの時期までにサンプルがちいさくなってしまっていたのは、総計33,200事業所を調査するとなっていた本来の標本設計を守らずに事業所数を削減してきたから (報告書 p. 6)。勝手にサンプルを減らしてきた結果だというのに、「全体のサンプル数が限られている中」とはなんという言い草か、とは思う。

あとは、平均値について「大きな偏りはなく」という監察委員会の微妙な表現には注意しておくべきであろう。偏りがないとは言い切れない、という含みを残した表現である。調査対象事業所の半数を捨てる作業が無作為抽出でなかった可能性はあるのだと思っておいたほうがよい。

と、いろいろ文言に引っかかるところはあるのだが、いちおう、監察委員会の評価としては、当時、この「これまでの集計方法」をとったことによって、精度が向上した――あるいは、精度が低下することはなく、同程度の「確からしさ」を確保できていた――ということのようである。

「標本誤差率」の実勢

この評価は、データに照らしてまちがっている。毎月勤労統計調査の過去の資料を集めてくれば、この調査の精度が2003年までに極端に悪化していたことがわかるからである。

以下の画像は、『毎月勤労統計要覧』各年版から、「標本誤差率」の表をコピーしたもの (私の書き込みが入っていて読みにくいのはご容赦願いたい)。「標本誤差率」とは毎月勤労統計調査独特の用語で、全国の多数の事業所から一部をサンプリングして調査した結果について、どの程度の標本誤差を見込めばいいかの評価基準として2006年まで使われていたものである。定義は この記事の末尾 に示す。なお、2007年以降現在まで使われている「標準誤差率」とはかなり大きくちがう値になるので、その点注意されたい。また、一連の不祥事の性質を考えれば、この数値を信用していいのかどうかも不安なところである。


-----
厚生労働省 (2003)『毎月勤労統計要覧』(平成14年版) p. 258. ISBN:4845231492


-----
厚生労働省 (2005)『毎月勤労統計要覧』(平成16年版) p. 272. ISBN:484524232X

2001年には、全体の標本誤差率は0.35%であった。これが、2003年には0.65%に上昇している。わずか2年で1.86倍になっているのであり、調査の統計的な精度はあきらかに低下している。ちなみに2000年以前は、1990年までずっと0.35%程度の水準だった。高くなっているのは、2002年 (0.43%) と2003年の数値だけである。このことから、監察報告書でいう「これまでの集計方法」なるものは、2002-2003年の2年間しか使っていなかったのではないかと思う。

この標本誤差率の値の推移からみて、厚生労働省がこの時期にとっていた手法が調査の精度を高めたと考えるのは無理というもの。事実は逆で、そのような手法が、毎月勤労統計調査の精度を急激に低下させたと考えておくべきであろう。

「標本誤差率」とは、おおむね、標準誤差を平均値で割った値である。この値が0.65%だということは、毎月勤労統計の「きまって支給する給与」平均値は、その上下に1.27% (=1.96×0.65%) くらいの信頼区間をとって解釈しなければならない (信頼率を95%に設定した場合)。今般、2004年以降の平均値がたった0.6%過小推定になっただけで大騒ぎになっているわけである。2003年においても、これと同程度かそれ以上推定値がはずれていたおそれは、じゅうぶんあると考えなければならない。調査が実際に達成した精度を検討することもなく「平均値に関しては大きな偏りはなく、給付等に影響を及ぼすこともない」と述べた監察委員会の無責任さは、末代まで語り継ぐべきものといえよう。

付録:毎月勤労統計における「標本誤差率」の定義

当時の『毎月勤労統計要覧』によれば、「標本誤差率」はつぎのように定義されていた。


-----
厚生労働省 (2006)『毎月勤労統計要覧』(平成17年版) pp. 288-289. ISBN:4845261545

ここでいう「標本誤差率」とは、サンプルから計算される変動係数に基づいて、推計値のばらつきを推測するものである。産業と事業所規模によって設定した層について個別に求める (②の部分)。29人未満規模の事業所 (第二種事業場) はそれ以上の規模の事業所 (第一種事業所) とはちがってサンプリング方法が複雑 なので、式もそれに対応した複雑なものになっている。複数の層をまとめたときの標本誤差率を知りたいときは、各層の労働者数Wで重みづけて集計する (①の部分)。

今回問題になっているのは、実際のサンプリングが公称の手続きにしたがっていなかったということである。したがって、この定義式で表わされる方法では「標本誤差率」の正確な値が求められないことになるので、その点は注意されたい。

なお、この「標本誤差率」が使われていたのは2006年までであり、2007年以降は「標準誤差率」が報告されるようになった。そちらの定義式は https://www.mhlw.go.jp/toukei/itiran/roudou/monthly/dl/maikin-chousa-seido.pdf などで読むことができる。ちがいがあるのは、複数の層をまとめる場合の重みづけに、労働者数Wだけでなく、その層の平均給与と全層まとめたときの平均給与との比Rをあわせて使うようになったところ。毎月勤労統計は2007年以降はこちらの「標準誤差率」を使っており (値はかなり小さめに出ている)、それ以前の「標本誤差率」とは比較可能でない。

続報 [2019-01-25追記]

実際にどの程度のサンプルが捨てられていたか、 https://remcat.hatenadiary.jp/entry/20190125/maikin2003 で検証しました。