remcat: 研究資料集

(TANAKA Sigeto)

あきらかにすべきことのリスト (労働時間等総合実態調査 (2013) の謎)

「労働時間等総合実態調査」(2013) について、厚生労働省から今日 (2月19日) 説明がなされることになっている。また、野党による 「働き方改革虚偽データ疑惑」ヒアリング もおこなわれている (これまでに3回開催)。前回の記事 https://remcat.hatenadiary.jp/entry/20180214/heikinteki を書いた時にはよくわからなかった、この調査をめぐる情報が、すこしずつあきらかになってきている。

今回の記事では、まだよくわかっていない(あるいは見当はつくものの証拠がない)疑問4点をとりあげる。

  • (A) 「平均的な者」とは「最も多くの労働者が属すると思われる時間外労働時間数の層に属する労働者」という定義でよいか。この定義は裁量労働制の労働時間の状況にも適用されるのか。
  • (B) 労働時間記録等の確認作業は全事業場でおこなったのか、一部だけか。一部だけとすれば、どのようなケースで、どれくらいの割合か。
  • (C) 「一般労働者」の1日の法定時間外労働のデータには、階級わけしたうえで一定の階級値を機械的にあてはめた数値が混在していると推論できるが、そのような理解でよいか。
  • (D) 「母集団に復元」するためのウェイトはどのように算出したか。また、表側のカテゴリーのなかで、サンプル中で過大/過小に代表されていたものはどれか

(A) 「平均的な者」とは

この調査で使われている「平均的な者」という概念について、前の記事では次のように書いた。

具体的には、おそらく、適当なカテゴリーにわけた選択肢を見せて「おたくの従業員中でいちばん多くが該当するのはどれですか」のようなことをたずねたのだろう。
-----
田中 重人 (2018-02-14) 「「平均的な者」の「1日の法定時間外労働の実績」平均とは何か」

https://remcat.hatenadiary.jp/entry/20180214/heikinteki

これは、『平成25年度労働時間等総合実態調査結果』 p. 7 にあったつぎの記述を根拠としている。

5 時間外労働・休日労働の実績
※この項の「最長の者」とは、調査対象月における月間の時間外労働が最長の者のことをいい、「平均的な者」とは、調査対象月において最も多くの労働者が属すると思われる時間外労働時間数の層に属する労働者のことをいう。
-----
厚生労働省 労働基準局 (2013)『平成25年度労働時間等総合実態調査結果』 p. 7

http://www.mhlw.go.jp/file/05-Shingikai-12602000-Seisakutoukatsukan-Sanjikanshitsu_Roudouseisakutantou/shiryo2-1_1.pdf

私は、当初、この定義は、この調査全体についてあてはまるのだろうと考えていた。しかし、よく読むと、定義の前に「この項の」という限定がついている。この限定を厳密にとれば、この定義は「5 時間外労働・休日労働の実績」(これは「一般労働者」についての項である) のみで通用するものであり、それ以外のところでは別の定義になっているという解釈ができる。

そして、裁量労働制の労働時間の状況などについて述べる 第7項「裁量労働制」では、この「平均的な者」は定義なく使われている

7 裁量労働制
……
3) 労働時間の状況
(2) 企画業務型裁量労働制 (最長の者及び平均的な者) (表51、52)
労働時間の状況として把握した時間の1日の平均時間は……平均的な者においては9時間16分……となっている。
-----
厚生労働省 労働基準局 (2013)『平成25年度労働時間等総合実態調査結果』 p. 11

http://www.mhlw.go.jp/file/05-Shingikai-12602000-Seisakutoukatsukan -Sanjikanshitsu_Roudouseisakutantou/shiryo2-1_1.pdf

実際、2月15日の衆議院予算委員会において、厚生労働省からつぎのように説明があった。

一般労働者につきましては、調査をいたしました事業場ごとに、事業者が調査対象月におきまして最も多くの労働者が属すると思われる時間外労働時間数の層に属する労働者として選んだ労働者でございます。
それから裁量労働制につきましては、調査した事業場ごとに、事業者が法に規定する労働時間の状況として把握した時間が平均的な者として選んだ労働者、ということで調査をしているところでございます。
-----
衆議院インターネット審議中継 (2018-02-15) 予算委員会 1:07:05 から。
逢坂誠二 (立憲民主党・市民クラブ) に対する山越敬一 (厚生労働省労働基準局長) 答弁

http://www.shugiintv.go.jp/jp/?ex=VL&deli_id=47787

一般労働者の調査では最頻値の階級に属する人を「平均的な者」としているのに対し、裁量労働制の場合には「労働時間の状況として把握した時間が平均的な者」を指しているのであるから、ちがう定義が使われているという答弁である。

正規分布のように左右対称でピークがひとつの分布であれば最頻値と平均値は一致する。しかしそうでなければ、これらのふたつの統計量はちがう値になるのがふつうである。たとえば、6人の労働者がいる事業場で、労働時間が8時間の者が3人、9時間、10時間、11時間の者がそれぞれひとりずつの場合を考えよう。この場合、最頻値は8時間であるが、平均値は9時間である。

労働時間等総合実態調査による結果の表ではどちらも「平均的な者」と表章されていて、おなじ基準で選ばれたかのようにみえるのだけれども、実際にはちがう基準で選んだ労働者をくらべていたことになる。


-----
http://twitter.com/yamanoikazunori/status/963234256439750656 から作成。赤線は引用時に加筆したもの。


-----
厚生労働省 労働基準局 (2013)『平成25年度労働時間等総合実態調査結果』 p. 68 表52。赤線は引用時に加筆したもの。

http://www.mhlw.go.jp/file/05-Shingikai-12602000-Seisakutoukatsukan -Sanjikanshitsu_Roudouseisakutantou/shiryo2-1_1.pdf

もっとも、前回記事にいただいたつぎのようなコメントのように、調査の現場では「平均的な者」の選択は適当にしかおこなわれていない可能性もある。そうすると、いったい何をあらわしているのかよくわからないデータを集めているだけなのかもしれない。

事業所に似たような調査をしたことがありますが、事業所の担当者様は統計学の最頻値・モードのような概念を知らないこともままあります。その場合、その概念を説明してもあまりよく理解されてなさそうだなと思えば、正しくはないですが平均的な者という言い方をして聞くことがありました(平均的な者というわけで、従業員の平均とはまた異なります)。調査の際に「平均的な者の法定時間外労働は何時間ですか」のように訊いた可能性はかなり高いのではないでしょうか。
-----
「「平均的な者」の「1日の法定時間外労働の実績」平均とは何か」に対するMTさんのコメント (2018-02-14 16:36)

https://remcat.hatenadiary.jp/entry/20180214/heikinteki#c1518593799

(B) 労働時間記録等の確認作業は全事業場でおこなったのか、一部だけか

前回記事 でも書いたように、『平成25年度労働時間等総合実態調査結果』 には調査の方法についての説明がほとんどなく、具体的にどのように調査をおこなったのかがわからない。しかし、野党6党による第3回「働き方改革虚偽データ疑惑」合同ヒアリング (2018-02-16) での厚生労働省からの配布資料には、「労働時間等総合実態調査の調査手順」として、つぎのような流れ図がふくまれている。


-----
「働き方改革虚偽データ疑惑」野党合同ヒアリング 厚労省配布資料 (2018-02-16) p. 5
https://www.minshin.or.jp/article/113116

https://www.minshin.or.jp/download/37445.pdf

この流れ図によれば、聞き取りとあわせて労務管理書類 (タイムカード等の労働時間記録) で裏付けをとることになっているのだが、これはすべての調査対象についておこなったわけではないのではないかという疑義がある。

客観的な記録をチェクするのは、不適切な運用が疑われた場合のみのようにこの資料からは見える。
もともと客観的なデータ収集を心がけていたなら、まず聞き取り、という記述にはならないはず。
-----
上西 充子 2018-02-17 12:18 のツイート

https://twitter.com/mu0283/status/964715747371986944

タイムカード等を確認していれば、労働時間は正確に、何時間何分という値が調査されているはず。しかしそれが一部しかおこなわれておらず、残りについては聞き取りしかしなかったのだとすれば、少数の選択肢から選んだだけの粗いカテゴリーのデータが混在している可能性がある。

(C) 平均値は、階級値を機械的にあてはめて算出したのか

今回問題になっている一般労働者の1日の法定時間外労働の表では、平均値がかなり大きく、週あたり、月あたりの数値から計算できる数値を大きく上回る。これがデータの捏造を疑う根拠のひとつとなっている。

この問題について、前回の記事では、法定労働時間が「2時間以下」の階級に「1時間」の値を与えて平均を求めているのではないか、という仮説を提示した。

仕方がないので、適当な階級値をあてはめて計算してみることにしたのだが、これが思いのほか簡単だった。
・「2時間以下」 → 1
・「2時間超3時間以下」 → 2
・「3時間超4時間以下」 → 3
・……
のように、整数をひとつずつ増やしながらあてはめるだけ (!) でよかったのだ。
〔……〕
-----
田中 重人 (2018-02-14) 「「平均的な者」の「1日の法定時間外労働の実績」平均とは何か」

https://remcat.hatenadiary.jp/entry/20180214/heikinteki

一般労働者の「平均的な者」の週あたりの法定時間外労働については、 『平成25年度労働時間等総合実態調査結果』 表24 (p. 38) から、「2時間以下」が63.8%であることがわかっている。週に2時間以下なのだから、週5日労働なら1日24分以下に相当する。今回問題になっている1日の法定時間外労働の表では、71.4% (=6762/9449) が「2時間以下」ということになっているのだが、このうち9割くらいは、1日24分以下の法定時間外労働だと類推できる。しかしこのような実際の正確な値を使って平均値を求めたのではなくて、この階級はすべて「1時間」という値を代入して計算したため、過大な平均値が出てしまったのではないか、ということだ。

ただ、問題の表のうち「合計」については、この計算で「平均」とほぼ一致するのだが、そのほかの行については、必ずしも一致しない。この点の検証には、具体的にどのようなデータになっているのかということをふくめて情報が必要である。

これは先の (B) の疑問とも関係のある話である。現時点では、労働時間記録を確認した正確な値があるのはデータの一部だけであり、それ以外の大部分は大雑把な階級でしか法定時間外労働を把握していなかった、というようなことになっているのではないかと推理している。

(D) 「母集団に復元」するためのウェイト

『平成25年度労働時間等総合実態調査結果』 の表には百分率しか書いていないので、ある条件に該当する事業場が具体的にいくつあったのかはわからない。しかし今回問題になっている、1日の法定時間外労働の表には、事業場数が載っている。それによると、たとえば企業規模別に見たとき、「大企業」が3776に対して「中小企業」が5673であり、およそ4:6の構成比になっている (何をもって「大企業」「中小企業」をわけているかの基準は不明)。

ところが、これを『平成25年度労働時間等総合実態調査結果』に載っている表に適用してみると、おかしなことが起こる。この構成比を使って企業規模別の数値から合計の数値を計算してみると、かなり大きくずれるのである。たとえば表24 (p. 38) の表では、平均値が「大企業」で4時間17分、「中小企業」で2時間18分となっているので、これを3776:5673の構成比で変換すると、3時間6分となり、表24に載っている「合計」の行の平均値2時間47分よりも1割ほど大きくなる。

これはおそらく、1日の法定時間外労働の表は、調査結果のデータの計算結果そのままなのに対し、『平成25年度労働時間等総合実態調査結果』の表は、抽出確率を考慮したウェイト付けをおこなったあとの結果を載せているからだろう。実際、『平成25年度労働時間等総合実態調査結果』 p. 1 には「調査結果は母集団に復元したものを表章している」とある。

そう仮定して、『平成25年度労働時間等総合実態調査結果』表24の企業規模別の平均から合計の平均を導けるように構成比を逆算してみると、大企業の占める率は25%となる。実際に調査対象となった標本における大企業の比率が40%だったとすると、大企業が1.6倍多くなるように抽出されていたことになる。どうしてそのような標本設計になったのだろうか?

このことはふたつの点から重要である。

ひとつは、企業規模によって「平均的な者」の労働時間が大きくちがうこと。これらを合成して全体の労働時間を分析する場合には、大企業が過大に抽出されていたという調査対象の偏りが適切に修正されている必要がある。

もうひとつは、裁量労働制を導入している事業場は、これとは別枠で「優先的に選定」されていることである (『平成25年度労働時間等総合実態調査結果』 p. 1)。一般労働者との比較をおこなう際には、ウェイト付けなどによる修正が、比較可能性を確保するのにじゅうぶんであるかを検討する必要がある。

おわりに

2月17日の朝日新聞は、厚生労働省幹部の声をつぎのように紹介している。

不自然なデータについて別の厚労省幹部は取材に「異常値で、捏造(ねつぞう)ではない。本来比較できないものを比較した。それ以上でも以下でもない」と話す。
-----
朝日新聞 (2018-02-17 05:00) 「「法案作成後に初提示」 裁量労働のデータで厚労幹部」

https://www.asahi.com/articles/DA3S13363494.html

捏造かどうかはともかくとして、「本来比較できないものを比較した」というのはそのとおりであり、当事者もわかっているようだ。ただ、この「本来比較できない」という部分が何を意味しているのかは、きちんと確定しておくべきである。

ここまで検討してきた4点は、この「比較できない」ということのそれぞれ異なる側面をあらわしたものと見ることができる。(A) はちがう概念におなじ名前をつけていたという問題であるが、それ以外にも、(B) 測定の方法がちがう、 (C) データ処理であたえた値がちがう、 (D) 統計分析の前提がちがう、といった疑念があり、それぞれ性質が異なる。そして、このデータをめぐる問題があきらかになったあとも、これらの疑念にこたえる資料は出てきていないのである。