remcat: 研究資料集

(TANAKA Sigeto)

日本統計学会の文書管理がデタラメな件

日本統計学会「公的統計に関する臨時委員会報告書」について文句を書きつづる連載 を書いていて、先ほど気付いたのだけれど、この学会は公開文書管理のやりかたがおかしい。

この報告書「公的統計に関する臨時委員会報告書 第一部:毎月勤労統計調査の不正をめぐる事案に関する見解」は今年6月5日に学会に提出されたもので、それを今回 (http://archive.is/9mmH8 によれば6月25日) 一般向けに公開したものということのようである。

『公的統計に関する臨時委員会報告書 第一部 毎月勤労統計調査の不正をめぐる事案に関する見解』が、2019年6月5日に日本統計学会の赤平会長(当時)と西郷理事長(当時)に提出され、2019年6月8日に開催された社員総会で報告されました。「公的統計に関する臨時委員会」(2019年4月1日付で日本統計学会に設置)における検討結果を踏まえ、本報告書は、第一部として「日本統計学会会員および一般市民」に対する声明の部分を取りまとめたものです。
―――――
日本統計学会「公的統計に関する臨時委員会報告書」 (2019-07-01)
https://www.jss.gr.jp/act/committee_report/

http://web.archive.org/web/20190701082601/https://www.jss.gr.jp/act/committee_report/

このときの報告書本文のPDFファイルは http://web.archive.org/web/20190701082657/https://www.jss.gr.jp/wp-content/uploads/kouteki_toukei_report_main.pdf にあるが、その表紙には「2019年6月5日」と日付が記載されていた。

バージョン管理がなってない

7月20日に日本統計学会の当該ページを見てみたところ、

報告書に固有名詞の誤りや表記のゆれなどがありましたので,訂正しました.(2019年7月20日)
―――――
日本統計学会「公的統計に関する臨時委員会報告書」 (2019-07-20)
https://www.jss.gr.jp/act/committee_report/

http://archive.is/qVwtS

との説明が追加されており、リンクされているPDFファイルも「確定版c1」というものに差し替えられていた。ところがそのファイル https://megalodon.jp/ref/2019-0720-1628-27/https://www.jss.gr.jp:443/wp-content/uploads/kouteki_toukei_report_main.pdf でも表紙の日付は「2019年6月5日」となっている。「訂正」をおこなったという記述はこのファイル内にはないので、最初に公表した報告書と相違があること自体がわからない状態になっている。

書籍などの出版においては、語句などの訂正をおこなった場合はバージョン (「版」「刷」など) の更新とあわせて管理するのが通例であり、そのときの年月日を奥付等に書いて訂正時期を明示する習慣がある。ウェブ上で公開する文書については必ずしも慣例が確立していないが、文書を変更したのであれば、(作成時の日付と並べて) 最終更新の日付を明示するのがふつうであろう。

内容にわたる改訂個所

さて、日付や改訂履歴がわからないにしても、語句訂正等、記述内容が変化しない程度の改訂であれば、バージョンが区別できなくても実害はないともいえる。しかし、この「公的統計に関する臨時委員会報告書」確定版c1 においては、内容についての実質的な記述変更がおこなわれていた。報告書本文11ページの、2018年の「断層」の解釈をめぐる記述がそれである。

2018年は、厚生労働省が導入した新たな推定手法の導入によって、上記の断層がたまたま前年比の計数を押し上げる方向に働き、公表値の前年比が不自然なほど高くなった。これに不正問題が絡んで、不正問題の発覚後、賃金の動向を良く見せかけるために統計を意図的に操作したのではないか、という誤解につながった。そして、国会における野党からの批判や、前述したようなマスメディアからの過剰な批判の原因ともなった。
 当初から、マスメディアや利用者に対して「共通事業所ベース」の併用を推奨するなど、2018年改定に関連する利用上の留意点をより積極的に広報していれば、「数字を良く見せるためにわざとやったのではないか」という無用な誤解を防げた可能性は十分にあった。
―――――
日本統計学会「公的統計に関する臨時委員会報告書 第一部: 毎月勤労統計調査の不正をめぐる事案に関する見解」(2019年6月5日) 〔確定版c1〕 p. 11
強調は、「確定版c1」での追加部分であることを示すため引用時に付加

https://www.jss.gr.jp/wp-content/uploads/kouteki_toukei_report_main.pdf

この引用は改訂後 (確定版c1) からのものであるが、強調して示した「厚生労働省が導入した新たな推定手法の導入によって、」は 当初公開されたファイル には存在せず、この「確定版c1」で追加された部分である。

ちなみにこの前のページには、「断層」についてつぎの説明がある (この部分は当初公開版と確定版c1 とで相違がない)。

東京都の従業員規模500人以上の層で全数調査が実施されていなかったことが明らかとなったきっかけは、2018年1月分の公表数値で大きな断層が発生したことであるが、標本の交代方法の変更(部分交代の採用)が断層の要因の一部となったと言われている。
―――――
日本統計学会「公的統計に関する臨時委員会報告書 第一部: 毎月勤労統計調査の不正をめぐる事案に関する見解」(2019年6月5日)〔確定版c1〕 p. 10

https://www.jss.gr.jp/wp-content/uploads/kouteki_toukei_report_main.pdf

ここから標本交代についての説明がつづいたあと、上記の「断層がたまたま前年比の計数を押し上げ」たという記述が出てくる。この断層の話は、標本の交代によって測定数値が上がったり下がったりすることを指す文脈の中にあったのである。したがって、p. 11 に「上記の断層がたまたま前年比の計数を押し上げる方向に働き」という記述があっても、それは標本交代にともなうランダムな変動を指しているものとして理解できた。

ところが、確定版c1 においては、「新たな推定手法の導入によって」計数を押し上げたという一言がわざわざ挿入されており、標本交代によるランダムな変動とは解釈できない内容に変更されている。

ここで、2018年から導入された「新たな推定手法」というのは、第一種事業所についての集計で、抽出率の逆数をかけた「復元」をおこなうようになったことを指していよう。

8.平成30(2018)年1月調査以降の集計方法の変更に際しての事実関係
〔……〕
雇用・賃金福祉統計室長(当時)Fは、平成29(2017)年度開始後遅くとも5月以降、当時のプログラム担当者に対し、平成30(2018)年1月調査以降の毎月勤労統計調査におけるローテーション・サンプリングの導入に向けたプログラム改修を指示した。その中で、それまで実施していなかった東京都における規模500人以上の事業所に係る抽出調査の結果及び30人以上499人以下の事業所のうち東京都と他の道府県で抽出率が異なる一部の産業の調査結果についてプログラム上適正に復元されるよう改修がなされた。
―――――
毎月勤労統計調査等に関する特別監察委員 (2019-01-22)「毎月勤労統計調査を巡る不適切な取扱いに係る事実関係とその評価等に関する報告書」 p. 11-12

https://www.mhlw.go.jp/content/10108000/000472506.pdf

2017年までは東京都の大規模事業所 (高賃金のところが多い) の抽出率を不正に下げていたことを考慮せずに全国一律の推計比率を使って推定していたため、全国平均の賃金水準を過少に推定してしまっていた。2018年から抽出率のちがいを考慮する「新たな推定手法」を導入したため、賃金の推定値が押し上げられて不自然に高い前年比伸び率が出るようになり、そのことへの疑惑が、東京都での不正抽出の摘発につながった。

ちなみに厚生労働省が2018年9月27日 (不正発覚前) に作成した資料によれば、月当たり「決まって支給する給与」推定額に2018年1月に生じた断層2086円のうち、標本交代要因の寄与は295円に過ぎない (厚生労働省「毎月勤労統計:賃金データの見方~平成30年1月に実施された標本交替等の影響を中心に」 https://www.mhlw.go.jp/toukei/list/dl/maikin-20180927-01.pdf p. 9)。この厚生労働省の説明を信じるなら、2018年1月の断層の発生について、標本交代によるランダムな変動のせいであるかのように書いていた当初公開版の記述のほうがおかしかったのだ。確定版c1 において「厚生労働省が導入した新たな推定手法」が原因だったことがはっきりわかるよう改訂したのは、事実の精確な記述という点では改善と評価できる。しかし、記述内容を変えたならそのことを明記すべきであって、「固有名詞の誤りや表記のゆれなどがありましたので,訂正しました」とだけ書くのはあきらかにおかしい。

一方で、この内容変更部分は、毎月勤労統計調査不正問題に対する日本統計学会「公的統計に関する臨時委員会」の認識の奇妙さを浮き彫りにしている。この委員会は、厚生労働省が調査不正を公表せずに「復元」のために推定手法を変更したこと、それによって断層が生じたことは認めている。にもかかわらず、それは「たまたま前年比の計数を押し上げる方向に働」いたものだと強弁するのである。「復元」をおこなった2018年の数値を「復元」していない前年の公表値と比較すれば、過大な賃金伸び率が出てくるのが当然であって、断じて「たまたま」ではありえないのだけれど。そして、「数字を良く見せるためにわざとやったのではないか」という当然わいてくる疑惑に対しては、「無用な誤解」と切り捨てる。

その他の改訂個所

これ以外に「確定版c1」の本文で改訂された場所はあるだろうか? ファイル全体をチェックしてみた。目視で相違を見ているだけなので、見落としはあるかもしれない。

フォントやレイアウトが変更されているようで、改行位置や改頁位置があちこち変わっている。また章・節の見出しの上下に入る空白も異なっている。文字色が変更されているところ (3ページ) もある。PDFファイルのプロパティによれば、当初公開版と確定版c1 とでは、作成に使用したOSもソフトウエアもちがうようだ。フォントやレイアウトが変わったのはそのせいだろうけれども、改頁位置まで変わってしまっているのは困りものである。また、テキストを抽出したときの文字化けの頻度が高くなっている。

こうした見た目の変更をのぞくと、つぎのような改訂がおこなわれている。

  • 「賃金基本構造統計」を「賃金構造基本統計」あるいは「賃金構造基本統計調査」に訂正 (i, ii, 6ページ)
  • 「賃金構造統計」を「賃金構造基本統計」に訂正 (5ページ)
  • 「毎月勤労統計」のあとに「調査」を挿入 (iページ)
  • 「本報告書および参考資料は、日本統計学会のウェブサイトに掲載して、広く利用に供することを依頼した。」を削除 (iページ)

https://www.jss.gr.jp/act/committee_report/ に「固有名詞の誤り」とあるのは、上記のような「賃金構造基本統計」に関する誤記を指しているのだろう。「調査」をつけるかどうかは「表記のゆれ」なのかもしれないが、これは実際には表記の統一がおこなわれたわけではないようだ。そして、ひとつの文をまるごと削除するという、誤りの訂正でも表記のゆれの処理でもないこともやっている。

なお、鍵括弧の前に不要な空白が入っている箇所 (7ページ) や「にも関わらず」という表記 (9, 14, 16ページ) がそのままになっているので、それほどまじめに校閲をかけたようにもみえない。

まとめ

というわけで、日本統計学会「公的統計に関する臨時委員会報告書」について、

  • 文書の日付やバージョンの管理がおかしい
  • 内容を変更しているにもかかわらず、「固有名詞の誤りや表記のゆれ」だけを訂正したかのような嘘を学会ページに書いている

ことがわかった。はたしてこんなので学術団体として大丈夫なのか、かなりの不安をおぼえる情報である。