あらすじ
【絶賛!】
政策はAI(人工知能)では作れないことを、徹底的にわからせてくれる。
――藻谷浩介氏(『里山資本主義』)
その数字は、つくり笑いかもしれないし、ウソ泣きかもしれない。
データの表面を信じてはいけない。その隠された素顔を知るための一冊!
――泉房穂氏(前・兵庫県明石市長)
【データの“罠”が国家戦略を迷走させる!? ビッグデータ時代の必読書!】
「データ」や「エビデンス」に基づいてさえいれば、その政策や意思決定は正しく、信用できると言えるのか?
私たちは政府統計を信頼しきっているが、その調査の過程やデータが生み出されるまでの裏側を覗けば、あまりにも人間臭いドタバタ劇が繰り広げられていて驚くはずだ。本書は英国国家統計局にも関わり、政府統計の世界を知りつくす著者が、ユーモア溢れる筆致でその舞台裏を紹介した一冊である。
扱われるのは、英国の移民政策、人口、教育、犯罪数、失業者数から飲酒量まで、実に多彩な事例。それぞれの分野で「ヤバい統計」が混乱をもたらした一部始終が解説される。いずれも、日本でも同じことが起こっているのではないかと思うような話ばかりだ。
現在、この国では「根拠(エビデンス)に基づいた政策決定(EBPM)」が流行り言葉のようになっている。人工知能の発達も急速に進みつつあり、アルゴリズムに意思決定や判断を任せようとの動きも見られる。「無意識データ民主主義」といった言葉も脚光を浴びつつある。しかし本書を読めば、数字やデータだけを頼りに物事を決めることの危うさが理解できるはずだ。
数学や統計学の予備知識はいっさい不要。楽しみながらデータリテラシーが身に着く、いま注目の集英社シリーズ・コモン第3弾!
【目次】
第一章 人々
第二章 質問する
第三章 概念
第四章 変化
第五章 データなし
第六章 モデル
第七章 不確かさ
感情タグBEST3
Posted by ブクログ
『問題は、そのようなときに役立つ「グッドデータ」【統計学的に理想的な良質のデータ】が、常に手に入るわけではないという点だ。(中略)一般に、物事は重要とみなされるようになって初めて数えられるようになる』―『はじめに』
まず最初に言っておきたいのは、本書はいわゆる「統計学」の教科書、あるいは、統計的手法を扱う人に向けた啓蒙書という訳ではない、ということ。もちろん、統計による推計の結果を扱う人が(回りくどい言い方だが)注意しておかなければならないことを丁寧に記した本ではあるのだけれど。本書の対象となるのは、どちらかと言えば統計学の基礎も統計的手法にも余り馴染みのない人であって、そんな人たちに向けて、推計が意味する(あるいは意味しない)ことを説く書。書評にも、本書のことわり(はじめに)にも、その主旨(本書には統計手法についての書ではなく数式も図も出て来ない)は記されているのだけれど、少しだけ期待していたものがあった。
著者が統計的手法を用いて推定する対象は、純粋に(自然科学が扱う対象物の特徴を捉えるために行う意味での)観測された数値ではない。その多くは一般に質的データ(名義尺度あるいは順序尺度)あるいはそれを標準化して数値に置き換えたデータだ。自然科学における観測対象ではなく社会科学における観測対象の統計につきまとう難しさが本書の主たるテーマであると言ってよいと思う。自然相手に観測されたデータ解析を一生懸命やってきた身からすると、そこが期待していたモノから逸れてしまう一因となるのだけれど、もともと期待していたのは統計手法の話ではない。実はデータ解析をする上で一番気を付けなければならないのは数学的な理論や算術的な工程ではなく、どうデータが準備されているかということなのだが、そのことについて著者が語ることに興味があったのだ。
著者はデータの観測に恣意が入る可能性について丁寧に説明している。それは自然科学分野の観測でも同じことなので首肯することも多い。一方で、もう少し異なる角度から語られるかも知れないと期待していたのは、いわゆる観測対象の選択(関心領域: area of interest)について。観測に絡む恣意性ということでは同じような主旨の話なのだけれど、その無意識の選択によって結果が左右されるという文脈で語られているところを越えて、その無意識の選択を如何に避けるか、あるいは補正していくかということについての言及がもう少しあることを期待していたのだ。
それは後進を指導する時に最も納得してもらうのが難しい(もちろん、説明すれば解ってもらえるのだが、データをもてあそぶ程には興味を持ってもらい難い)ことなのだ。そもそも統計の根本の課題は、標本の統計量をどの程度母集団の統計量と見做してよいか、であるのは当然なのだが、そんな深遠な問いの前に、個々のデータの解像度の差、取得された時の条件の違い、そもそも何処で取得されたものを集めているのか、といったことを、計算機をぶん回す前に吟味することの大切さ、そしてそこに結果を無意識の内に誘導してしまうリスクがあること、そんな話がもう少しあるのかなと思っていた(もちろん、少し異なる設定での話は語られているのだが)。
世の中、やれビッグデータだのデータオリエンテッドだの探索的データ解析だのと言うけれど、本書の一項目にもあるように、結局昔から言われる通り、Garbage-in, Garbage-out(ゴミを入力すれば結果もゴミ)なのだから。
Posted by ブクログ
アメリカの政治がひどいことになっているので、これからは、欧州に学ばないといけないだろうか。英米は2大政党制という点で共通しており、政治についてあまり参考にならないだろうか。
Posted by ブクログ
原題は「Bad Data」。「ヤバイ統計」という日本語タイトルはどうかな。なんとなく違和感。
正確な統計処理は難しい。
その、「歪み」の原因を、いろんな視点から切り込む。
類書は多い。
著者は英国の中央で統計関係の仕事に取り組んでいるので、事例は英国の、政策絡みにほぼ限定されているところが他と違うかな。
極めて散文的で、ざっと読むにはいい。
AIに関する項もあったのが新しいかな。
それくらい。