【感想・ネタバレ】ナンバーセンス ビッグデータの嘘を見抜く「統計リテラシー」の身につけ方のレビュー

あらすじ

『ヤバい統計学』著者が放つ、データ過多の時代の基本スキル。
正しい分析と間違った分析をどう見分けるか?
大学ランキングから肥満、個人情報、失業問題、スポーツまで。
今回も“世の中”を題材に、数式を極力使わず、エピソードたっぷりに描く。
ビッグデータが広まるほど、まちがった解釈・分析も広まる。データの嘘を見抜く「ナンバーセンス(数字リテラシー)」の身につけ方、教えます。

...続きを読む
\ レビュー投稿でポイントプレゼント / ※購入済みの作品が対象となります
レビューを書く

感情タグBEST3

このページにはネタバレを含むレビューが表示されています

Posted by ブクログ

ネタバレ

統計やデータ処理の欺瞞的使用について実例をあげて詳述したもの。扱われているデータがロースクールのSAT試験の点数とかグルーポン、アメフトのシミュレーションゲームなど、日本人には関心のない分野が多いため、読む気力がなかなか出にくいかも。

・ビッグデータは基本的に、因果関係について何かを語るものではない。データの洪水が、隠れていた因果関係をさらけ出すというのは、ありがちな誤解だ

・2009年にグーグルのエリック・シュミットCEOは「誰にも知られたくないことがあるなら、最初からやらないほうが賢明だろう」と語っている。SNS時代の今、記憶しておくべき発言

・買い物内容から妊娠しているかどうかを判定し、妊婦用品のダイレクトメールを送るというマーケティング手法について、擬陽性、妊娠していない女性について、これを妊娠しているとみなして広告を送りつけることの危険性が語られている。女性客の10%が妊娠しているとして、20%の的中率(これでもすごく高いんだとか)のアルゴリズムでは、14/90(16%)は妊娠していないのに広告のターゲットになる

・統計モデルはニュートンの重力のモデルとは違う。りんごを木から落とす下向きの力は、昨日も、きょうも、明日も働く。しかし現実世界の相関関係は一貫性とはほど遠い。あなたがきょう緑色の傘を持っているからと言って、次に買う傘も緑色とはかぎらない。因果関係を無視するモデルは物理科学の世界ではモデルとして認められることはない。この構造的な限界は、データがどれだけ大量にあっても乗り越えることはできないのだ。

・ビッグデータと黒い白鳥が他喜悦したら、勝つのは黒い白鳥だ。

・誰もあえて口にしないが、相関関係のモデルが導き出した予測の大半は間違っている。人間の行動という万華鏡を、公式に押し込もうとしても無駄なだけだ。ビッグデータの到来は、理論の終焉ではない。あらゆる統計モデルに仮説が含まれている。

0
2015年04月05日

「ビジネス・経済」ランキング