あらすじ
「データ分析ブーム」がもたらしたのは、怪しい“分析らしきもの”と、それに基づいた誤解や偏見……。本書では、「問題」「解説」を通して、データ分析の失敗例を紹介しながら、データを正しく読み解くための実践的な視点や方法、また、思考に役立つ基礎的な知識やコツを紹介していく。誤った分析をしないため、騙されないための、基本的・実践的な読解と思考の方法とは――。
...続きを読む感情タグBEST3
このページにはネタバレを含むレビューが表示されています
Posted by ブクログ
2022/3/26 メトロ書店御影クラッセ店にて購入。
2023/9/29〜10/5
最近流行りのデータサイエンス系の知識をいろいろ身につけないと行けないので購入。相関関係と因果関係の読み取りについてよく分かった。これはありがちな間違いだよな。気をつけないと。
Posted by ブクログ
一つの答えがわかっても、安心しない。
交通事故のニュースが増えた原因=事故が珍しくなくなった、ニュース番組のお茶の間化、放送時間の拡大。ビジネスマン以外の視聴者の増加。取材可能範囲が増えた。スマホ、監視カメラ、ドライブレコーダー、視聴者による素材提供が増えた、高速道路の延伸、高規格道路が公共事業で増えた、航空機、ヘリコプターの増大、空港の増加、交通事故は死亡事故だけではない、など。
結果を生み出すのは一つや二つではない。
時間の節約に見えてもったいない。複数かつ重傷的な理由が隠れている。
交通事故は死亡事故だけではない。
秋田県は見栄っ張り?
散布図に隠れている相関関係。
男余り率と男性未婚率。
データはゆがむモノ。
出口調査と若者の評価の違い。
データのゆがみは集計の工夫で解消することは困難なことが多い。=インターネットでアンケートを行えばインターネット普及率は100%。
次点バネは本物か。生存バイアスではないか。
第二次世界大戦中、戻った航空機の損傷箇所を調べ、それ以外の場所を補強した。
交絡因子=第三因子。
時系列同士は因果関係がなくても自動的に相関しやすい。
地域別集計データも偽の相関をしやすい。ツイッターの使用と選挙運動。わかりやすさが間違いの元。
世の中の出来事は複雑な因果構造をもっているので、単純な因果関係を主張するのは何かが違うのはと注意するべき。
Posted by ブクログ
<目次>
はじめに 怪しいデータ分析への処方箋
第1章 データ分析読解の基本、因果関係~対象に関する知識と想像力の重要性
第2章 怪しさを感じる糸口、議論と数字のズレ~分析を間違いと判断する手順
第3章 結果論は分析ではない~データから要因を探る技術と方策
第4章 データが歪めば結果も歪む~分析対象とデータの取り方に注意する
第5章 「分析したつもり」の落とし穴~気が付きにくいデータの歪み
第6章 幻の因果関係を生み出す交絡因子~三角関係を暴いて相手説を崩す
第7章 散布図に潜む罠~分析の存在理由を問うことが大切
第8章 偽の相関、逆の因果を叫べば勝ちではない~因果関係の丁寧な考察がデータ分析攻略の近道
<内容>
最近はやりの「データサイエンス」の基本である、データ分析についての教科書的なもの。もともと大学での講義録だったようで、例題を基に丁寧な解説と正解例を提示してくれる。かなり細かい解説なので、自分はややついていけなかった(やはり純文系アタマなのかな?)が、著者は、新聞やネット上のエセ分析をかなり気にしているようで、そこへの批判もくみ取れる。