あらすじ
データの背後には何が潜んでいる? 探る手法とその意図を物語風に解説!
第2弾の本書では、データ分析で利用されている代表的な手法を丁寧に解説しました。取り上げたのは、「因子分析」、「主成分分析」、「t検定」、そして「分散分析」です。具体的には、第1弾で活躍した「データサイエンティスト」の二項文太を参謀?に迎えて、顧客である弁当屋の看板娘である正規乱子のクラスが、新年度に新校舎へ引越しできる権利を獲得するために作戦を展開していきます。第1弾と同様に、本書も通勤通学の電車の中でも通読できるよう、できるだけ単純化した説明を試みています。また、さらに本書の内容をソフトウェアで追体験できるよう、本書用のソフトウェア・パッケージを開発し公開する予定です。データを集めて解析しその背後に潜む要因を探る作業をしなければならないんだけど、いろいろな統計的方法を、いつ、どう使えばいいの?と悩んでいる人々に贈ります。
感情タグBEST3
Posted by ブクログ
前作ではです・ます調だったのが,今回はそうでなくなり,「小説」部分がうんと長くなりました。統計学としての情報量は期待しない方がいいです。
因子分析,主成分分析,t検定,分散分析
*****
現実のデータ分析はあくまで仮説の妥当性を判断する補助手段でしかないんです。データ分析の結果が妥当かどうか,あるいは使えるかどうかは,また別の次元での判断が必要になるわけですから。(p.62)
因子分析の場合,想定した因子でテスト結果全体が説明できるかどうかは分かりません。なので誤差を想定します。一方,主成分分析は,そもそもテスト結果全体を圧縮しようという発想です。(p.159)