【感想・ネタバレ】データ分析に必須の知識・考え方 統計学入門 仮説検定から統計モデリングまで重要トピックを完全網羅のレビュー

あらすじ

※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。

データ分析のための手法は、統計学の考え方に基づいています。だから、本格的なデータ分析に取り組むためには、統計学の知識と考え方を身に着けることが不可欠。にも関わらず、既存の統計学の本は「数学的な記述ばかりの難解な専門書」もしくは「広く浅くの超入門書」ばかりで、「データ分析の前提となる統計学」を本格的に学ぶには厳しい状況だと言わざるを得ません。対して本書は、データ分析には必須な仮説検定から統計モデリング、さらに因果推論、ベイズ統計、機械学習、数理モデルまで幅広いトピックを網羅的に扱っています。

記述については最大限にわかりやすく、数学的な説明をできるだけ減らし、図を多用することで、数学に自信のない読者の方でも読み通せるように工夫しました。統計学に苦手意識・不安のある方、文系の方やこれからデータサイエンスを本格的に始めてみたい方、生物学・医学・心理学などの研究分野でデータ分析が必須の学生の方など、統計学をきちんと学びたい全ての方に向けた一冊です。

...続きを読む
\ レビュー投稿でポイントプレゼント / ※購入済みの作品が対象となります
レビューを書く

感情タグBEST3

Posted by ブクログ

 統計学の広範囲の見通しを得たく手に取りました。本書は最近ソシムが出している読みやすさ・見やすさと網羅性を確保したデータサイエンスの概説書シリーズの一冊であり、本書は統計学の多くのトピックを手際よくまとめた便利な本です。
 本書は記述統計から推測統計の範囲に至るまで、仮設検定のような複雑なトピックも含めて広い範囲を異常にわかりやすく説明したうえ、統計モデリングやベイズ統計や機械学習に至るまで広範な内容を説明しています。詳細をうまく省いて、何を仮定して何が結論できるかがいつも明快に示されていて、もう少し理論的な本を読むときにはわかりにくい話の流れが掴みやすい内容です。図版に関しても、説明したい内容に関して、目立たせたい部分や違いを強調したい内容g 統計学の広範囲の見通しを得たく手に取りました。本書は最近ソシムが出している読みやすさ・見やすさと網羅性を確保したデータサイエンスの概説書シリーズの一冊であり、本書は統計学の多くのトピックを手際よくまとめた便利な本です。
 本書は記述統計から推測統計の範囲に至るまで、仮設検定のような複雑なトピックも含めて広い範囲を異常にわかりやすく説明したうえ、統計モデリングやベイズ統計や機械学習に至るまで広範な内容を説明しています。詳細をうまく省いて、何を仮定して何が結論できるかがいつも明快に示されていて、もう少し理論的な本を読むときにはわかりにくい話の流れが掴みやすい内容です。図版に関しても、説明したい内容に関して、目立たせたい部分や違いを強調したい内容が一目でわかるようになっていて筆者や編集者の丁寧な気配りを感じます。特に仮設検定に関しては丁寧で誤解を生みにくい説明が手を変え品を変え繰り返し与えられ、仮設検定で示せることやp値の定義などがじっくり見につくようになっています。
 ただ本書にはちょっと読みにくい部分もあります。本書の図は理解のための骨格を強調して非常に見やすいものでありますが、ちょっと図の中に文章を入れすぎかなとは思います。その点がダメとは思いませんが違和感はあります。あと前書きに「数学的な説明をできるだけ減らし」とあるわりには結構数式で説明しているかなとも感じ、若干コンセプトとズレているような気もします(統計学の本なので当たり前ではあるのですが)。

0
2023年12月25日

Posted by ブクログ

数値数式が、ちゃんと都度都度グラフ(座標)で説明されるのでとてもわかりやすい。科学分野の人たちが何をベースに物事を考えてるか、知識が更新された。

自分自身の理解度は検定のとこと後半(因果推論関連は読んできた)までで、回帰分析らへんはまたおいおい見ていきたいけど、p値の問題も把握できてよかった。

数理モデルって何?て思ってたけど、CGがやってきたことだな?

統計学、知れば知るほど、世界の母集団は複雑だねえ。この方法で取り出せる真実はホントほんの一部だねえと思う。

0
2023年04月23日

Posted by ブクログ

全体像
を知らないままで聞き齧りであーだこーだ
の人が多い迷走
全体像
を本書で読むと見通しが良くなる

0
2022年01月09日

Posted by ブクログ

高校数学の統計分野から機械学習まで、様々な話題を網羅的に紹介。色んな検定手法の違いをコンパクトに整理している。別の統計学の本でゴリゴリ勉強した後に読むと、各手法を俯瞰的に復習できてとても良い。
易しく書いているので入門……と思いきや、やはり別の教科書的な本である程度手を動かして学んでからでないと、この本も結局頭に入って来ないと思う。

0
2025年07月23日

Posted by ブクログ

●2024年5月18日、東大【第97回】五月祭。東京大学・書籍部にあった。

●2025年5月26日、東京大学・書籍部にあった。セッションで寄った日。

0
2025年05月28日

Posted by ブクログ

返却期限が来て途中まで
高校生が習うような統計の基礎から、各検定法のメリット、デメリットについてまとめられている

0
2023年11月01日

Posted by ブクログ

ネタバレ

まあまあ面白かった.わかりやすかったし.

絵で解説されてて読みやすい.
主に論文読むときとかシミュしたあとの分析とかで役に立つと思って読んだが,
普通に読み物としても興味深い内容があっていいね
教官のおすすめであったがまあサクッと読めた
現実に反映できるかは俺次第であるが,提示されたグラフや結論を鵜呑みにすべきではないってのはよくわかったわ

内容は,
ヒストグラムによる分布の可視化とビン幅の注意点,
統計量(標準偏差とか)の使い方・特徴,
得られた実現値からある確率分布の母集団を推定するという目標,
母集団と標本の誤差の扱い方,
信頼区間の考え方,
t分布ってサンプル数少ないときにも出せる正規分布みたいなやつ,
仮説検定(仮説を立てて検証,帰無仮説,対立仮説),
2つのデータ群に「統計的に優位な差が見られた」とする観測値の平均の差とかに外れ値が出る確率であるp値の定義,
立てた仮説で本当は差がないのに優位な差があると判断してしまうリスク(過誤)について,
検定の種類(正規性があるときは平均とか標準偏差のパラメトリック検定,外れ値とか非対称な分布はノンパラメトリック検定とか),
ANOVA(母集団3群以上の平均値の比較としての分散分析っての,群同士のペアで比較してすべてのペアの平均が同じか確認.少なくとも一つが違うかが出る),
多重比較検定(ANOVAとはちがって,どの群が違うのかがわかる)
2つの変数の相関と回帰(相関の有無と因果関係は別),
相関係数は正規性のあるデータじゃないと使うの危険なこと,
重回帰(説明変数が2こ以上あるもの,体重についての運動量と身長とか)
共分散分析(2変数の)
ロジスティック回帰(Yes,Noの確率を表すときの推移の関数として使える)
オッズ比(起こる確率/起こらない確率 のやつ 普通の確率何%とは扱いが違う)
再現性の危機 仮設検定で統計的に優位となるp値をいじれてしまう話
p-hacking p値いじれること 最近はネガティブデータも掲載するようにされてきてるし,研究者側もp値よくなるまでサンプル数増やしたりしないようにしたり,尤もらしい良い仮説を立てるように努めるべき
因果と相関 観察データと実験データによる根拠の分析 実験データはそのほかの要因,交絡因子の影響を除くことができる
統計的因果推論 重回帰とかを使って観察データから推測する奴
ベイズ統計 確率に不確実性を考慮する
次元を減らす(変数を減らす)ための主成分分析、共通因子
統計分析に関わる機械学習の。
教師なし学習はクラスター分析と次元削減
教師あり学習は2変数の間の関数を求める
モデル化。確率によるモデルと数理によるモデル
決定論的モデル(微分方程式、差分方程式、偏微分方程式など)ある時刻の状態が決まったら次の状態が一意に決まる
確率的モデル(ランダムウォーク、マルコフ過程など)
非線形の基本的な考え方は変数の値に依存して増え方のルールが代わるって考えると線形非線形わかりやすいな
過去に依らず、現在によって未来が決まる性質をマルコフ性という

0
2023年05月31日

「ビジネス・経済」ランキング