【感想・ネタバレ】Pythonで学ぶあたらしい統計学の教科書のレビュー

あらすじ

基礎理論を飛ばさない!
推定・検定から統計モデル・機械学習へ!

本書は統計学の理論をゼロから学べる教科書です。
IoTやビッグデータの発展によりさまざまなデータが社会にあふれ、
全てのデータを確認するのは難しくなってきています。
多くのデータから価値があるデータを作成するには統計学の知識が必須です。

【本書のポイント】
本書は統計学をはじめて勉強するかたでも、
読み進めていけるように、以下の3点を重点的に解説しています。
・データをどのように分析するのか
・なぜそのように分析するのが良いことなのか
・Pythonを使ってどのように分析するのか

【統計学を勉強するためのツールについて】
この書籍では、学習していく際のツールに、プログラミング言語のPythonを使用します。
PythonはExcelやRより自由度が高く、機械学習に多く利用されているので幅広い層から注目を集めています。
Pythonに馴染むことにより、機械学習を利用したデータ分析者になるための基礎的な技術も身に付けられます。

【本書の構成】
本書は全7部構成になっています。
それぞれの部で次のようなことを解説しています。
第1部では統計学の基本を解説しています。
第2部でPythonの基本やJupyter Notebookの使い方を説明します。
第3部でPythonを用いた統計分析の方法を学びます。
第4部からは統計モデルについて学んでいきます。
第5部では正規線形モデルを解説します。
第6部それを発展させた一般化線形モデルについて解説します。
第7部は、統計学から機械学習へのつながりを学びます。

統計学やPythonのことを何も知らない方にもオススメの一冊です。

※本電子書籍は同名出版物を底本として作成しました。記載内容は印刷出版当時のものです。
※印刷出版再現のため電子書籍としては不要な情報を含んでいる場合があります。
※印刷出版とは異なる表記・表現の場合があります。予めご了承ください。
※プレビューにてお手持ちの電子端末での表示状態をご確認の上、商品をお買い求めください。

...続きを読む
\ レビュー投稿でポイントプレゼント / ※購入済みの作品が対象となります
レビューを書く

感情タグBEST3

Posted by ブクログ

Pythonを使った実装を通して統計学の基礎から機械学習のさわりまで学べる本。第2版が出ているのでそちらを入手予定。

0
2024年11月22日

Posted by ブクログ

Pythonの基本事項から統計も中学生レベルから説明されており、非常に良かったです。 複雑な統計学や、長くなるライブラリは一切排除し、それぞれの計算式と使い所をしっかりと載せてくれています。めっちゃ勉強になりました。

0
2019年02月21日

Posted by ブクログ

 説明がすっきりまとまっており頭に入りやすい。統計学の習得に最初に読む本ではないが、振り返りに良いと感じた。
使用しているPythonのライブラリはScipyとstatsmodels両方使用してあったがどちらかに統一してもらったほうが学習コストが下がったと思われる。

1部 統計学の基本
 1章 統計学
 2章 標本が得られるプロセス
 3章 標本が得られるプロセスの抽象化
 4章 記述統計の基礎
 5章 母集団分布の推定
  省略
 6章 確率質量関数と確率密度関数
  離散型確率の確率関数のことを確率質量と言うのは知らなかった。
 7章 統計学の計算
  7-8の標本分散が偏りを持つ理由は直感的な理解に役立った。
 8章 確率論の基本
  このへんはサラリと説明
 9章 確率変数と確率分布
  確率分布(密度)から確率を計算する方法がある。実際はPythonでやるので難しくはない。
2部 PythonとJupyter Notebookの基本
 省略
3部 Pythonによるデータ分析
 1章 Pythonによる記述統計:1変量データ編
  1変量の統計量の紹介
 2章 Pythonによる記述統計:多変量データ編
  整然データのことは初めて知った。いわれてみればあとあと加工しやすい。DBなどに保存している形に良く似ている。
  共分散の説明がわかりやすい。
 3章 matplotlib,seabornによるデータの可視化
  省略
 4章 母集団からの標本抽出シミュレーション
  省略
 5章 標本の統計量の性質
  バイオリンプロットの利点が今回初めてわかった。標準偏差と標準誤差の違いがわかってなかった。
 6章 正規分布とその応用
  t分布に母数の推定に使えることを知った。
 7章 推定
  点推定、区間推定、信頼区間の説明があった。
 8章 統計的仮説検定
  いままでわかりにくかった検定が少しだけわかった。実際検定をやろうとするとこれだけの知識だけではダメな気もする。t値、p値(p203-p211)の説明がある。
 9章 平均値の差の検定
  t検定は平均値の差の検定に使用される。
 10章 分割表の検定
  統計にだまされそうな事例でした。
 11章 検定の結果の解釈
  結構実務的な内容
4部 統計モデルの基本
 ここから現代的な?統計に入るのかな?
 1章 統計モデル
  
 2章 統計モデルの作り方
 3章 データの表現とモデルの名称
 4章 パラメタ推定:尤度の最大化
 5章 パラメタ推定:損失の最小化
  5-6最小二乗法と最尤法の関係はなるほどと思った。
 6章 予測精度の評価と変数の選択
5部 正規線形モデル
 1章 連続型の説明変数を1つ持つモデル(単回帰)
  このへんからライブラリstatsmodelsの使い方が出てくる。結果の解釈の説明があったの良い。Q-Qプロットはあまりわからなかった。
 2章 分散分析
  全体的にレベルが高くついていけなかった。
 3章 複数の説明変数をもつモデル
  実用に使用できる内容であった。
6部 一般化線形モデル
 1章 さまざまな確率分布
 2章 一般化線形モデルの基本
  線形予測子、リンク関数などかなり高度な内容であった。
 3章 ロジスティック回帰
 4章 一般化線形モデルの評価
 5章 ポアソン回帰
7部 統計学と機械学習
 省略

0
2019年01月19日

Posted by ブクログ

Pythonを動かしながら統計に親しむことができて楽しい。統計の内容は詳しい。
著者は水産科学で統計を使っていた方。

0
2019年05月19日

「IT・コンピュータ」ランキング