あらすじ
※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。
21世紀に入り、ベイズ理論が様々な分野で爆発的に活用され始めました。「ベイズテクノロジー」「ベイズ統計学」「ベイズエンジン」などと、「ベイズ」の名を冠した言葉が、数学、経済学、情報科学、心理学など、幅広い分野で用いられ始めています。現代の確率論、統計論、情報論において、ベイズ理論は欠かすことのできない地位を確保することになったのです。
ところで、「ベイズ」とは何でしょうか?
実は人の名で、このベイズが現在の「ベイズ理論」と呼ばれる基本公式を導き出しました。簡単に言うと、曖昧性を排除した一般的な統計学とは違い、ベイズ理論は、この曖昧性を利用することで統計に対して柔軟性が生じさせます。よって、従来の定型的な確率論や統計論では対処できない「経験」や「常識」を取り込んだデータ処理も、ベイズ理論は可能にしてくれるのです。
本書は、このベイズ理論を統計学的に使う「ベイズ統計学」について、その基本から応用まで、身近な例を使ってわかりやすく解説する入門書になります。
感情タグBEST3
Posted by ブクログ
最近流行のベイズ統計。とてもわかりやすい。
--
・一般的には、原因が与えられたときに、その結果を議論します。ところが、ベイズの基本公式は、それを反対にしてくれるのです。すなわち、結果から原因をたどれるように変換してくれるのです。
・尤度:原因HのもとでデータDが得られる確率
・事前確率的な情報を蔑ろにしている代表的な例:ある事故で軽症を負った人は10人も死亡したのに、重症の人は7人しか死ななかった。⇒軽症の人が1万人、重症の人が10人というデータがふ化されていたら、何ら不思議はない事故。
Posted by ブクログ
「ベイズはスパムフィルタに使われているらしいけどよく分からない」「機械学習の本が難しすぎる」「統計的機械学習の実装を見ても、理論が難しくてよく分からない」という人に。
Posted by ブクログ
最近話題のベイズ統計学。レコメンドアルゴリズムとしてのベイジアンネットワーク、統計学としてのベイズ推定など、最近の「予測」モデルについては、ベイズ統計学が多く使われているようになりながらも、かいつまんでもベイズ統計学が従来の確率論や統計学と何が違うのかイメージがしづらかった。それを非常にわかりやすく説明してくれている本。説明はかなり丁寧、何度も概念をいろんな方法で繰り返し説明してくれているので、すらーっと読めるし、内容もよく理解できる。但し、大学受験レベルの確率論や大学1,2年レベルの統計学の知識がないと飲み込みができない可能性が高く、初習者は簡単な統計学などの本から入ったほうがいいだろう。
Posted by ブクログ
ある出来事が起きた時、その原因として複数の出来事が考えられる。
これらの内、どれが原因だろうか?
この推測を行う手法にベイズ推定と言う物があります。
そしてこの様な考え方に基づく統計学が、本書のテーマであるベイズ統計学です。
これは様々な分野で応用されており、その為、根っからの文系人間でもこれと格闘する必要に迫られる事も考えられます。
本書はこの様な事態に陥った方の助けとなる一冊です。
構成は全6章からなり、それぞれ
第1章:
ベイズ統計学の応用分野やその考え方、ベイズの定理を考えた18世紀のアマチュア数学者トーマス・ベイズ等を簡単に解説
第2章:
簡単な確率の解説
第3章:
ベイズの定理、ベイズ推定について解説
第4章:
ベイズ推定の応用例
第5章:
一様分布、ベルヌーイ分布、正規分布、ベータ分布と言った確率分布の解説
第6章:
これまでの解説を基に、ベイズ統計学の解説を行う
と言う内容になっています。
題名に「これならわかる!」と言うキーフレーズが使われているだけあって簡単な解説が心がけられており、上述の通り文系の方でも比較的理解しやすい内容となっているのではないでしょうか。
また、文系のみならず理系でもベイズ統計学になじみのない場合、ベイズ理論を学ぶ最初の一冊としての存在価値は高いかと思います。
様々な分野での応用が進むベイズ理論。
これの大まかな理解には丁度良い一冊です。
尚、私が読んだのは初版なのですが、ざっと目についた限り
3/52を1/14と誤って約分(p.40)
分母の+を×と誤記(p.92)
と言う2カ所の誤記が見つかりました。
それぞれ内容を理解しながら読んでいけばすぐに気が付く間違いですが、気になる方は出版されていれば訂正版をお買い求めになられると良いかと思います。
Posted by ブクログ
これは間違いなくベイズ統計の入門書としては決定版だ。今までなんとなくぼんやりしていたけどよくわかった。ベイズ統計ってとても壮大な理論であることがよく分かった。
Posted by ブクログ
●これならわかる!ベイズ統計学
●ベイズの定理
・事象の独立
P(B|A)=P(B)の場合、Aの発生がBの発生確率に影響しない。この場合、以下の独立事象の乗法定理が成立する
独立事象の乗法定理:P(A∩B)=P(A)P(B)
・条件付き確率P(B|A)とは、Aが発生した場合にBである確率。同時確率P(B∩A)とは1サンプルを選択した場合にAかつBである確率
・ベイズの定理
P(A|B)=P(B|A)P(A)/P(B)
BのもとでAが起こる確率 = AのもとでBが起こる確率×Aの起こる確率/Bの起こる確率
●ベイズ更新の考え方
・データを取り込むたびに事後確率が変化することをベイズ更新と呼ぶ
・ベイズ流の計算では、データを得ることで経験や常識が更新(学習)されていく
●ベイズの展開公式の本質
ベイズの定理の解釈を変える。
Aを原因や仮定(Hypothesis)と、BをそのAのもとで得られた結果(データ)と解釈すると、
P(H|D)=P(D|H)P(H)/P(D)
となる。
・式中の3つの概念を以下のとおり定義する。
・尤度(ゆうど) P(D|H)原因HのもとでデータDが得られる確率
・事前確率 P(H) 分析前に原因Hが得られる確率
・事後確率 P(H|D) データDを考慮して得られた分析後の原因Hの確率
・ここで、事後確率が尤度と事前確率の積に比例する点が重要
・1回目の事後確率を2回目のデータ分析の際の新たな事前確率として利用する
・ベイズ理論の功績の一つは、事前確率の大切さを再認識させてくれたこと。
注意しなければ、尤度に目を奪われて、事前確率を忘れてしまいがちである。
●ベイズ理論計算の3ステップ
・ベイズ統計学において、事後分布は尤度と事前分布の積に比例する
・ベイズ統計学の基本公式
π(θ|D)=kf(D|θ)π(θ)
・ベイズ統計学では、確率分布を規定する定数(母数)を確率変数として扱う点に特徴がある
1.モデル化し、尤度を算出する
2.事前確率を設定する
3.ベイズの展開公式を用いて事後確率を算出する
●ベイズ統計の応用
・ベイズ理論による推定法のメリットは、事前確率という形で、現在目の前にあるデータだけでなく、その背景にあるデータも
スムーズに取り込んで、より正確な推定を行えること
・迷惑メールか通常メールかの判定を行う場合、各々の発生確率に基づいて、大きい確率を持つ方に分類すればよい
・ベイズ流の意思決定理論では、事後確率から算出した損失期待値から最適なものを選択する
・ベイジアンネットワークでは、マルコフ条件という重要な性質を仮定する
マルコフ条件:各ノードの確率変数が、そのノードの親ノードの条件付き確率のみで表されるという条件
●計算方法
・ベルヌーイ分布の公式
0の発生確率p, 1の発生確率1-pのベルヌーイ分布において、平均値μ=p, 分散σ^2=p(1-p)
・事前分布に特定の分布を指定すると、事後分布も同じパターンの確率分布となる(自然な共役分布)
・MCMC法は積分値を乱数により近似的に計算する方法であり、ベイズ統計において有名な確率分布を利用できない場合に有効
Posted by ブクログ
とてもわかりやすい。
ベイズの基本公式
P(H|D)=P(D|H)*P(H)/P(D)
H:原因、D:データ(結果)
P(H|D):事後確率、P(D|H):尤度、P(H):事前確率
事前確率の情報がない場合は等確率にする(理由不十分の原則)。
複数のデータがある場合は、1回目のデータで得られた事後確率を2回目の事前確率とする(ベイズ更新)。データの順番を変えても同じ(逐次合理性)。
原因が複数ある場合(原因に重複がない場合)
P(Hi|D)=P(D|Hi)*P(Hi)/ΣP(D|Hi)*P(Hi)
ナイーブベイズフィルター:文書中の単語はすべて独立と仮定してふるい分けする。
分類Hnの下でデータ(D1,D2...)が現れる確率は、それぞれのデータDiが現れる確率の積になる。
P(D|Hn)=ΠP(Dj|Hn)
現れたデータが分類Hnである確率の分子P(D|Hn)*P(Hn)が最大の分類を選択する。
P(D|Hn)*P(Hn)=(ΠP(Dj|Hn))*P(Hn)
Posted by ブクログ
めちゃくちゃ親切だし単元が細かく途切れているので集中力なくてもちょこちょこ進められます。
数列苦手意識ある人の立場になってくれています。
最後のベルヌーイなんたらのあたりとかは駆け足になってる感で、難しかった。
Posted by ブクログ
題名に偽りなく、ベイズ統計学の入門書。私が今まで読んだ類書の中では、最も分かりやすい本。例えば、事前確率の考え方(場合によっては、強引に仮定を置いてしまう!)といったところまで、懇切丁寧に解説しつくしています。これを読むと、類書(こちらも入門書を名乗っているが)も読みやすくなると思います。
Posted by ブクログ
最近、耳にすることが多いベイズ統計学に興味があり、斜め読みをして、ベイズ統計学の概略をつかむことができた。内容は、今までの統計学(ピアソン、ネイマン)の頻度論とはことなり、人間の主観を生かすことでより求めたい確立等を求めることがわかった。
内容は、ベイズ統計の概略、往来の確率論、ベイズ定理、ベイズ低利の応用、往来の統計論、ベイズ統計学という形である。例題や図もあって、統計学の初心者もゆっくり読み進めればわかるのではないだろうか。
類書が少ないので比較はできないが、わかりにくいことは絶対にない。
Posted by ブクログ
■評価
★★★☆☆
■感想
◯ベイズ統計について、数学が苦手な人でも丁寧に追っていけば理解出来料に書いてある本。
◯ベイズ統計は難しいことを言っているのではなく、順番入れ替えてもOKだし後から更新もできるし、人間の感覚にも近い。便利なものだなぁと思った。
◯逆に従来の統計学(p値検定)って、医学研究以外ではあんまり使われなくなるのかなぁ、、という気がした。
Posted by ブクログ
★イメージだけ分かった気に★厳密な前提条件がなくても、仮定を重ねて統計や確率を分析できるのがベイズ統計学らしい。自分で使うわけではないので具体的な計算の部分はすっ飛ばしたが、こういう考え方があり実生活では役に立つというイメージだけはつかめた。
Posted by ブクログ
ベイズ理論とは、ベイズの定理と呼ばれる確率公式を出発点とする理論を指す。
ベイズの定理は、ベイズ確率論の基本公式になる。このベイズ確率論は、データ分析や情報理論、ゲーム理論などの基礎分野を介して、経済学や心理学、意思決定論などさまざまな分野に活躍の場を広げている。
また近年、ベイジリアンネットワークと呼ばれる理論が人気を集めている。自然や社会の多くの出来事は、原因と結果の確率的な連鎖としてモデル化できるので、そのモデルを素直に表現し、具体的計算法を提供するベイジリアンネットワークは、自然科学や社会科学で大変注目されている。
さらに、ベイズの定理は、従来の統計学と違った見方のできるベイズ統計論に発展する。過去の経験や常識をシームレスに取り込める方法論として、統計学の大きな位置を占めるようになってきた。