【感想・ネタバレ】因果推論の科学 「なぜ?」の問いにどう答えるかのレビュー

\ レビュー投稿でポイントプレゼント / ※購入済みの作品が対象となります
レビューを書く

感情タグBEST3

Posted by ブクログ

とても面白い本。「ですよね!そうするしかないですよね!?」という部分(因果ダイアグラムと、それが主観的にしかやりようがないという点)と「すいません、それもう少し詳しく書いてください」の部分(do演算子やバックドア基準、フロントドア基準のルール)があり、後者は別の本を読めばいいのだろうか。練習問題があるといいな。

自分がやりたいこと、知りたいことを突き詰める方法があるんだと知れてよかった。

0
2024年03月01日

Posted by ブクログ

世界屈指の人工知能科学者が因果推論について、過去の事例や著者自身の経験・研究をもとに解説している。そもそも因果推論とはなにをすることか、人工知能の科学者がどうして因果推論について研究することになったのか、因果推論を蔑ろにしていた統計学者などの歴史、一貫して重要性を主張していた因果ダイアグラムの解説などさまざまなことが学べる。

私自身、計量経済学を中心にデータ分析を学んでいたこともあり、もともと因果推論には関心があった。本書でも述べられていたが、伝統的に?計量経済学のほとんどの教科書では因果ダイアグラムを使われることがなかった。しかし、因果ダイアグラムを駆使することで、交絡・コライダー・媒介などを明確にできることが説明されていた。このことは非常にまなびになった。あの有名なモンティ・ホール問題も因果ダイアグラムで解説されている。
データのみから情報を得るだけでは因果推論はてきない(因果のはしご一段目)。介入や反事実(因果のはしごの二段目、三段目)を扱うには、推論したい事象の分野についてよく考察できるだけの知識や経験が必要だと実感した。なお、観察データから純粋な効果(本書ではdo演算子が式にある問題)を推定できる方法も本書では解説されている(フロントドア調整など)が、これらもそれぞれの因果の向きや理屈を理解していないといけない。

本書では因果推論をうまく扱えなかったがために間違った道に進み、多くの失敗(たばこや壊血病など)をしてきたことが紹介されている。私自身、本書の内容についてまだまだ理解不足なことばかりであるが、因果推論の考え方で正しい道の方向に向いていきたいと思った。

0
2024年01月25日

Posted by ブクログ

『自主的に薬Dを服用した患者の寿命Lの観察頻度は、数学的にはP(L|D)という式で表すことになる。これは、統計学の教科書に出てくる標準的な条件付き確率の式だ。この式が表現しているのは、患者が薬Dを服用したのを見て考慮に入れた場合の寿命Lの確率Pである。P(L|D)とP(L|do(D))ではまったく違うことに注意してほしい。見ること(観察)と行動すること(介入)は根本的に違う。そしてこの違いは、私たちが気圧計の測定値の低下を嵐が来る原因とみなさない理由の説明になる。気圧計の値が下がっているのを見て、それを考慮に入れれば、嵐の確率は上がっていると考えていいが、気圧計の値を無理に下げたとしても、嵐が来る確率に変化は起きないのだ』―『序章 「因果推論」という新しい科学/因果ダイアグラムと記号言語』

1999年に書いたテクニカルノートの冒頭に「一般に回帰法を用いたデータ処理においては、データ空間の中に潜在する関係を見い出すデータモデリングに着目した部分と、データから推定されたモデルの評価/最適化に着目した部分があり、各々に技術的な要素がある。ここではまずデータモデリングの部分について技術的要素を整理し、その後、モデルの評価/最適化に係わる技術的要素について言及する」と記してある。拙い論考ではあるが、ここでデータ解析の実務者としての自分が考えていたことは、物理学的なデータ間の関係性と統計学的な関係性とは分けて考えておかなければならない、ということであったと顧みる。如何にそれらしい関係性をデータ群から見出しても物理学的な関係性に落とし込めなければ意味はないとの戒めが当時の自分にもあったのだ。だからこそ、非線形の回帰法を利用しつつ如何に物理的な裏付けのある関係性を見い出すかということを懸命に模索していた時にこんなメモを残したのだ。その「物理的な関係」を広義に言い直してみれば「因果律」ということになる。それは、原著のタイトル「The Book of Why」の答えとしてデータを前にした者が求めたいものである。しかし、アインシュタインは一般相対性理論を展開する中で全ての事象は相対的な関係でしか著せないと言った。事象Aに事象Bが先行しているように見える世界もあれば、その逆に見える世界も同時に存在し得る。だとすればAがBの結果であるという単純な因果律など存在しないのかという極端な話にもなるが、ヒトは自分の生きている世界観の中で因果律を求めたがる生き物だ(だからこそ都市伝説や陰謀論に引き付けられる人々も多いのだろう)。ラプラス的世界観は現代物理学では否定されているにも拘らず、人は因果律を求めその応用として未来を予想しようとする。閑話休題。

本書は、一般ビジネス書の書棚に平積みされるような本ではあるけれど、決して万人が読んですぐに得心できる類の本ではない。少なくとも、統計学的な一般素養が必要とされる。統計学的な一般素養とは、単に統計処理ソフトを使えるという意味では決してなくて、その処理で用いられている手法についての理解、データを扱う上での注意点などを理解している、という意味である。例えば、職場のパソコンに必ず入っているであろう表計算ソフトを利用して二つのデータの関係性が近似式で散布図に挿入されたのを見て係数を知れば充分という人に、この本はお勧めできない。多変量解析において独立変数の選択や次元の呪いに苦しんだことがあり、より自然な関係性を求めて非線形の関係式をモデルとして検証したいと思いつつ不用意な変数の変形によるデータの偏重を如何に避けるかということに取り組んだことのある人であれば、ひょっとすると面白く読めるかも知れない。データマイニング的な手法を扱ったことがあれば申し分ないし、ディープラーニングの理論的な側面を学んだことがある人なら正に著者が想定している読者になれるだろう。それでも統計学者ではない実務者にとってはやや意外でもある「因果律」を否定する統計学界の風習に対して、それを形而上学的な論争ではなく数学的に自明な解決を目指して理論を展開してきた著者の技法については、この本を読んだからと言って完全に理解できる訳ではない。だが、著者が何故「因果ダイアグラム」という手法に拘り、do演算子などを駆使して「左辺」と「右辺」の関係性を単純な「対比」から「因果」へ導こうしているのかの主張はよく理解できる。ただし繰り返しになるが、表計算ソフトで回帰分析をする際に、XとYを入れ替えることの意味や主成分分析との違いを(つまり、観測されたデータは、観測されていないデータも含めたデータ群が形成する空間をより低い次元の空間に落とし込んだ「影」に過ぎないのだと)認識していない人には、回りくどく、そして、やや自慢話的な語りの多い本書はとても読み難い本ではあるだろう。

『科学的な問いの中でも回顧的な思考が関わるものには、「反事実」と呼ばれる因果推論に特有の、別の種類の表現が必要になる。たとえば、ジョーが薬Dを服用して、一カ月後に死亡したとする。ここで問いたいのは、果たして薬Dは彼の死の原因なのか否かということだ。この問いに答えるには、ジョーは薬を服用しようとしていたが、結局は気が変わって服用しなかった、という架空の筋書きを想像する必要がある。この場合、果たしてジョーは死なずに生きているだろうか。すでに書いたとおり、古典的な統計学はデータを要約するだけである。つまり、この問いを表現するための言語すら持っていないということだ』―『序章 「因果推論」という新しい科学/反事実的推論の重要性』

著者が断言する「データは何も教えてくれない」とは、実に刺戟的だが、昨今のディープラーニング型の人工知能信奉が蔓延る中、心に留めておくべき言葉であると思う。そんな風潮に流される若い世代の技術者に接して思い出すのは、データ解析初学者であった頃によく先達から言われた「ガーベージ・イン・ガーベージ・アウト」という言葉。何でも良いから大量のデータを読み込ませて、どうしてそうなるのかも解らない畳みこみニューラルネットワークの出した答えが見た目それらしいからと言って受け入れる風潮には自分も違和感がある。私見だが、ニューラルネットワーク的な手法がやっているのは極端に言えばデータのオーバーシュートで、幾重にも再帰的に入れ子になった多変量の多項式。そこから見い出される関係性の頑健性はそもそも考慮されていない。データには常にエラーがあり、それを理解しつつ確度の高い関係性を構築するかが本来解析者のやるべき仕事ではないのか。そんな誰に言うともなく言いたかったことを久しぶりに思い出した。

0
2023年01月24日

Posted by ブクログ

因果推論って難しくて腑に落としにくいですが
先人たちがどう悩んで論を立てていったかをなぞることにより理解を深めるってのはありですね
スラスラ読めるってほどでは流石にないですが内容の難しさの割にはリーダブルで好著

0
2022年11月05日

Posted by ブクログ

『入門 統計的因果推論』を始めとした著書があり,因果推論では知らない人はいないであろうJudea Pearlの本が書店に積まれていることに驚いた。内容としては,Pearl流因果推論の道具を取り上げつつも一般人向けに物語を仕立てたものとなっている。

0
2023年08月16日

Posted by ブクログ

因果推論の基本を歴史を交えながら解説する本
いい内容だけど歴史を交えているせいで長すぎる。純粋に因果推論とか因果ダイヤグラムを学びたいなら伝えたい点に絞ってある方が学びやすい。

0
2023年02月05日

Posted by ブクログ

物語としてはとても面白かったです。ピアソンやフィッシャーといった大家のプライベートな側面や、著者が歩んできた特別な道筋など。
ところどころ数式が出てきますが、このあたりは縦書きで読むのややしんどかったです。技術的なところは別の本で勉強したい気がしています。
強いAIに踏み込もうとする姿勢など、かなりユニークなポジショニングだなと感じました。

0
2022年10月10日

Posted by ブクログ

ネタバレ

難しかった。松尾先生の解説で、何となく全体像は見えたかも。因果関係という当たり前と思える事象に統計学が対応できたのはつい最近らしい。独自の因果モデルを作れば馬券ソフト開発に役立つか?

・相関は見られたが、因果については何も言えない 時代が続いた。
・因果について表現する言語を発明→因果ダイアグラム
・相関を解析するのには交絡因子が課題。主流はランダム化比較試験(RCT)
・RCTができない場合が多いので、交絡因子を調整して因果効果を推論する
 ・コライダー(結合)を調整してしまうと、元の変数が独立から従属に変わる。
 ・モンティホールパラドックスは司会者のドア選択がコライダーとなり新車の位置と出場者のドア選択に影響
・Do演算子を導入して数式化。ある薬(drug)Dを患者に与えて それが寿命(lifespan)Lに与える影響はP(L|do(D))と表現(Pは確率)
・患者が自主的に薬Dを服用したのを観察した際の数式P(L|D)と P(L|do(D))
は別物。Do演算子は介入を表す。
・Do演算子の数式を解くには、交絡因子を調整する。介入と結果の間の交絡因子を含むバックドア経路を交絡因子を調整することによってブロックする方法が一般的だが、介入と結果の経路に中間因子があれば、介入データを調整することで介入→中間因子→結果の因果効果を推定できる。
・因果ダイアグラムを用いると、観察データや実験データを使い、現実ではない筋書き=反事実的なシナリオについて情報を引き出せる。もし〇〇だったら、××だったのにという仮定法過去を定量化できるようになる。

0
2023年03月24日

「学術・語学」ランキング