松尾豊の一覧
「松尾豊」の新着作品・人気作品や、最新のユーザーレビューをお届けします!
作者を フォローする
フォローするとこの作者の新刊が配信された際に、お知らせします。
値引き作品コーナー
配信予定・最新刊
ユーザーレビュー
今までの機械学習の歴史や仕組み、これからのAIの展望が書いてある。
第一次と第二次AIブームという数十年ながら長く悲観的な歴史から第三次という成功したディープラーニングについてとてもわかりやすく書かれていた。
やはり、AIの話は研究者に喋らせるべきだと感じた。
Posted by ブクログ
『自主的に薬Dを服用した患者の寿命Lの観察頻度は、数学的にはP(L|D)という式で表すことになる。これは、統計学の教科書に出てくる標準的な条件付き確率の式だ。この式が表現しているのは、患者が薬Dを服用したのを見て考慮に入れた場合の寿命Lの確率Pである。P(L|D)とP(L|do(D))ではまったく違
...続きを読む うことに注意してほしい。見ること(観察)と行動すること(介入)は根本的に違う。そしてこの違いは、私たちが気圧計の測定値の低下を嵐が来る原因とみなさない理由の説明になる。気圧計の値が下がっているのを見て、それを考慮に入れれば、嵐の確率は上がっていると考えていいが、気圧計の値を無理に下げたとしても、嵐が来る確率に変化は起きないのだ』―『序章 「因果推論」という新しい科学/因果ダイアグラムと記号言語』
1999年に書いたテクニカルノートの冒頭に「一般に回帰法を用いたデータ処理においては、データ空間の中に潜在する関係を見い出すデータモデリングに着目した部分と、データから推定されたモデルの評価/最適化に着目した部分があり、各々に技術的な要素がある。ここではまずデータモデリングの部分について技術的要素を整理し、その後、モデルの評価/最適化に係わる技術的要素について言及する」と記してある。拙い論考ではあるが、ここでデータ解析の実務者としての自分が考えていたことは、物理学的なデータ間の関係性と統計学的な関係性とは分けて考えておかなければならない、ということであったと顧みる。如何にそれらしい関係性をデータ群から見出しても物理学的な関係性に落とし込めなければ意味はないとの戒めが当時の自分にもあったのだ。だからこそ、非線形の回帰法を利用しつつ如何に物理的な裏付けのある関係性を見い出すかということを懸命に模索していた時にこんなメモを残したのだ。その「物理的な関係」を広義に言い直してみれば「因果律」ということになる。それは、原著のタイトル「The Book of Why」の答えとしてデータを前にした者が求めたいものである。しかし、アインシュタインは一般相対性理論を展開する中で全ての事象は相対的な関係でしか著せないと言った。事象Aに事象Bが先行しているように見える世界もあれば、その逆に見える世界も同時に存在し得る。だとすればAがBの結果であるという単純な因果律など存在しないのかという極端な話にもなるが、ヒトは自分の生きている世界観の中で因果律を求めたがる生き物だ(だからこそ都市伝説や陰謀論に引き付けられる人々も多いのだろう)。ラプラス的世界観は現代物理学では否定されているにも拘らず、人は因果律を求めその応用として未来を予想しようとする。閑話休題。
本書は、一般ビジネス書の書棚に平積みされるような本ではあるけれど、決して万人が読んですぐに得心できる類の本ではない。少なくとも、統計学的な一般素養が必要とされる。統計学的な一般素養とは、単に統計処理ソフトを使えるという意味では決してなくて、その処理で用いられている手法についての理解、データを扱う上での注意点などを理解している、という意味である。例えば、職場のパソコンに必ず入っているであろう表計算ソフトを利用して二つのデータの関係性が近似式で散布図に挿入されたのを見て係数を知れば充分という人に、この本はお勧めできない。多変量解析において独立変数の選択や次元の呪いに苦しんだことがあり、より自然な関係性を求めて非線形の関係式をモデルとして検証したいと思いつつ不用意な変数の変形によるデータの偏重を如何に避けるかということに取り組んだことのある人であれば、ひょっとすると面白く読めるかも知れない。データマイニング的な手法を扱ったことがあれば申し分ないし、ディープラーニングの理論的な側面を学んだことがある人なら正に著者が想定している読者になれるだろう。それでも統計学者ではない実務者にとってはやや意外でもある「因果律」を否定する統計学界の風習に対して、それを形而上学的な論争ではなく数学的に自明な解決を目指して理論を展開してきた著者の技法については、この本を読んだからと言って完全に理解できる訳ではない。だが、著者が何故「因果ダイアグラム」という手法に拘り、do演算子などを駆使して「左辺」と「右辺」の関係性を単純な「対比」から「因果」へ導こうしているのかの主張はよく理解できる。ただし繰り返しになるが、表計算ソフトで回帰分析をする際に、XとYを入れ替えることの意味や主成分分析との違いを(つまり、観測されたデータは、観測されていないデータも含めたデータ群が形成する空間をより低い次元の空間に落とし込んだ「影」に過ぎないのだと)認識していない人には、回りくどく、そして、やや自慢話的な語りの多い本書はとても読み難い本ではあるだろう。
『科学的な問いの中でも回顧的な思考が関わるものには、「反事実」と呼ばれる因果推論に特有の、別の種類の表現が必要になる。たとえば、ジョーが薬Dを服用して、一カ月後に死亡したとする。ここで問いたいのは、果たして薬Dは彼の死の原因なのか否かということだ。この問いに答えるには、ジョーは薬を服用しようとしていたが、結局は気が変わって服用しなかった、という架空の筋書きを想像する必要がある。この場合、果たしてジョーは死なずに生きているだろうか。すでに書いたとおり、古典的な統計学はデータを要約するだけである。つまり、この問いを表現するための言語すら持っていないということだ』―『序章 「因果推論」という新しい科学/反事実的推論の重要性』
著者が断言する「データは何も教えてくれない」とは、実に刺戟的だが、昨今のディープラーニング型の人工知能信奉が蔓延る中、心に留めておくべき言葉であると思う。そんな風潮に流される若い世代の技術者に接して思い出すのは、データ解析初学者であった頃によく先達から言われた「ガーベージ・イン・ガーベージ・アウト」という言葉。何でも良いから大量のデータを読み込ませて、どうしてそうなるのかも解らない畳みこみニューラルネットワークの出した答えが見た目それらしいからと言って受け入れる風潮には自分も違和感がある。私見だが、ニューラルネットワーク的な手法がやっているのは極端に言えばデータのオーバーシュートで、幾重にも再帰的に入れ子になった多変量の多項式。そこから見い出される関係性の頑健性はそもそも考慮されていない。データには常にエラーがあり、それを理解しつつ確度の高い関係性を構築するかが本来解析者のやるべき仕事ではないのか。そんな誰に言うともなく言いたかったことを久しぶりに思い出した。
Posted by ブクログ
日進月歩の分野としては、やや古い本になってしまうのかもしれないが、昨今のAI絵やAI文章の簡単な仕組みが理解できた。わかりやすい。
Posted by ブクログ
因果推論って難しくて腑に落としにくいですが
先人たちがどう悩んで論を立てていったかをなぞることにより理解を深めるってのはありですね
スラスラ読めるってほどでは流石にないですが内容の難しさの割にはリーダブルで好著
Posted by ブクログ
人工知能について、ディープラーニングについて、素人にも概念が掴めるように丁寧に解説していて非常に良かった。
2014年時点で人工知能学者の目指している人工知能はまだ出来ていないが、人工知能が出来ないわけがない。その理由も述べられているが、これには首肯する他ない。
また、あとがきの筆者の純粋な人工知
...続きを読む 能に対する思いになんだか笑ってしまった。
今読んでも学びになる、とても良い本だと思う。
Posted by ブクログ
松尾豊のレビューをもっと見る