山岡忠夫のレビュー一覧 - 電子書籍・無料漫画ならブックライブ

強い将棋ソフトの創りかた

山岡忠夫 / 加納邦彦

5.0

Posted by ブクログ

最近は以前ほど指さなくなったが、将棋には長く親しんでおり、そのAIの裏側には強い興味を抱いていた。専門的な内容ゆえ、上原隆平著『はじめてのアルゴリズム』のような難解な解説が続くことを覚悟してページをめくったが、意外にも分かりやすい雰囲気に満ちていた。

将棋愛好家にとって聞き慣れた用語が多用されているため、AI全般、そして将棋AIの仕組みを理解する上で非常に相性の良いテキストだと感じる。

本書で触れられているミニマックス法やモンテカルロ木探索といったアルゴリズムは、Web開発など他分野にも通じる知識だと思う。チェスや囲碁との比較、Pythonが選ばれる理由などの背景知識も充実しており、現

0

2025年12月22日

将棋AIで学ぶディープラーニング

山岡忠夫

IT・コンピュータ / 全般

5.0

(2)

Posted by ブクログ

Ⅰ部導入編
　1章コンピュータ将棋について
　　省略
Ⅱ部理論編
　2章コンピュータ将棋のアルゴリズム
　　ゲームの木、ミニマックス法、αβ法、評価関数について簡単な説明
　3章コンピュータ囲碁のアルゴリズム
　　モンテカルロ法とその発展版UCTアルゴリズム
　4章 AlphaGoの手法
　　優先順位制御の改善 -> 方策ネットワーク
　　プレイアウトの改善 -> 価値ネットワーク

　　方策ネットワーク
　　　囲碁の局面を画像のように認識して多くの棋譜を学習させてどの着手から優先して指すか決める
　　価値ネットワーク
　　　囲碁の局面を画像のように認識して直接その局面を

0

2019年12月28日

将棋AIで学ぶディープラーニング

山岡忠夫

IT・コンピュータ / 全般

5.0

(2)

Posted by ブクログ

本書は、囲碁におけるAlphaGoの手法を参照しつつ、コンピュータ将棋のアルゴリズムを、モンテカルロ法＋ディープラーニングを使って、実装する方法を解説している。

コンピュータ将棋の従来手法
→ミニマックス法。
評価関数の質が要であり、2006年のBonanzaが初めて、評価関数の機械学習を導入した。

コンピュータ囲碁で用いられているモンテカルロ法
→ランダムに終局までプレイして、
その勝敗の平均値から、最も勝率の高い手を選択する。

AlphaGoにおける、ディープラーニングの適用範囲は、次の２点
方策ネットワーク（Policy Network）
→ 合法手の中から探索すべき手を選択 →

0

2018年05月29日