山岡忠夫の作品一覧
「山岡忠夫」の「将棋AIで学ぶディープラーニング」「強い将棋ソフトの創りかた」ほか、ユーザーレビューをお届けします!
- 作者をフォローする
- フォローすると、この作者の新刊が配信された際に、お知らせします。
無料マンガ・ラノベなど、豊富なラインナップで100万冊以上配信中!
「山岡忠夫」の「将棋AIで学ぶディープラーニング」「強い将棋ソフトの創りかた」ほか、ユーザーレビューをお届けします!
Posted by ブクログ
本書は、囲碁におけるAlphaGoの手法を参照しつつ、コンピュータ将棋のアルゴリズムを、モンテカルロ法+ディープラーニングを使って、実装する方法を解説している。
コンピュータ将棋の従来手法
→ミニマックス法。
評価関数の質が要であり、2006年のBonanzaが初めて、評価関数の機械学習を導入した。
コンピュータ囲碁で用いられているモンテカルロ法
→ランダムに終局までプレイして、
その勝敗の平均値から、最も勝率の高い手を選択する。
AlphaGoにおける、ディープラーニングの適用範囲は、次の2点
方策ネットワーク(Policy Network)
→ 合法手の中から探索すべき手を選択 →