山岡忠夫の作品一覧

「山岡忠夫」の「将棋AIで学ぶディープラーニング」「強い将棋ソフトの創りかた」ほか、ユーザーレビューをお届けします！

作者をフォローする

フォローすると、この作者の新刊が配信された際に、お知らせします。

作品一覧

新着順

強い将棋ソフトの創りかた

5.0

IT・コンピュータ / 言語・プログラミング

1巻3,608円 (税込)

※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 Pythonプログラミングを行いながら、ディープラーニングの技術を使った将棋AIを完成させていきます。ディープラーニングフレームワークのPyTorchを活用し、Google Colabで動かしながら学びます。本書には3つの目的があります。 1つの目的は、ディープラーニングを使用した将棋AIの仕組みを解説することです。ディープラーニングを使用した将棋AIは、従来型の将棋AIよりも特に序中盤での大局観に優れていると言われており、その疑問に答えます。もう1つの目的は、実際に手を動かして将棋AIを実装してみることです。Pythonプログラミングを行いながら将棋AIを完成させます。最後の目的は、強い将棋ソフトを創ることです。コンピュータ将棋の大会で優勝したGCT電竜を超えるような、より強い将棋AIを創る方法を解説していきます。 Part 1　導入編第1章コンピュータ将棋について Part 2　理論編第2章コンピュータ将棋のアルゴリズム第3章ディープラーニングの基本 Part 3　実装編第4章ディープラーニングフレームワーク第5章Pythonで将棋AIを創る第6章対局プログラムの実装第7章GCT電竜を超える強い将棋AIを創る Part 4　発展編第8章さらに強くするために

試し読みフォロー
将棋AIで学ぶディープラーニング

5.0

IT・コンピュータ / 全般

1巻3,498円 (税込)

※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。人より強い“将棋プログラム”を作ろう 2016年3月、プロ棋士に勝つには後10年かかると言われていたコンピュータ囲碁でAlphaGoがトップ棋士に勝利しました。そこで使われた手法がディープラーニングです。 AlphaGoは局面を「画像」として認識し、打ち手の確率と局面の勝率を予測することで、次の打ち手を決めています。画像とはどのようなものか、次の打ち手をどうやって決めるのか？AlphaGoの論文をヒントに、ディープラーニングを使い棋譜を学習した将棋AIの開発を行います。強化学習のみでトップレベルの強さを持つAlphaZeroの手法も取り入れています。［導入編］では、コンピュータ将棋の歴史とディープラーニングの関係、コンピュータ将棋の大会の概要を紹介します。［理論編］では、従来のコンピュータ将棋のアルゴリズム、コンピュータ囲碁で用いられているモンテカルロ木探索とAlphaGoがどのようにディープラーニングを応用したか。基礎的な知識について解説しつつ、これらを将棋AIに応用する方法について述べます。［実践編］では、ディープラーニングを使った以下の３つの将棋AIについて、PythonとChainerで実装していきます。方策ネットワーク（policy network）を使って指し手の予測のみでプレイするAI 価値ネットワーク（value network）を使って1手探索を行うAI 方策ネットワークと価値ネットワークを使ってモンテカルロ木探索を行うAI 最後に、より強い将棋AIを作りたいという方のために、ヒントとなる情報を紹介します。

試し読みフォロー

山岡忠夫の詳細検索へ

ユーザーレビュー

一覧 >>

強い将棋ソフトの創りかた
IT・コンピュータ / 言語・プログラミング

5.0

(1)
- カート
- 試し読み
Posted by ブクログ

最近は以前ほど指さなくなったが、将棋には長く親しんでおり、そのAIの裏側には強い興味を抱いていた。専門的な内容ゆえ、上原隆平著『はじめてのアルゴリズム』のような難解な解説が続くことを覚悟してページをめくったが、意外にも分かりやすい雰囲気に満ちていた。

将棋愛好家にとって聞き慣れた用語が多用されているため、AI全般、そして将棋AIの仕組みを理解する上で非常に相性の良いテキストだと感じる。

本書で触れられているミニマックス法やモンテカルロ木探索といったアルゴリズムは、Web開発など他分野にも通じる知識だと思う。チェスや囲碁との比較、Pythonが選ばれる理由などの背景知識も充実しており、現

0

2025年12月22日
将棋AIで学ぶディープラーニング
IT・コンピュータ / 全般

5.0

(2)
- カート
- 試し読み
Posted by ブクログ

Ⅰ部導入編
　1章コンピュータ将棋について
　　省略
Ⅱ部理論編
　2章コンピュータ将棋のアルゴリズム
　　ゲームの木、ミニマックス法、αβ法、評価関数について簡単な説明
　3章コンピュータ囲碁のアルゴリズム
　　モンテカルロ法とその発展版UCTアルゴリズム
　4章 AlphaGoの手法
　　優先順位制御の改善 -> 方策ネットワーク
　　プレイアウトの改善 -> 価値ネットワーク

　　方策ネットワーク
　　　囲碁の局面を画像のように認識して多くの棋譜を学習させてどの着手から優先して指すか決める
　　価値ネットワーク
　　　囲碁の局面を画像のように認識して直接その局面を

0

2019年12月28日
将棋AIで学ぶディープラーニング
IT・コンピュータ / 全般

5.0

(2)
- カート
- 試し読み
Posted by ブクログ

本書は、囲碁におけるAlphaGoの手法を参照しつつ、コンピュータ将棋のアルゴリズムを、モンテカルロ法＋ディープラーニングを使って、実装する方法を解説している。

コンピュータ将棋の従来手法
→ミニマックス法。
評価関数の質が要であり、2006年のBonanzaが初めて、評価関数の機械学習を導入した。

コンピュータ囲碁で用いられているモンテカルロ法
→ランダムに終局までプレイして、
その勝敗の平均値から、最も勝率の高い手を選択する。

AlphaGoにおける、ディープラーニングの適用範囲は、次の２点
方策ネットワーク（Policy Network）
→ 合法手の中から探索すべき手を選択 →

0

2018年05月29日