作品一覧

  • 強い将棋ソフトの創りかた
    -
    ※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 Pythonプログラミングを行いながら、ディープラーニングの技術を使った将棋AIを完成させていきます。 ディープラーニングフレームワークのPyTorchを活用し、Google Colabで動かしながら学びます。 本書には3つの目的があります。 1つの目的は、ディープラーニングを使用した将棋AIの仕組みを解説することです。ディープラーニングを使用した将棋AIは、従来型の将棋AIよりも特に序中盤での大局観に優れていると言われており、その疑問に答えます。 もう1つの目的は、実際に手を動かして将棋AIを実装してみることです。Pythonプログラミングを行いながら将棋AIを完成させます。 最後の目的は、強い将棋ソフトを創ることです。コンピュータ将棋の大会で優勝したGCT電竜を超えるような、より強い将棋AIを創る方法を解説していきます。 Part 1 導入編 第1章コンピュータ将棋について Part 2 理論編 第2章コンピュータ将棋のアルゴリズム 第3章ディープラーニングの基本 Part 3 実装編 第4章ディープラーニングフレームワーク 第5章Pythonで将棋AIを創る 第6章対局プログラムの実装 第7章GCT電竜を超える強い将棋AIを創る Part 4 発展編 第8章さらに強くするために
  • 将棋AIで学ぶディープラーニング
    5.0
    1巻3,498円 (税込)
    ※この商品はタブレットなど大きいディスプレイを備えた端末で読むことに適しています。また、文字だけを拡大することや、文字列のハイライト、検索、辞書の参照、引用などの機能が使用できません。 人より強い“将棋プログラム”を作ろう 2016年3月、プロ棋士に勝つには後10年かかると言われていたコンピュータ囲碁でAlphaGoがトップ棋士に勝利しました。そこで使われた手法がディープラーニングです。 AlphaGoは局面を「画像」として認識し、打ち手の確率と局面の勝率を予測することで、次の打ち手を決めています。画像とはどのようなものか、次の打ち手をどうやって決めるのか?AlphaGoの論文をヒントに、ディープラーニングを使い棋譜を学習した将棋AIの開発を行います。強化学習のみでトップレベルの強さを持つAlphaZeroの手法も取り入れています。 [導入編]では、コンピュータ将棋の歴史とディープラーニングの関係、コンピュータ将棋の大会の概要を紹介します。 [理論編]では、従来のコンピュータ将棋のアルゴリズム、コンピュータ囲碁で用いられているモンテカルロ木探索とAlphaGoがどのようにディープラーニングを応用したか。基礎的な知識について解説しつつ、これらを将棋AIに応用する方法について述べます。 [実践編]では、ディープラーニングを使った以下の3つの将棋AIについて、PythonとChainerで実装していきます。 方策ネットワーク(policy network)を使って指し手の予測のみでプレイするAI 価値ネットワーク(value network)を使って1手探索を行うAI 方策ネットワークと価値ネットワークを使ってモンテカルロ木探索を行うAI 最後に、より強い将棋AIを作りたいという方のために、ヒントとなる情報を紹介します。

ユーザーレビュー

  • 将棋AIで学ぶディープラーニング

    Posted by ブクログ

    Ⅰ部 導入編
     1章 コンピュータ将棋について
      省略
    Ⅱ部 理論編
     2章 コンピュータ将棋のアルゴリズム
      ゲームの木、ミニマックス法、αβ法、評価関数について簡単な説明
     3章 コンピュータ囲碁のアルゴリズム
      モンテカルロ法とその発展版UCTアルゴリズム
     4章 AlphaGoの手法
      優先順位制御の改善 -> 方策ネットワーク
      プレイアウトの改善 -> 価値ネットワーク

      方策ネットワーク
       囲碁の局面を画像のように認識して多くの棋譜を学習させてどの着手から優先して指すか決める
      価値ネットワーク
       囲碁の局面を画像のように認識して直接その局面を

    0
    2019年12月28日
  • 将棋AIで学ぶディープラーニング

    Posted by ブクログ

    本書は、囲碁におけるAlphaGoの手法を参照しつつ、コンピュータ将棋のアルゴリズムを、モンテカルロ法+ディープラーニングを使って、実装する方法を解説している。

    コンピュータ将棋の従来手法
    →ミニマックス法。
    評価関数の質が要であり、2006年のBonanzaが初めて、評価関数の機械学習を導入した。

    コンピュータ囲碁で用いられているモンテカルロ法
    →ランダムに終局までプレイして、
    その勝敗の平均値から、最も勝率の高い手を選択する。

    AlphaGoにおける、ディープラーニングの適用範囲は、次の2点
    方策ネットワーク(Policy Network)
    → 合法手の中から探索すべき手を選択 →

    0
    2018年05月29日

新規会員限定 70%OFFクーポンプレゼント!