強化学習 講談社作品一覧

  • イラストで学ぶ 人工知能概論 改訂第2版
    -
    ★初学者向けの名著を100ページ増の大改訂! ホイールダック2号は深層学習を手に入れた!★ ・全面的に記述を見直すも、第1版との連続性を最大限保ち、ますますパワーアップ! ・「ニューラルネットワーク」の章を新設し、深層学習の歴史的位置づけ、CNN、RNNをわかりやすく解説した! ・「確率的生成モデル」の章を新設し、強化学習・状態推定・教師なし学習などに関わる解説に芯を通すことができた! まずは、この1冊から始めよう! 【主な内容】 第1章 人工知能をつくり出そう  第2章 探索(1):状態空間と基本的な探索 第3章 探索(2):最適経路の探索 第4章 探索(3):ゲームの理論 第5章 計画と決定(1):動的計画法 第6章 確率モデル(1):確率とベイズ理論の基礎  第7章 確率モデル(2):確率的生成モデルとナイーブベイズ 第8章 計画と決定(2):強化学習 第9章 状態推定(1):ベイズフィルタ 第10章 状態推定(2):粒子フィルタ 第11章 学習と認識(1):クラスタリングと教師なし学習  第12章 学習と認識(2):パターン認識と教師あり学習  第13章 学習と認識(3):ニューラルネットワーク  第14章 言語と論理(1):自然言語処理  第15章 言語と論理(2):記号論理  第16章 言語と論理(3):証明と質問応答  第17章 まとめ:知能を「つくる」ということ
  • イラストで学ぶ ディープラーニング 改訂第2版
    3.0
    おお!もう第2版! 深層学習ベストセラーがさらにパワーアップ。リカレントニューラルネットワーク、GAN、深層強化学習の「章」が新たに加わり、ツールの最新事情も反映された。50ページ以上増強されたお得な一冊!
  • 機械学習スタートアップシリーズ ゼロからつくるPython機械学習プログラミング入門
    -
    ★★理論と実装のバランスがよい、「機械学習 with Python」の決定版★★ ■機械学習モジュールが普及することにより、かえって学びづらくなった機械学習アルゴリズムの基本を徹底マスター! ■scikit-learnを使わない、numpyとpandasのみのコーディングで、実装力がスキルアップ! ■ブラックボックスの中身を理解し、一生モノの知識を身につけよう! 【本書のサポートページ】すぐに実践できるコードがWeb公開! https://github.com/hhachiya/MLBook  【機械学習スタートアップシリーズ】 https://www.kspub.co.jp/book/series/S042.html 【主な内容】 第1章 機械学習とは何か 第2章 Python入門 第3章 数学のおさらい(線形代数、最適化、確率、統計) 第4章 回帰分析(線形回帰分析、ロジスティック回帰分析) 第5章 分類(線形判別分析、サポートベクトルマシン、ナイーブベイズ法、決定木) 第6章 カーネルモデル 第7章 ニューラルネットワーク 第8章 強化学習 第9章 教師なし学習(主成分分析、因子分析、クラスター分析)
  • 機械学習スタートアップシリーズ Pythonで学ぶ強化学習 [改訂第2版] 入門から実践まで
    4.0
    「Pythonで強化学習が実装できる!」と好評を得た入門書の改訂版。読者からの要望・指摘を反映させた。主に、Policy GradientとA2Cの記述・実装を見直した。・Pythonプログラミングとともに、ゼロからていねいに解説。・コードが公開されているから、すぐ実践できる。・実用でのネックとなる強化学習の弱点と、その克服方法まで紹介。【おもな内容】Day1 強化学習の位置づけを知る 強化学習とさまざまなキーワードの関係 強化学習のメリット・デメリット 強化学習における問題設定:Markov Decision Process Day2 強化学習の解法(1): 環境から計画を立てる 価値の定義と算出: Bellman Equation 動的計画法による状態評価の学習: Value Iteration 動的計画法による戦略の学習: Policy Iteration モデルベースとモデルフリーとの違いDay3 強化学習の解法(2): 経験から計画を立てる 経験の蓄積と活用のバランス: Epsilon-Greedy法 計画の修正を実績から行うか、予測で行うか: Monte Carlo vs Temporal Difference 経験を価値評価、戦略どちらの更新に利用するか:Valueベース vs PolicyベースDay4 強化学習に対するニューラルネットワークの適用 強化学習にニューラルネットワークを適用する 価値評価を、パラメーターを持った関数で実装する:Value Function Approximation 価値評価に深層学習を適用する:Deep Q-Network  戦略を、パラメーターを持った関数で実装する:Policy Gradient 戦略に深層学習を適用する:Advantage Actor Critic (A2C) 価値評価か、戦略かDay5 強化学習の弱点 サンプル効率が悪い 局所最適な行動に陥る、過学習をすることが多い 再現性が低い 弱点を前提とした対応策Day6 強化学習の弱点を克服するための手法 サンプル効率の悪さへの対応: モデルベースとの併用/表現学習 再現性の低さへの対応: 進化戦略 局所最適な行動/過学習への対応: 模倣学習/逆強化学習Day7 強化学習の活用領域 行動の最適化 学習の最適化
  • 強化学習
    5.0
    理論は裏切らない! ・強化学習で必要になる数理を広くカバーした。・一貫したていねいな解説なので、じっくり読める。付録・参考文献も充実!・ベルマン方程式、TD学習、方策勾配、POMDP、深層強化学習をより深く!/【おもな内容】 第1章 準備 1.1 強化学習とは 1.2 マルコフ決定過程と逐次的意思決定問題 1.3 方策 1.4 逐次的意思決定問題の定式化  第2章 プランニング 2.1 準備 2.2 動的計画法 2.3 動的計画法による解法 2.4 線形計画法による解法 第3章 探索と活用のトレードオフ 3.1 概要 3.2 探索と活用のトレードオフ 3.3 方策モデル  第4章 モデルフリー型の強化学習 4.1 データにもとづく意思決定 4.2 価値関数の推定 4.3 方策と行動価値関数の学習 4.4 収束性 4.5 アクター・クリティック法 第5章 モデルベース型の強化学習 5.1 問題設定の整理 5.2 環境推定 5.3 ブラックボックス生成モデルに対するプランニング 5.4 オンラインのモデルベース型強化学習 第6章 関数近似を用いた強化学習 6.1 概要 6.2 価値関数の関数近似 6.3 方策の関数近似 第7章 部分観測マルコフ決定過程 7.1 部分観測マルコフ決定過程(POMDP)の基礎 7.2 POMDP のプランニング 7.3 POMDP の学習 第8章 最近の話題 8.1 分布強化学習 8.2 深層強化 学習付録A 補足A.1 証明 A.2 ノルム A.3 線形計画法 A.4 自然勾配法の補足
  • これならわかる機械学習入門
    4.0
    【道具として使いこなす!】 膨大な観測データから普遍的な法則を抽出する手法とは? 高校数学レベルから始まり、Python入門、TensorFlowによる実装、最新の論文まで踏み込む入門書。 【著者サポートページ】 https://github.com/akio-tomiya/intro_ml_in_physics 【目次】 第1章 データとサイエンス 1.1 物理学とデータサイエンス/1.2 最小2乗法とオーバーフィット/1.3 テイラー展開と振り子の等時性/コラム:武谷の三段階論 第2章 行列と線形変換 2.1 ベクトル、行列と線形変換/2.2 変換としての行列/2.3 行列に関する色々/コラム:計算量のオーダー 第3章 確率論と機械学習 3.1 確率の基礎事項/3.2 教師あり学習と教師なし学習、強化学習/3.3 確率変数と経験的確率、大数の法則/3.4 大数の弱法則の証明/3.5 カルバックライブラーダイバージェンス/3.6 尤度と赤池情報量基準、汎化/3.7 ロジスティック回帰 第4章 ニューラルネットワーク 4.1 ニューラルネットワークの概論/4.2 万能近似定理/コラム:新しい道具と新理論 第5章 トレーニングとデータ 5.1 ニューラルネットワークの入出力と学習/5.2 誤差関数と汎化、過学習/5.3 誤差関数の最適化・学習/コラム:次元の呪い 第6章 Python入門 6.1 Pythonによるプログラミング入門/6.2 Pythonと他言語の比較/6.3 NumPyとMatplotlib/6.4 Pythonでのクラス 第7章 TensorFlowによる実装 7.1 TensorFlow/Kerasとは/7.2 データやライブラリのロード/7.3 データの分割とニューラルネットワークの設計/7.4 学習/7.5 結果の評価/コラム:量子化という用語 第8章 最適化、正則化、深層化 8.1 最適化法の改良/8.2 過学習を防ぐ/8.3 多層化にむけて 第9章 畳み込みニューラルネットワーク 9.1 フィルター/9.2 畳み込みニューラルネット/コラム:知能と飛行機 第10章 イジング模型の統計力学 10.1 イジング模型/10.2 イジング模型のモンテカルロ法/10.3 熱浴法のPythonコードとデータの準備/コラム:統計力学と場の量子論 第11章 Nature Physicsの論文を再現しよう 11.1 論文について/11.2 データの前処理/11.3 実験
  • 詳解 確率ロボティクス Pythonによる基礎アルゴリズムの実装
    -
    僕たちは、こんな本を待っていた。Sebastian Thrunらの名著『確率ロボティクス』(マイナビ)の翻訳者であり、同分野の第一人者でもある、上田隆一氏が書き下ろす至極の入門書! ・理論→実装という一貫した流れで、丁寧に解説。まさにバイブル!・Jupyter Notebook対応だから、すぐに実践できる!・コードはGitHubで全部公開!【第1章「はじめに」より抜粋】 本書は、確率をロボットの認識機能や制御に用いることを考える分野「確率ロボティクス」の入門書です。ロボットの開発者、研究者になるには機械、計算機、制御に関する勉強も必要なうえ、上記のような状況なので、確率論、統計学の理解も重要になってきています。たくさん勉強しなければならないので「手短に」といいたいところですが、確率というものに実感がもてるまでには頭の訓練が必要です。 筆者は学生のとき、確率に対する実感を養うために(実際は家賃込みの月6万円の仕送りを増やすために)、学生寮、後楽園、高田馬場あたりの「現場」でかなりの訓練をして仕送りを減らしていましたが、そちらをおすすめするわけにはいきません。そこでロボティクスでよく使われるアルゴリズムを書いて動かしてもらい、実感をもってもらおうと企画したのが本書です。【主な内容】第1部 準備/第1章 はじめに/第2章 確率・統計の基礎/第3章 自律ロボットのモデル化/第4章 不確かさのモデル化 第2部 自己位置推定とSLAM/第5章 パーティクルフィルタによる自己位置推定/第6章 カルマンフィルタによる自己位置推定/第7章 自己位置推定の諸問題/第8章 パーティクルフィルタによるSLAM/第9章 グラフ表現によるSLAM 第3部 行動決定第/10章 マルコフ決定過程と動的計画法/第11章 強化学習/第12章 部分観測マルコフ決定過程 付録A ベイズ推論によるセンサデータの解析 付録B 計算

最近チェックした本