強化学習講談社一覧 - 漫画・ラノベ（小説）・無料試し読みなら、電子書籍・コミックストアブックライブ

イラストで学ぶ　人工知能概論　改訂第２版

-

1巻2,860円 (税込)

★初学者向けの名著を100ページ増の大改訂！　ホイールダック２号は深層学習を手に入れた！★ ・全面的に記述を見直すも、第1版との連続性を最大限保ち、ますますパワーアップ！・「ニューラルネットワーク」の章を新設し、深層学習の歴史的位置づけ、CNN、RNNをわかりやすく解説した！・「確率的生成モデル」の章を新設し、強化学習・状態推定・教師なし学習などに関わる解説に芯を通すことができた！まずは、この１冊から始めよう！【主な内容】第1章人工知能をつくり出そう　第2章探索(1)：状態空間と基本的な探索第3章探索(2)：最適経路の探索第4章探索(3)：ゲームの理論第5章計画と決定(1)：動的計画法第6章確率モデル(1)：確率とベイズ理論の基礎　第7章確率モデル(2)：確率的生成モデルとナイーブベイズ第8章計画と決定(2)：強化学習第9章状態推定(1)：ベイズフィルタ第10章状態推定(2)：粒子フィルタ第11章学習と認識(1)：クラスタリングと教師なし学習　第12章学習と認識(2)：パターン認識と教師あり学習　第13章学習と認識(3)：ニューラルネットワーク　第14章言語と論理(1)：自然言語処理　第15章言語と論理(2)：記号論理　第16章言語と論理(3)：証明と質問応答　第17章まとめ：知能を「つくる」ということ

試し読みフォロー

イラストで学ぶ　ディープラーニング　改訂第２版

3.0

山下隆義

学術・語学 / 理工

ＫＳ情報科学専門書

1巻2,860円 (税込)

おお!もう第2版! 深層学習ベストセラーがさらにパワーアップ。リカレントニューラルネットワーク、GAN、深層強化学習の｢章｣が新たに加わり、ツールの最新事情も反映された。50ページ以上増強されたお得な一冊!

試し読みフォロー

機械学習スタートアップシリーズ　ゼロからつくるＰｙｔｈｏｎ機械学習プログラミング入門

-

八谷大岳

IT・コンピュータ / 言語・プログラミング

ＫＳ情報科学専門書

1巻3,300円 (税込)

★★理論と実装のバランスがよい、「機械学習 with Python」の決定版★★ ■機械学習モジュールが普及することにより、かえって学びづらくなった機械学習アルゴリズムの基本を徹底マスター！ ■scikit-learnを使わない、numpyとpandasのみのコーディングで、実装力がスキルアップ！ ■ブラックボックスの中身を理解し、一生モノの知識を身につけよう！【本書のサポートページ】すぐに実践できるコードがWeb公開！ https://github.com/hhachiya/MLBook　【機械学習スタートアップシリーズ】 https://www.kspub.co.jp/book/series/S042.html 【主な内容】第1章機械学習とは何か第2章 Python入門第3章数学のおさらい（線形代数、最適化、確率、統計）第4章回帰分析（線形回帰分析、ロジスティック回帰分析）第5章分類（線形判別分析、サポートベクトルマシン、ナイーブベイズ法、決定木）第6章カーネルモデル第7章ニューラルネットワーク第8章強化学習第9章教師なし学習（主成分分析、因子分析、クラスター分析）

試し読みフォロー

機械学習スタートアップシリーズ　Ｐｙｔｈｏｎで学ぶ強化学習　［改訂第２版］　入門から実践まで

4.0

久保隆宏

IT・コンピュータ / 全般

ＫＳ情報科学専門書

1巻3,080円 (税込)

「Ｐｙｔｈｏｎで強化学習が実装できる！」と好評を得た入門書の改訂版。読者からの要望・指摘を反映させた。主に、ＰｏｌｉｃｙＧｒａｄｉｅｎｔとＡ２Ｃの記述・実装を見直した。・Pythonプログラミングとともに、ゼロからていねいに解説。・コードが公開されているから、すぐ実践できる。・実用でのネックとなる強化学習の弱点と、その克服方法まで紹介。【おもな内容】Day1　強化学習の位置づけを知る　強化学習とさまざまなキーワードの関係　強化学習のメリット・デメリット　強化学習における問題設定：Markov Decision Process　Day2　強化学習の解法(1): 環境から計画を立てる　価値の定義と算出: Bellman Equation　動的計画法による状態評価の学習: Value Iteration　動的計画法による戦略の学習: Policy Iteration　モデルベースとモデルフリーとの違いDay3　強化学習の解法(2): 経験から計画を立てる　経験の蓄積と活用のバランス: Epsilon-Greedy法　計画の修正を実績から行うか、予測で行うか: Monte Carlo vs Temporal Difference　経験を価値評価、戦略どちらの更新に利用するか：Valueベース vs PolicyベースDay4　強化学習に対するニューラルネットワークの適用　強化学習にニューラルネットワークを適用する　価値評価を、パラメーターを持った関数で実装する：Value Function Approximation　価値評価に深層学習を適用する：Deep Q-Network 　戦略を、パラメーターを持った関数で実装する：Policy Gradient　戦略に深層学習を適用する：Advantage Actor Critic (A2C)　価値評価か、戦略かDay5　強化学習の弱点　サンプル効率が悪い　局所最適な行動に陥る、過学習をすることが多い　再現性が低い　弱点を前提とした対応策Day6　強化学習の弱点を克服するための手法　サンプル効率の悪さへの対応: モデルベースとの併用/表現学習　再現性の低さへの対応: 進化戦略　局所最適な行動/過学習への対応: 模倣学習/逆強化学習Day7　強化学習の活用領域　行動の最適化　学習の最適化

試し読みフォロー

強化学習

5.0

森村哲郎

学術・語学 / 理工

機械学習プロフェッショナルシリーズ

1巻3,300円 (税込)

理論は裏切らない！　・強化学習で必要になる数理を広くカバーした。・一貫したていねいな解説なので、じっくり読める。付録・参考文献も充実！・ベルマン方程式、TD学習、方策勾配、POMDP、深層強化学習をより深く！／【おもな内容】　第1章　準備　1.1　強化学習とは　1.2　マルコフ決定過程と逐次的意思決定問題　1.3　方策　1.4　逐次的意思決定問題の定式化　　第2章　プランニング　2.1　準備　2.2　動的計画法　2.3　動的計画法による解法　2.4　線形計画法による解法　第3章　探索と活用のトレードオフ　3.1　概要　3.2　探索と活用のトレードオフ　3.3　方策モデル　　第4章　モデルフリー型の強化学習　4.1　データにもとづく意思決定　4.2　価値関数の推定　4.3　方策と行動価値関数の学習　4.4　収束性　4.5　アクター・クリティック法　第5章　モデルベース型の強化学習　5.1　問題設定の整理　5.2　環境推定　5.3　ブラックボックス生成モデルに対するプランニング　5.4　オンラインのモデルベース型強化学習　第6章　関数近似を用いた強化学習　6.1　概要　6.2　価値関数の関数近似　6.3　方策の関数近似　第7章　部分観測マルコフ決定過程　7.1　部分観測マルコフ決定過程（POMDP）の基礎　7.2　POMDP のプランニング　7.3　POMDP の学習　第8章　最近の話題　8.1　分布強化学習　8.2　深層強化　学習付録A　補足A.1　証明　A.2　ノルム　A.3　線形計画法　A.4　自然勾配法の補足

試し読みフォロー

これならわかる機械学習入門

4.0

富谷昭夫

学術・語学 / 理工

ＫＳ物理専門書

1巻2,640円 (税込)

【道具として使いこなす！】膨大な観測データから普遍的な法則を抽出する手法とは？高校数学レベルから始まり、Python入門、TensorFlowによる実装、最新の論文まで踏み込む入門書。【著者サポートページ】 https://github.com/akio-tomiya/intro_ml_in_physics 【目次】第1章　データとサイエンス 1.1　物理学とデータサイエンス／1.2　最小2乗法とオーバーフィット／1.3　テイラー展開と振り子の等時性／コラム：武谷の三段階論第2章　行列と線形変換 2.1　ベクトル、行列と線形変換／2.2　変換としての行列／2.3　行列に関する色々／コラム：計算量のオーダー第3章　確率論と機械学習 3.1　確率の基礎事項／3.2　教師あり学習と教師なし学習、強化学習／3.3　確率変数と経験的確率、大数の法則／3.4　大数の弱法則の証明／3.5　カルバックライブラーダイバージェンス／3.6　尤度と赤池情報量基準、汎化／3.7　ロジスティック回帰第4章　ニューラルネットワーク 4.1　ニューラルネットワークの概論／4.2　万能近似定理／コラム：新しい道具と新理論第5章　トレーニングとデータ 5.1　ニューラルネットワークの入出力と学習／5.2　誤差関数と汎化、過学習／5.3　誤差関数の最適化・学習／コラム：次元の呪い第6章　Python入門 6.1　Pythonによるプログラミング入門／6.2　Pythonと他言語の比較／6.3　NumPyとMatplotlib／6.4　Pythonでのクラス第7章　TensorFlowによる実装 7.1　TensorFlow/Kerasとは／7.2　データやライブラリのロード／7.3　データの分割とニューラルネットワークの設計／7.4　学習／7.5　結果の評価／コラム：量子化という用語第8章　最適化、正則化、深層化 8.1　最適化法の改良／8.2　過学習を防ぐ／8.3　多層化にむけて第9章　畳み込みニューラルネットワーク 9.1　フィルター／9.2　畳み込みニューラルネット／コラム：知能と飛行機第10章　イジング模型の統計力学 10.1　イジング模型／10.2　イジング模型のモンテカルロ法／10.3　熱浴法のPythonコードとデータの準備／コラム：統計力学と場の量子論第11章　Nature Physicsの論文を再現しよう 11.1　論文について／11.2　データの前処理／11.3　実験

試し読みフォロー

詳解　確率ロボティクス　Ｐｙｔｈｏｎによる基礎アルゴリズムの実装

-

上田隆一

学術・語学 / 理工

KS理工学専門書

1巻4,290円 (税込)

僕たちは、こんな本を待っていた。Sebastian Thrunらの名著『確率ロボティクス』（マイナビ）の翻訳者であり、同分野の第一人者でもある、上田隆一氏が書き下ろす至極の入門書！　・理論→実装という一貫した流れで、丁寧に解説。まさにバイブル！・Jupyter Notebook対応だから、すぐに実践できる！・コードはGitHubで全部公開！【第1章「はじめに」より抜粋】　本書は、確率をロボットの認識機能や制御に用いることを考える分野「確率ロボティクス」の入門書です。ロボットの開発者、研究者になるには機械、計算機、制御に関する勉強も必要なうえ、上記のような状況なので、確率論、統計学の理解も重要になってきています。たくさん勉強しなければならないので「手短に」といいたいところですが、確率というものに実感がもてるまでには頭の訓練が必要です。　筆者は学生のとき、確率に対する実感を養うために（実際は家賃込みの月6万円の仕送りを増やすために）、学生寮、後楽園、高田馬場あたりの「現場」でかなりの訓練をして仕送りを減らしていましたが、そちらをおすすめするわけにはいきません。そこでロボティクスでよく使われるアルゴリズムを書いて動かしてもらい、実感をもってもらおうと企画したのが本書です。【主な内容】第1部　準備／第1章　はじめに／第2章　確率・統計の基礎／第3章　自律ロボットのモデル化／第4章　不確かさのモデル化　第2部　自己位置推定とSLAM／第5章　パーティクルフィルタによる自己位置推定／第6章　カルマンフィルタによる自己位置推定／第7章　自己位置推定の諸問題／第8章　パーティクルフィルタによるSLAM／第9章　グラフ表現によるSLAM　第3部　行動決定第／10章　マルコフ決定過程と動的計画法／第11章　強化学習／第12章　部分観測マルコフ決定過程　付録A　ベイズ推論によるセンサデータの解析　付録B　計算

試し読みフォロー

強化学習講談社作品一覧

イラストで学ぶ　人工知能概論　改訂第２版

イラストで学ぶ　ディープラーニング　改訂第２版

機械学習スタートアップシリーズ　ゼロからつくるＰｙｔｈｏｎ機械学習プログラミング入門

機械学習スタートアップシリーズ　Ｐｙｔｈｏｎで学ぶ強化学習　［改訂第２版］　入門から実践まで

強化学習

これならわかる機械学習入門

詳解　確率ロボティクス　Ｐｙｔｈｏｎによる基礎アルゴリズムの実装

最近チェックした本

ジャンル一覧

選択中のジャンル:件

すべてのタグ

強化学習 講談社作品一覧

イラストで学ぶ 人工知能概論 改訂第２版

イラストで学ぶ ディープラーニング 改訂第２版

機械学習スタートアップシリーズ ゼロからつくるＰｙｔｈｏｎ機械学習プログラミング入門

機械学習スタートアップシリーズ Ｐｙｔｈｏｎで学ぶ強化学習 ［改訂第２版］ 入門から実践まで

強化学習

これならわかる機械学習入門

詳解 確率ロボティクス Ｐｙｔｈｏｎによる基礎アルゴリズムの実装

最近チェックした本

強化学習講談社作品一覧

イラストで学ぶ　人工知能概論　改訂第２版

イラストで学ぶ　ディープラーニング　改訂第２版

機械学習スタートアップシリーズ　ゼロからつくるＰｙｔｈｏｎ機械学習プログラミング入門

機械学習スタートアップシリーズ　Ｐｙｔｈｏｎで学ぶ強化学習　［改訂第２版］　入門から実践まで

詳解　確率ロボティクス　Ｐｙｔｈｏｎによる基礎アルゴリズムの実装