商品詳細 | Knowledge Worker

丸善のおすすめ度

強化学習(機械学習プロフェッショナルシリーズ)

在庫状況有り	お届け予定日 3～4日	数量冊
価格 \3,300（税込）

この商品について問合せる

発行年月	2019年05月
出版社／提供元	講談社
言語	日本語
媒体	冊子
ページ数／巻数	12p,305p
大きさ	21cm
ジャンル	和書／理工学／情報学／人工知能
ISBN	9784065155912
商品コード	1030155286
NDC分類	007.13
基本件名	機械学習
本の性格	実務向け
新刊案内掲載月	2019年06月5週
商品URL	https://kw.maruzen.co.jp/ims/itemDetail.html?itmCd=1030155286

著者紹介

森村哲郎（著者）：日本アイ・ビー・エム　東京基礎研究所　研究員

内容

理論は裏切らない
・強化学習で必要になる数理を広くカバーした。
・一貫したていねいな解説なので、じっくり読める。付録・参考文献も充実！
・ベルマン方程式、TD学習、方策勾配、POMDP、深層強化学習をより深く！

【おもな内容】
第1章　準備
1.1　強化学習とは
1.2　マルコフ決定過程と逐次的意思決定問題
1.3　方策
1.4　逐次的意思決定問題の定式化

第2章　プランニング
2.1　準備
2.2　動的計画法
2.3　動的計画法による解法
2.4　線形計画法による解法

第3章　探索と活用のトレードオフ
3.1　概要
3.2　探索と活用のトレードオフ
3.3　方策モデル

第4章　モデルフリー型の強化学習
4.1　データにもとづく意思決定
4.2　価値関数の推定
4.3　方策と行動価値関数の学習
4.4　収束性
4.5　アクター・クリティック法

第5章　モデルベース型の強化学習
5.1　問題設定の整理
5.2　環境推定
5.3　ブラックボックス生成モデルに対するプランニング
5.4　オンラインのモデルベース型強化学習

第6章　関数近似を用いた強化学習
6.1　概要
6.2　価値関数の関数近似
6.3　方策の関数近似

第7章　部分観測マルコフ決定過程
7.1　部分観測マルコフ決定過程（POMDP）の基礎
7.2　POMDP のプランニング
7.3　POMDP の学習

第8章　最近の話題
8.1　分布強化学習
8.2　深層強化学習

付録A　補足
A.1　証明
A.2　ノルム
A.3　線形計画法
A.4　自然勾配法の補足

準備プランニング探索と活用のトレードオフモデルフリー型の強化学習モデルベース型の強化学習関数近似を用いた強化学習部分観測マルコフ決定過程最近の話題

カート

カートに商品は入っていません。

前のページに戻る