丸善のおすすめ度
強化学習アルゴリズム入門~「平均」からはじめる基礎と応用~
曽我部 東馬
著
発行年月 |
2019年05月 |
---|
|
|
言語 |
日本語 |
---|
媒体 |
冊子 |
---|
|
|
ページ数/巻数 |
7p,202p |
---|
大きさ |
21cm |
---|
|
ジャンル |
和書/理工学/情報学/人工知能 |
---|
|
|
ISBN |
9784274223716 |
---|
|
商品コード |
1030364913 |
---|
NDC分類 |
007.13 |
---|
|
|
本の性格 |
実務向け |
---|
|
新刊案内掲載月 |
2019年06月5週 |
---|
|
商品URL
| https://kw.maruzen.co.jp/ims/itemDetail.html?itmCd=1030364913 |
---|
著者紹介
曽我部 東馬(著者):理学博士(物理学専攻)。電気通信大学准教授、株式会社グリッド最高技術顧問、東京大学先端科学技術研究センター客員研究員。
内容
「平均」の観点から強化学習の原理がわかる!
AlphaGoがプロ棋士を破った2016年以降、さまざまな分野から注目されている深層強化学習ですが、専門書は非常に難解でわかりづらい傾向にあります。
そこで本書は、初歩的な数学を使って原理をわかりやすく解説します。価値・探索・マルコフ決定過程・動的計画法・モンテカルロ法・TD法といった強化学習の諸要素を、中高生にもなじみ深い平均値の計算から説明し、初学者でも基本とコツを自然と身につけられます。抽象的な強化学習の概念と煩雑な数学式を直感的に感じつつ、本質まで把握できることが本書の最大の特徴です。
また、すべての例題にPythonとMATLABのコードを示し、原理・数式・コードという一連の流れを紐付けて理解できるようになっています。初学者でも入りやすく、難しさを感じないまま、強化学習の基本と深層学習のコツを自然と身につけられる入門書です。
【本書の特徴】
・難解な強化学習の原理を、中高生にもなじみ深い「平均値の計算」という観点からわかりやすく解説しています。
・すべての例題にPythonとMATLABのコードを例示しています。