商品詳細(参照) | Knowledge Worker

丸善のおすすめ度

現場で使える!Python深層強化学習入門～強化学習と深層学習による探索と制御～(AI&TECHNOLOGY)

伊藤多一, 今津義充, 須藤広大, 仁ノ平将人, 川﨑悠介, 酒井裕企, 魏崇哲　著

在庫状況お取り寄せ	お届け予定日 10日間
価格 \3,740（税込）

発行年月	2019年08月
出版社／提供元	翔泳社
言語	日本語
媒体	冊子
ページ数／巻数	13p,313p
大きさ	21cm
ジャンル	和書／理工学／情報学／人工知能
ISBN	9784798159928
商品コード	1030565561
NDC分類	007.13
基本件名	深層学習
本の性格	実務向け
新刊案内掲載月	2019年09月3週
商品URL	https://kw.maruzen.co.jp/ims/itemDetail.html?itmCd=1030565561

内容

注目の最新AI技術！深層強化学習の開発手法がわかる！

第一線で活躍する著者陣の書下ろしによる待望の1冊！

【本書の目的】

AlphaGo（アルファ碁）でも利用されている深層強化学習。

AIサービスのみならずロボティクス分野でもその応用が期待されています。

本書は、AI開発に携わる第一線の著者陣が深層強化学習の開発手法について書き下ろした注目の1冊です。

【本書の特徴】

第1部では、まず、深層強化学習の概要について説明します。

次いで、強化学習の基礎（Q学習、方策勾配法、Actor-Critic法）と深層学習の基礎（CNN、RNN、LSTM）を解説します。

さらに、簡単な例題として倒立振子制御を取り上げ、DQNとActor-Critic法による実装例を紹介します。

第2部では、具体的な応用例として3つのアプローチを実装込みで解説します。

1つ目は、連続動作制御です。ヒューマノイドシミュレータの2足歩行制御を試みます。

2つ目は、パズル問題の解法です。巡回セールスマン問題（TSP）やルービックキューブの解探索について説明します。

3つ目は、系列データ生成です。文書生成（SeqGAN）やニューラルネットワークのアーキテクチャ探索（ENAS）を解説します。

全体を通して、行動の制御を担うエージェントのモデル化と、方策ベースの強化学習によるエージェントの学習法について学ぶことができます。

【読者が得られること】

深層強化学習による開発手法を学ぶことができます。

【対象読者】

深層強化学習を学びたい理工学生・エンジニア

■Part 1　基礎編 CHAPTER 1　強化学習の有用性　1.1　機械学習の分類　1.2　強化学習でできること　1.3　深層強化学習とは CHAPTER 2　強化学習のアルゴリズム　2.1　強化学習の基本概念　2.2　マルコフ決定過程とベルマン方程式　2.3　ベルマン方程式の解法　2.4　モデルフリーな制御 CHAPTER 3　深層学習による特徴抽出　3.1　深層学習　3.2　畳み込みニューラルネットワーク（CNN）　3.3　再帰型ニューラルネットワーク（RNN） CHAPTER 4　深層強化学習の実装　4.1　深層強化学習の発展　4.2　行動価値関数のネットワーク表現　4.3　方策関数のネットワーク表現 ■Part 2　応用編 CHAPTER 5　連続制御問題への応用　5.1　方策勾配法による連続制御　5.2　学習アルゴリズムと方策モデル　5.3　連続動作シミュレータ　5.4　アルゴリズムの実装　5.5　学習結果と予測制御 CHAPTER 6　組合せ最適化への応用　6.1　組合せ最適化への応用について　6.2　巡回セールスマン問題　6.3　ルービックキューブ問題　6.4　まとめ CHAPTER 7　系列データ生成への応用　7.1　SeqGANによる文章生成　7.2　ネットワークアーキテクチャの探索 APPENDIX　開発環境の構築　AP1　ColaboratoryによるGPUの環境構築　AP2　DockerによるWindowsでの環境構築