ホーム > 商品詳細

丸善のおすすめ度

現場で使える!Python深層強化学習入門~強化学習と深層学習による探索と制御~(AI&TECHNOLOGY)

伊藤 多一, 今津 義充, 須藤 広大, 仁ノ平 将人, 川﨑 悠介, 酒井 裕企, 魏 崇哲  著

在庫状況 お取り寄せ  お届け予定日 10日間  数量 冊 
価格 \3,740(税込)         

発行年月 2019年08月
出版社/提供元
言語 日本語
媒体 冊子
ページ数/巻数 13p,313p
大きさ 21cm
ジャンル 和書/理工学/情報学/人工知能
ISBN 9784798159928
商品コード 1030565561
NDC分類 007.13
基本件名 深層学習
本の性格 実務向け
新刊案内掲載月 2019年09月3週
商品URL
参照
https://kw.maruzen.co.jp/ims/itemDetail.html?itmCd=1030565561

内容

注目の最新AI技術!深層強化学習の開発手法がわかる!

第一線で活躍する著者陣の書下ろしによる待望の1冊!



【本書の目的】

AlphaGo(アルファ碁)でも利用されている深層強化学習。

AIサービスのみならずロボティクス分野でもその応用が期待されています。

本書は、AI開発に携わる第一線の著者陣が深層強化学習の開発手法について書き下ろした注目の1冊です。



【本書の特徴】

第1部では、まず、深層強化学習の概要について説明します。

次いで、強化学習の基礎(Q学習、方策勾配法、Actor-Critic法)と深層学習の基礎(CNN、RNN、LSTM)を解説します。

さらに、簡単な例題として倒立振子制御を取り上げ、DQNとActor-Critic法による実装例を紹介します。

第2部では、具体的な応用例として3つのアプローチを実装込みで解説します。

1つ目は、連続動作制御です。ヒューマノイドシミュレータの2足歩行制御を試みます。

2つ目は、パズル問題の解法です。巡回セールスマン問題(TSP)やルービックキューブの解探索について説明します。

3つ目は、系列データ生成です。文書生成(SeqGAN)やニューラルネットワークのアーキテクチャ探索(ENAS)を解説します。


全体を通して、行動の制御を担うエージェントのモデル化と、方策ベースの強化学習によるエージェントの学習法について学ぶことができます。



【読者が得られること】

深層強化学習による開発手法を学ぶことができます。


【対象読者】

深層強化学習を学びたい理工学生・エンジニア

目次

カート

カートに商品は入っていません。