丸善のおすすめ度
将棋AIで学ぶディープラーニング~人より強い将棋プログラムを作る!~
山岡 忠夫
著
発行年月 |
2018年03月 |
---|
|
|
言語 |
日本語 |
---|
媒体 |
冊子 |
---|
|
|
ページ数/巻数 |
10p,277p |
---|
大きさ |
24cm |
---|
|
ジャンル |
和書/理工学/情報学/人工知能 |
---|
|
|
ISBN |
9784839965419 |
---|
|
商品コード |
1027041515 |
---|
NDC分類 |
007.13 |
---|
|
|
本の性格 |
実務向け |
---|
|
新刊案内掲載月 |
2018年04月4週 |
---|
|
商品URL
| https://kw.maruzen.co.jp/ims/itemDetail.html?itmCd=1027041515 |
---|
内容
将棋プログラムの作成を通してディープラーニングをより深く理解できる。2016年3月、プロ棋士に勝つには後10年かかると言われていたコンピュータ囲碁でDeepMindが開発したAlphaGoがトップ棋士に勝利しました。そのAlphaGoで使われた手法がディープラーニングです。AlphaGoでは局面を「画像」として認識し打ち手の確率と局面の勝率を予測することで、次の打ち手を決めています。画像とは具体的にどのようなものか、次の打ち手をどうやって決めるのか?AlphaGoの論文をヒントに、ディープラーニングを使い棋譜を学習した将棋AIの開発を行います。強化学習のみでトップレベルの強さを持つAlphaZeroで用いられた手法についても取り入れています。[導入編]では、コンピュータ将棋の歴史とディープラーニングの関係、コンピュータ将棋の大会の概要と参加方法について紹介します。[理論編]では、実装する将棋AIの前提となる理論について解説します。従来のコンピュータ将棋のアルゴリズム、コンピュータ囲碁で用いられているモンテカルロ木探索とAlphaGoがどのようにディープラーニングを応用したか。基礎的な知識について解説しつつ、これらを将棋AIに応用する方法について述べます。[実践編]では、ディープラーニングを使った、実際に対局できる以下の3つの将棋AIについて、PythonとChainerで実装していきます。方策ネットワーク(policy network)を使って指し手の予測のみでプレイするAI。価値ネットワーク(value network)を使って1手探索を行うAI。方策ネットワークと価値ネットワークを使ってモンテカルロ木探索を行うAI。最後に、より強い将棋AIを作りたいという方のために、ヒントとなる情報を紹介します。