丸善のおすすめ度
Vision Transformer入門~新しいコンピュータビジョンの世界~(CVL)
山本 晋太郎,
徳永 匡臣,
箕浦 大晃,
キュウゲツ(QIU YUE),
品川 政太朗
著
片岡 裕雄
監修
発行年月 |
2022年09月 |
---|
|
|
言語 |
日本語 |
---|
媒体 |
冊子 |
---|
|
|
ページ数/巻数 |
8p,263p |
---|
大きさ |
23cm |
---|
|
ジャンル |
和書/理工学/情報学/情報理論 |
---|
|
|
ISBN |
9784297130589 |
---|
|
商品コード |
1034874551 |
---|
NDC分類 |
007.1 |
---|
|
|
本の性格 |
実務向け |
---|
|
新刊案内掲載月 |
2022年10月4週 |
---|
|
商品URL
| https://kw.maruzen.co.jp/ims/itemDetail.html?itmCd=1034874551 |
---|
著者紹介
山本 晋太郎(著者):山本晋太郎(やまもと しんたろう)
2022年3月に早稲田大学先進理工学研究科物理学及応用物理学専攻にて博士後期課程を修了し、博士(工学)を取得。学生時代は主にコンピュータビジョンと自然言語処理の分野の研究に従事。博士論文のテーマは、効率的な研究コミュニケーションのための科学論文解析。現在は企業の研究開発部門に勤める会社員。本書の第1章の執筆を担当。
徳永 匡臣(著者):徳永 匡臣(とくなが まさおみ)
株式会社野村総合研究所AIソリューション推進部AI tech lab.所属
2019年3月、東北大学工学部を卒業。2021年3月、東京工業大学大学院情報理工学院情報工学系知能情報コースにて修士課程を修了。現在は、コンピュータビジョンおよび自然言語の業務に従事。趣味として、インターネット上で論文の解説記事を執筆。本書の第2章の執筆を担当。
箕浦 大晃(著者):箕浦 大晃(みのうら ひろあき)
中部大学大学院工学研究科情報工学専攻博士後期課程3年
2020年中部大学大学院博士前期課程情報工学専攻修了。2020年中部大学大学院博士後期課程情報工学専攻在学中。コンピュータビジョン、パターン認識の研究に従事。本書の第3章、第6章の執筆を担当。
キュウゲツ(QIU YUE)(著者):QIU YUE(キュウ ゲツ)
国立研究開発法人産業技術総合研究所人工知能研究センター研究員
2021年3月筑波大学大学院システム情報工学研究科博士後期課程修了(工学)、2021年10月により産業技術総合研究所人工知能研究センター研究員。言語と画像のマルチモーダルタスク・画像認識・3次元認識・動画像認識に従事。本書の第4章、第5章の執筆を担当。
品川 政太朗(著者):品川政太朗(しながわ せいたろう)
奈良先端科学技術大学院大学先端科学技術研究科情報科学領域助教
2013年東北大学工学部を卒業、2015年同大学大学院情報科学研究科で修士(情報科学)、2020年9月に奈良先端科学技術大学院大学で博士(工学)を取得し、同年11月より同大学助教。コンピュータビジョンと自然言語処理双方の領域を中心として幅広く興味を持ち、自然言語による対話的な画像編集をはじめとした視覚と言語の融合研究と対話システム研究に従事。本書の第7章、第8章の執筆を担当。
片岡 裕雄(監修):片岡裕雄(かたおか ひろかつ)
国立研究開発法人産業技術総合研究所人工知能研究センター主任研究員
2014年慶應義塾大学大学院理工学研究科後期博士課程修了、博士(工学)。2020年10月より国立研究開発法人産業技術総合研究所主任研究員。画像認識、動画解析、人物行動解析に従事。2011/2020年VIEW小田原賞、2019年度産総研論文賞、ACCV 2020 BEST PAPER HONORABLE MENTION AWARD受賞。
内容
自然言語処理分野におけるブレイクスルーとなったTransformerをコンピュータビジョンに応用したモデルがVision Transformer(ViT)です。さまざまなコンピュータビジョンのタスクにおいて、ディープラーニングではスタンダードとなっているRNN、CNN、および既存手法を用いた処理精度を上回ることが確認されています。
本書は注目のViTの入門書です。Transformerの成り立ちからはじめ、その理論と実装を解説していきます。今後のViTの活用が期待される応用タスク、ViTから派生したモデルを紹介したあと、TransoformerとViTを分析し、その謎を解明していきます。今後も普及が期待されるViTを盛りだくさんでお届けします。
目次
1章 TransformerからVision Transformerへの進化
2章 Vision Transformerの基礎と実装
3章 実験と可視化によるVision Transformerの探求
4章 コンピュータビジョンへの応用
5章 Vision and Languageへの応用
6章 Vision Transformerの派生手法
7章 Transformerの謎を読み解く
8章 Vision Transformerの謎を読み解く