商品詳細(参照) | Knowledge Worker

コンピュータビジョン最前線<2023Winter> 一人称ビジョン・拡散モデル

井尻善久, 牛久祥孝, 片岡裕雄, 藤吉弘亘, 延原章平　編

在庫状況有り	お届け予定日 3～4日
価格 \3,300（税込）

発行年月	2023年12月
出版社／提供元	共立出版
言語	日本語
媒体	冊子
ページ数／巻数	147p
大きさ	26cm
ジャンル	和書／理工学／情報学／人工知能
ISBN	9784320125506
商品コード	1037152810
NDC分類	007.13
基本件名	パターン認識-雑誌
商品URL	https://kw.maruzen.co.jp/ims/itemDetail.html?itmCd=1037152810

内容

【最新動向サーベイ】
・イマドキノ一人称ビジョン：人の身体に軽量小型のウェアラブルカメラを装着し、装着者自身の視点から見た映像を撮影することで自身およびその周辺の環境を理解する一人称ビジョンについて、浅く広く、応用や実践も含めて紹介。

【論文フカヨミ】
・フカヨミStable Diffusionと脳活動：Stable Diffusionと名付けられた潜在拡散モデルの各要素やプロセスが、脳内の活動とどのように対応しているかを探ることで、生物学的に拡散モデルの解釈を試みた研究について紹介。加えて、新たな深層学習モデルの訓練を必要としないシンプルなデコーディングの枠組みも提案。

・フカヨミ音響情報のCV応用：本稿では音と画像を活用した研究をおおまかに、意味情報をもつ音響信号を用いて人物姿勢や画像を生成するモデルと、反響音から室内の3次元空間情報を推定するモデルに大別し、それぞれの代表的な研究について解説。

・フカヨミ潜在空間で画像編集：表現空間における座標系に注目し、生成される画像を高品質に編集できる手法deep curvilinear editing (DeCurvEd) を紹介。

【チュートリアル】
・ニュウモン拡散モデル：前々号（Summer 2023）掲載の「イマドキノ拡散モデル」では、拡散モデルの基礎を踏まえつつも、最新の研究動向を体系的に広く紹介することに主眼に置いた。今回はチュートリアル記事として前回よりさらに大きく紙面を割き、爆発的な進展の中で登場した数多くの技術の中でも特に広く使われているものを中心に、そのアイデアや技術の詳細を紹介。

その他、漫画「君も魔法をかけてみよう！」、CV分野の学会・研究会・国際会議の開催日程や投稿日が一挙にわかる「CVイベントカレンダー」を掲載。

巻頭言（岡野原大輔）イマドキノ一人称ビジョン―「私」の目から見える世界を理解する技術―（八木拓真）フカヨミStable Diffusionと脳活動―ヒトの脳活動を用いた画像生成モデルの理解と活用―（高木優・西本伸志）フカヨミ音響情報のCV応用―画像と音を用いた最新AIの研究動向！―（柴田優斗）フカヨミ潜在空間で画像編集―大きさ・色・形，思いどおりに画像を編集！―（青嶋雄大・松原崇）ニュウモン拡散モデル―画像生成の新たなフロンティアへの招待―（石井雅人・早川顕生）君も魔法をかけてみよう！（春嵐） CVイベントカレンダー