KNOWLEDGE WORKER ナレッジワーカー



コンピュータビジョン最前線<2023Winter> 一人称ビジョン・拡散モデル

井尻 善久, 牛久 祥孝, 片岡 裕雄, 藤吉 弘亘, 延原 章平  編
在庫状況 有り  お届け予定日 3~4日 
価格 \3,300(税込)         
発行年月 2023年12月
出版社/提供元
共立出版
言語 日本語
媒体 冊子
ページ数/巻数 147p
大きさ 26cm
ジャンル 和書/理工学/情報学/人工知能
ISBN 9784320125506
商品コード 1037152810
NDC分類 007.13
基本件名 パターン認識-雑誌
商品URLhttps://kw.maruzen.co.jp/ims/itemDetail.html?itmCd=1037152810

内容

【最新動向サーベイ】
・イマドキノ一人称ビジョン:人の身体に軽量小型のウェアラブルカメラを装着し、装着者自身の視点から見た映像を撮影することで自身およびその周辺の環境を理解する一人称ビジョンについて、浅く広く、応用や実践も含めて紹介。

【論文フカヨミ】
・フカヨミStable Diffusionと脳活動:Stable Diffusionと名付けられた潜在拡散モデルの各要素やプロセスが、脳内の活動とどのように対応しているかを探ることで、生物学的に拡散モデルの解釈を試みた研究について紹介。加えて、新たな深層学習モデルの訓練を必要としないシンプルなデコーディングの枠組みも提案。

・フカヨミ音響情報のCV応用:本稿では音と画像を活用した研究をおおまかに、意味情報をもつ音響信号を用いて人物姿勢や画像を生成するモデルと、反響音から室内の3次元空間情報を推定するモデルに大別し、それぞれの代表的な研究について解説。

・フカヨミ潜在空間で画像編集:表現空間における座標系に注目し、生成される画像を高品質に編集できる手法deep curvilinear editing (DeCurvEd) を紹介。

【チュートリアル】
・ニュウモン拡散モデル:前々号(Summer 2023)掲載の「イマドキノ拡散モデル」では、拡散モデルの基礎を踏まえつつも、最新の研究動向を体系的に広く紹介することに主眼に置いた。今回はチュートリアル記事として前回よりさらに大きく紙面を割き、爆発的な進展の中で登場した数多くの技術の中でも特に広く使われているものを中心に、そのアイデアや技術の詳細を紹介。

その他、漫画「君も魔法をかけてみよう!」、CV分野の学会・研究会・国際会議の開催日程や投稿日が一挙にわかる「CVイベントカレンダー」を掲載。

目次