コンピュータビジョン最前線<2023Winter> 一人称ビジョン・拡散モデル
井尻 善久,
牛久 祥孝,
片岡 裕雄,
藤吉 弘亘,
延原 章平
編
発行年月 |
2023年12月 |
---|
|
|
言語 |
日本語 |
---|
媒体 |
冊子 |
---|
|
|
ページ数/巻数 |
147p |
---|
大きさ |
26cm |
---|
|
ジャンル |
和書/理工学/情報学/人工知能 |
---|
|
|
ISBN |
9784320125506 |
---|
|
商品コード |
1037152810 |
---|
NDC分類 |
007.13 |
---|
|
|
|
|
|
|
商品URL
| https://kw.maruzen.co.jp/ims/itemDetail.html?itmCd=1037152810 |
---|
内容
【最新動向サーベイ】
・イマドキノ一人称ビジョン:人の身体に軽量小型のウェアラブルカメラを装着し、装着者自身の視点から見た映像を撮影することで自身およびその周辺の環境を理解する一人称ビジョンについて、浅く広く、応用や実践も含めて紹介。
【論文フカヨミ】
・フカヨミStable Diffusionと脳活動:Stable Diffusionと名付けられた潜在拡散モデルの各要素やプロセスが、脳内の活動とどのように対応しているかを探ることで、生物学的に拡散モデルの解釈を試みた研究について紹介。加えて、新たな深層学習モデルの訓練を必要としないシンプルなデコーディングの枠組みも提案。
・フカヨミ音響情報のCV応用:本稿では音と画像を活用した研究をおおまかに、意味情報をもつ音響信号を用いて人物姿勢や画像を生成するモデルと、反響音から室内の3次元空間情報を推定するモデルに大別し、それぞれの代表的な研究について解説。
・フカヨミ潜在空間で画像編集:表現空間における座標系に注目し、生成される画像を高品質に編集できる手法deep curvilinear editing (DeCurvEd) を紹介。
【チュートリアル】
・ニュウモン拡散モデル:前々号(Summer 2023)掲載の「イマドキノ拡散モデル」では、拡散モデルの基礎を踏まえつつも、最新の研究動向を体系的に広く紹介することに主眼に置いた。今回はチュートリアル記事として前回よりさらに大きく紙面を割き、爆発的な進展の中で登場した数多くの技術の中でも特に広く使われているものを中心に、そのアイデアや技術の詳細を紹介。
その他、漫画「君も魔法をかけてみよう!」、CV分野の学会・研究会・国際会議の開催日程や投稿日が一挙にわかる「CVイベントカレンダー」を掲載。