丸善のおすすめ度
Data‐centric AI入門(ML Systems)
宮澤 一之,
齋藤 邦章,
清野 舜,
小林 滉河,
河原塚 健人,
鈴木 達哉
著
片岡 裕雄
監修
発行年月 |
2025年01月 |
---|
|
|
言語 |
日本語 |
---|
媒体 |
冊子 |
---|
|
|
ページ数/巻数 |
8p,263p |
---|
大きさ |
21cm |
---|
|
ジャンル |
和書/理工学/情報学/人工知能 |
---|
|
|
ISBN |
9784297146634 |
---|
|
商品コード |
1039697475 |
---|
NDC分類 |
007.13 |
---|
|
|
本の性格 |
実務向け |
---|
|
新刊案内掲載月 |
2025年02月2週 |
---|
|
商品URL
| https://kw.maruzen.co.jp/ims/itemDetail.html?itmCd=1039697475 |
---|
著者紹介
宮澤 一之(著者):GO株式会社にてコンピュータビジョン技術の研究開発や実装を担うチームのリーダーを務める。2010年に東北大学にて博士号を取得後、三菱電機株式会社に入社し、映像解析や自動外観検査などの研究開発に携わる。2019年より株式会社ディー・エヌ・エーにてモビリティ向けのコンピュータビジョン技術の研究開発およびチームマネジメントに従事し、2020年に同社が関わり設立された株式会社Mobility Technologiesに転籍。2023年4月にGO株式会社へ商号変更。プライベートでは、1,200人以上のメンバーが所属するData-Centric AI Communityを運営し、定期的な勉強会を開催している。本書の1章、6章の執筆を担当。
齋藤 邦章(著者):OMRON SINIC X Corporation シニアリサーチャー 2018年に東京大学情報理工学系研究科創造情報学専攻の修士課程を修了し、アメリカBoston UniversityのComputer Science専攻の博士課程に進学。Nvidia, Meta, Googleでリサーチインターンを経験。大学およびインターン先では、ドメイン適合、半教師付き学習、画像生成、Vision-Languageに関する研究を行い、2023年に博士号を取得。2023年より現職。現在は画像と言語両方に関わる研究に従事。本書の2章の執筆を担当。
清野 舜(著者):SB Intuitions株式会社 シニアリサーチエンジニア 2022年に東北大学大学院情報科学研究科博士後期課程を修了し、博士(情報科学)を取得。2019年より理化学研究所革新知能統合研究センターにて勤務したのち、 2022年にLINE株式会社 (現: LINEヤフー株式会社) に入社。2024年より現職。現在は主に大規模言語モデルの研究開発に従事。本書の3章の執筆を担当。
小林 滉河(著者):SB Intuitions株式会社 チーフリサーチエンジニア 2021年に筑波大学大学院図書館情報メディア研究科修士課程修了。同年よりLINE株式会社 (現: LINEヤフー株式会社) に入社。2024年より現職にて、大規模言語モデルのファインチューニングに関する研究開発およびチームマネジメントに従事。本書の4章の執筆を担当。
河原塚 健人(著者):東京大学大学院情報理工学系研究科特任助教 2017年に東京大学工学部機械情報工学科を卒業、2019年・2022年に東京大学大学院情報理工学系研究科知能機械情報学専攻の修士課程・博士課程を修了し、博士(情報理工学)を取得。2022年より現職。筋骨格ヒューマノイドの身体設計と制御, 深層学習に基づく知能ロボットシステムの研究に従事。本書の5章の執筆を担当。
鈴木 達哉(著者):2020年に上智大学大学院理工学研究科を修了後、株式会社ディー・エヌ・エーに入社。現在はGO株式会社へ出向し、コンピュータビジョンに関する研究開発に従事。プライベートでは、Data-Centric AI Communityの運営に参加し、定期的な勉強会を開催。本書の6章の執筆を担当。
片岡 裕雄(監修):2014年 慶應義塾大学大学院 博士(工学)。2024年現在、産業技術総合研究所 上級主任研究員、オックスフォード大学 Academic Visitor および cvpaper.challenge 主宰。時空間モデルのベースライン3D ResNetの研究開発,実データ不要の事前学習法 数式ドリブン教師あり学習(Formula-Driven Supervised Learning; FDSL)を提案。2019/2022年度AIST Best Paper、2020年 ACCV 2020 Best Paper Honorable Mention Award、2023年 BMVC 2023 Best Industry Paper Finalist。研究はMIT Technology Reviewや日経等メディアにて掲載。本書の監修を担当。
内容
Data-centric AIとは、機械学習の権威でありGoogleのAI研究チームを率いたAndrew Ngが2021年に提唱した、モデルよりもデータに主眼を置くというAI開発のアプローチです。過去数十年にわたりAI開発においては、固定されたデータセットに対してニューラルネットワークをはじめとしたモデルを適用し、そのモデルを改善することに関心が寄せられていました。しかし、このモデルを中心としたアプローチでは、データセットへの過度な依存やデータセットが抱える課題への無意味な適合により、実用において期待ほどモデルの性能が改善しないといった問題が指摘されています。そのため近年はモデルを固定したうえで、データ拡張、アノテーションの効率化や一貫性の担保、能動学習といったデータに工夫を加えることによってモデルの性能を向上させるアプローチに注目が集まっています。本書では、Data-centric AIの概要を解説したあとに、画像認識、自然言語処理、ロボットといった分野におけるデータを改善するための具体的なアプローチを解説します。最終章では、企業における実践的な取り組みを紹介します。