機械学習トレーニングデータがわかる本
吉崎 哲郎 著
内容
目次
第1章 機械学習とトレーニングデータ 1.1 プログラミングから見た機械学習 1.2 トレーニングデータの位置付け 第2章 データ活用とは 2.1 DXからデジタルファーストへ 2.2 経営者は何を考えるべきか 2.3 エンジニアが考えること 2.4 機械学習を取り巻く課題 2.5 実行すべきこと 第3章 さまざまなユースケース 3.2 機械翻訳 3.3 画像認識 3.4 動画 3.5 チャットボット・ボイスボット 3.6 自然言語処理 3.7 固有表現抽出 3.8 ポイントオブインタレスト(POI) 3.9 自動車関連技術 3.10 ARVRメタバース 3.11 その他 第4章トレーニングデータ 4.1 音声データ 4.2 画像 4.3 動画 4.4 センシングデータ(3D点群データ) 4.5 シンセティックデータ 第5章データアノテーション 5.1 プリラベリングデータ 5.2 音声データからのアノテーション 5.3 テキストデータのアノテーション 5.5 アノテーションフォーマット 第6章 アノテーションツール 6.1 データ収集 6.2 プロジェクト定義 6.3 データ管理と割り当て 6.4 音声系 6.5 テキスト系 6.6 画像・動画系 6.7 3D点群データ 6.8 品質チェック工程 6.9 データ取りまとめ 第7章 データセキュリティ 7.1 関連する法律 7.2 データセキュリティについて 7.3 AI倫理 第8章 トレーニングデータの重要性