丸善のおすすめ度
Pythonではじめるデータ分析のための前処理入門(実践Data Scienceシリーズ)
菅 由紀子
著
発行年月 |
2025年07月 |
---|
|
|
言語 |
日本語 |
---|
媒体 |
冊子 |
---|
|
|
ページ数/巻数 |
8p,263p |
---|
大きさ |
24cm |
---|
|
ジャンル |
和書/理工学/情報学/情報処理 |
---|
|
|
ISBN |
9784065395868 |
---|
|
商品コード |
1040452323 |
---|
NDC分類 |
007.609 |
---|
|
|
本の性格 |
実務向け |
---|
|
新刊案内掲載月 |
2025年08月4週 |
---|
|
商品URL
| https://kw.maruzen.co.jp/ims/itemDetail.html?itmCd=1040452323 |
---|
著者紹介
菅 由紀子(著者):菅 由紀子
株式会社Rejoui 代表取締役・広島大学客員教授・データサイエンティスト協会スキル定義委員
中央大学経済学部卒業後、株式会社サイバーエージェントにてマーケティングリサーチ事業の立ち上げに従事。その後、株式会社ALBERTにて、多様な業界のデータ分析プロジェクトを担当し、データサイエンティストとして多数のプロジェクトに従事。2016年に株式会社Rejouiを創業し、データ分析・AI活用コンサルティング、データサイエンス教育、DX推進支援事業を展開。官公庁・企業・大学と連携し、データサイエンス教育の普及やデータ活用の社会実装に取り組む。
データサイエンティスト協会スキル定義委員として、データサイエンティストのスキル標準策定にも貢献するほか、日本全国各地でデータ活用の促進や次世代人材の育成を精力的に行っている。その功績が認められ、2021年度日本統計学会統計教育賞を受賞。
内容
★データ分析の現場の、即戦力になる!★
・データの前処理からモデリングに至るまでのデータ分析のプロセスを体系的に解説
・位置情報・テキスト・音声・画像などの非構造化データも扱う
・現場での課題解決を意識し、架空の旅行代理店データを用いたストーリー形式で解説
・生成AIを用いたデータハンドリング、特徴量エンジニアリング、不均衡データへの対処法、クラウド技術の活用など、最新のトレンドにも対応
・コードを公開しているから、すぐに実践できる!
【バーチャルデータサイエンティスト アイシア=ソリッド推薦!】
実際の分析事例を軸に前処理の技法を見ることで、
地に足のついた実践的な知識を得られる良書!
不均衡データへの対処や位置情報データの扱いなど、
実務頻出なのに解説が少ないテーマも扱っており、
データのプロや、プロを目指す人のための書籍と言えます。
本書を読み終わったらすぐに実践に飛び込めるでしょう!
【おもな内容】
1 前処理とは何か
2 前処理に向けたデータ理解
3 データクレンジングとしての前処理
4 データの基本事項確認としての前処理
5 データのソート・抽出
6 データの集計
7 データ結合
8 データ変換
9 モデリングのためのデータ変換
10 非構造化データの前処理――テキストデータ
11 非構造化データの前処理――位置情報・音声・画像
12 クラウド技術の活用と機械学習の実行