KNOWLEDGE WORKER ナレッジワーカー



丸善のおすすめ度

前処理大全~SQL/pandas/Polars実践テクニック~ 改訂新版

本橋智光, 橋本秀太郎  著

在庫状況 有り  お届け予定日 3~4日 
価格 \3,740(税込)         
発行年月 2024年05月
出版社/提供元
技術評論社
言語 日本語
媒体 冊子
ページ数/巻数 24p,447p
大きさ 23cm
ジャンル 和書/理工学/数学/確率論・数理統計学
ISBN 9784297141387
商品コード 1038384692
NDC分類 417
基本件名 数理統計学-データ処理
本の性格 実務向け
新刊案内掲載月 2024年06月4週
商品URLhttps://kw.maruzen.co.jp/ims/itemDetail.html?itmCd=1038384692

著者紹介

本橋智光(著者):SIerの研究員、Web系企業の分析者を経て、SUSMEDのCTO。株式会社ホクソエムのメンバーでもある。基盤・Webアプリ・機械学習・数理最適化等幅広くこなす。最近の好きなプログラミング言語はRust。
橋本秀太郎(著者):北海道大学 大学院情報科学研究科 博士後期課程修了。博士(情報科学)。大学院修了後はSIerでデータ分析関連の研究開発やコンサルティングに従事。現在は国内でも有数の膨大なデータを持つインターネット企業に勤め、データサイエンスチームのリードとして、日々サービスグロースのためのデータ分析を行う。

内容

BigQuery、Pandas、Polarsを使った実用的なモダン前処理を学びましょう!

データ分析において前処理が重要かつ多くの時間をとられる業務であることは広く知られてきました。同時に前処理を実現するためのライブラリは大きく改善されてきています。また、機械学習モデルの進化によって、求められる前処理の内容も変わってきています。本書は、初めて学ぶ方にも昔学んでから知識をアップデートしていない方にも、悪いサンプルコードと良いサンプルコードを紹介しながら丁寧にデータ分析の前処理を学べる技術書です。

本書は、第一版の前処理大全から大きく構成や内容を変更しています。SQLはBigQuery準拠に変更し、Pandasは最新バージョンの思想に沿い新機能を使ったコードに変更しました。Rの代わりにR同様にパイプラインで書きやすくかつ処理エンジンがRustベースで書かれているため高速なPolarsに変更しました。また、前処理内容も大きく変更し、より現在よく使われる処理を実用ケースとともに解説しています。また、新たな試みとしてコラムとして少しマニアックだけど役立つプログラムの裏側の解説や分析テクニックを紹介しており、中級者の方にとっても有用な知識をお届けしています。

目次