内容
スモールなデータの解析手法・ノウハウが身につく!
人工知能によるビッグデータ解析が近年、広く注目されています。しかし、製造メーカなどのほとんどの一般企業においてはデータ量が少なかったり偏っていたりする、スモールデータがデータの中心です。本書はそのようなスモールデータの解析手法を解説するものです。
Webデータや気象データに代表されるようなビッグデータが注目される一方で、機械の故障データのように発生自体がまれであったり、臨床データのように倫理的な問題からデータ収集が困難、あるいはラベリングが専門家以外困難で教師データが集まらなかったりするスモールなデータ、すなわちスモールデータが存在します。
これらのデータは測定されている変数の数に比べて統計モデリングに必要なデータが不足していたり、正負双方のサンプルが必要となる分析において、その取得が困難といったような問題があり、そのままビッグデータの考え方を適用するのは適当ではありません。
本書は、はじめにスモールデータとは何かから、データの作り方となる次元削減と回帰分析の手法、つづいてスパースなデータのモデリング、クラスタリング、不均衡なデータの解析手法、異常検出を述べていきます。そして最後にスモールデータの解析においてのポイント・考え方を述べて、読者がスモールデータを有効に解析できるようになるようまとめました。