内容
【書籍の特徴】
・生命ビッグデータに対し統計解析を行う際に重要な概念と技法を説明しました。
・紹介する手法の多くに丁寧な数学的導出をつけました。これにより読者が各手法の原理を理解したうえで自信をもって使いこなせるようになることを目指しました。
・生命ビッグデータに対し,仮説検定を用いる際に重要な多重検定補正の概念や,人工知能・機械学習手法を用いる際に重要な過適合の概念については実例を交え詳しく説明しました。
【各章について】
1章:統計解析の目的と確率論の基礎事項を解説。
2章:統計解析で頻繁に用いられる確率分布の具体例を挙げる。
3章:確率論の重要定理である大数の法則と中心極限定理についての解説。
4章:仮説検定や統計的有意性の概念についての詳細な解説。
5章:データ解析の現場で頻繁に用いられる仮説検定手法の具体例を挙げる。
6章:一度に多数の仮説検定を行う際に重要となる多重検定補正の手法について解説。
7章:確率モデル解析の概念について説明し,確率モデルに含まれるパラメータをデータから推定するために用いられる最尤推定法について解説。
8章:データのクラスタ構造を把握するために使われる混合正規分布について導入し,そのパラメータを推定するために使われる期待値最大化法について解説。
9章:説明変数から目的変数を予測する回帰モデルを照会した後,モデルの過適合を避けるために導入される正則化項とベイズ推定法との関連について解説。
10章:生命過程の確率的なゆらぎをモデル化するために有用なマルコフ過程とその平衡分布について実例を挙げながら解説。
11章:計算機を用いたランダムサンプリングの手法と,ランダムサンプリングを用いて,期待値計算や数値積分を行う方法とその原理について解説。
12章:ベイズ推定の事後分布の性質を調べるために有用なマルコフ連鎖モンテカルロ法について解説。
13章:確率過程における到達時刻の概念について解説し,これに付随して現れるいくつかの確率分布を紹介。
【著者からのメッセージ】
生命ビッグデータ解析で重要となる統計解析の基礎概念と手法について解説しました。様々な手法を紹介していますが,それらの原理を丁寧に説明することで,読者が納得して使えるようになることを目指しました。データ解析の現場で役立てていただければ幸いです。
【キーワード】
統計解析,確率変数,大数の法則,中心極限定理,仮説検定,P値,多重検定補正,確率モデル,最尤推定法,混合正規分布,期待値最大化法,回帰分析,過適合,ベイズ推定,確率過程,マルコフ過程,ランダムサンプリング,マルコフ連鎖モンテカルロ法,到達時刻