Pythonで気軽に化学・化学工学
金子 弘昌 著
内容
目次
1章 必要なソフトウェアをインストールして,Jupyter Notebook やPython に慣れる 1.1 Anaconda のインストール 1.2 Jupyter Notebook の使い方 1.3 Jupyter Notebook の起動 1.4 セルおよびセルのタイプとモード 1.5 セルの実行 1.6 おもな操作方法 1.7 キーボードショートカット 1.8 Jupyter Notebook の終了 2章 Python プログラミングの基礎を学ぶ 2.1 数値や文字などの扱い 2.2 数値や文字の集合の扱い 2.3 組み込み関数による効率的な処理 3章 データセットの読み込み・確認・変換・保存ができるようになる 3.1 データセットの読み込み 3.2 データセットの中身の確認 3.3 データセットの保存 4章 データセットの特徴を把握する 4.1 行列形式によるデータセットの表現 4.2 ヒストグラムによるデータの分布の確認 4.3 おもな基礎統計量を計算することによる特徴量間の比較 4.4 散布図による特徴量間の関係の確認 4.5 相関係数による特徴量間の関係の強さの確認 5章 データセットを前処理して扱いやすくする 5.1 特徴量のスケールの統一化 5.2 ばらつきの小さい特徴量の削除 5.3 類似した特徴量の組における一方の特徴量の削除 6章 データセットの見える化(可視化)をする 6.1 主成分分析 37 6.2 t-distributed Stochastic Neighbor Embedding (t-SNE) 43 7章 データセットを類似するサンプルごとにグループ化する 49 7.1 クラスタリング 49 7.2 階層的クラスタリングの基礎 50 7.3 階層的クラスタリングの実行 53 7.4 化学・化学工学での応用 56 8章 モデルy=f (x) を構築して,新たなサンプルのyを推定する 8.1 クラス分類(クラス分類とクラスタリングとの違い,教師あり学習と教師なし学習) 8.2 k-NN によるクラス分類とクラス分類モデルの推定性能の評価 8.3 回帰分析 8.4 k-NN や最小二乗法による回帰分析と回帰モデルの推定性能の評価 8.5 モデルの推定性能を低下させる要因とその解決手法(PLS) 8.6 さまざまな解析の自動化・効率化 8.7 非線形の回帰分析手法やクラス分類手法 8.8 ダブルクロスバリデーション 8.9 化学・化学工学での応用 9章 モデルの推定結果の信頼性を議論する 9.1 目的変数の推定に用いる最終的なモデル 9.2 モデルの適用範囲 9.3 One-Class Support Vector Machine (OCSVM) 10章 モデルを用いてy からx を推定する 10.1 仮想サンプルの生成 10.2 仮想サンプルの予測および候補の選択 11章 目標達成に向けて実験条件・製造条件を提案する 11.1 実験計画法 11.2 応答曲面法 11.3 適応的実験計画法 12章 化学構造を扱う 12.1 RDKit のインストール 12.2 化学構造の表現方法 12.3 化合物群の扱い 12.4 化学構造の数値化 12.5 化学構造のデータセットを扱うときの注意点およびデータセットの前処理