実装:SGDでロジスティック回帰
実装コード要約
- 乳癌データインポート
- 内容の確認
- negative/positive群のヒストグラム比較
- feature間の相関テーブル・ヒートマップを確認
- 最適化処理実装
- 最適化実行(loss計算失敗)
- クロスバリデーション: Accuracy 0.892
- 最適化実行(feature正規化してloss計算実施)
- クロスバリデーション: Accuracy 0.946
所感:
featureの正規化するだけで結構性能が変わる。
他の最適化手法を適用して、比較分析したい。
参考:
パターン認識と機械学習 上 4.3.2 ロジスティック回帰
機械学習 はじめよう:連載|gihyo.jp … 技術評論社