mikemoke blog

データ解析やってます。統計・機械学習・画像解析など。

DeepLearningをサンプルデータ作って評価_Sample2(正規分布の線形和+ノイズ)

色々な条件を想定してサンプルデータを作成し、DeepLearningが他の手法に比べてどのような性能を示すのか、どのような挙動を示すのか、確認しています。

結果は以下リンクにまとめています。

 

mikemoke.hatenablog.com

 

サンプル2

目的:

ノイズを含めたパラメータを用いて、判別性能を評価したい。

 

サンプル作成方法:

10個の正規分布から得られる値に、正規分布のノイズを加えたものをパラメータとする。

  • class1: (N(0,1)+N(0,0.2))より得られる10個の値をパラメータとする。
  • class2: (N(2,1)+N(0,0.2))より得られる10個の値をパラメータとする。
    ※ノイズとしてN(0,0.2)を追加

 

サンプルデータ:

  • training 40,000 (class1:20,000, class2:20,000) 
  • validate 20,000 (class1:10,000, class2:10,000) 
  • parameter数 10

 

結果:

  • Logistic回帰
    Accuracy:99.88%
  • DeepLearning
    Accuracy:99.91%
    ※隠れ層:1層 10ノード  (Deepではない
  • AdaBoost
    Accuracy:99.73%
    ※学習回数:100

 

考察:

  • サンプル1とデータの性質は殆ど変わっていないので、新たな知見は特になし。
  • パラメータ数が減ったことで、AdaBoostが良好な判別性能を示している。

 

今後の予定:

  • 今回用いたデータをベースに、非線形化、ミスラベルなどを加え、判別性能の評価を実施