ランダムフォレスト
#機械学習
#データ分析
#分類木
#分類(機械学習)
#アンサンブル学習
決定木の上位互換
分類木をたくさん作って、多数決で予測をする、精度の高いアルゴリズム
決定木の予測精度を上げるために考えられた手法
学習データを分割して、幾つものパターンの分類木を作り、多数決で予測をする
沢山の木があるので森という意味で「フォレスト」とついている
決定木は複数の条件で分岐を行うが、どんな分岐を行うかは様々なパターンが考えられる
ある1つの有効だと思われるパターンで分類したが、別のパターンの分類がよかったかもしれないなどある
複数のパターンを使うことで、より精度の高い予測ができるようになる
データについて
同じデータで木を作っても同じ分岐になるだけなので、ランダムに行列のデータを選ぶようにして、異なるデータになるようにする
さまざまな予測モデルを作成して、最終的に1つの予測結果を出す手法をアンサンブル学習という