ランダムフォレスト
複数の決定木を集めたもの。
ツリー(木)が集まったものなので、フォレスト(森)と呼ばれる。
たとえば、「写真Aは男性か女性か」という質問に対して、分類木1は女性、分類木2は男性、分類木3は女性という分析結果を出している場合、すべての分類木の結果を集めて多数決をとったら、写真Aは女性であるという分析結果が出る。
特徴
アンサンブル学習
多数決をとる学習方法で、別々の決定木としてそれぞれ学習させた結果を融合・統一させる。学習範囲が異なる複数の決定木を集めてアンサンブル学習を行うことで、単独の決定木よりも優れた分析結果を得ることができる。
バギング
アンサンブル学習の主な手法のひとつであり、ブートストラップサンプリングによって得た学習データを用い、複数の決定木を作って多数決をとる。多様性のある分析結果を出す。
ブーストトラップサンプリング
母集団の学習データから、各決定木で使うデータをランダムに復元抽出すること。データセットに対して多様性をもたせる手法。復元抽出とは、一度選んだデータがまた選べるよう重複を許す抽出方法である。
メリット
決定木をもとにしているためシンプルでわかりやすく分析結果を説明しやすい点や、各決定木は並列処理が可能なため計算も高速で精度もよい点などが挙げられる。