〈T4〉機械学習01:概要と特徴
#テーマ4
機械学習とは
コンピューターが大量のデータを学習し、分類や予測などのタスクを遂行するアルゴリズムやモデルを自動的に構築する技術のこと。現在のAIの中核技術。【参考(1)より引用】
機械学習が用いられる場面
所定の数式や方程式が存在せず、大量のデータセットと多数の変数が含まれている複雑なタスクや課題がある場合。たとえば、顔認識や音声認識、常に変化する状況下でのデータ利用、データの変化に伴うプログラムの適応性が求められるなどの場面。【参考(2)より引用】
機械学習の種類
https://gyazo.com/aafc51d0e999c3e96506ffb3cee50dcf 【参考(1)より引用】
機械学習は、上記の通り、「教師なし学習」、「教師あり学習」、「強化学習」におおよそ分類される。詳細は、〈T4〉機械学習02:機械学習の種類を参照のこと。
機械学習のメカニズム
機械学習においては、それを最大限運用するために、様々なアルゴリズムが開発・運用されているが、詳細は、〈T4〉機械学習03:アルゴリズムを参照のこと。
過学習
統計学や機械学習において、訓練データに対して学習されているが、未知データに対しては適合・汎化できていない状態を指し、それは汎化能力の不足に起因する。【参考(3)より引用】
通常、学習アルゴリズムは一連の訓練データを使って訓練される。つまり、典型的な入力データとその際の既知の出力結果を与える。学習者はそれによって、訓練データでは示されなかった他の例についても正しい出力を返すことができるようになると期待される。しかし、学習期間が長すぎたり、訓練データが典型的なものでなかった場合、学習者は訓練データの特定のランダムな(本来学習させたい特徴とは無関係な)特徴にまで適合してしまう。このような過剰適合の過程では、訓練データについての性能は向上するが、それ以外のデータでは逆に結果が悪くなる。【参考(3)より引用】
すなわち、適切な学習データや時間でないと、機械学習の効果を最大限発揮できないということであり、機械学習を運用するのみでは、完全な利活用をできるわけではないということである。
汎化能力
未知のテストデータに対する識別能力を汎化能力といい、識別関数がその能力が高いと汎化性能が高いということになる。【参考(4)より引用】
回帰問題
回帰問題とは数値を予想する問題のこと。学習時に入力データと出力データから対応する規則を学び、未知の入力データに対して適切な出力結果を生成する手法。教師あり学習といえる。【参考(5)より引用】
強化学習については、〈T4〉機械学習02:機械学習の種類を参照のこと。
参考資料等
(1)【保存版】機械学習とは | 意味や仕組み・勉強方法を徹底解説(Ledge/ai)2020年12月19日最終アクセス。 https://ledge.ai/machine-learning/
(2)機械学習とは?仕組みや活用事例、習得法を徹底解説(MathWorks)2020年12月19日最終アクセス。
https://jp.mathworks.com/discovery/machine-learning.html
(3)過剰適合(Wikipedia)2020年12月19日最終アクセス。https://ja.wikipedia.org/wiki/過剰適合
(4)汎化性能とは?(Qiita)2020年12月19日最終アクセス。https://qiita.com/YosukeHoshi/items/927d233408346b41e524
(5)機械学習の代表的な手法(回帰問題編part1)(no1solutions)2020年12月19日最終アクセス。http://challenge.no1s.biz/programming/ai/451