「マシンラーニング(機械学習)」とは何か…4つの分類を解説

「マシンラーニング(機械学習)」とは何か…4つの分類を解説

Posted date:2017.05.01

photo by Mathematica(flickr)

 ここ数年、話題のキーワードとして浮上して久しい人工知能(AI)。なかでも、画像認識、音声認識などの領域で優れたパフォーマンスを発揮し、さまざまな産業で応用がはじまっているのが「マシンラーニング(機械学習)」の分野だ。昨今、一般に広く認知されている「ディープラーニング」も、このマシンラーニングのひとつとなる。

 ところでマシンラーニングとは何か。米計算機科学者で、コンピュータゲームおよび人工知能研究の権威として知られるアーサー・サミュエル氏は、次のように定義している。

「Field of study that gives computers the ability to learn without being explicitly programmed.」

 直訳すれば、「明示的なプログラムなしに、コンピュータに学習能力を付与する研究分野」となる。つまり、マシンラーニングは人工知能の「学習」に関する研究分野、もしくはその関連技術を指し、データに内在したパターン、規則、意味などを、アルゴリズムをベースにコンピュータに自ら学習させ、次いで新たに入力されたデータの結果を予測するようにする技術と言いかえることができる。

 マシンラーニングは、大別すると以下の4つに分けることができる。

①教師あり学習(Supervised Learning)
②教師なし学習(Unsupervised Learning)
③準教師あり学習(Semi-supervised Learning)
④強化学習(Reinforcement Learning)

 まず、教師あり学習とは、意味=ラベルを付与した訓練データをベースに、他のデータを予測させる技術だ。例えば、フェイスブックなどSNSで、「この人は○○さんだ」とタグ付けしたり、名前を何回も人間が書きこむことで、コンピュータが対象の顔を学習。一定のタイミングで「この人は○○さんである」と認識できるようになる。他にも、アパートの面積や部屋数、位置などのデータとともに価格を学ばせることで、いずれ新たに入力された物件の価格を、コンピュータに自動で推測させるなどの使い方がある。

 一方、教師なし学習は、教師あり学習とは異なり、ラベルがないデータ間のパターンを把握。入力されたデータ間の類似性などを根拠に、データの要素を群集させたり、密度関数を推論する。実用の見地から言うと、迷惑メールなどを排除するスパムフィルタなどに、この教師なし学習が使われているという。

【関連記事】>>>人工知能の注目トレンド「GAN:敵対的生成ネットワーク」とは
【関連記事】>>>インドの「優しい人工知能」が干ばつや悪徳高利貸から農家を救う

1 2 3

参照
blog.brainpad.co.jp