「マシンラーニング(機械学習)」とは何か…4つの分類を解説

ロボティア編集部2017年5月1日(月曜日)

 ここ数年、話題のキーワードとして浮上して久しい人工知能(AI)。なかでも、画像認識、音声認識などの領域で優れたパフォーマンスを発揮し、さまざまな産業で応用がはじまっているのが「マシンラーニング(機械学習)」の分野だ。昨今、一般に広く認知されている「ディープラーニング」も、このマシンラーニングのひとつとなる。

 ところでマシンラーニングとは何か。米計算機科学者で、コンピュータゲームおよび人工知能研究の権威として知られるアーサー・サミュエル氏は、次のように定義している。

「Field of study that gives computers the ability to learn without being explicitly programmed.」

 直訳すれば、「明示的なプログラムなしに、コンピュータに学習能力を付与する研究分野」となる。つまり、マシンラーニングは人工知能の「学習」に関する研究分野、もしくはその関連技術を指し、データに内在したパターン、規則、意味などを、アルゴリズムをベースにコンピュータに自ら学習させ、次いで新たに入力されたデータの結果を予測するようにする技術と言いかえることができる。

 マシンラーニングは、大別すると以下の4つに分けることができる。

①教師あり学習(Supervised Learning)
②教師なし学習(Unsupervised Learning)
③準教師あり学習(Semi-supervised Learning)
④強化学習(Reinforcement Learning)

 まず、教師あり学習とは、意味=ラベルを付与した訓練データをベースに、他のデータを予測させる技術だ。例えば、フェイスブックなどSNSで、「この人は○○さんだ」とタグ付けしたり、名前を何回も人間が書きこむことで、コンピュータが対象の顔を学習。一定のタイミングで「この人は○○さんである」と認識できるようになる。他にも、アパートの面積や部屋数、位置などのデータとともに価格を学ばせることで、いずれ新たに入力された物件の価格を、コンピュータに自動で推測させるなどの使い方がある。

 一方、教師なし学習は、教師あり学習とは異なり、ラベルがないデータ間のパターンを把握。入力されたデータ間の類似性などを根拠に、データの要素を群集させたり、密度関数を推論する。実用の見地から言うと、迷惑メールなどを排除するスパムフィルタなどに、この教師なし学習が使われているという。

【関連記事】>>>人工知能の注目トレンド「GAN:敵対的生成ネットワーク」とは
【関連記事】>>>インドの「優しい人工知能」が干ばつや悪徳高利貸から農家を救う

なお、教師あり学習と教師なし学習には、それぞれ以下のような技法などがある。

■教師あり学習
•一般線形モデル(Generalized linear models=GLM)
•意思決定ツリー(Decision trees)
•ランダムフォレスト(Random forests)
•勾配ブースティング(Gradient boosting machine=GBM)

■教師なし学習
•クラスタリング(Clustering)
•異常検出(Anomaly detection)
•次元削減(Dimension reduction)

 強化学習については、株式会社ブレインパッド社のブログに分かりやすい解説が掲載さていたので引用したい。

「強化学習とは、試行錯誤を通じて『価値を最大化するような行動』を学習するものです。教師付き学習とよく似た問題設定ですが、与えられた正解の出力をそのまま学習すれば良いわけではなく、もっと広い意味での『価値』を最大化する行動を学習しなければなりません。例えば、株の売買により利益を得る問題が強化学習にあたります。この場合、持っている株をすべて売り出せば確かにその時点では最もキャッシュを得ることができますが、より長期的な意味での価値を最大化するには、株をもう少し手元に置いておいたほうが良いかもしれません」

 なお、ディープラーニングは、教師あり学習、教師なし学習、強化学習のいずれのアプローチも可能だが、現状では製品化されている関連製品の9割以上が教師あり学習で訓練されたものとなるそうだ。

 それらマシンラーニングの強みは、大きくふたつあるといわれている。まずひとつが、膨大なデータの中から一定のパターンを自ら見つけ出すというもの。そしてもうひとつが、未来予測(future prediction)だ。

【関連記事】>>>Facebookが写真に映る人間の感情・内容を読み取る人工知能「Lumos」を開発
【関連記事】>>>「マスターアルゴリズム」著者が預言する人工知能の未来

 ふたつの強みは、詐欺防止、ターゲットデジタルディスプレイ、コンテンツ推薦、製品の品質向上、有望・潜在的な顧客の洗い出し、メディア最適化、医療保健サービスの改善、製品の故障予測など、実にさまざまな分野で応用・実用化されはじめている。

 また最近では、ディープラーニングを使えば、認識や予測だけではなく、ものごとを生成することができるとする専門家たちもいる。AIが音楽や絵を生み出したり、産業用ロボットに新たな環境で取るべき作業を自ら学習させたりと、その応用の可能性はかなり幅広い。今後、人工知能はどのような発展を遂げていくのだろうか。その行く末に対する注目は、日ごとに高まるばかりだ。

【関連記事】>>>人工知能で癌治療を…ディープマインドとロンドン大学が提携
【関連記事】>>>人工知能が”偏見学習”する!?「AIは人間から悪意を学ぶ」英論文が憂慮
【関連記事】>>>人工知能が17世紀の古典文献を機械翻訳…作業期間が27年も短縮と予想

photo by Mathematica(flickr)