人工知能の注目トレンド「GAN:敵対的生成ネットワーク」とは

人工知能の注目トレンド「GAN:敵対的生成ネットワーク」とは

Written by Pocca

Posted date:2017.03.08


photo by wikimedia commons


 昨今の人工知能ブームの中心にある「ディープラーニング」。その発展によって、画像認識や音声認識、機械翻訳などの多くのタスクの性能が飛躍的に向上した。

 そもそも、ディープラーニングがこれほどまでに有名になったきっかけは、2012年に開催された画像認識コンテスト(ImageNet Large ScaleVisual Recognition Challenge)だと言われている。カナダ・トロント大学のチームが約1200万画像・1000カテゴリの画像認識に対して初めてディープラーニングを適用し、圧倒的な精度を実証したのだ。彼らのチームは他に大きく差をつけ優勝。以来、同コンテストは毎年行われており、世界中の一流大学や研究機関が参加し、独自のアルゴリズムを競っている。

 それから数年、ディープラーニングは画像分野などで急速に拡大し、さまざまな革新を起こしている。米フェイスブックやマイクロソフト、中国バイドゥ(百度)といった海外大手IT企業も、画像検索や音声認識、自然言語処理などさまざまなサービスにディープラーニングを実用化している。

 このようにディープラーニングによる認識技術が発展する一方、「生成」技術においても大きな進化を遂げている。なかでも近年最も脚光を浴びている技術が「GAN:敵対的生成ネットワーク(Generative Adversarial Network)」。はたしてGANとは、どのような技術なのか。

 もともと機会学習の方法は、コンピュータに質問と回答を同時に教える方法が一般的であった。たとえば、犬の画像に「分類は犬である」という正解を付けたデータを読み込ませる。さらには「どうしてそれが犬に分類されるのか?」ということをコンピュータに考えさせ、「犬の特徴量」を自ら発見させる。そうすることによって、コンピュータはその特徴量のものが「犬」である、と学習していく仕組みだ。

 しかしコンピュータは、画像を一枚だけ解析して特徴量を覚えたところで、ほかの犬の画像を見せても、最初に覚えた犬の画像にそっくりでなければ、同じ「犬」だとは判別できない。したがって、膨大な量の犬の画像を読み込ませるのだ。このように膨大な特徴量から照合することで、「犬」を識別できる精度が上がっていく。そのように、これまでの機械学習はほとんどコンピュータにひとつひとつ答えを読み込ませていく「教師あり学習」だった。

1 2 3

外部記事リンク

techm
news-medical.net
dddmag.com