NVIDIAが「有名人のフェイク画像」生成...敵対的生成ネットワーク(GAN)応用

ロボティア編集部2017年10月31日(火曜日)

半導体メーカー・NVIDIAが、人工知能(AI)を活用した「フェイク画像生成」に関する技術論文を発表した。同技術は、敵対的生成ネットワーク(GAN=Generative Adversarial Networks)を応用したものだ。

GANは、ふたつのニューラルネットワークを相互に競争させることで、なるべく人間の手を介さず、データ入手・処理・活用方法を多様化する。この技術をフェイク画像生成に応用した場合、片方のニューラルネットワークがまずフェイク画像の検知方法を模索する。一方、もう片方のニューラルネットワークは、競争相手が生み出した検知方法をベースに、より完璧なフェイク画像を作っていく。つまり、弁証法的に検知・生成のプロセスが繰り返されていくことになる。

NVIDIAは、このGANを有名人のフェイク画像を作成するのに使用した。 NVIDIAの「テスラP100 GPU」、ディープラーニングライブラリ「CUDA」、開発ツール「cuDNN」などで構成されたニューラルネットワークは、有名人の写真から、目鼻立ち、背景、色などの情報を取得。続いて、有名人の写真に自ら学習した背景ぼかしを入れ構図を変更し、新しいイメージを作成したという。なお必要に応じて画素補間(画素を詰めて、解像度や色を補完する技術)も加えた。そうして、実際には撮影されていない有名人の写真をランダムに生み出すことに成功したが、GANがその技術を習得するまでに約20日間が必要だったと説明している。

NVIDIAは、GANを活用して1024×1024の解像度・高画質の画像を作ったと述べている。また今後、機械学習エンジン・テンサーフロー(TensorFlow)と、複数のGPU(Graphic Processing Unit)を利用して、次のステップの“教育段階”に進むとも言及している。

Photo by devblogs.nvidia.com