ディープマインドのゲームAIはアクションゲームが不得意!?

ディープマインドのゲームAIはアクションゲームが不得意!?

Written by Jin Kodama

Posted date:2016.06.22


ディープマインド_アタリ2600_Montezuma's Revenge_DQN

photo by youtube


 グーグルが開発しているゲーム専用人工知能DQN(deep Q-network)。人工知能がゲームをプレイしながら学習し、時に人間以上の実力を発揮する。

 グーグル傘下の人工知能企業ディープマインドは、人間と同レベルの知能を備えた人工知能の開発を目指している。そのなかの試みのひとつとして、DQNに様々なゲームをプレイさせているのだが、その結果、人工知能が人間以上にこなすことができるゲームと、そうでないゲームが存在することが明らかになってきた。

 ディープマインドのDQNは、何度も試行錯誤を繰り返しながら学習、知識を蓄積する。このような学習形態は強化学習(reinforcement learning)と呼ばれている。

グーグル_ディープマインド_DQN

photo by Deepmind Blog


 ディープマインドはDQNに、前提となる知識が全くない状態で、アタリ2600(米国で開発された家庭用ゲーム機)のゲーム50種をプレイするようにした。結果、29種のゲームで人間を凌駕するスコアを残したという。最もスコアが高かったゲームはビデオピンボールで、人間よりも2539%も高いスコアをマークした。一方、モンテズーマズ・リベンジ(Montezuma’s Revenge)という、スーパーマリオに似たスクロール型アクションゲームでは苦戦(0%)を強いられている。(上表参照)

1 2

参照
deepmind.com