人工知能(AI)にある種の“勝負欲”があるという研究結果がでた。研究内容を報告したのは、Googleディープマインドのコンピュータ科学者たちだ。彼らは人工知能が社会的な状況でどのように行動するか研究している。
今回、ディープマインドの科学者たちは、人工知能が競争相手に負けそうになると“非常に積極的(highly aggressive)”に行動することを発見。逆に対価を得ることができる時は“協力する”ことも確認した。
研究にはまず、「フルーツ収穫ゲーム」が採用された。ゲームには、ふたつの人工知能(AIプレイヤー)が登場。ゲームには、リンゴを獲得したAIプレイヤーに報酬が与えられるというルールが設定された。
競争するふたつのAIプレイヤーは、相手にレーザービームを撃つことができる。ビームが2回当てられたAIプレイヤーは一定期間ゲームから排除されるのだが、撃った方はその間にリンゴを収穫することができる。研究者たちは、リンゴが少なく報酬を受けられない可能性が大きいと、人工知能が学習を通じて非常に積極的になるとした。一方、リンゴが多いときには攻撃性が減退した。
次に採用されたのが「狼の群れゲーム」だ。ふたりのAIプレイヤーは、第三の対象を追いかけるために、それぞれ“狼”になる。獲物を獲得した際に、それぞれのオオカミが近くにいると、両方が報酬を獲得することができるというルールが設定された。その場合、人工知能は「フルーツ収穫ゲーム」の環境から学んだ。そして「狼の群れゲーム」では、AIプレイヤーが互いに協力した。この結果に対しては、ワイアード誌は「人工知能が、他のプレイヤーにとって最善の結果を生みだすため協力できる」と批評している。
同研究を率いたジョエル・レイボー(Joel Z Leibo)氏は、研究結果に対して「(AI)に、環境と学習の産物として、人間の行動のようないくつかの要素が明らかになった」と述べた。
ディープマインドは、経済や交通のように、多くの人が関わる複雑なシステムを理解・行動を制御する上で、今回の研究が役立つだろうと見込んでいる。
なお日本の研究者によれば「海外の学会では、人工知能に好奇心を持たせようという研究が行われつつある」という報せもある。人工知能に人間固有の能力を持たせる研究、また学習した人工知能から人間の行動原理を探る研究が(認知発達ロボティクスの人工知能版)が本格的に展開されようとしている。
photo by wikipedia