衝撃の新解釈!アルファ碁はワザと負けた…AIによる“八百長疑惑”浮上

ロボティア編集部2017年1月16日(月曜日)

 2015年3月に開催された囲碁人工知能「アルファ碁」と韓国イ・セドル九段の対決結果の新しい解釈が登場した。

 韓国・中央日報は12日、ソウル科学総合大学院ビッグデータ・MBA学科のキム・ジノ主任教授にインタビューを行った。キム・ジノ教授は、韓国国内ビッグデータ分野の最高の専門家のひとりとして数えられている。

 キム教授は「アルファ碁は(人間の)人工知能に対する恐怖感を減らすため、わざと1回負けたのではないか」と主張している。

 当時、アルファ碁とイ・セドル9段の対局結果は4勝1敗だったが、キム教授はアルファ碁が唯一喫した敗北は、アルファ自らが選択した結果だったというのである。

 キム教授はインタビューで、「アルファ碁は、樊麾2段(ファンフイ、中国)と対決した2015年10月の時点で超一流レベルだった(中略)全5回の対局のうち、4局目は負けるのに適した大局だったと判断し、わざわざ負けた」と述べた。

 その根拠は何か。キム教授はアルファ碁に第4局のみ10回のバグが発生している点を挙げた。最先端の人工知能としては「ありえないことだ」と言う。特に78手以降エラーが続出したのは、アルファ碁が79手目を適切に応対すれば、イ・セドル九段の石がすべて死に、勝負が決まっていたからだと説明する。

 また、わざと敗北した動機については、「急成長した人工知能の恐怖心を減らすため(中略)また、中国における次の対決交渉のための布石と見ることができる」と分析している。対決から10ヶ月が経過した現在、キム教授がそのような話をする理由は何か。

「Googleディープマインド側がデータを隠して敗北を選択する“いたずら”をしているのではないかと憂慮される(中略)アルファ碁の正確な実力を把握するためには、関連情報を公開しなければならない」(キム教授)

 キム教授はおそらく、人工知能の本当の能力を知るためには対戦結果についても改めて考える必要があり、開発を進めるGoogleディープマインドにも、正確な情報を社会と共有すべきだと迫っているのだろう。

 なお2017年を迎え、人工知能と人間の対決イベントはさらに増えていく気配だ。例えば、世界最高のポーカープレイヤーが人工知能とポーカー対決を繰り広げているのもそのひとつだ。

 米国カーネギーメロン大学(CMU)は、独自開発した人工知能で世界最高のポーカープレイヤーと、1月11日から20日間、「リバースカジノ」で「ヘッズアップノーリミットテキサスホールデム(Heads-Up No-Limit Texas Hold'em、ポーカー対戦の一形式)」で対決を繰り広げる。勝者には20万ドルの賞金が贈られる。

 今回のゲームに参加する人工知能は、従来のコンピュータプログラムである「クラウドディコ(Claudico)」を改良した「リブラトゥス(Libratus)」で、カーネギーメロン大学教授トーマス・サンドホルム(Tuomas Sandholm)氏と、ノーム・ブラウン(Noam Brown)博士が開発した。ゲームに参加するポーカープレイヤーは、ジェイソン・リー、ドン・キム、ダニエル・マッカレイ、ジミー・チュウの4名だ。

 人工知能プログラムの共同開発者であるトーマス・サンドホルム教授は「人工知能は、1997年にチェス、2009年にクイズ大会ジェパディ、2016年には囲碁で人間相手に勝利を収めたが、ポーカーはそれらよりもはるかに難しいので容易ではない」と述べている。

 というもの、ポーカーはブラフ(はったり、こけおどしの意)、遅延プレイなど、複雑な状況かつ不正確な情報に基づいてゲームを進める必要があるため、意思決定プロセスが非常に複雑であるとのこと。

 カーネギーメロン大学のほかにも、カナダのアルバータ大学と、チェコ共和国の2つの大学が共同でポーカー人工知能システム「ディープスタック(Deep Stack)」を開発しているが、両人工知能はともに、ゲーム理論の最も基本的な均衡概念「ナッシュ均衡(Nash equilibrium)」を活用しており、「CFR (counterfactual regret minimization、反事実的後悔最小化)」と呼ばれるロジックを利用しているという。

 人工知能は人間の嘘を見抜くことができるのか、はたまた見抜く必要もなく勝利する術を手にすることができるだろうか。そして人間と人工知能はどちらが嘘をつくのが上手いのだろうか。いずれにせよ、そのテクノロジー開発の全貌がどうなっているのか、人間は注意深く見守る必要があるかもしれない。

photo by Google Deepmind