人間が持つ能力のひとつに「モノをつまみあげる」というものがある。物の形状や大きさが変化しても、人間は対象に合わせてつまみあげることができる。しかし、ロボットにはそれができない。大きさや形が少し変化しただけでも混乱してしまう。工場や倉庫に普及している産業用ロボットアームは、通常、プログラミングされた製品だけを扱うことができる。
そんなロボットアームの能力の限界を克服しようと、ロボットスタートアップ・Embodied Intelligenceが研究に乗り出した。同社は最新の人工知能技術を利用して、様々な形およびサイズのモノをつまみあげることができる「汎用ロボットアーム」を研究している。
Embodied Intelligenceは、非営利機関・オープンAIとバークレー大学出身の研究者たちによって設立された。発足と同時に調達した資金は700万ドル。これまでは活動を表に出さない「ステルスモード」で活動してきたが、最近では自社の研究成果について積極的に周知し始めている。
同社CEOのpeter Chen氏は、米メディアインタビューに答え「展示会に出展されたロボットは素晴らしい機能を備えていますが、ほとんどのひとつのことしかできない」とし「私たちは、いくつかの仕事をすることができるロボットを開発することを望んでいる」と述べている。加えて「私たちは今後10〜20年の間に、汎用ロボットに多くのタスクを処理させるようにするというビジョンを持ち、会社をスタートさせた」と抱負を語っている。
ロボットにモノを持たせる、または操作させるためには、一般的にふたつの技術的な選択肢があるとされてきた。ひとつは「ハードコーディング(hard-coding)」。これは、ロボットにすべての動きを細かくプログラミングする手法である。欠点としては、エンジニリングに多くの費用がかかり、かつ周囲の環境が少し変わっただけでも問題が生じてしまうという点だ。もうひとつの方法は、人工知能技術を使用した「強化学習」である。これは、試行錯誤を通じてロボットに動きを学習させる方法。トラブル解決時にインセンティブを与えることで、ロボットはさらに効果的な方法を探すようになる。
一方、Embodied Intelligenceは「模倣学習(imitation learning)」を選択した。この方法では、ロボットは人の動作を見てそのまま行動をコピーする。より詳細に言えば、行動を正確に真似るのではなく、見たもの一般化し、抽象的な「命令セット」(※1)に転換する。
同社は「デモによる学習方法(learning-by-demonstration method)」を採用。すべての種類のシナリオに適用できる単一の学習ソフトウェアを開発するという方針を取り、仮想化技術も採用するとしている。
Embodied Intelligence側は、「まだ自分たちの技術の信頼性が90%に過ぎない。実際に工場や物流現場に導入させるためには、99.9%まで信頼性を高めなければならない」としている。
(※1)コンピュータのハードウェアに対して命令を伝えるための言葉の語彙