世界的権威に聞く「ロボット×ディープラーニング最前線」

Photo by James Pond on Unsplash

画像・音声認識や自然言語処理(人間が使用する言語をコンピューターに処理させる技術)などの分野で高い精度を実現するディープラーニング(深層学習)は、社会およびビジネス課題を解決する最新技術として期待を集めている。

ディープラーニングが技術トレンドとして浮上し数年が経過した現在、同技術はさまざまな産業へ応用されつつある。日本が競争力を誇る「ロボット産業」もそのひとつ。人工知能(AI)の最新技術であるディープラーニングとロボットは、いまどのように融合しようとしているのか。両分野に精通する世界的権威である早稲田大学・尾形哲也教授にお話しを伺った。

ロボットとディープラーニングの現在進行形の関係を語る際、その文脈は大きくふたつあると尾形氏は言う。ひとつは、サービスロボットのひとつにカテゴライズされている「コミュニケーションロボット」の能力向上だ。

ソフトバンクのロボット・ペッパーが例として最適かもしれまない。人工知能を搭載したコミュニケーションロボットは、人間の言葉や表情、声を「認識」し感情を読み取り、適切なリアクションや反応を示したり、時に人間のような感情表現を行うことができるようになってきている。

尾形氏はそれらをいわゆる「情報系(IT系)のロボット」と表現する。カメラ、スピーカー、マイクなどを使って外部の情報を収集し、人間に情報や、コミュニケーション、精神的サポートなど「非モノ」をサービスとして提供するロボットだ。言い換えれば、PCやタブレットの延長、もしくはそれらを“擬人化”したものが、ディープラーニングの力で一定の能力を獲得することに成功しているということになりる。

「コミュニケーションロボットの能力は、ディープラーニングを取り入れることで大きく向上しています。例えば、人間と機械が自然言語を取り交わすための『対話システム』。
現在、スマートスピーカーやAIアシスタントの言語認識能力の向上はめざましいですよね。それら認識能力は対話に限らず拡張されていくでしょう」(尾形氏)

一方で、工場や倉庫などで実際にモノを触ったり、動かすというタスクが要求される「産業用ロボット」にも、ディープラーニングを応用しようという世界的な流れが徐々に生まれている。なお、産業用ロボットにディープラーニングを使うというコンセプトが世に広まり始めたのは2015年から。また世界の学術系トップカンファレンスで「産業用ロボット×ディープラーニング」というキーワードが注目され始めたのはつい2年前、2017年からだと尾形氏は業界事情を説明する。

「産業用ロボットにディープラーニングを使うことを想定した上で、最初に研究が進んだ分野は『ビジョンシステム』。ロボットに物体の位置や掴む箇所を正確に認識させるというような研究です。ロボットの『視覚』と説明した方が分かりやすいかもしれませんね。意外かもしれませんが、一昔前までの産業用ロボットは物体の位置を正確かつ柔軟に把握するという能力を与えることすらとても大変なことだったんですよ。それが、ディープラーニングの登場で事情が変わってきた。また、今年5月に開催された米国電気電子学会(IEEE)が主催する世界トップカンファレンス『ICRA』では、『視覚』だけでなく、『触覚』や『力覚』の能力を向上させるためのディープラーニング研究事例などが多く発表・評価されています」(尾形氏)

河鐘基

記者:河鐘基


1983年、北海道生まれ。株式会社ロボティア代表。テクノロジーメディア「ロボティア」編集長・運営責任者。著書に『ドローンの衝撃』『AI・ロボット開発、これが日本の勝利の法則』(扶桑社)など。自社でアジア地域を中心とした海外テック動向の調査やメディア運営、コンテンツ制作全般を請け負うかたわら、『Forbes JAPAN』 『週刊SPA!』など各種メディアにテクノロジーから社会・政治問題まで幅広く寄稿している。