コンピュータビジョン=”ロボットの目”開発を急ぐITの巨人たち

ロボティア編集部2015年12月27日(日曜日)

 KOTRA(大韓貿易投資振興公社)や関連業界関係者がによると、Google、フェイスブック、アップルなどIT企業は、マシンラーニング以外にも、コンピュータビジョン技術の確保に焦点を合わせるという。センサーを利用して動作を検出したり、視覚情報を解釈、空間を認識するのが同技術確保の目標となる。

 マシンビジョンとも呼ばれるコンピュータビジョンは、機械やコンピュータが物事を見て理解する分析システムである。人間が受け入れる情報の大半が目から入ってくるイメージであるため、コンピュータビジョン技術は人工知能の研究分野でも重要なものとなる。

 同技術が注目されたのは1990年代以降、国家安全保障の分野で、顔認識システムの必要性が大きくなったためと言われている。以後、「認知」を主要な要素としたコンピュータビジョン技術が続々と開発された。最近では、スマートフォンやSNSが普及し、毎秒ごとに膨大な量の画像データが生成されている。映像資料の分析技術も必須とされはじめた。そのため、さらなるコンピュータビジョン技術の発展が進んでいる。

 コンピュータビジョン技術の確保に乗り出しているのは主にインターネットサービス企業だ。ユーザーが作成した膨大な量の画像・映像データを分析し、それを元にまた他のサービスに繋げる。

 グーグル「タンゴプロジェクト(Project Tango)」は、3D拡張現実を実装したモバイル機器の開発が目的である。機器に取り付けられたセンサーやカメラで、人の目や脳が果たす役割をそのまま実行する。プロジェクトには、ボッシュ、nVIDIA、SKテレコムなどが参加している。

 アップルの無人自動車プロジェクト「タイタン」もコンピュータビジョン技術に基づいている。自動走行車が外部の外部環境や地形を把握して走行方向を設定するためには、目が必要となる。アップルは、プロジェクトを進めるために、コンピュータビジョン、マシンラーニングなどの人工知能の専門家を世界中から大勢迎え入れている。

cortexica
photo by cortexica.com

 フェイスブックは、画像やビデオの中の人物を認識し、ユーザーとマッチングするサービス「モーメンツ(moments)」をリリースした。グループの中で、写真・動画を送受信したり、編集する必要はなく、接続された人と自動的に共有される仕組みだ。ここには、コンピュータビジョンやマシンラーニング技術が利用されているが、コンピュータが5秒以内に分析する画像の数は8億枚以上に達するとも言われている。

 コンピュータビジョンを使ったサービスとしてはその他に、ユーザーが気に入っているファッションアイテムをカメラで認識して探してくれるコーテッシカ(cortexica)、人工知能コンピュータ、ロボットトレーナーが運動姿勢を教えてくれるスマートスポット(SmartSpot)などが代表的である。

photo by machinelearningsoftware.org