フェイスブックが独自開発している人工知能(AI)ベースの画像認識技術「ルーモス(Lumos)」は、写真の中に「どのような対象がいるか」だけではなく、「どのような内容が込められているか」まで把握する力を確保してようとしている。タグ、説明などに依存せず、ピクセル(pixel)情報から写真のなかの出来事を理解することを目指す。
フェイスブックが最近公開したブログによると、そもそもルーモスは、視覚障害者にフェイスブックのニュースフィードに上がった写真に、どのような内容が盛り込まれているか知らせる目的で開発された。
昨年4月、フェイスブックが公開した「オートマチックオルタナティブテキスト(AAT)」は、視覚障害者がスマートフォンでFacebookにログインすると、ニュースフィードを読みあげてくれる機能だ。ルーモスは、その機能に採用されている。例えば、「写真には3人が写っている」「笑顔だ」という風に、写真の内容を説明してくれる。フェイスブックは今後、その技術を写真検索機能の向上に使う計画だ。
なおブログのなかで、フェイスブックのアプライドマシンラーニング事業部の総括・ジャクイーン・キンテーロ・カンデラ(Joaquin Quiñonero Candela)氏は、「ルーモスプラットフォームである、FBラーナーフロウ(FBLearner Flow)は、マシンラーニング開発プラットフォームの最上段に位置している」と説明している。
FBラーナーフロウでは、フェイスブックのエンジニアがマシンラーニング技術を応用する際にルーモスを活用できるようにし、ディープランニング、コンピュータビジョン技術など、他の技術の学習過程を経なくてもよいようにした。ルーモスプラットフォームが、自動でそれら作業を代わりに遂行してくれる。現在、FBランナーフローでは、月120万個のAIと関連した各種実験を進められているという。
今後Facebookはルーモスを写真だけでなく、動画にも適用する。動画の中にどのような内容が含まれているか把握し、キーワード検索の精度向上に利用していく構えだ。また、ユーザーに嫌悪感を抱かせるコンテンツやスパムをブロックしたり、写真に自動的に説明を付けるタスクなどにも技術を応用していく予定である。
photo by fotologic