リクルートテクノロジーズがディープラーニング活用した画像認識技術のAPIを無料公開

リクルートテクノロジーズがディープラーニング活用した画像認識技術のAPIを無料公開

Posted date:2017.07.13

 リクルートテクノロジーズが、機械学習やディープラーニングを用いたソリューションAPI群「A3RT(アート)」に2つのAPIを新たに追加した。

 A3RTは「必要な最新テクノロジーをいつでも手軽に」というコンセプトのもと開発が進められている、機械学習やディープラーニングを用いたソリューションAPI群。3月16日にはその第一弾として、画像解析や文章分類モデル作成など6つのAPIが公開されている。その反響を受け、今回は「DCGAN」の技術を用いた画像生成API、および「マルチモーダルDeep Learning」を用いた画像とテキストの相互検索APIが追加された。

※脚注
①DCGAN:Deep Convolutional Generative Adversarial Networksの略。ディープラーニングを活用した画像生成などに用いられる技術
②マルチモーダルDeep Learning:複数のデータの関係性を学習する。たとえば、画像とテキストの関係性を学習することで、その相互検索を可能にする技術

■複数の画像データを学習して新たな画像を生成。DCGAN技術を手軽に利用「Image Generate API」

 Image Generate APIは、DCGANの技術を用いてオリジナルの画像を生成するAPI。あらかじめ4500枚以上の画像を学習させたアルゴリズムから自動生成された画像を合成し、新しい画像を作ることができる。また、作成した画像を評価することで生成に反映させることができる。現在、ユーザーがモデルを作成できる機能は提供されていないが、今後ユーザーが自由にデータをアップロードして学習させることができる機能を提供予定だ。

 このAPIを使えば、①オリジナル画像を生成する、②生成した画像を複数選択し合成する、③合成した画像を評価するなどが可能。今後、ユーザーによるモデル作成が可能になった際には、このAPIを活用して多様なジャンルの画像生成が行われることが期待される。

■うまく言語化できなくても検索できちゃう? マルチモーダルDeep Learning技術を活用した新API「Image Search API」

 Image Search APIは、マルチモーダルDeep Learning技術を用いた画像とテキストの相互検索API。画像とテキストの関係を学習することで、テキストから画像を検索したり画像からテキストを検索したりといった相互検索を行うことができる。現在、オリジナルの画像データを用いることはできないが、用意されているサンプルデータを用いて技術を体験できる。このAPIを使ってできることは、①自然な言葉で画像を見つけること、②画像をもとに関連する言葉を見つけること、③画像をもとに類似の画像を見つけること、④文章から関連する単語を見つけることなどとなる。

■その他、現在公開されているAPIラインアップ

※A3RT公式サイトはこちら