Googleが文章を要約する人工知能の開発動向を公開

Googleが文章を要約する人工知能の開発動向を公開

Written by Shinji Ikematu

Posted date:2016.09.10


人工知能_文章要約

photo by Google Research Blog


 Googleが、記事要約文・タイトルを作成する人工知能の能力を公開した。 Googleブレインチームのソフトウェアエンジニア、ピーター・リュウ(Peter Liu)氏は8月24日、Googleリサーチ公式ブログに、「テンサーフローライブラリを使用したテキストの要約(Text summarization with TensorFlow)」という記事を掲載した。

「要約は機械の読み取りする力を支える。要約をこなすため、機械学習モデルはドキュメントから重要な情報を抽出することが必要だが、これはコンピュータには大変やりがいのある仕事だ」(ピーター・リュウ氏)

 リュウ氏ら研究チームは、機械学習によるテキスト要約のために試みた、いくつかのアプローチについて説明している。例えば「アリスとボブは、列車に乗って動物園に行った。彼らは子供のキリン、ライオン、色とりどりの熱帯鳥の群れを見た」というような原文が与えられたとき、それら各アプローチによって異なる結果が出るという説明だ。

 アプローチのひとつとしては、テキストマイニング分野の「逆文書頻度(IDF)」のような指標を活用して、ドキュメント内の重要に見える部分を抽出し、それを要約する方式だ。このアプローチでは「アリスとボブは動物園に行く。鳥の群れを見た」という結果となった。このような抜粋方法だと、文法的に奇妙な感じがする。

 他のひとつは、本文の一部を強制的に抜粋すという風ではなく、内容をある程度書き換えさせる方式である。いわゆる「抽象的な要約(abstractive summarization)」と名付けられたアプローチを適用した結果は次のようになった。

「アリスとボブは動物園に行き、獣や鳥を見た」

 リュウ氏は「この例では、我々は似たような分量の単語により多くの情報を保存するため、原文にない単語を用いた(中略)抽象的要約がより良い方法であることが明らかだった」としている。

1 2

参照
googleblog
zdnet.com