人工知能が声を持たない人々の声を生み出す...音声合成技術の進化

ロボティア編集部
ロボティア編集部
Photo by blog.kt.com

韓国通信大手・KTが、先天的に聴覚障碍を持つ女性の声を人工知能(AI)で「生成」することに成功。そのエピソードが韓国で大きな話題となっている。

キム・ソヒ氏(48才女性)は先天性聴覚障碍を抱えており、生まれた時から今まで、聞くことも、話すこともできなかった。彼女の夢は、家族と自分の声で話すこと。今回、その夢がAI技術により叶うことになった。

キム氏の声は「推論」と精巧化の過程を経て生成された。まず家族の声を録音して、声色、イントネーション、方言など、声を構成するすべてをデータ化した。続いてAIがデータをベースに声を推論。この過程には、同じ性別の同年代の人々の声も活用された。推論された声データはさらに、キム氏の口の形に合わせて精巧化の過程を経た。最終的に、スマートフォンを通じて生成された声で人々と対話が可能となった。

キム氏の声を“探す”作業は、ソウルにあるKT融合技術院で進められた。同作業には、AI音声合成技術「GiGA Genie」など、KTが保有・開発中の先端デジタル技術が総動員された。また、AI技術開発チーム、ソフトウェア開発団など研究開発本部内の専門家が大勢参加。 初の試みでありながら試行錯誤を繰り返した結果、キム氏は“自分の声”で以下のようなメッセージを送ることに成功した。

「お母さん、お父さん、お兄さん、お姉さん、そしてスビン(娘)、ソンジン(息子)。うちの家族みんなに私の声を聞かせることができて嬉しく、感謝しています。 お母さん、私の心配はしないでね。お母さんのおかげで楽しく生きて来られました。お姉さん、幼い時から聾唖の妹である私を恥ずかしく思わずいてくれてありがとう。私にとって姉さんは、最高の人です。スビン、お母さんに言いたいこといっぱいあったのに聞いてあげられなくてごめん。ソンジン、お母さんのそばで元気に育ってくれてありがとう。すべてありがたく、愛しています」

キム氏の母親は「娘の声を聞くことができたので、一生の願いが叶った」と喜びを語った。 なお、姉のキム・ミギョン氏の子供の頃の夢は「声がもうひとつ欲しい」といものだったという。もうひとつ声があれば、妹にあげられると思っていたからだ。その姉の願いも今や、人工知能によって実現した。



KTは今後も、公益事業・社会貢献事業の一環として、聴覚障碍者の声を取り戻す事業を継続的していく計画だという。キム氏の声の再現過程はユーチューブにアップロードされ、次の対象者も応募開始した。第1次公募は4月30日に締め切られたが、約30人が申し込んだという。

KTは他にも、聴覚障碍を持つ人々が自分の声を日常生活で活用できるよう支援するモバイルアプリ「音の贈り物」(仮称)を開発している。スマートフォンでアプリを起動して言いたいことを文字入力すると、自分の声が合成され相手に聞かせることができる。一方、相手の言葉は文字に変換され確認することができる。 また、聴覚障碍者の手語を認識して声に変換したり、聴覚障碍を持った親が子供に自分の声で言葉を教える機能も用意している。