【寄稿】モバイルファーストの次に来る世界（後編）withコロナ時代にボイスが拓く新しい未来のかたち

半年近く続くコロナとの共存生活では、スマートスピーカーをはじめデジタルアシスタントの存在感が一気に増しています。英国では４家庭に１つがスマートスピーカーを所持しており、モバイルデバイスでの音声アシスタント利用は日本に比べ一般化しています。コロナウイルス感染症のパンデミックによるロックダウンの前後を比較した調査では、ロックダウン後ボイスアプリケーションへのトラフィックが劇的に増加し、回答者の半数以上は一日の使用頻度や使用時間がロックダウン前と比べると増えたと回答しており、また20%は約２倍になったと回答しています。

ロックダウン中の生活の中で、スマートスピーカーとの関係性に何か変化があったのでしょうか？声を使いスマートスピーカーに話しかける行為は、孤立する時間が長いロックダウン生活の中で「会話」を生み、音楽や情報エンターテインメントが提供されたことで人々は退屈せずに済んだのです。

約50%の回答者がマインドフルネスや瞑想のサポート、心身の健康の維持にスマートスピーカーが役立ったと回答しており、1日1回以上スマートスピーカーで遊んだと答えた子どもたちはロックダウン前の17%から大きく飛躍し29%となりました。スマートスピーカーは家庭内隔離を余儀なくされた子どもたちにとってもよい遊び相手となったようです。

新しい生活様式が求められるwithコロナ生活の中で、家庭にあるスマートスピーカーの存在は、音楽や情報エンターテインメントを提供するデバイスを超えて、「家族の一員」と認識されるようになってきたのではないでしょうか。

前回はボイスへの認識、活用度が市場の経済成長度によって違いが見られること、日本も該当する保守的成長市場での広告・マーケティング領域におけるボイスの有用性についてご紹介しました。今回は、日本における実際の生活者へのボイスの普及やボイスの未来についてご紹介します。また、マーケティング領域にとどまらず、今後幅広く有効に活用されていくボイスの可能性について考えていきましょう。

スマートスピーカーに対する誤解：いつの間にか日本でも生活に浸透しはじめたボイス

2019年末に実施された日本国内におけるスマートスピーカーの所有率に関するレポートによると、回答者のうち「所有している」はわずか7%にとどまる一方、「スマートスピーカーは知っているが、持っていない」という回答者は71%に上ります。また、回答者のうち22%は「スマートスピーカーが何かわからない、聞いたことがない」と回答し、５人に1人はスマートスピーカー自体を知らず日本国内での認知率は低くとどまっていることが明らかになりました。しかし、実際のところボイスの利用にあたりスマートスピーカーは必須ではありません。意識せずとも人々がボイスを活用している可能性は高く、浸透を示す事例は増えてきています。

例えば先日、会社の同僚との会話でこんなやり取りがありました。

同僚：「うちにFire TV Stickがあって、Alexaにつなげたいのだけどどのスピーカーがいい？」
筆者：「Fire TV StickにAlexa入ってるよ」
同僚：「え、Alexaのスピーカー買わなきゃいけないと思ってた」
筆者：「音声コントロール使ってる？」
同僚：「使ってる」

同僚は30代、当社の仕事柄デジタルにも流行にも疎い訳ではありません。Fire TV Stickをボイスコントロールで使い、Amazon プライム・ビデオを視聴しています。それでもデジタルアシスタントであるAlexaを使うには、専用スマートスピーカー機器が必要だと思っていたのです。

別の例を挙げると、デリバリーサービスの出前館がAlexa スキルを開発し、昨年末に「Alexaからの初回オーダーでキャッシュバック」というキャンペーンを行いました。アマゾンジャパンによると、キャンペーン中オーダーに使用されたAlexa搭載デバイスの割合はEchoを含めたスマートスピーカーで2〜3割程度しかなく、Fire TV機器が約半数を占めていたそうです。またその時初めて出前館のスキルをアクティベートしたユーザーも多かったことから、同キャンペーンによりFire TV機器にもAlexaが搭載されていると初めて気づいたユーザーが大勢いたことがわかります。

これらは人々がデジタルアシスタントの利用=スマートスピーカーという誤解を持っていることと、気づかないうちにデジタルアシスタントをすでに利用している可能性を示唆しています。前回の記事で取り上げた「実際にボイスはいつ日本の市場に普及するのか？」との問いに対して「気付いていないだけで、実は普及しはじめている」という回答が当てはまる1つの理由です。

GoogleアシスタントやSiriは、iOSやAndroid上のモバイルアプリにディープリンクすることができます。自宅のデジタルアシスタントに話しかけるだけで、モバイルアプリの特定の場所を開いてくれるほか、ボイスアプリによって相互的にスマートスピーカー以外のデバイスからデジタルアシスタントに話しかけることもでき、外出先での情報アップデートや、後々のために情報やリンクをモバイルデバイスに送っておくことも可能です。

米国の調査では、成人の半数以上(約1億3千万人)が運転中に音声アシスタントを使用した経験があり、3分の1は常用しているとのデータもあります。これはデジタルアシスタントを使用するデバイスは、家庭内のスマートスピーカーだけではなく、移動中や外出先のスマートフォンでも使用シーンがあることを示唆しています。

運転中は手と視覚を使っての操作や情報の取得は危険を伴うため、音声ナビゲーションには最適なシチュエーションです。つまり、デジタルアシスタントは家庭内・外出先を問わず利用できるのです。また、つい先日2020年8月末にAmazonが発売を発表したフィットネスバンド「Halo」には、バンドに搭載するマイクでユーザーの声の調子からメンタルの状態を解析し、周囲の人がユーザーの声をどう認識しているかを予測し人間関係改善にもつなげる「Tone」というオプトイン機能が搭載されます。

現在デジタルアシスタントは、スマートスピーカーを通して「音楽を聞く」「照明をコントロールする」といったコマンドを実行する単なるデバイスという認識ですが、AIアシスタント搭載デバイスの増加によって、デジタルアシスタントの使用シーンは今後どんどん増えていくでしょう。私たちが生活の中で実際に役立つ「アシスタント」として感じる日はもうすぐそこまで来ています。

加速する未来、より有意義なつながりが可能に

Alexaはスキルと呼び、Googleはアクションと呼んでいるボイスアプリケーションは、デジタルアシスタントがアクセスできる音声対応のアプリケーションを指します。ボイスアプリケーションが世界を変えるかもしれない未来の可能性をご紹介しましょう。

デジタルアシスタントのしくみを人間の身体と考えてみてください。スマートスピーカーには耳（マイク）、脳（バックエンド処理およびチャットロジック）、口（スピーカー）が備わっています。携帯のアシスタントには目（カメラ）があり、人間にはないスクリーンでアウトプットも可能であるため、私たち人間よりもさらに進んでいます。そして最も興味深いのは、追加インプット（距離を隔てて多様に広がる圧力、温度、光、運動センサー）とアウトプット（スクリーン、AR、VR）によってデジタルアシスタントの可能性を広げる機会があることです。

これを最大限活用するには、バックエンド（脳）が非常に重要となります。弊社グループでイギリスの酒造メーカーDiageoのために開発されたカクテルの作り方と材料購入を提案するボイスアプリケーションには、単なる音声ガイダンスだけではなく動画やエンターテインメントの要素を盛り込み、より高いユーザーエクスペリエンスの提供を実現しています。

音声がブランドイメージに与えるインパクトは絶大！ソニックブランディングの考慮

有名ミュージシャンや俳優が音声アシスタントに自らの「音声」を提供したというニュースは最近よく耳にしますが、これはほんの始まりにすぎません。これらのアシスタントのバックエンドで他のテクノロジーとの連携の強化によって、彼らの「音声」だけではなく、スキルや専門知識をより的確にアップロードできるようになっています。声と知識のアップロードにより実現できるボイスアプリケーションのアイデア例としては以下のようなものが考えられます。

－朝起きると有名ファッション・デザイナーがあなたのその日のコーディネートをクローゼットから選んでくれる。(実際、Amazon Echo Lookでは、画像認識APIと組み合わせて服があなたの体型とどれだけフィットしているかを識別することができました。)

－午後は現役の有名サッカー選手からあなたのプレーやフォームについて、ARやセンサー付きの靴やボールを利用して、パーソナライゼーションされたアドバイスとレッスンを受ける。

一見夢のような話ですが、専門家とデジタルアシスタントが協働することで革命的な変化がもたらされる可能性は十分にあるのです。

子どもたちに言語を教えるためにGoogleが起こしたアクション

2020年、コロナウイルス感染拡大防止のため子どもたちは自宅学習を求められ、教育機関もオンライン授業への対応が必須となりました。これに伴い、オンライン教育は需要が伸びているものの、現在の教育システムはオフライン・オンライン問わず完璧とは言い難いのが現実です。

特に30人以上のクラスや「標準化された」カリキュラムでは、熱心な教師も生徒一人ひとりのニーズを完璧に満たすことは難しいでしょう。もし、教師の知識とテクノロジーが組み合わされ、ボイスが追加されたらどうなるのでしょうか？

例えば、データソースとしてオンラインにアップロードされた動画を利用し、生徒一人ひとりにパーソナライズされたロジックでプログラムを作成。そこにボイスを追加することで、双方向での対話型教育カリキュラムは実現可能です。生徒それぞれにパーソナライズされたカリキュラムの中で、不正解の問題や生徒の質問が出た場合にはその部分の説明を展開していきます。また、生徒が何も質問しない場合でも、AIで生徒のニーズを特定しそれを満たす動きは可能で、世界中のどこでも誰でも生徒たちは素晴らしい教師にアクセスすることができます。

実際に、Google Indiaは音声認識技術を使用して、インドの子どもたちにヒンディー語と英語を教えるためにBoloという音読学習アプリを作成しました。これは、Read Alongとしてリリースされ、180か国以上で利用可能、9言語に対応(日本語未対応)し世界中で活用されています。テクノロジーを駆使し、より上質な教育を受ける機会を得た子どもたちが、今後世界にもたらすメリットは大きいでしょう。

インターネットのおかげで地球上のどこにいても人や情報につながることができますが、そのつながりはかなり浅いものです。これからはつながりの質を高めることが大切になります。つながり（コネクション）の数が増えると、それぞれの質は低下していくのが常ですが、ボイスとデジタルアシスタントは、現在の浅いつながりをより深く、効率よく、個々にとって意味のあるものにすることを可能にします。このポテンシャルがボイスの特徴だと言えるでしょう。

▼寄稿者プロフィール

Nate Shurilla (ネイト・シュリラ)
iProspect グローバルリーダーシップ Global Director of Commerce & Voice。世界最大級のパフォーマンスエージェンシーiProspectにて、56か国約5000人が従事するコマース事業と音声認識事業のヘッドを務める。動向を先読みし、クライアントのニーズに合った戦略立案やプロジェクトを実行。異なる文化、考え方の中でコマースを根本から成功に導くべくGoogle, Amazon, Facebook, Microsoftなどのグローバルパートナーシップを担当し共同開発に取り組むほか、Forbes、ITmedia、ECのミカタなど国内外の有力メディアにおいて寄稿執筆やインタビュー経験も多数。世界各国のイベントで講演も行い、KOL(Key Opinion Leader)として情報発信を続けている。

土田晃子 (つちだあきこ)
アイプロスペクト・ジャパン株式会社 iP Labデジタルアシスタントイノベーション Leader。2016年5月にアイプロスペクト・ジャパンに入社し、データを活用したUI/UX向上提案を中心にクライアントビジネスに貢献。R&Dおよび戦略提案やイノベーションに特化したアイプロスペクト・ジャパン iP Labにて、2019年2月よりデジタルアシスタントイノベーションLeaderに就任し、日本における「ボイス」事業の活動をリードしている。

関連記事