|
☆タッチパネルのスマートフォンが世の中に登場したとき、指で触っただけで様々な機能やコンテンツを利用できるその利便性に世界中が驚いたが、その時、指に代わる入力デバイスとして「声」が登場することは誰も想像していなかったはずだ。
しかし、スマートフォンを操作する新たな方法として、ユーザーの音声入力にスマートフォンが応えてくれる「音声認識サービス」はここ数年で急激に進化している。 Android 端末に標準搭載されている「Google 音声検索」や iPhone の「Siri」はユーザーに馴染みがあるところだが、NTT ドコモの「しゃべってコンシェル」や、Yahoo!JAPAN の「音声アシスト」など日本国内でも日本人ユーザーに最適化された音声サービスは様々なものが登場し、利用者が拡大している。 中でも、登場以来その完成度の高さから大きな話題になっているのが、「しゃべってコンシェル」だ。 弊誌で行った「Siri」との比較レビューでも、日本語を正確に解釈して適切な答えを返してくれるその能力の高さに驚かされたが、6月にはそのポテンシャルをそのままに、「知りたいこと」をスマートフォンに話しかけると、その言葉の意図を読み取り、インターネット上の情報を調べ、最適な回答を画面に表示する「知識Q&A」という機能が追加された。 『家庭の医学』『オリコン芸能人事典』など、オンライン上のデータベースを活用することができ、質問の意図に適した回答を得られるようになったほか、雑談のような日常会話にもあらゆるバリエーションで回答する「雑談機能」も強化された。 ● 音声エージェントサービスの“いま”をどう見るか 「世界的に、音声で端末を操作し、スマホを秘書のように使う技術は、今後の主流になる」と語るのは、フィーチャーフォンからスマートフォンまで幅広くモバイルデバイスを研究している武蔵野学院大学 国際コミュニケーション学部 准教授(工学博士)の木暮祐一氏だ。 音声による操作や情報検索の最大の利点は、ユーザーのリテラシーに関係なく、誰でも簡単にそれが行うことができる点だ。 「従来は、デジタルデバイスに対して何かリクエストをしようと思ったときに、そのリクエストを自分で変換して、デバイスに文字や操作などのデータ入力をする必要があり、リテラシーの低いユーザーにとっては“壁”になっていた。技術面では、このデータ入力をいかに簡単にするかという点で様々な開発をしてきたが、最も簡単な入力手段である“声”で端末を操作することができるようになった点は画期的だ。」と木暮氏は評価する。 しかし、日本における音声エージェントサービスの認知や利用の拡大には、まだ発展の余地があるという。 「歴史的に、日本人は海外に比べて音声が出るサービスの利用には抵抗があった。 しかし、通話手段として発展を遂げてきた日本の携帯電話利用を考えれば、音声通話の利用に抵抗があるわけではないので、通話をするようにスマートフォンに話しかけることに対しても違和感がないはずだ。 もっと多くの人に利用シーンが認知され、利用が拡大すれば、今後“話せば、答えてくれる”という音声エージェントサービスは通話機能に次ぐ重要なサービスになるはずだ」と木暮氏は期待を寄せる。 例えば、「しゃべってコンシェル」は設定するとスマートフォンを耳に当てることで音声入力をすることができるが、このようなスタイルであれば、ユーザーは抵抗感を感じないでサービスを利用することができよう。 ● 「しゃべってコンシェル」が持つ2つのストロングポイント 木暮氏は、注目されている「しゃべってコンシェル」についても、「まだまだ進化が期待できる」としながらも、その完成度を高く評価をしている。中でも注目すべき点が、「音声認識の正確性」と「データベースの豊富さ」の2点だ。 「従来の音声認識は、しっかりと正しい日本語を発しないと認識してくれなかったが、『しゃべってコンシェル』は自然に話しかけてもその意図を読み取ってくれる。 この音声解析能力が優秀だ」と木暮氏。日本語は表現のゆらぎや語彙の豊富さ、文脈の複雑さなどによって機械的に正しく意図を読み取ることが難しい言語だと言われてきたが、「しゃべってコンシェル」はこの点に的確に応えるサービスを生み出した。 「Apple の『Siri』も海外サービスでありながら日本語への対応をしっかりしている点は感心できるが、『しゃべってコンシェル』は日本語を知り尽くした日本の企業が日本人のために作ったサービスである点が、完成度の高さに繋がってるのではないか」と木暮氏は語った。 また、今後の進化に対しては、「音声エージェントサービスの利点は、スマートフォンとクラウドが連携している点だ。 ユーザーの利用がデータベース上に蓄積されることによってクラウド上にある音声認識処理の精度が向上したり、データベース処理の正確性が上がれば、サービスは更なる進化を遂げることができるだろう」と期待を寄せる。 また更に、「サービスに個性を持たせ、ユーザーの利用によってカスタマイズされることで、ユーザーが愛着を持つサービスになれば、音声エージェントサービスが“検索する道具”ではなく“頼りになるパートナー”になるはずだ」とサービスの今後に対する希望を語った。 2点目は、「しゃべってコンシェル」による音声検索で参照するデータベースの豊富さだ。「しゃべってコンシェル」による情報検索は、ユーザーが知りたいことを話しかけると、NTT ドコモが提携する様々なクラウドデータベースを参照して答えを探し出す仕組みだが、「このデータベースの強さが NTT ドコモの強さだ」と木暮氏は評価する。 「NTT ドコモは iモードの時代からコンテンツプロバイダーとのパートナーシップを積極的に進め、豊富なコンテンツを提供してきた。このノウハウを元に、『しゃべってコンシェル』が利用できるクラウドデータベースにも必要なコンテンツが網羅されている点が優れているし、今後もそのバリエーションは豊富になっていくだろう。 このような取り組みは端末メーカーや OS ベンダー単独では決して実現できないことだ。 ネットワークの提供、コンテンツ協業、端末メーカーとの連携を網羅的に取りまとめてきたドコモならではの特徴だと言えよう」(木暮氏)。 ● “声”は究極のユーザーインターフェイスになる 最後に、今後の音声エージェントサービスの展望やサービスの進化に対する期待を伺った。 木暮氏によると、音声エージェントサービスは世界的に重要度が増しており、開発競争も加熱しているほか、国内でもその重要度は高まっているという。中でも、日本のスマートフォンユーザーにとって、音声エージェントサービスとの親和性は高いのではないかというのが木暮氏の見方だ。 「日本と欧米とはスマートフォンの利用シーンに若干の違いがある。 欧米では、スマートフォンはパソコンを補佐する“サブのデバイス”という意味合いが強く、主に“情報を受け取ること”が利用目的の中心だが、日本では電話やメールなど“自ら情報を発信すること”が利用シーンの中心だ。 音声エージェントサービスは自分が思ったことや考えを自ら入力するという意味合いが強く、日本人の利用シーンにとっての親和性が高い。 一方、欧米ではスマートフォンの利用シーンに変化が訪れるのではないか」と木暮氏は分析する。 また、日本ではこのような“情報を発信する”というユーザーの利用目的に応えるために、考えをデジタル化し、入力を簡単にするためのユーザーインターフェイスが様々な形で進化してきたが、スマートフォンに話しかけて、それを理解してもらう音声エージェントサービスは「その究極の形だ」と木暮氏は評価する。 「今後、音声エージェントサービスはスマートフォンのインターフェイスとして主流になっていくだろう。中でも、インターネット上の信頼できるデータベースとリテラシーに関係なく誰でも簡単に正確な答えを見つけることができる『しゃべってコンシェル』は、スマートフォンだけでユーザーニーズの全てを解決できるという点でインターネット利用のカタチを変える可能性がある。 今後も、ユーザーの様々なニーズに繊細に応えるサービスに進化することを期待したい」。 木暮氏のお話を聞いて感じるのは、音声エージェントサービスがユーザーの情報に対する欲求にすぐに応えてくれるサービスとなるだろうということだ。木暮氏が指摘していたように、従来、デジタルデバイスを活用するには様々な操作をしたりリクエストを入力するという“手間”が存在し、その手間を惜しむユーザーはそこでアクションを諦めることになっていた。しかし、アプリを呼び出してリクエストを口に出すことで求めている情報にアクセスできるという「しゃべってコンシェル」の利便性は、この手間を完全に取り払ったことになる。ユーザーにとっては、インターネット上に存在する様々な情報を最も効率よく活用する手段として、今後更なる発展が期待されるだろう。 . お気に入りの記事を「いいね!」で応援しよう
Last updated
July 7, 2012 07:01:09 AM
コメント(0) | コメントを書く
[株式投資(IPO、東証、NY市場、CME)] カテゴリの最新記事
|