そう聞くと、とても順調に普及が進んでいるかのようにも思えるのだが、実際には少なからぬ課題が生まれ始めている。対話エンジンを開発する日本のAI企業関係者のひとりは言う。
「AIスピーカーのボイスインターフェース(VUI)は、アプリケーションが大規模になるにつれフローが複雑になりユーザーの使い勝手がきわめて悪くなるし、アプリケーション間のシステムおよびデータ連携が盤石でないため、ひとつのアプリケーションにすべての要素を詰め込まなければならない。またPCやスマートフォンと違って声で指示を出すため、各アプリケーションのパスワードをすべて暗記しなければならないなど、ユーザーの負担が増えるという課題に直面している」
これは、人間とコンピュータの接点が目から声に移行するなか、その際の人間の行動様式の変化をアプリケーション側に取り込めていないということ、また各AIスピーカーやアプリケーション、利用データに互換性がないため、ユーザーにとっては非常に使いづらい状況がある、もしくはこれからそのような状況が生まれてくるという指摘である。
AIスピーカーには、その他にも決定的な課題がある。それは、セキュリティ上の問題だ。音声認識を備えたAIスピーカーを身の回りに設置するということは、会話データや音声データが抜き取られるリスクと常に隣合わせにあることを意味する。通信産業に精通するシンクタンク関係者は指摘する。
「AIスピーカーは一定の音声コマンドを起動しないと、録音や音声データ収集を開始しないとされています。しかし最初の音声コマンドを聞き取るということは、起動していない時でも人間の会話を“聞いている”と考えるのが妥当ではないでしょうか。また集められた音声データが誰に送られているか、途中で抜き取られていないかをユーザーが判断することができません。そのようなセキュリティへの不信感は、普及の足を引っ張る要因となるはずです」
出荷台数だけでなく、アプリケーションおよびサービスまで含め、AIスピーカー市場が名実ともに成長するためには、コンピュータと人間のコミュニケーションの在り方、またその会話内容を保護する仕組みづくりが重要になってきそうだ。