それは、アレクサが起動していないときでも、ユーザーの声を聞き続けているというものだ──。「アレクサ」と呼び掛けていないにも関わらず、アレクサが話しかけてくることを、筆者は何度も経験している。現状ではデバイスメーカーは、アマゾンからアレクサ認定を受ける上で、1日3回までの誤認は許されており、アレクサが誤って起動してユーザーの声を聞いている頻度はわりと高いのだ。
音声アシスタントの限界
アレクサが周囲の音声を常に聞いている技術的な要因として、クラウドコンピューティングが挙げられる。アレクサが聞き取った全ての言葉は、アマゾンのクラウドサービスに送信され、自動的にテキスト化されている。
そして、「音楽をかけて」や「電気をつけて」といったコマンドを読み取った後に反応しているのだ。スピーカー本体は必要な計算能力やインテリジェンスを持たず、全ての処理はクラウド上で行われている。
アマゾンには、エコーがユーザーの同意を得ず、密かにクラウドに送信した会話の断片を分析するためのチームが存在する。アマゾンは、その理由を「顧客体験を向上するため」としている。これらのデータは匿名化されていないため、スマートスピーカーの所有者を割り出すことが可能だ。
音声認識技術を手掛けるSnipsのCTO、Joseph Dureauは次のように述べている。「ユーザーが意図しようとしまいと、アレクサは起動ワードを認識すると音声をクラウドに送信し始め、音声認識や自然言語処理が行わる」
これに対し、Dureau が開発したSnipsはデバイス上で処理を行うため、音声データがデバイスの外部に送信されることがないという。「音声アシスタントが誤って起動したとしても、プライベートな会話がクラウドに送信されることはない」
「盗聴」ではないとアマゾンは主張
アマゾンは、アレクサアプリの「音声録音」機能を停止することが可能だと説明している。しかし、実際には録音内容を製品開発に使用することを止めさせることができるだけで、アレクサが誤って録音した場合には、データの使用を止めることはできない。アマゾンは、「この機能を停止すると、新機能がうまく作動しない恐れがある」と警告している。
「データが一定量を超えると、それ以上集めてもパフォーマンスはほとんど変わらない。優れたパフォーマンスを実現するのに必要な量のデータは、クラウドソーシングをすれば数時間で集めることができる。従って、品質向上を理由に毎日数百万ものユーザーの音声データを集めることは正当化されない」とDureauは指摘する。
アマゾンは5月14日、留守宅を警備する新機能「Alexa Guard」を米国でリリースした。これは、アレクサが常に周囲の音声を聞いているからこそ可能な機能だ。
Alexa Guardを起動すると、デバイスに搭載された遠方集音マイクを使ってガラスが割れた音をはじめ、煙感知器や一酸化炭素検知器の警報を聞き取り、自宅やオフィスを守ってくれる。起動ワードは必要ない。
グーグルは、先日の「Google I/O」で次世代グーグルアシスタントを発表した。Snipsやグーグルは、プライバシー保護を重視し、ユーザーの音声やガラスの割れた音などをアップロードしなくても顧客体験を向上できる新たな音声アシスタントの提供を目指している。