西田宗千佳のイマトミライ
第17回
アップルにAmazon、音声アシスタントの「プライバシー問題」とはなにか
2019年9月2日 08:15
アップルがSiriのプライバシー施策について変更を加えた。音声認識の学習の過程で、ユーザーがSiriに話しかけた音声の一部をアップルが委託した業者が聞いていた、とされる問題に絡むものだ。
アップル、Siriの音声録音問題で謝罪。「理想とするやり方ではなかった」
音声アシスタントの精度アップのために、各社は音声を録音し、解析している。その過程では、プライバシー保護に関する疑義や課題が示されている。アップルの問題もそのひとつだが、AmazonやGoogleも同じ問題を指摘されている。むしろ、発火点はAmazonのAlexaについての記事だったように記憶している。
各社が抱えていた「音声認識の学習におけるプライバシー面での課題」とはなんなのか? そして、今回のアップルの施策はどういう意味を持っているのだろうか?
筆者は以前Amazonの事業責任者に、この問題を直接取材した。そこでの経験もふまえ、今回の問題を解説してみよう。
音声アシスタントの学習のために「音声を人が聞く」
そもそも、今回の問題はどういうことなのだろうか? 各社の状況はほぼ似通っている。
スマートスピーカーが使う音声アシスタントには「学習」が必要だ。音声をテキストにするための学習もあるし、どのような作業にどのような命令をするのかという学習もある。学習の内容や手法は多岐にわたる。その中には、「音声アシスタントを介して録音されたデータ」を人が聞いて確認し、今後音声アシスタントのAIが命令を判断するために必要な評価や学習を行なう。
こうした行為を、アップルはプレスリリースの中で「グレーディング」と呼んでいる。そして、Amazonは「ラベル付け」と呼んでいる。
こうした行為はどのくらい行なわれているのか? アップルはプレスリリースの中で、使用する音声サンプルはリクエスト全体の「0.2%」としている。
ではAmazonはどうか? 今年6月、Amazonのデバイス事業に関する実質的な責任者であるAmazon Devices シニア・バイスプレジデントのデイブ・リンプ氏は、「取得したオーディオのうち1%」が使われている」と話している。
ここでいう「音声アシスタントが取得している音声」というのは、「Alexa」や「Hey, Siri」などのコマンドワードを発した後のものを指す。コマンドワードを発するまで、スマートスピーカーや音声アシスタントは、音声を記録していないし、クラウドにも送っていない。「スマートスピーカーがあった部屋の音声がすべて、まるで盗聴器のようにAmazonやアップルに録音されている」と勘違いしている人もいるようだが、それは間違いだ。
ただし、各種の不具合によって、「本来は保存されていなかったはずの音声が記録されていた」という事件は起きている。こうしたことは、音声アシスタントやスマートスピーカーの信頼性を大きく損ねるものであり、あってはならない。各社には徹底した品質管理をお願いしたい。
匿名化されているが「大量のデータを人が聞いている」
もうひとつ共通しているのは、両社とも、使っていた音声を匿名化した上で使っている、ということだ。どの音声を誰が発したのか、どこに住む人物が発したのかといったデータについては、少なくとも、音声を確認する人々は見られないようになっている、という。
確かに、チェックのために聞かれた音声の中には、聞いた人が驚くような内容を含むものがあったようだ。そうした「センセーショナルな音声」を聞いた人の証言が報道されることで、この問題が特に注目された、という部分もある。Amazonのリンプ氏は「Alexaに関するメディアによるレポートは、センセーショナルすぎて、正確性に欠けていた」と話す。そうした部分があったのも事実だろう。
一方で、今回問題となっているのは、こうした作業を「各社から依頼を受けた他の事業者が行なっていた場合が含まれる」という点だ。
チェックに使われるのは「たった1%」「たった0.2%」のデータとはいうものの、その量は膨大だ。
スマートスピーカーだけを例に計算してみよう。
2018年度までに、スマートスピーカーは全世界で累計1億台が出荷された、と言われている。
仮にその半分が今も実働しており、中国以外の市場向けが6割とすると、ざっくり3,000万台のスマートスピーカーが、欧米や日本などで稼働し、AmazonやGoogleやアップルが音声の命令を処理していることになる。それらが平均1日に5件のリクエストを受けたとすれば(これは保守的な数字だと思う)、全体では1億5,000万リクエストがある計算になる。その1%がチェック対象だとすれば、それだけで15万件。0.2%でも3万件ある。非常に大雑把な推測だが、数が二桁も三桁もズレている、ということはあるまい。
これに、スマホなどの音声アシスタントを使う他の機器が加われば数はさらに増える。効率的な処理をしてもかなりの人手がかかることは間違いなく、外部企業との協力があっても不思議はない。
「外部委託だから、聞いていた事実やその中身が漏れる」というつもりはないが、すべてを自社管理する方が厳密なのは事実だろう。
「人が聞いている」ことをユーザーが認識していない、という問題
なにより重要なことは、結果として、いかに匿名化されていたとしても、「自分の声が誰かに聞かれていて、その内容を他人やメディアにしゃべった人間がいる」という事実そのものが、消費者の意識として許容できない可能性がある、ということだ。
リンプ氏のいうように、この件を「あなたの声を誰かが聞いて楽しんでいた」という風にメディアが伝えてしまうのはセンセーショナル過ぎる、と筆者も同意する。
だが、音声アシスタントを使う時、「情報が記録されている」ことは許諾で認識していたとしても、誰かが聞いているかもしれない、そして、報道されたように「楽しんでいた」かもしれない……と想像している人はごく少ないだろう。
事実8月まで、Amazonは「音声を新機能開発に役立てる」と書いてはいたが、「人がチェックしている」とは書いていなかった。現在は「人間がレビューする可能性がある」と記述を追加している。
SiriについてもGoogleアシスタントについても、他の音声アシスタントについても同様だ。自分だと紐付く形でないにしても、「音声を人間が聞く可能性がある」とちゃんと認識していた人は少ないのではないか。
そもそもそこに、ひとつのズレがある。
「削除」を容易にする各プラットフォーマー
どちらにしろ、こうした懸念には、プラットフォーマー側としては対応しなければならない。
ひとつは、記録されたデータをユーザーが簡単に消去する方法を用意することだ。
Amazonの場合には「プライバシーハブ」から削除が可能になっており、音声でも「Alexa、今私が言ったことを削除して」「Alexa、私が今日言ったことを全部削除して」ということで、聞かれたくない発言を記録から消去できるようになっている。
ただし、音声コマンドによる消去は、プライバシーハブから明示的に「オン」にしないといけないようだ。
Googleアシスタントも、Googleアカウントのアクティビティページから削除可能だが、この場合、ウェブの検索履歴などとセットになっている。日付などから検索して消すことができるが、「声で一発で消せる」という意味では、Amazonの方が楽だ。
また、音声アシスタント「Clova」を展開しているLINEから利用履歴の削除について回答が得られたため、追記する。
現在、LINE Clovaには、音声データを含む利用履歴の削除方法は「用意されていない」(LINE広報)という。
ただし、「ユーザーが自身で発話履歴の確認ができる機能」「オプトアウト(音声データがそもそも保存されないように選択可能)の搭載に向けて準備が進められているという。
なお、LINE Clovaの場合、LINEの通話やメッセージなどとの連携もあるが、こちらは元々「音声認識結果の評価対象に含まれず、保存もされない」(LINE広報)状態だ。
アップルは「音声を録音しない」ことを標準に
アップルは大きく方針を変える。
「削除を充実させる」という他社と同じ方針ではなく、今後はそもそも「音声は記録しない」ことが標準となる。ユーザーが「Siriの改善に協力する」と明示した場合のみ、従来のような匿名化が行われた上で音声データが記録され、改善に利用されるようになる。
これまでは、Apple IDのSiriの機能を「すべてオフ」にすることで、それまでの履歴が削除されていた。明示的にどこかの期間だけを削除することはできなかった。実は、「データが誰のものか」をApple IDに紐付けていないからだ。
アップルの場合、Apple IDとSiriの履歴は直接紐付けられておらず、Siriの利用開始時に作られるランダムな「ユーザー番号」と紐付けられていた。どのユーザー番号が誰のものかを知る方法はない。他社はまず紐付けて記録し、その後に匿名化して学習につかっていたが、ちょっと方針が違ったわけだ。そして、最長18カ月データは保存され、ソフトの品質向上に使われたのち、自動的に削除されていた。他社はずっと残り続ける。
元々他社に比べ匿名化を進めた方法といえるが、すでに述べたように、一方で、自ら選んで削除する方法はない。また、「音声を提供しない」で使う方法もなかった。
だがこれからは、自ら改善に参加しない場合記録されなくなる。よくわからず「改善に参加する」という人はいるかもしれないが、少なくとも「音声を一切他人に聞かれたくない」という人は、明示的に「記録しない」方法を選べる。これはさらに一歩踏み込んだ判断をした、と言えるのではないだろうか。
Amazonが進める「ラベル付けに頼らない」AIの進化
一方、Amazonはまた別の手法も研究している。
そもそも「音声を人間が聞く」ということからプライバシー問題になるのは、「ラベル付けするために人間が聞く」という作業があるからだ。
そこで現在Amazonでは、ラベル付けに人を介さず、自動で機械自身が学習をしていく技術の開発も進められている。
Amazonも人の手でラベル付けすることを「やりたい」わけではない。コスト的にはできるだけ止めたいのだ。完全に「ラベル付け」がなくなることはないかもしれないが、数が減れば漏洩リスクも減る。
だから、ラベルのない「教師なしデータ」からの自動学習を進めることは、プライバシー保護の向上とコスト削減、両方にプラス、という発想なのだ。
【追記】LINE Clovaの対応について情報を追加(9月2日12時50分)