バーチャルアシスタントを裏側で支える「影の AI トレーナー」

この間、 Alexa がある家に行ってきて、初めて使い方を実際に体験できました 1

あいうシステムは、僕は否定的なので偏った意見になりますが、どう考えてもあま り便利ではないみたいです。日本語の解釈が遅いのか分かりませんが、音楽の指定 はスマホのアプリや直接スピーカーを操作した方が早いと感じました。

とにかく、僕の感想はさておき、バーチャルアシスタントについて、2年前ほど読ん だ記事を思い出しました。

記事は、インターネット利用者の権利とプライバシー保護を主張する 仏 NGO の La Quadrature du Net が2年前に書いたものです。せっかくなので、内容を軽く翻訳し ます。

Hi, I'm Cortana.

Via Android Authority

本記事は冒頭の Alexa ではなく Cortana という AI 搭載のバーチャルアシスタン トについてですが、 Alexa であろうが、 Cortana であろうが、 Google のなんと かであろうが大きく変わらないでしょう。こういったバーチャルアシスタントを自 分の家に設置することに伴うプライバシー侵害について考えましょう。

なお、勘ですが、バーチャルアシスタントを購入する人はアシスタントの裏側には AI、つまりパソコンが存在して、人間が聴いていると思っていないのでしょうね。 ユーザのせいではありません。メーカーはバーチャルアシスタントや検索の結果を 「観る」ことはコンピュータによって行われていると言ってるからです。

しかし、実際には雇用契約書も NDA も結んでいない人によってプライベートな会 話、検索、名前やその他の個人情報をトランスクリプトされています。

『AI トレーナー』と呼ばれている仕事です。

当然ですが、 AI は生まれて賢いというわけではありません。ユーザの要求を解釈 したり、習慣を覚えたりしなければ価値がありません。

そのトレーニングには人間の助けが必要です。 AI トレーナーはユーザの質問と バーチャルアシスタントの回答の関連度を確認し、場合によって準備された回答を AI に覚えてもらうよう「教えています」。

なお、殆どの AI トレーナーはテレワーク (※ 2018年はまだ普通ではなかった) で 時給をもらっているいわゆる「マイクロワーカー」です。また、直接 Microsoft や Appleに採用されていなくて派遣会社経由です。

ちなみに、マイクロタスク (言葉を転写したり、画像にラベルをつけたりする) の 報酬は1〜3セントです。もちろん、個人情報保護に関するトレーニングや認識研修 は一切ない。

AI トレーナーのインタビュー

LQDN は仮名 Julie (ジュリ) さんにインタビューし、実際に Cortana をどうやっ てトレーニングしたか教えてもらいました。

インタビューによると、 Cortana が聞き取った平均3秒から15秒 (場合によっては 数分間) の音声をトレーナーに聞かせて、上記に書いた通り転写したりバーチャル アシスタントの回答を確認したりしています。もう一つの仕事は、音声にノイズ等 が入っていたらそれをタグとして記録します。そうすることで、 Cortana はなぜう まく解釈・聞き取れなかったかを学習させます。

ジュリさんは仕事をしながら、ユーザはバーチャルアシスタントの向こうに会話を 聴いている人がいることを認識しているかと何回考えました。

会話の内容は日常の天気予報の質問や好きな AV の種類の質問から、社会保障個人 番号や企業の議事録まで、何でもありました。 Cortona の誤解により呼ばれていな い時に起動して聞き取ることもよくあったよう。。。

また、 Cortana の場合は Xbox と接続できるため、法に触れておかしくない子ども (13才以下) の会話も聞き取れました。

幸いなことに、会話全体の録音をいっぺんに聴けることは基本的に無かったです。 いつも録音の一部のみです。しかし、同じ人による一部の会話を同じ日に数回聴く ことがたまにあって、簡単にどんな人かを理解するには充分でした。

もちろん、発言者の情報は一切共有されていません。しかし、会話を聴くだけで大 体理解できまてしまいます。

最後に、自分のパソコンから働いていたため、やろうと思えば会話を録音すること ができました。

参照: Derrière les assistants vocaux, des humains vous entendent


個人的な感想ですが、このようなサービスのプライバシー設定をカスタマイズする には、一般ユーザーに届かないコンピュータスキルが必要な場合が多いと思いま す。また、「コンテンツのパーソナライズ」、「結果の最適化」、「お客様の体験 と当社のサービスの向上のため」などといった言い訳で、企業はユーザを騙して自 身のプライバシーを犠牲にして取引させようとすることが多いです。ほとんどの ユーザーはどんな設定にしたら良いか分からないまま、全面同意を及ぶ既存設定で 「同意」したり、「承諾」したりします。 GAFAM はその有利な情況をうまく活用し ます。


  1. Alexa を持つ人は数人を知っていますが、殆どの場合は購入してから数日後使うの諦めたり、僕の前で使うの遠慮したりして・・・ ↩︎