バーチャルアシスタントを裏側で支える「影の AI トレーナー」

2021年06月05日 in AI • プライバシー with #cortana #バーチャルアシスタント
約 4 分

この間、 Alexa がある家に行ってきて、初めて使い方を実際に体験できました ¹。

あいうシステムは、僕は否定的なので偏った意見になりますが、どう考えてもあまり便利ではないみたいです。日本語の解釈が遅いのか分かりませんが、音楽の指定はスマホのアプリや直接スピーカーを操作した方が早いと感じました。

とにかく、僕の感想はさておき、バーチャルアシスタントについて、2年前ほど読んだ記事を思い出しました。

記事は、インターネット利用者の権利とプライバシー保護を主張する仏 NGO の La Quadrature du Net が2年前に書いたものです。せっかくなので、内容を軽く翻訳します。

Hi, I'm Cortana. — Via Android Authority

本記事は冒頭の Alexa ではなく Cortana という AI 搭載のバーチャルアシスタントについてですが、 Alexa であろうが、 Cortana であろうが、 Google のなんとかであろうが大きく変わらないでしょう。こういったバーチャルアシスタントを自分の家に設置することに伴うプライバシー侵害について考えましょう。

なお、勘ですが、バーチャルアシスタントを購入する人はアシスタントの裏側には AI、つまりパソコンが存在して、人間が聴いていると思っていないのでしょうね。ユーザのせいではありません。メーカーはバーチャルアシスタントや検索の結果を「観る」ことはコンピュータによって行われていると言ってるからです。

しかし、実際には雇用契約書も NDA も結んでいない人によってプライベートな会話、検索、名前やその他の個人情報をトランスクリプトされています。

『AI トレーナー』と呼ばれている仕事です。

当然ですが、 AI は生まれて賢いというわけではありません。ユーザの要求を解釈したり、習慣を覚えたりしなければ価値がありません。

そのトレーニングには人間の助けが必要です。 AI トレーナーはユーザの質問とバーチャルアシスタントの回答の関連度を確認し、場合によって準備された回答を AI に覚えてもらうよう「教えています」。

なお、殆どの AI トレーナーはテレワーク (※ 2018年はまだ普通ではなかった) で時給をもらっているいわゆる「マイクロワーカー」です。また、直接 Microsoft や Appleに採用されていなくて派遣会社経由です。

ちなみに、マイクロタスク (言葉を転写したり、画像にラベルをつけたりする) の報酬は1〜3セントです。もちろん、個人情報保護に関するトレーニングや認識研修は一切ない。

AI トレーナーのインタビュー

LQDN は仮名 Julie (ジュリ) さんにインタビューし、実際に Cortana をどうやってトレーニングしたか教えてもらいました。

インタビューによると、 Cortana が聞き取った平均3秒から15秒 (場合によっては数分間) の音声をトレーナーに聞かせて、上記に書いた通り転写したりバーチャルアシスタントの回答を確認したりしています。もう一つの仕事は、音声にノイズ等が入っていたらそれをタグとして記録します。そうすることで、 Cortana はなぜうまく解釈・聞き取れなかったかを学習させます。

ジュリさんは仕事をしながら、ユーザはバーチャルアシスタントの向こうに会話を聴いている人がいることを認識しているかと何回考えました。

会話の内容は日常の天気予報の質問や好きな AV の種類の質問から、社会保障個人番号や企業の議事録まで、何でもありました。 Cortona の誤解により呼ばれていない時に起動して聞き取ることもよくあったよう。。。

また、 Cortana の場合は Xbox と接続できるため、法に触れておかしくない子ども (13才以下) の会話も聞き取れました。

幸いなことに、会話全体の録音をいっぺんに聴けることは基本的に無かったです。いつも録音の一部のみです。しかし、同じ人による一部の会話を同じ日に数回聴くことがたまにあって、簡単にどんな人かを理解するには充分でした。

もちろん、発言者の情報は一切共有されていません。しかし、会話を聴くだけで大体理解できまてしまいます。

最後に、自分のパソコンから働いていたため、やろうと思えば会話を録音することができました。

参照: Derrière les assistants vocaux, des humains vous entendent

個人的な感想ですが、このようなサービスのプライバシー設定をカスタマイズするには、一般ユーザーに届かないコンピュータスキルが必要な場合が多いと思います。また、「コンテンツのパーソナライズ」、「結果の最適化」、「お客様の体験と当社のサービスの向上のため」などといった言い訳で、企業はユーザを騙して自身のプライバシーを犠牲にして取引させようとすることが多いです。ほとんどのユーザーはどんな設定にしたら良いか分からないまま、全面同意を及ぶ既存設定で「同意」したり、「承諾」したりします。 GAFAM はその有利な情況をうまく活用します。

Alexa を持つ人は数人を知っていますが、殆どの場合は購入してから数日後使うの諦めたり、僕の前で使うの遠慮したりして・・・ ↩︎

Menu

Projects

バーチャルアシスタントを裏側で支える「影の AI トレーナー」

AI トレーナーのインタビュー