表情認識AIはいずれ感情を読み取る? 活用される未来とプライバシーの問題

2021.11.19

技術・科学

0コメント
表情認識AIはいずれ感情を読み取る? 活用される未来とプライバシーの問題

顔認識システムはすでに至るところに搭載されている。iPhoneの「Face ID」は所有者の顔を認識してロックを解除できるし、飲料大手のDydoは顔認識で決済する自動販売機を開発。また、中国の一部では至るところに設置された監視カメラの映像から顔認識で犯罪者を探し出すシステムも導入されている。さらに近年では顔認識を超え、“表情を認識するAI”の研究が進められている。表情読み取りAIは将来的にどのように使われ、普及していくのか。事例を見ながら表情読み取りAIの未来とその課題について考える。

MITから生まれた表情認識技術のベンチャーAffectiva

米Affectivaは表情に関する技術を研究するMITメディアラボから派生した表情認識技術のベンチャー企業だ。エジプト系アメリカ人の情報工学研究者ラナ・エル・カリウビィ氏がCEOを努めており、彼女のスピーチはTEDでも話題になった。

Affectivaは90カ国以上、990万人以上から得た表情のデータベースを基にした表情認識AIで、システム構築にはFACS(Facial Action Coding System)理論が使われている。難解なため詳細は割愛するが、FACS理論は機械で表情を読み取れるようにするために顔面筋の動きを符号化する理論である。ちなみにFACS理論の特許は1970年代に取得されたもので新しくはないが、近年のAI技術とデータベースを駆使することで実用化が可能となった。

Affectivaは21の表情と7種類の感情を読み取れるとしており、4歳以上であれば対応可能とのこと。クラウドベースの技術なのでWindowsさえあれば導入が可能。現段階では試験的な利用がメインだがすでに商用化されている。

アメリカのチョコレートメーカーHershey’s社とのコラボ企画では、読み取り機に向かって笑顔を見せると試供品のチョコが提供される商品陳列棚が開発された。国内では明治安田生命やリクルートの関連企業を対象にAffectivaの技術を活用した「心sensor for Training」が提供されている。

このソフトはスタッフの表情や笑顔を認識して相手にどのような印象を与えるか評価・採点するもので、営業スタッフのトレーニングに活用されているようだ。広告を視聴した人の表情から広告の効果を評価するような使い方もされていることから、表情認識AIは広告・営業の分野で普及していく可能性が高い。将来、設定を変更しない限りPCのカメラが表情を勝手に認識し、それに合わせてブラウザ上の広告を変える“表情ターゲティング広告”が一般的になるかもしれない。

富士通の技術は「表情」と「声」から心を読み取る

表情認識技術は日本でも研究されており、富士通研究所は工学・芸術分野で名高い米カーネギーメロン大学と共同で開発を進めている。

表情認識技術はAffectivaのように表情筋の動きをとらえるのが一般的だ。富士通の技術も各筋肉の動きを単位化したAction unitを使っている。しかし、顔は常に正面を向いているわけではなく、傾いたり横を向いたりしていることが多いため正確にとらえるには大量のデータが必要となる。データが足りなければ認識の精度に影響してしまう。そこで富士通では傾いた顔でも正面を向いたような顔にする補正技術を搭載し、表情認識AIの精度を高めるアプローチをとっている。

そして同社は他の表情認識AIよりも高い精度を有する点をアピールする。通常の表情認識技術は営業分野で使われるようなわかりやすい表情の読み取りを対象としているが、富士通の技術は医療分野や自動車等のドライバーの安全装置のような分野での採用を目指しているようだ。こうした分野で実用化されるには「戸惑い」や「うわの空」、あるいはストレスを読み取れるほどの精度が必要となる。

さらに同社は声認識も駆使して包括的に感情を認識する技術をもつ。小型コミュニケーションロボット「unibo(ユニボ)」には富士通が開発した「声認識」及び「表情認識」技術が搭載されている。富士通はコールセンター向けに客の態度やNGワードを認識するシステムを提供しているが、これに関連した技術が使われているのだろう。uniboは話しかけた人の音声感情と表情をそれぞれグラフ化し人の心を読み取ろうとする。そして読み取った感情と発言内容を基に回答する機能をもつ。

uniboの性能はそこまで高くないようだが、表情と声の認識精度がさらに高まり、そこに高性能な会話機能が搭載されればヒト代替ロボットの完成だ。人間は表情を見ながら会話する。数十年後に普及するであろう店員ロボットや、ペットとしての会話ロボットには必ず表情認識AIが搭載されるはずだ。

機械は表情を記憶できてしまう

Affectiva、富士通以外にも多くの企業が表情読み取りAIを研究しているが、実用化できそうな分野は多岐にわたる。前記のように表情を読み取って最適な広告を出せるシステムがあれば、BtoC企業がこぞって利用するだろう。セキュリティ・安全分野では罪を犯しそうな人の表情を読み取って入店を断ることもできるし、クルマに搭載すれば居眠り運転や飲酒運転を察知して事故を防止することもできる。医療向けでは医師が見逃した患者の表情から疾患を特定できるかもしれない。

このように表情読み取りAIは多くのメリットをもたらしてくれそうだが、一方で、表情を記憶できてしまうことが問題でもある。人が相手の表情を読み取るのはその場の感情を判断するためだが、機械はすべて場面における表情を記憶しパターンまで認識できてしまう。

どの広告を見たときに興奮し、どの広告で嫌な顔をするのかをAIが記憶すれば、自分の表情がマーケティング戦略の一環で勝手に使われてしまうかもしれない。ショッピングの際に顔が読み取られ、どういう趣味の人か店舗側が記録するかもしれない。その程度ならまだいいが、表情から得られた趣味嗜好のデータが自分の同意なく売買される可能性もある。そして政治分野で使われればさらに問題だ。現政権に関する映像が流れた際、嫌な顔をしているのが認識され記録されれば反政権的な思想の持ち主として登録されるかもしれない。某国ならやりそうだ。

プライバシーを守るためにも表情読み取りAIを“その場”だけの利用に限り、メモリに記録させない等の規制が必要となってくるだろう。