No.005
2020.05.20
音声から気分・感情を判定するAI
Empath(エンパス)
概要
Empathとは、声から会話の質と感情を解析するAIエンジンである。言葉の意味内容ではなく、声のスピード、抑揚、トーンなどの物理的な特徴量から機械学習をベースに独自のアルゴリズムで感情を推定する。また、発話者同士の発話の割合や話すスピードの差異など会話の質を可視化することができる。
なにがすごいのか?
声色、トーン、スピード、強さなど様々な指標を解析
音声を解析しているため、言語に依存しない
WebAPIによるリアルタイム解析が可能
なぜ生まれたのか?
Empathは東日本大震災後に医療現場を支援する企業のプロダクトとして生まれた。ボランティアが被災地で鬱になってしまう問題があり、早めにカウンセリングを受けてもらうため、メンタルヘルス悪化時の早期発見を目的として開発されている。発語した文章での判定では被験者の本意が検知できない可能性があるが、音声での判定のため、客観的な解析を提示することができる。今後様々な分野での応用が見込まれ、コミュニケーションをサポートする新たなテクノロジーとして注目されている。
妄想プロジェクト 妄想プロジェクト
朗読上手なリーディングAI
Empathのエンジンを用いて感情を込めた抑揚を逆生成することで、朗読上手なリーディングAIを育成する。楽しいとき、寂しいとき、眠たいとき。話しかけるだけでその子の感情を読み取り、今一番聞きたいトーンの声でお話を読み聞かせてくれる。そのときの気持ちに寄り添った、最高の話し相手になってくれるだろう。
実現事例 実現プロジェクト
コールセンター向け共感AI「DARUMA」
顧客とオペレーターの音声から感情をリアルタイムで解析、その結果をもとにバーチャル・アシスタント「DARUMA」が通話中のオペレーターに寄り添いサポートする。業務過多で個別のオペレーターに対してのフォローができない管理者に代わり、DARUMAがオペレーターを褒めてサポートした結果、出席率の向上やオペレーターのモチベーション維持に寄与した。オペレーターに対するモニタリングを効率化しフォローが必要なオペレーターをリアルタイムで検出するとともに、オペレーターの成長を促進し、アウトバウンド・コールでの成約率向上も実現している。
エモいガチャ「Emotional Candybox」
場の雰囲気を検知し、盛り上がった際にガムがコロンと1つ出てくるガチャ。Empathによるリアルタイム解析により、場の盛り上がりを可視化し、閾値を超えるとガチャが回る仕組みとなっている。会議での盛り上げを加速するともに、結果をデータ化することで盛り上げ上手なメンバーを抽出できる可能性がある。
なぜできるのか?
数万人の音声データをもとに、複数の音声指標で解析
Empathはボリューム、ピッチ、スピード、イントネーションなど音声の物理的特徴量を解析することで感情を測定している。その根底にあるのは機械学習モデルであり、数万人の音声データをいくつかの音声指標に聞かせ、うち複数が”この人は怒っている”、と判定したデータのみをAIの学習の元になるデータとして採用している。
WebAPIによるリアルタイム解析とデータの蓄積
Empathの感情分析エンジンはWebのAPIとしてリアルタイムに解析を行うことができるが、そのリアルタイム解析を支えているのは独自のアルゴリズムによる高速処理の実行だ。
また、WebのAPIユーザーからも音声データを獲得しており、その数は日に日に増大し、アルゴリズムも日々修正を繰り返されている。
相性のいい産業分野
この知財の情報・出典
この知財は様々な特許や要素技術が関連しています。
詳細な情報をお求めの場合は、お問い合わせください。
商願2014-35949:「Empath」
特開2019-28732:「音声等から気分を解析して動作を制御する装置」(特許出願中)
商願2014-35949:「Empath」
特開2019-28732:「音声等から気分を解析して動作を制御する装置」(特許出願中)