顧客が、応対にあたった従業員に対して威圧的な言動や不当な要求などを行う「カスタマーハラスメント(以下「カスハラ」)」。精神的・肉体的な負担を引き起こし、職場環境を悪化させる要因として社会問題となっています。ソフトバンクではコールセンター向けのカスハラ対策ソリューションとして企業や自治体への提供を見据え、AIを活用し、コールセンターで受電したお客さまの威圧的な声を穏やかなトーンに変換する技術の研究を、東京大学と共同で進めています。
目次
社会問題となる “カスハラ” の現状とは
厚生労働省が2022年に発行した「カスタマーハラスメント対策 企業マニュアル」によると、日本国内の企業・団体で働く8,000人を対象にした調査では、カスハラを受けた人の9割が「心身に影響があった」と回答。繰り返しカスハラを受けた人は精神的なストレスを感じ、「会社を休むことが増えた」「眠れなくなった」「通院したり服薬をした」など、心身に影響を及ぼしているとの結果も。
- ※
引用:厚生労働省「カスタマーハラスメント対策 企業マニュアル」p.15「カスタマーハラスメントによる従業員への被害は深刻」
ソフトバンクでは、従業員が快適に働ける環境を維持し、お客さまと良好な関係を保つことを目的とした「カスタマーハラスメントに関する当社の考え方」を制定。お客さまと応対するショップのスタッフやコールセンターのオペレーターが安心して働ける職場づくりのための取り組みを行っています。
一方で、社会課題となっている電話応対におけるカスハラ対策のソリューションとして、コールセンターで受電した際の怒鳴り声や感情的な声などを、リアルタイムでAIが抑制する「Emotion Canceling(エモーション キャンセリング)」を開発。東京大学と共同で実用化に向けた研究を進めています。
声色の抑制が応対ストレスの軽減に
ソフトバンク株式会社 IT統括 IT&アーキテクト本部 プラットフォーム開発部
(中央)担当部長 中谷 敏之(なかたに・としゆき)
(右)今村 俊雄(いまむら・としお)
(左)髙原 周平(たかはら・しゅうへい)
AIソリューション「Emotion Canceling」の開発メンバー。
東京大学 大学院情報理工学系研究科システム情報学専攻 特任准教授
髙道 慎之介(たかみち・しんのすけ)さん
音声合成、声質変換に関する研究を専門とする。日本語音声合成の第一人者として令和6年度科学技術分野 文部科学大臣表彰(若手科学者賞)を受賞。
なぜ、コールセンター向けに「Emotion Canceling」を開発しようと思ったのでしょうか。
中谷 「以前訪れたコールセンターでの出来事がきっかけです。オペレーターがいろんな問い合わせに対応する中で、理不尽な要求に苦慮している場面に出くわしました。もちろん、全てのお客さまのご要望を真摯(しんし)に受け止め、対応を行うことは当然なのですが、中には声を荒らげるような方がいて精神的なストレスになっていました。この問題をAIで解決できないかと考え、ソフトバンクの社内起業制度『ソフトバンクイノベンチャー』でアイデアを提案し、ソリューションの開発を進めることになりました」
髙道さん 「東京大学が参加することになったのは、最先端のAI研究機関を目指してソフトバンクと共に設立している『Beyond AI 研究推進機構』を通じて、AIと音声技術の研究について相談を受けたためです。人間の仕事や創造性を奪ってしまうというAIのネガティブなイメージが世の中にある一方、今回のアイデアは、明確に人を助けるための技術としてポジティブにつながること、そして社会貢献にもつながると思い、実用化に向けた共同研究を行うことになりました」
「怖いと感じる声」を「怖くない声」にするAI音声変換技術
開発を進めている「Emotion Canceling」について教えてください。
今村 「『Emotion Canceling』はコールセンターの電話応対業務に特化しています。AIを活用した感情認識・音声加工技術によって、お客さまの通話音声を穏やかなトーンに変換して、オペレーターに届けることができます。簡単に言えば、怒鳴り声などの『怖いと感じる声』を、話している内容はそのままでより穏やかな話者の特徴を加えることで、『怖くない声』に変換しています。最初は音声から怒りの感情を取り除く技術を目指したのですが、お客さまがどのような感情で話しているかを把握することは応対で重要な部分ですので、『怖くない声』に近づける技術に切り替えました」
“声を変換する” と聞くとボイスチェンジャーを連想してしまいます。
今村 「当初はボイスチェンジャーのように声の高さを変えたり、音量を下げたりする実験を行ったのですが、オペレーターが受けるストレスは軽減されませんでした。また、意図しない抑揚やニュアンスに変換され、面白おかしく聞こえてしまうことがあり、応対に集中できないという声がありました。AIを活用することで、ボイスチェンジャーよりも自然で穏やかな音声に変換できるようになりました」
髙原 「動画では2つのパターンを紹介していますが、変換できる声色は複数の声から選ぶことができます。オペレーターが聞き慣れている声色に変換されることで、応対に集中することが可能です」
東京大学との共同研究で、ソフトバンクは2025年度中の実用化を目指す
AI音声変換の研究を進める中で、技術的な難しさはありますか。
髙原 「クレームの声色には甲高い声や重低音の声といったあらゆるパターンがあることに加え、静かな自宅以外に街の喧騒(けんそう)の中にある環境音など、さまざまな場所での通話環境に対応して『怖くない声』に変換することはとても難しいことです。40時間以上にわたる模擬音声を学習させ、声の怖さに直結する特徴量を分析し、モデルを改善していくという作業を行っています」
髙道さん 「電話の音声品質では、音声信号の周波数はクリアな音声と比べると3分の1に減少してしまいます。これは音声としての情報量も3分の1になるということです。その限られた情報量で、かつリアルタイムに音声変換する技術の開発は大きなチャレンジです。また、音声変換に関しては人間がどのような声を怖がっているのか、何を聞いたら怖いと感じるのかをコンピューター上で数値化する必要があり、これはボイスチェンジャーではできない技術で、今回の研究で特に難しい部分です」
音声変換で30%以上の怒り抑制効果に
現時点でどのような成果がありましたか。
中谷 「オペレーターの経験者、未経験者合計300人以上に協力を依頼し、音声変換前と変換後を聴き比べ、話し手の怒りを感じる度合いを7段階で評価してもらいました。結果、変換前より変換後の音声が怒りを感じる度合いが30%以上抑制されているという評価を得ました。怒りの声色を抑制することで、お客さまの要求を正しく理解し、適切な応対ができるような環境を実現するため、ソフトバンクは2025年度中の事業化に向け、音声変換技術で使うモデルの技術開発をさらに進めたいと考えています」
ソフトバンクとの共同研究に期待することはありますか。
髙道さん 「東京大学のアカデミックな研究者として、音声技術に関する研究を進めてきましたが、大学では商用化を実現するのは難しい。一方でソフトバンクは研究・開発・実践できる現場、全ての側面をマネジメントできる架橋があり、共同研究において即時フィードバックがあるのはとても頼もしく感じています。これまでの研究成果をいち早く実用化できるようサポートしていきたいですね」
(掲載日:2024年7月26日)
文:ソフトバンクニュース編集部