音声解析技術の適用トレンド
人の音声を解析処理する技術は、すでに日常生活でも一般的なものとなっており、Siri, Alexa, Googleアシスタントなど、音声によるコントロールは違和感のないインターフェイスとして受け入れられています。また、Web会議での議事録作成や、自動翻訳機能など、言語処理機能も一般化し、日常のさまざまな業務の効率化に貢献しています。
ここでは、弊社がこの分野での協業を本年開始したPhonexia社の観点から、その最新動向をご紹介させていただきます。Phonexia社は2006年にチェコ共和国のブルノ工科大学の研究グループからスピンアウトした専門企業で、コアテクノロジーとなるソフトウエア製品Phonexia Speech Engineを軸に、音声生体認証および音声分析の最先端技術をグローバル展開しています。
事例から見る代表的なユースケース
Phonexia社が公開している事例(PDFダウンロード)では innogy社、CommData社および Home credit社 各社のコールセンター事例、そして Unit for the Suppression of Organized Crime の犯罪調査事例が紹介されています。音声解析技術の適用という点では、やはり音声会話に依存するコールセンター業務での利用が典型的なものと言えるでしょう。業務の効率化など、投資対効果が計りやすいことから、コールセンターは音声認識技術を展開しやすい業務エリアとなっています。
コールセンターでは、問い合わせ対応、苦情受付、販売活動など、多岐にわたる音声による顧客対応が行われます。特定の用語やフレーズの出現率を見ることで、会話内容の大まかな統計的把握が可能となり、また使用すべきでない用語をモニターすることで顧客対応の品質を図ることもできます。会話全体が自動的に文字に起こされ、AIによる自然言語理解と連携して、概要を要約したり、後日詳細を確認したりすることが可能です。現状でも幅広く進んでいるコールセンターへの適用ですが、今後はAIとの連携が一層加速され、対顧客サービスがより自動化され最適化されることになると考えられます。
特殊詐欺対策例
今回オリゾンで作成したデモンストレーションにあるような “なりすまし電話” への対応も、実践的な適用事例となります。日本で未だに問題として日々注意喚起がされているオレオレ詐欺は、相手が誰であるかを判断する能力が、会話のみではいかに脆弱であるかを示した犯罪事例となっています。右のビデオ(※再生時には音量にご注意ください)では実際にPhonexiaを使用した、通話者の識別を行う仕組みの適用例となります。
所謂オレオレ詐欺手法では、声までは偽装せずに、家族が “会社に対して損失を出してしまった” など、その状況のみを偽装し、その範囲で詐欺シナリオにかかった被害者から金品を詐取する、という犯行形式になります。音声偽造など犯行に多くの投資をせず、”人の思い込み” を利用したもので、一般的に広く対象を広げて行われることから、このようなその “思い込み” を阻止する仕組みにより、かなりのケースで有効なものになると考えられます。
また、上でご紹介しているPhonexia社の公開事例でもある犯罪捜査の場面では、複数の話者の中から、特定のものの音声を識別したり、その事案に関わる特定用語を膨大な会話データから検出するなど、犯罪捜査の現場で広く活用されている例となります。音声生体認証と音声分析は、将来の犯罪捜査や抑止の状況に広く適用されることが期待されています。
音声解析技術の課題
音声解析の今後の課題では、すでに問題として認識されているAI音声との識別が挙げられます。マイクロソフト社の VALL-E など、3秒間で取得した音声サンプルからその人物の声を再現し自然な会話を生成するなど、人間では識別の困難な人口音声が日常に入り込みつつあります。
AIの作り出すディープフェイク動画では、人間の認識できる範囲での真偽の識別が困難な場合が多く、それと合わせたAIの生成した音声により、ますます会話の相手が本人であるかないかの判定が困難となっています。実際の犯罪発生も、他国に比べて高くはない現状ですが、関連テクノロジーが汎用化するにつれて、遠からず日本でも社会問題化するものと予想されます。
また、現在でもスマホによる通話では、人の声をデジタル化して伝送するのではなく、その話者の声に最も近い合成音声を伝送している場合があります。このような実装により、人口的に生成された擬似音声か、または人の声を元とした本来の音声かを、識別・区別することは困難であることが考えられます。Phonexia社では大学との共同研究を通して、このエリアでの更なる技術開発を計画しています。
今後の方向性
Phonexia社では、今後マイクロサービス化含め特にクラウド環境でのソリューションの堅牢性を、さらに高めてゆく予定です。軽量化されたクライアント・アプリケーションから、REST API経由でPhonexiaの機能を利用することで、幅広いソリューションユースケースへの対応が期待されます。これを踏まえオリゾンシステムズでは、音声解析技術を利用した日本向けのソリューションのご提供に向けて、Phonexia社との協業を進めてまいります。