Google以丰富的对话情境资讯改进客服中心AI的语音识别能力-电子发烧友网

2018年Next大会上推出的人工智能预包装服务客服中心 AI（Contact Center AI），现在Google透过增加人工智能理解对话情境的方法，进一步强化虚拟代理人语音识别的能力，用户现在还可以更灵活地自订定义Speech Context类别，减少人工智能对于文字概念混淆的问题。

Google提到，即便客服中心虚拟代理人的语音识别精准度达90％，但是比起实验室，实际使用环境以及杂讯的影响，在部分情况下，仍然会使得自动语音识别的结果变得很糟，因此现在Google进一步更新客服中心AI所使用的技术，特别是在Dialogflow以及云端语音转文字两服务，以提升辨识品质。

Dialogflow让用户能够在网页、行动应用程式或是热门的传讯平台，建构对话服务，而这次更新，Google为Dialogflow加入了自动语音调适能力（Auto Speech Adaptation），以对话情境资讯，解决虚拟代理人混淆单字发音的问题。

由于许多单字的读音很相似，在电话中可能无法很清楚传递，像是cheese和these的发音，还有可能把mail误翻成male或nail，但是当虚拟代理人知道这些对话背景，发生在速食餐厅或是商品退货时，便不容易混淆这些字。用户只要在Dialogflow控制台中，将自动语音调适功能打开，就能让语音识别准确度上升40％以上。

Google也改进了互动式语音应答（IVR）以及电话虚拟代理人，所使用的云端语音转文字基线模型，而这将会使语音转录的结果更好，Google以电话用语的常用短句最佳化了该模型，使得新模型的表现，在美国英文上的辨识准确度提高15％，再加上自动语音调适功能，还能进一步提升辨识的品质。

开发人员在使用云端语音转文字服务时，能使用SpeechContext参数来控制情境资讯，让语音转录更加精确，以让虚拟代理人更精准地辨识企业产品等特定名词。

而现在Google在SpeechContext中新增类别，而预定义的类别则对应到流行或是通用的概念上，使用情境像是在数字沟通时，4个数字的组合可能代表年、时间或是金钱，而开发者可以在SpeechContext类别，调校整个自动语音识别的单字列表，改善输入语音的转录结果。

不过，Google也提到，使用SpeechContext这样的工具，会增加部分短句被撷取的机率，这可能降低了语音有提及却没出现在转录文字上的错误，但同时也会增加语音未提及却出现在转录文字的情形，自动语音调适的强度需要权衡结果进行调整，而SpeechContext的Boost功能解决了开发者这样的烦恼，可以自动为使用案例调整语音调适的最佳强度。

过去云端语音转语音服务，处理语音只能以1分钟为单位，而这对于需要较长时间转录文字的使用案例，像是会议、即时影片或是电话等是个大问题，现在Google将处理语音时间上限提高至5分钟，而且API也允许开发人员开启新的串流对话，来接续前一个串流对话，以做到无限时间的串流语音转录文字。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

Google

Google

+关注

关注
5

文章
1766

浏览量
57570
语音识别

语音识别

+关注

关注
38

文章
1742

浏览量
112690

原文标题：Google以丰富的对话情境资讯改进客服中心AI的语音识别能力

文章出处：【微信号：ctiforumnews，微信公众号：CTI论坛】欢迎添加关注！文章转载请注明出处。

基于W2605C语音识别合成芯片的智能语音交互闹钟方案-AI对话享受智能生活

随着科技的飞速发展，智能家居产品正逐步渗透到我们的日常生活中，其中智能闹钟作为时间管理的得力助手，也在不断进化。基于W2605C语音识别与语音合成芯片的智能语音交互闹钟，凭借其强大的联

发表于 12-31 11:54 •47次阅读

汤姆猫AI语音情感陪伴机器人搭载全志R128芯片

接入AI大模型，可实现语音交互、情绪识别、连续对话、中英双语互动等功能，科技感满满。

发表于 12-26 14:20 •230次阅读

【「大模型启示录」阅读体验】如何在客服领域应用大模型

多个因素以确保所选模型能够满足企业的具体需求和目标。首先，企业需要明确自己的客服需求和目标。例如，是否需要24小时在线客服服务？是否需要处理复杂问题的能力？是否需要个性化服务？明确这些需求有助于企业更好

发表于 12-17 16:53

NVIDIA将在越南开设首个研发中心以推动AI发展

从事软件开发等工作，借助越南丰富的 STEM（科学、技术、工程和数学）工程师人才库，携手行业领袖、初创企业、政府机构、大学及学生，共同加速 AI 的应用。 NVIDIA 创始人兼首席执行官黄仁勋表示：“我们很高兴能开设 NVIDIA 的研发

发表于 12-07 11:19 •767次阅读

基于智能语音交互的智能呼叫中心工作机制

注于智能语音识别领域，与众多呼叫中心、智能客服厂商建立稳定的合作关系，以标贝科技接手过的案例为例，为您分享基于智能

发表于 12-03 16:44 •298次阅读

基于智能<b class='flag-5'>语音</b>交互的智能呼叫<b class='flag-5'>中心</b>工作机制

语音识别技术的应用与发展

语音识别技术的发展可以追溯到20世纪50年代，但直到近年来，随着计算能力的提升和机器学习技术的进步，这项技术才真正成熟并广泛应用于各个领域。语音识别

发表于 11-26 09:20 •500次阅读

ASR语音识别技术应用

语音识别技术应用的分析：一、ASR语音识别技术原理 ASR语音识别技术的基本原理是将人类

发表于 11-18 15:12 •703次阅读

ChatGPT：怎样打造智能客服体验的重要工具？

ChatGPT作为智能对话生成模型，可以帮助打造智能客服体验的重要工具。以下是一些方法和步骤：1.数据收集和准备：收集和整理与客服相关的数据，包括常见问题、回答示例、客户对话记录等。这

发表于 11-01 11:12 •181次阅读

ChatGPT：为未来的个人和企业提供革命性的对话解决方案

的知识：ChatGPT经过大规模的预训练，可以提供丰富的知识和信息，能够回答各种问题，并提供有用的建议和指导。3.可定制性：ChatGPT可以根据个人或企业的需求进行定制，以适应特定的对话场景和行业需求

发表于 11-01 11:12 •171次阅读

以AI破解个性化客服难题

一文汇集多个行业借助 AI 实现的个性化客服实践

发表于 10-25 09:06 •1892次阅读

聆思CSK6视觉语音大模型AI开发板入门资源合集（硬件资料、大模型语音/多模态交互/英语评测SDK合集）

大模型语音问答、拍照识图、大模型绘图等丰富供能示例，支持语音唤醒、多轮语音交互。 2智能对话除了大模型语

发表于 06-18 17:33

智能消毒柜语音识别芯片推动智能家居技术发展

个全新的高度。在技术背景方面，它融合了先进的语音识别技术和人工智能算法。它不仅能够准确识别用户的语音指令，还能够通过机器学习和大数据分析，不断优化自身的

发表于 05-29 13:28 •376次阅读

【Longan Pi 3H 开发板试用连载体验】给ChatGPT装上眼睛，并且还可以语音对话：5，音频采集

，要根据环境噪音校准一下麦克风阈值，接下来开始采集。当音量超过阈值后还是录音，音量低于阈值一段时间后结束录音。随后将得到的音频传入语音识别模型转为文字，这里我使用的是google的模型： import

发表于 04-16 11:12

【Longan Pi 3H 开发板试用连载体验】给ChatGPT装上眼睛，还可以语音对话

对话能力。目前计划使用的具体方案和流程如下：使用speech_recognition进行语音输入，完成后将语音数据导入Whisper或googl

发表于 04-12 12:41

开发者手机 AI - 目标识别 demo

功能简介该应用是在Openharmony 4.0系统上开发的一个目标识别的AI应用，旨在从上到下打通Openharmony AI子系统，展示Openharmony系统的AI

发表于 04-11 16:14