0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Google以丰富的对话情境资讯改进客服中心AI的语音识别能力

931T_ctiforumne 来源:YXQ 2019-07-30 15:57 次阅读

2018年Next大会上推出的人工智能预包装服务客服中心AI(Contact Center AI),现在Google透过增加人工智能理解对话情境的方法,进一步强化虚拟代理人语音识别的能力,用户现在还可以更灵活地自订定义Speech Context类别,减少人工智能对于文字概念混淆的问题。

Google提到,即便客服中心虚拟代理人的语音识别精准度达90%,但是比起实验室,实际使用环境以及杂讯的影响,在部分情况下,仍然会使得自动语音识别的结果变得很糟,因此现在Google进一步更新客服中心AI所使用的技术,特别是在Dialogflow以及云端语音转文字两服务,以提升辨识品质。

Dialogflow让用户能够在网页、行动应用程式或是热门的传讯平台,建构对话服务,而这次更新,Google为Dialogflow加入了自动语音调适能力(Auto Speech Adaptation),以对话情境资讯,解决虚拟代理人混淆单字发音的问题。

由于许多单字的读音很相似,在电话中可能无法很清楚传递,像是cheese和these的发音,还有可能把mail误翻成male或nail,但是当虚拟代理人知道这些对话背景,发生在速食餐厅或是商品退货时,便不容易混淆这些字。用户只要在Dialogflow控制台中,将自动语音调适功能打开,就能让语音识别准确度上升40%以上。

Google也改进了互动式语音应答(IVR)以及电话虚拟代理人,所使用的云端语音转文字基线模型,而这将会使语音转录的结果更好,Google以电话用语的常用短句最佳化了该模型,使得新模型的表现,在美国英文上的辨识准确度提高15%,再加上自动语音调适功能,还能进一步提升辨识的品质。

开发人员在使用云端语音转文字服务时,能使用SpeechContext参数来控制情境资讯,让语音转录更加精确,以让虚拟代理人更精准地辨识企业产品等特定名词。

而现在Google在SpeechContext中新增类别,而预定义的类别则对应到流行或是通用的概念上,使用情境像是在数字沟通时,4个数字的组合可能代表年、时间或是金钱,而开发者可以在SpeechContext类别,调校整个自动语音识别的单字列表,改善输入语音的转录结果。

不过,Google也提到,使用SpeechContext这样的工具,会增加部分短句被撷取的机率,这可能降低了语音有提及却没出现在转录文字上的错误,但同时也会增加语音未提及却出现在转录文字的情形,自动语音调适的强度需要权衡结果进行调整,而SpeechContext的Boost功能解决了开发者这样的烦恼,可以自动为使用案例调整语音调适的最佳强度。

过去云端语音转语音服务,处理语音只能以1分钟为单位,而这对于需要较长时间转录文字的使用案例,像是会议、即时影片或是电话等是个大问题,现在Google将处理语音时间上限提高至5分钟,而且API也允许开发人员开启新的串流对话,来接续前一个串流对话,以做到无限时间的串流语音转录文字。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • Google
    +关注

    关注

    5

    文章

    1758

    浏览量

    57418
  • 语音识别
    +关注

    关注

    38

    文章

    1725

    浏览量

    112560

原文标题:Google以丰富的对话情境资讯改进客服中心AI的语音识别能力

文章出处:【微信号:ctiforumnews,微信公众号:CTI论坛】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    语音识别技术的应用与发展

    语音识别技术的发展可以追溯到20世纪50年代,但直到近年来,随着计算能力的提升和机器学习技术的进步,这项技术才真正成熟并广泛应用于各个领域。语音识别
    的头像 发表于 11-26 09:20 192次阅读

    ASR语音识别技术应用

    语音识别技术应用的分析: 一、ASR语音识别技术原理 ASR语音识别技术的基本原理是将人类
    的头像 发表于 11-18 15:12 338次阅读

    ChatGPT:怎样打造智能客服体验的重要工具?

    ChatGPT作为智能对话生成模型,可以帮助打造智能客服体验的重要工具。以下是一些方法和步骤:1.数据收集和准备:收集和整理与客服相关的数据,包括常见问题、回答示例、客户对话记录等。这
    的头像 发表于 11-01 11:12 137次阅读
    ChatGPT:怎样打造智能<b class='flag-5'>客服</b>体验的重要工具?

    ChatGPT:为未来的个人和企业提供革命性的对话解决方案

    的知识:ChatGPT经过大规模的预训练,可以提供丰富的知识和信息,能够回答各种问题,并提供有用的建议和指导。3.可定制性:ChatGPT可以根据个人或企业的需求进行定制,适应特定的对话场景和行业需求
    的头像 发表于 11-01 11:12 127次阅读
    ChatGPT:为未来的个人和企业提供革命性的<b class='flag-5'>对话</b>解决方案

    AI破解个性化客服难题

    一文汇集多个行业借助 AI 实现的个性化客服实践
    的头像 发表于 10-25 09:06 1840次阅读
    <b class='flag-5'>以</b><b class='flag-5'>AI</b>破解个性化<b class='flag-5'>客服</b>难题

    智能头盔语音识别声控芯片,AI离线语音识别ic方案,NRK3301

    专用的智能语音交互系统以及头部姿态识别能力,解决了骑行时智能产品的交互可用性和方便性的核心问题。本文将对NRK3301语音识别声控芯片应用在
    的头像 发表于 09-10 08:02 312次阅读
    智能头盔<b class='flag-5'>语音</b><b class='flag-5'>识别</b>声控芯片,<b class='flag-5'>AI</b>离线<b class='flag-5'>语音</b><b class='flag-5'>识别</b>ic方案,NRK3301

    聆思CSK6视觉语音大模型AI开发板入门资源合集(硬件资料、大模型语音/多模态交互/英语评测SDK合集)

    大模型语音问答、拍照识图、大模型绘图等丰富供能示例,支持语音唤醒、多轮语音交互。 2智能对话除了大模型
    发表于 06-18 17:33

    智能消毒柜语音识别芯片推动智能家居技术发展

    个全新的高度。 在技术背景方面,它融合了先进的语音识别技术和人工智能算法。它不仅能够准确识别用户的语音指令,还能够通过机器学习和大数据分析,不断优化自身的
    的头像 发表于 05-29 13:28 332次阅读
    智能消毒柜<b class='flag-5'>语音</b><b class='flag-5'>识别</b>芯片推动智能家居技术发展

    【Longan Pi 3H 开发板试用连载体验】给ChatGPT装上眼睛,并且还可以语音对话:5,音频采集

    ,要根据环境噪音校准一下麦克风阈值,接下来开始采集。当音量超过阈值后还是录音,音量低于阈值一段时间后结束录音。随后将得到的音频传入语音识别模型转为文字,这里我使用的是google的模型: import
    发表于 04-16 11:12

    【Longan Pi 3H 开发板试用连载体验】给ChatGPT装上眼睛,还可以语音对话

    对话能力。 目前计划使用的具体方案和流程如下: 使用speech_recognition进行语音输入,完成后将语音数据导入Whisper或googl
    发表于 04-12 12:41

    开发者手机 AI - 目标识别 demo

    功能简介 该应用是在Openharmony 4.0系统上开发的一个目标识别AI应用,旨在从上到下打通Openharmony AI子系统,展示Openharmony系统的AI
    发表于 04-11 16:14

    Google多模态大模型看后续大模型应该具备哪些能力

    前段时间Google推出Gemini多模态大模型,展示了不凡的对话能力和多模态能力,其表现究竟如何呢?
    的头像 发表于 12-28 11:19 1202次阅读
    从<b class='flag-5'>Google</b>多模态大模型看后续大模型应该具备哪些<b class='flag-5'>能力</b>

    语音数据集在智能客服系统中的应用与挑战

    的效率和质量。本文将详细介绍语音数据集在智能客服系统中的应用、面临的挑战以及未来的发展趋势。 二、语音数据集在智能客服系统中的应用 语音
    的头像 发表于 12-25 09:46 441次阅读

    语音数据集:AI语音技术的灵魂

    提升语音识别和生成能力语音数据集为AI模型提供了丰富
    的头像 发表于 12-14 14:33 982次阅读

    语音数据集:推动AI语音技术的核心力量

    的发展趋势。 二、语音数据集的重要性 提高语音识别和生成能力语音数据集包含大量的语音样本,可以
    的头像 发表于 12-12 11:32 677次阅读