0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一种基于端到端基于语音的对话代理

倩倩 来源:互联网分析沙龙 2020-09-09 14:14 次阅读

美国专利商标局(USPTO)授予Microsoft的一项新专利表明,该公司正在开发能够反映用户对话风格和/或面部表情的对话代理。专利- 语言风格匹配代理 -于2020年9月3日授予Microsoft,并以发明者Daniel J McDuff,Kael R. Rowan,Mary P Czerwinski,Deepali Aneja和Rens Hoegen称号。

随着语音识别和生成对话模型的发展,诸如聊天机器人和虚拟代理之类的对话界面正变得越来越流行。尽管这种自然语言的交互导致了人机交互的发展,但这种交流大多是单调的且受约束的。因此,这些对话最终只是事务性的,并不是很自然。

这项新的专利技术旨在带来一种基于端到端基于语音的对话代理,该对话代理可以进行更自然,多轮回的对话,从而与用户的对话风格和面部表情保持一致。

被实现为仅语音的代理或用脸部体现的会话代理可以与用户的语音和面部表情匹配。可以通过识别用户语音的韵律特征并为具有相同或相似特征的虚拟代理合成语音来实现会话代理的语言样式匹配。用户的面部表情可以通过具体化的对话代理的脸部来识别和模仿。虚拟代理的发言可以基于预定的脚本响应和由机器学习技术生成的开放式响应的组合。与用户的会话风格和面部表情保持一致的会话代理可能会被认为更值得信赖,更容易理解,

对话代理可以是纯音频的,也可以是体现的,这意味着它具有看起来像在说话的“脸”。在这两种实现方式中,代理可以使用机器学习技术,并以自然且可理解的方式响应用户的话语,从而整体上改善人机交互。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人机交互
    +关注

    关注

    12

    文章

    1209

    浏览量

    55432
  • 语音识别
    +关注

    关注

    38

    文章

    1742

    浏览量

    112713
  • 聊天机器人
    +关注

    关注

    0

    文章

    339

    浏览量

    12332
收藏 人收藏

    评论

    相关推荐

    自动驾驶技术研究与分析

    编者语:「智驾最前沿」微信公众号后台回复:C-0450,获取本文参考报告:《自动驾驶行业研究报告》pdf下载方式。 自动驾驶进入2024年,
    的头像 发表于 12-19 13:07 231次阅读

    在自动泊车的应用

    要做到15Hz以上。这样就对存储和算力需求降低很多。 上海交通大学的五位学生发表了自动泊车的论文:《ParkingE2E: Camera-based End-to-end P
    的头像 发表于 12-18 11:38 403次阅读
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>在自动泊车的应用

    阶跃星辰发布国内首个千亿参数语音大模型

    近日,阶跃星辰在官方公众号上宣布了项重大突破——推出Step-1o千亿参数语音大模型。该模型被誉为“国内首个千亿参数
    的头像 发表于 12-17 13:43 229次阅读

    准确性超Moshi和GLM-4-Voice,语音双工模型Freeze-Omni

    GPT-4o 提供的全双工语音对话带来了股研究热潮,目前诸多工作开始研究如何利用 LLM 来实现
    的头像 发表于 12-17 10:21 211次阅读
    准确性超Moshi和GLM-4-Voice,<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b><b class='flag-5'>语音</b>双工模型Freeze-Omni

    已来,智驾仿真测试该怎么做?

    智驾方案因强泛化能力、可持续学习与升级等优势备受瞩目,但这对仿真测试带来了巨大挑战。康谋探索了一种有效的
    的头像 发表于 12-04 09:59 2645次阅读
    <b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>已来,智驾仿真测试该怎么做?

    爆火的如何加速智驾落地?

    编者语:「智驾最前沿」微信公众号后台回复:C-0551,获取本文参考报告:《智能汽车技术研究报告》pdf下载方式。 “
    的头像 发表于 11-26 13:17 319次阅读
    爆火的<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>如何加速智驾落地?

    连接视觉语言大模型与自动驾驶

    自动驾驶在大规模驾驶数据上训练,展现出很强的决策规划能力,但是面对复杂罕见的驾驶场景,依然存在局限性,这是因为
    的头像 发表于 11-07 15:15 279次阅读
    连接视觉语言大模型与<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>自动驾驶

    Mobileye自动驾驶解决方案的深度解析

    强大的技术优势。 Mobileye的解决方案概述 1.1 什么是自动驾驶?
    的头像 发表于 10-17 09:35 385次阅读
    Mobileye<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>自动驾驶解决方案的深度解析

    测试用例怎么写

    编写测试用例是确保软件系统从头到尾能够正常工作的关键步骤。以下是个详细的指南,介绍如何编写
    的头像 发表于 09-20 10:29 492次阅读

    测试不正常如何处理

    测试(End-to-End Testing)是一种测试方法,它模拟用户与系统的实际交互,从用户界面开始,通过应用程序的所有层,直到数据库。这种测试的目的是确保系统的各个组件在实际
    的头像 发表于 09-20 10:25 391次阅读

    实现自动驾驶,唯有

    ,去年行业主流方案还是轻高精地图城区智驾,今年大家的目标都瞄到了(End-to-End, E2E)。
    的头像 发表于 08-12 09:14 758次阅读
    实现自动驾驶,唯有<b class='flag-5'>端</b><b class='flag-5'>到</b><b class='flag-5'>端</b>?

    电阻的电流和电压是如何区分的

    电阻,又称为四测量电阻或凯尔文电阻,是一种特殊的电阻器,主要用于精密测量电路中的电阻值。四电阻的电流和电压
    的头像 发表于 08-05 10:48 1334次阅读

    比较器输入和输出的关系

    比较器是一种电子设备,用于比较两个电压或电流信号的大小。比较器的输入和输出之间的关系是其核心功能之。 比较器的基本原理 比较器是一种
    的头像 发表于 07-10 10:39 2492次阅读

    循环神经网络在语音识别中的应用

    (Recurrent Neural Networks, RNN)在语音识别领域的应用日益广泛,特别是在语音识别系统中,RNN及其变体如
    的头像 发表于 07-08 11:09 601次阅读

    小鹏汽车发布大模型

    小鹏汽车近日宣布,其成功研发并发布了“国内首个量产上车”的大模型,该模型可直接通过传感器输入内容来控制车辆,标志着智能驾驶技术的新突破。
    的头像 发表于 05-21 15:09 697次阅读