0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

揭秘语音交互:个性化AI打造“数字化的你”

章鹰观察 来源:高通 作者:侯纪磊博士 2018-07-18 15:42 次阅读

从更精美的照片、更高的安全性到更自然的用户界面(UI),人工智能AI)正以无缝的方式更多地丰富我们的生活。高能效和个性化是Qualcomm AI Research的核心研究领域,因为它们对于下一代无处不在的智能用户体验而言不可或缺。终端侧AI正在支持虚拟助理的发展,而个性化正成为今天的虚拟助理和未来真正个人助理之间的主要差异。

AI驱动语音交互革命

语音是我们一直期盼的变革性交互方式,它可以提供用户与终端间的自然交互,而无需任何手部操作。先进的语音交互具有始终开启、对话式、个性化和私密的特征,可支持我们进行高效且自然的对话。从智能手机智能音箱到扩展现实(XR)设备和汽车,语音交互正在众多产品种类中日益发展和普及。

要实现端到端的语音交互体验,其中需要多个组件的支持(见图1)。语音交互的流程是这样的:首先麦克风采集语音信号,然后是语音预处理、语音激活、语音识别和自然语言理解,最终是终端通过语音合成的方式响应用户。由此可见,端到端的语音交互是个多步骤的复杂流程。

图1:语音交互的功能组件。

为什么今天语音交互变得如此普及?一个重要因素是,机器学习已经点燃了语音交互的革命。机器语音识别的准确率正不断逼近95%,达到与人类准确率相当的水平。当机器准确率不能达到人类的水平,整个语音交互过程就没法做到对话式的自然高效交流,因此用户体验会有显著下降。机器学习技术可应用于几乎所有的语音交互组件之上,从而提升各方面及整体的交互体验。

终端侧的语音交互至关重要

因计算、内存和功率的限制,主要语音交互组件(如自动语音识别和自然语言处理)传统上都由云端AI所支持。但是,终端侧处理具有众多独特的优势,包括更快的响应速度、更高的可靠性和更好的隐私保护。尤其是在私密性方面,今天的消费者渴望把数据掌握在自己手中,并且有权选择是否将数据发到云端进行处理或存储。因此,更多在终端上进行处理并为云端功能提供补充,这是目前行业的重要趋势之一。而其中的主要挑战在于,需要在移动终端的功耗和散热限制下运行并实现复杂的语音交互功能。

图2:语音交互的主要组件正向终端侧迁移。

Qualcomm正积极应对这项挑战,并把低功耗的终端侧AI应用于语音交互组件之上。以下是几个例子:

1、语音降噪将带噪语音处理成清晰语音并输出,这在嘈杂环境中尤其重要。Qualcomm AI Research正在开发一个降噪深度学习模型,该模型与传统方法相比有显著的性能提升,并具有较高效率可在助听器这样非常受限的处理能力、功耗和散热条件下运行。

2、 自动语音识别将语音转录为文本。测试表明,深度学习技术可在移动终端上实现顶级的语音识别准确率。Qualcomm AI Research已经完成了一个深度学习声学模型的训练并使其适应每个用户的口音和环境,从而提高个性化程度。

今天,终端侧的语音交互已经成为现实。Qualcomm AI Research已经可以在终端侧实现整体的端到端语音交互处理,并在2018年的CES大会上演示了智能家居中的端到端语音交互体验。在适应口音和环境后,这项演示对特定领域的指令集已经可以实现超过95%的意图理解准确率。

个性化成就真正的虚拟助理

真正的虚拟助理是在终端里面有一个“数字化的我”。因此,它需要分析个人信息并不断学习用户偏好,从而成为真正了解用户的数字助理。情境式智能是实现个性化的必备条件,而实现情景式智能需要融合多种终端侧传感器的数据(如麦克风、摄像头和陀螺仪)及其他终端侧和终端外数据(见图3)。

图3:情境式智能融合多种传感器和个人信息。

增强个性化的一大好处在于,它能够推动个人助理进一步发展并兼具响应性和主动性。真正的个人助理不仅能够在用户提问时提供个性化的答案,还能基于情境分析进行自主决策和无提示对话。

为进一步提升虚拟助理的个性化程度,Qualcomm AI Research正对终端侧的“AI agent”展开研究,它有望从所有传感器数据中不断学习个人信息,最终实现直观行动。AI agent的关键功能包括情境式融合及学习,这最终将支持个性化响应并丰富我们的生活。初步研究结果已展现出终端侧个性化的远大前景。个性化不仅将提升虚拟个人助理的用户体验,而且将丰富我们生活的方方面面。这项技术将变革众多行业,不断推动行业创新。

(本文内容来自Qualcomm高级总监兼AI研究项目负责人侯纪磊博士的署名博客)

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 传感器
    +关注

    关注

    2545

    文章

    50384

    浏览量

    750653
  • AI
    AI
    +关注

    关注

    87

    文章

    29611

    浏览量

    267905
  • 机器学习
    +关注

    关注

    66

    文章

    8337

    浏览量

    132255
  • 语音交互
    +关注

    关注

    3

    文章

    282

    浏览量

    27960
收藏 人收藏

    评论

    相关推荐

    AI破解个性化客服难题

    一文汇集多个行业借助 AI 实现的个性化客服实践
    的头像 发表于 10-25 09:06 1681次阅读
    以<b class='flag-5'>AI</b>破解<b class='flag-5'>个性化</b>客服难题

    高校转型数字化的原因有哪些

    作为知识传播和创新的重要场所,必须紧跟科技发展的步伐,通过数字化转型来适应这一趋势,确保自身在激烈的竞争中保持领先地位。 提升教学质量与效率: 数字化技术为教学提供了更加丰富、灵活和个性化的手段。通过在线课程、
    的头像 发表于 09-26 10:39 190次阅读

    Meta发布Imagine Yourself AI模型,重塑个性化图像生成未来

    Meta公司近日在人工智能领域迈出了重要一步,隆重推出了其创新之作——“Imagine Yourself”AI模型,这一突破性技术为个性化图像生成领域带来了前所未有的变革。在社交媒体与虚拟现实技术
    的头像 发表于 08-26 10:59 413次阅读

    亚马逊推出个性化AI歌单功能Maestro,进军音乐市场

    据亚马逊公司透露,其音乐应用程序 Amazon Music 已开始向少量美国用户推出 AI 生成歌单功能 Maestro 的测试版服务。这项服务允许用户利用多样的提示信息(如文本、表情符号及其组合等),迅速生成个性化的歌单。
    的头像 发表于 04-17 16:48 568次阅读

    激光打标机:精准定位,实现个性化标识需求

    激光打标机:精准定位,实现个性化标识需求激光打标机,以其精准定位的特性,成为实现个性化标识需求的得力工具。在现代制造业中,个性化标识已成为产品差异化、品牌塑造和提升附加值的重要手段。激光打标机通过其
    的头像 发表于 03-19 19:43 445次阅读
    激光打标机:精准定位,实现<b class='flag-5'>个性化</b>标识需求

    打造专属高清视频转换器:满足个性化视频转换需求

    随着视频技术的不断进步和多样,用户对视频格式转换的需求也日益增长。标准的视频转换器虽然能够满足大部分用户的需求,但对于那些有特定需求或希望实现更高效、更个性化转换的用户来说,打造专属的高清视频
    的头像 发表于 02-22 14:29 262次阅读

    个性化定制,提升运营效率:SAP二次开发引领企业数字化转型

    的解决方案,助力其实现数字化转型,提高运营效率,迎接不断变化的业务需求。 提升企业运营效率,打造个性化管理工具 SAP二次开发服务可以根据企业的特定需求,深入定制现有的SAP系统,为企业提供
    的头像 发表于 02-18 13:29 344次阅读

    数字化IP网络广播在教育领域的应用与影响

    ,提供更加多元个性化的教学服务。通过数字化技术,IP网络广播可以实现音频信号的高质量传输和播放,提供清晰、稳定的音频效果。同时,IP网络广播还可以支持多种音频格式和传输协议,满足不同教学场景的需求。 其次,
    的头像 发表于 01-23 15:00 416次阅读
    <b class='flag-5'>数字化</b>IP网络广播在教育领域的应用与影响

    如何借助数字化技术打造TPM管理新模式?

    在企业运营中,数字化技术具有不可替代的作用。尤其在设备管理领域,借助数字化技术打造全新的TPM(全员生产维护)管理模式已经成为企业发展的必经之路。那么,如何借助数字化技术
    的头像 发表于 01-02 10:12 401次阅读

    企业数字化转型的三个层次:需求侧、供应侧和生产侧数字化

    用户对信息获取和消费的方式发生了根本性的变化,他们更倾向于使用数字化工具和平台进行信息检索、产品购买和社交互动,这使得企业需要重新思考营销和销售策略。用户在数字化时代更加注重个性化和定
    的头像 发表于 12-10 11:14 3279次阅读
    企业<b class='flag-5'>数字化</b>转型的三个层次:需求侧、供应侧和生产侧<b class='flag-5'>数字化</b>

    WT588F02B-C015语音芯片:内置丰富资源,助力个性化功能产品定制

    随着科技的飞速发展,语音芯片在众多领域中扮演着越来越重要的角色。作为一款备受瞩目的语音芯片,WT588F02B-C015(IO扩展)语音芯片凭借其内置丰富的资源和功能,成为了客户个性化
    的头像 发表于 12-01 09:29 358次阅读

    WT588F02B-C015语音芯片:内置丰富资源,助力个性化功能产品定制

    随着科技的飞速发展,语音芯片在众多领域中扮演着越来越重要的角色。作为一款备受瞩目的语音芯片,WT588F02B-C015(IO扩展)语音芯片凭借其内置丰富的资源和功能,成为了客户个性化
    的头像 发表于 12-01 09:18 399次阅读
    WT588F02B-C015<b class='flag-5'>语音</b>芯片:内置丰富资源,助力<b class='flag-5'>个性化</b>功能产品定制

    基于数字化语音存储回放及GSM语音传输系统设计

    电子发烧友网站提供《基于数字化语音存储回放及GSM语音传输系统设计.pdf》资料免费下载
    发表于 11-17 16:48 0次下载
    基于<b class='flag-5'>数字化</b><b class='flag-5'>语音</b>存储回放及GSM<b class='flag-5'>语音</b>传输系统设计

    情感语音识别在人机交互中的应用与挑战

    一、引言 情感语音识别是近年来人工智能领域的研究热点之一,它能够通过分析人类语音中的情感信息实现更加智能个性化的人机交互。本文将探讨情感
    的头像 发表于 11-15 15:42 507次阅读

    情感语音识别技术在人机交互中的应用与挑战

     一、引言 随着人工智能技术的不断发展,人机交互已经成为了研究的热点之一。情感语音识别技术作为人机交互中的重要组成部分,能够通过识别人的语音情感,实现更加智能
    的头像 发表于 11-09 15:27 765次阅读