0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

揭秘语音交互:个性化AI打造“数字化的你”

章鹰观察 来源:高通 作者:侯纪磊博士 2018-07-18 15:42 次阅读

从更精美的照片、更高的安全性到更自然的用户界面(UI),人工智能AI)正以无缝的方式更多地丰富我们的生活。高能效和个性化是Qualcomm AI Research的核心研究领域,因为它们对于下一代无处不在的智能用户体验而言不可或缺。终端侧AI正在支持虚拟助理的发展,而个性化正成为今天的虚拟助理和未来真正个人助理之间的主要差异。

AI驱动语音交互革命

语音是我们一直期盼的变革性交互方式,它可以提供用户与终端间的自然交互,而无需任何手部操作。先进的语音交互具有始终开启、对话式、个性化和私密的特征,可支持我们进行高效且自然的对话。从智能手机智能音箱到扩展现实(XR)设备和汽车,语音交互正在众多产品种类中日益发展和普及。

要实现端到端的语音交互体验,其中需要多个组件的支持(见图1)。语音交互的流程是这样的:首先麦克风采集语音信号,然后是语音预处理、语音激活、语音识别和自然语言理解,最终是终端通过语音合成的方式响应用户。由此可见,端到端的语音交互是个多步骤的复杂流程。

图1:语音交互的功能组件。

为什么今天语音交互变得如此普及?一个重要因素是,机器学习已经点燃了语音交互的革命。机器语音识别的准确率正不断逼近95%,达到与人类准确率相当的水平。当机器准确率不能达到人类的水平,整个语音交互过程就没法做到对话式的自然高效交流,因此用户体验会有显著下降。机器学习技术可应用于几乎所有的语音交互组件之上,从而提升各方面及整体的交互体验。

终端侧的语音交互至关重要

因计算、内存和功率的限制,主要语音交互组件(如自动语音识别和自然语言处理)传统上都由云端AI所支持。但是,终端侧处理具有众多独特的优势,包括更快的响应速度、更高的可靠性和更好的隐私保护。尤其是在私密性方面,今天的消费者渴望把数据掌握在自己手中,并且有权选择是否将数据发到云端进行处理或存储。因此,更多在终端上进行处理并为云端功能提供补充,这是目前行业的重要趋势之一。而其中的主要挑战在于,需要在移动终端的功耗和散热限制下运行并实现复杂的语音交互功能。

图2:语音交互的主要组件正向终端侧迁移。

Qualcomm正积极应对这项挑战,并把低功耗的终端侧AI应用于语音交互组件之上。以下是几个例子:

1、语音降噪将带噪语音处理成清晰语音并输出,这在嘈杂环境中尤其重要。Qualcomm AI Research正在开发一个降噪深度学习模型,该模型与传统方法相比有显著的性能提升,并具有较高效率可在助听器这样非常受限的处理能力、功耗和散热条件下运行。

2、 自动语音识别将语音转录为文本。测试表明,深度学习技术可在移动终端上实现顶级的语音识别准确率。Qualcomm AI Research已经完成了一个深度学习声学模型的训练并使其适应每个用户的口音和环境,从而提高个性化程度。

今天,终端侧的语音交互已经成为现实。Qualcomm AI Research已经可以在终端侧实现整体的端到端语音交互处理,并在2018年的CES大会上演示了智能家居中的端到端语音交互体验。在适应口音和环境后,这项演示对特定领域的指令集已经可以实现超过95%的意图理解准确率。

个性化成就真正的虚拟助理

真正的虚拟助理是在终端里面有一个“数字化的我”。因此,它需要分析个人信息并不断学习用户偏好,从而成为真正了解用户的数字助理。情境式智能是实现个性化的必备条件,而实现情景式智能需要融合多种终端侧传感器的数据(如麦克风、摄像头和陀螺仪)及其他终端侧和终端外数据(见图3)。

图3:情境式智能融合多种传感器和个人信息。

增强个性化的一大好处在于,它能够推动个人助理进一步发展并兼具响应性和主动性。真正的个人助理不仅能够在用户提问时提供个性化的答案,还能基于情境分析进行自主决策和无提示对话。

为进一步提升虚拟助理的个性化程度,Qualcomm AI Research正对终端侧的“AI agent”展开研究,它有望从所有传感器数据中不断学习个人信息,最终实现直观行动。AI agent的关键功能包括情境式融合及学习,这最终将支持个性化响应并丰富我们的生活。初步研究结果已展现出终端侧个性化的远大前景。个性化不仅将提升虚拟个人助理的用户体验,而且将丰富我们生活的方方面面。这项技术将变革众多行业,不断推动行业创新。

(本文内容来自Qualcomm高级总监兼AI研究项目负责人侯纪磊博士的署名博客)

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 传感器
    +关注

    关注

    2550

    文章

    51041

    浏览量

    753098
  • AI
    AI
    +关注

    关注

    87

    文章

    30754

    浏览量

    268902
  • 机器学习
    +关注

    关注

    66

    文章

    8408

    浏览量

    132569
  • 语音交互
    +关注

    关注

    3

    文章

    286

    浏览量

    28003
收藏 人收藏

    评论

    相关推荐

    语音芯片赋能可穿戴设备:开启个性化音频新体验

    语音芯片与可穿戴设备合作,带来定制音效、智能降噪、个性化推荐、语音交互及跨设备共享等,引领个性化
    的头像 发表于 12-14 15:44 403次阅读

    4G模组PWM调光入门:打造个性化呼吸灯

    一直有朋友问我怎么打造个性化呼吸灯,本文我将以合宙低功耗4G模组经典型号——Air780E为例,展示PWM输出呼吸灯的实现方法,帮助大家深入理解如何在项目中应用PWM技术。
    的头像 发表于 11-17 09:56 223次阅读
    4G模组PWM调光入门:<b class='flag-5'>打造</b><b class='flag-5'>个性化</b>呼吸灯

    智慧路灯照明管理系统,呈现个性化城市照明效果

    【智慧城市】智慧路灯照明管理系统,呈现个性化城市照明效果
    的头像 发表于 10-28 14:39 275次阅读
    智慧路灯照明管理系统,呈现<b class='flag-5'>个性化</b>城市照明效果

    AI破解个性化客服难题

    一文汇集多个行业借助 AI 实现的个性化客服实践
    的头像 发表于 10-25 09:06 1876次阅读
    以<b class='flag-5'>AI</b>破解<b class='flag-5'>个性化</b>客服难题

    高速数字化仪的技术原理和应用场景

    高速数字化仪是一种用于采集高速模拟信号,并将其转换为数字信号进行处理和储存的设备。以下是对其技术原理和应用场景的详细介绍:一、技术原理 采样:高速数字化仪的采样率是指每秒钟采样多少次,采样率越高
    发表于 10-21 14:34

    高校转型数字化的原因有哪些

    作为知识传播和创新的重要场所,必须紧跟科技发展的步伐,通过数字化转型来适应这一趋势,确保自身在激烈的竞争中保持领先地位。 提升教学质量与效率: 数字化技术为教学提供了更加丰富、灵活和个性化的手段。通过在线课程、
    的头像 发表于 09-26 10:39 271次阅读

    Meta发布Imagine Yourself AI模型,重塑个性化图像生成未来

    Meta公司近日在人工智能领域迈出了重要一步,隆重推出了其创新之作——“Imagine Yourself”AI模型,这一突破性技术为个性化图像生成领域带来了前所未有的变革。在社交媒体与虚拟现实技术
    的头像 发表于 08-26 10:59 503次阅读

    雷拓科技|专业智慧酒店音视频整体解决方案,打造个性化优质服务

    多样个性化的优质服务,利用智能的系统提高效率、智慧型的管理模式降低人工成本,以及对资源的合理配置以提升酒店的竞争力。 智慧酒店是指酒店拥有—套完善的智能体系,依托大数据、云计算
    的头像 发表于 05-30 13:53 473次阅读
    雷拓科技|专业智慧酒店音视频整体解决方案,<b class='flag-5'>打造</b><b class='flag-5'>个性化</b>优质服务

    亚马逊推出个性化AI歌单功能Maestro,进军音乐市场

    据亚马逊公司透露,其音乐应用程序 Amazon Music 已开始向少量美国用户推出 AI 生成歌单功能 Maestro 的测试版服务。这项服务允许用户利用多样的提示信息(如文本、表情符号及其组合等),迅速生成个性化的歌单。
    的头像 发表于 04-17 16:48 614次阅读

    激光打标机:精准定位,实现个性化标识需求

    激光打标机:精准定位,实现个性化标识需求激光打标机,以其精准定位的特性,成为实现个性化标识需求的得力工具。在现代制造业中,个性化标识已成为产品差异化、品牌塑造和提升附加值的重要手段。激光打标机通过其
    的头像 发表于 03-19 19:43 504次阅读
    激光打标机:精准定位,实现<b class='flag-5'>个性化</b>标识需求

    打造专属高清视频转换器:满足个性化视频转换需求

    随着视频技术的不断进步和多样,用户对视频格式转换的需求也日益增长。标准的视频转换器虽然能够满足大部分用户的需求,但对于那些有特定需求或希望实现更高效、更个性化转换的用户来说,打造专属的高清视频
    的头像 发表于 02-22 14:29 306次阅读

    个性化定制,提升运营效率:SAP二次开发引领企业数字化转型

    的解决方案,助力其实现数字化转型,提高运营效率,迎接不断变化的业务需求。 提升企业运营效率,打造个性化管理工具 SAP二次开发服务可以根据企业的特定需求,深入定制现有的SAP系统,为企业提供
    的头像 发表于 02-18 13:29 415次阅读

    数字化管理成为了企业数字化转型的重要支撑

    数字化转型是企业发展的重要趋势,数字化管理是支撑。RFID技术广泛应用于各个领域,结合数字化和智能技术,企业可实现全面智能管理,提升核心
    的头像 发表于 02-03 11:43 476次阅读
    <b class='flag-5'>数字化</b>管理成为了企业<b class='flag-5'>数字化</b>转型的重要支撑

    数字化IP网络广播在教育领域的应用与影响

    ,提供更加多元个性化的教学服务。通过数字化技术,IP网络广播可以实现音频信号的高质量传输和播放,提供清晰、稳定的音频效果。同时,IP网络广播还可以支持多种音频格式和传输协议,满足不同教学场景的需求。 其次,
    的头像 发表于 01-23 15:00 471次阅读
    <b class='flag-5'>数字化</b>IP网络广播在教育领域的应用与影响

    如何借助数字化技术打造TPM管理新模式?

    在企业运营中,数字化技术具有不可替代的作用。尤其在设备管理领域,借助数字化技术打造全新的TPM(全员生产维护)管理模式已经成为企业发展的必经之路。那么,如何借助数字化技术
    的头像 发表于 01-02 10:12 456次阅读