揭秘语音交互：个性化AI打造“数字化的你”-电子发烧友网

从更精美的照片、更高的安全性到更自然的用户界面（UI），人工智能（AI）正以无缝的方式更多地丰富我们的生活。高能效和个性化是Qualcomm AI Research的核心研究领域，因为它们对于下一代无处不在的智能用户体验而言不可或缺。终端侧AI正在支持虚拟助理的发展，而个性化正成为今天的虚拟助理和未来真正个人助理之间的主要差异。

AI驱动语音交互革命

语音是我们一直期盼的变革性交互方式，它可以提供用户与终端间的自然交互，而无需任何手部操作。先进的语音交互具有始终开启、对话式、个性化和私密的特征，可支持我们进行高效且自然的对话。从智能手机、智能音箱到扩展现实（XR）设备和汽车，语音交互正在众多产品种类中日益发展和普及。

要实现端到端的语音交互体验，其中需要多个组件的支持（见图1）。语音交互的流程是这样的：首先麦克风采集语音信号，然后是语音预处理、语音激活、语音识别和自然语言理解，最终是终端通过语音合成的方式响应用户。由此可见，端到端的语音交互是个多步骤的复杂流程。

图1：语音交互的功能组件。

为什么今天语音交互变得如此普及？一个重要因素是，机器学习已经点燃了语音交互的革命。机器语音识别的准确率正不断逼近95%，达到与人类准确率相当的水平。当机器准确率不能达到人类的水平，整个语音交互过程就没法做到对话式的自然高效交流，因此用户体验会有显著下降。机器学习技术可应用于几乎所有的语音交互组件之上，从而提升各方面及整体的交互体验。

终端侧的语音交互至关重要

因计算、内存和功率的限制，主要语音交互组件（如自动语音识别和自然语言处理）传统上都由云端AI所支持。但是，终端侧处理具有众多独特的优势，包括更快的响应速度、更高的可靠性和更好的隐私保护。尤其是在私密性方面，今天的消费者渴望把数据掌握在自己手中，并且有权选择是否将数据发到云端进行处理或存储。因此，更多在终端上进行处理并为云端功能提供补充，这是目前行业的重要趋势之一。而其中的主要挑战在于，需要在移动终端的功耗和散热限制下运行并实现复杂的语音交互功能。

图2：语音交互的主要组件正向终端侧迁移。

Qualcomm正积极应对这项挑战，并把低功耗的终端侧AI应用于语音交互组件之上。以下是几个例子：

1、语音降噪将带噪语音处理成清晰语音并输出，这在嘈杂环境中尤其重要。Qualcomm AI Research正在开发一个降噪深度学习模型，该模型与传统方法相比有显著的性能提升，并具有较高效率可在助听器这样非常受限的处理能力、功耗和散热条件下运行。

2、自动语音识别将语音转录为文本。测试表明，深度学习技术可在移动终端上实现顶级的语音识别准确率。Qualcomm AI Research已经完成了一个深度学习声学模型的训练并使其适应每个用户的口音和环境，从而提高个性化程度。

今天，终端侧的语音交互已经成为现实。Qualcomm AI Research已经可以在终端侧实现整体的端到端语音交互处理，并在2018年的CES大会上演示了智能家居中的端到端语音交互体验。在适应口音和环境后，这项演示对特定领域的指令集已经可以实现超过95%的意图理解准确率。

个性化成就真正的虚拟助理

真正的虚拟助理是在终端里面有一个“数字化的我”。因此，它需要分析个人信息并不断学习用户偏好，从而成为真正了解用户的数字助理。情境式智能是实现个性化的必备条件，而实现情景式智能需要融合多种终端侧传感器的数据（如麦克风、摄像头和陀螺仪）及其他终端侧和终端外数据（见图3）。

图3：情境式智能融合多种传感器和个人信息。

增强个性化的一大好处在于，它能够推动个人助理进一步发展并兼具响应性和主动性。真正的个人助理不仅能够在用户提问时提供个性化的答案，还能基于情境分析进行自主决策和无提示对话。

为进一步提升虚拟助理的个性化程度，Qualcomm AI Research正对终端侧的“AI agent”展开研究，它有望从所有传感器数据中不断学习个人信息，最终实现直观行动。AI agent的关键功能包括情境式融合及学习，这最终将支持个性化响应并丰富我们的生活。初步研究结果已展现出终端侧个性化的远大前景。个性化不仅将提升虚拟个人助理的用户体验，而且将丰富我们生活的方方面面。这项技术将变革众多行业，不断推动行业创新。

（本文内容来自Qualcomm高级总监兼AI研究项目负责人侯纪磊博士的署名博客）

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

传感器

传感器

+关注

关注
2554

文章
51566

浏览量
757687
AI

AI

+关注

关注
87

文章
32012

浏览量
270869
机器学习

机器学习

+关注

关注
66

文章
8458

浏览量
133215
语音交互

语音交互

+关注

关注
3

文章
288

浏览量
28098

Melexis LED驱动方案助力汽车制造商打造个性化车内空间

汽车内饰氛围灯，早已不再是简单的照明工具，更是提升驾乘体验、展现个性化风格的重要元素。从静态的色彩点缀到动态的灯光秀，车内灯光正变得越来越智能、复杂。面对这一趋势，Melexis提供一系列高性能LED驱动方案，以卓越的性能、灵活的扩展性和强大的通讯能力，为汽车制造商打造梦

发表于 02-21 17:04 •324次阅读

数字化领航：打造设备管理新生态

本文深入剖析了数字化设备管理系统的进化逻辑与实践路径，提出传统设备管理的三重困局和数字化重构的三个核心能力升级。

发表于 02-20 10:24 •100次阅读

<b class='flag-5'>数字化</b>领航：<b class='flag-5'>打造</b>设备管理新生态

三星发布Vision AI，打造个性化AI屏幕体验

近日，在2025年国际消费电子展(CES 2025)“First Look”活动上，三星震撼发布了其最新的科技成果——三星Vision AI。这一创新技术旨在通过个性化的AI屏幕体验，为用户带来

发表于 01-14 14:58 •350次阅读

解锁个性化语音交互新时代：九芯智能语音云平台，让创意声音触手可及！

九芯智能语音云平台提供全面高效安全的智能语音服务，支持自定义语音内容，简化烧录流程，依托AI技术，助力各行业智能化升级，引领

发表于 01-02 16:51 •238次阅读

解锁<b class='flag-5'>个性化</b><b class='flag-5'>语音</b><b class='flag-5'>交互</b>新时代：九芯智能<b class='flag-5'>语音</b>云平台，让创意声音触手可及！

语音芯片赋能可穿戴设备：开启个性化音频新体验

语音芯片与可穿戴设备合作，带来定制化音效、智能降噪、个性化推荐、语音交互及跨设备共享等，引领个性化

发表于 12-14 15:44 •543次阅读

4G模组PWM调光入门：打造个性化呼吸灯

一直有朋友问我怎么打造个性化呼吸灯，本文我将以合宙低功耗4G模组经典型号——Air780E为例，展示PWM输出呼吸灯的实现方法，帮助大家深入理解如何在项目中应用PWM技术。

发表于 11-17 09:56 •329次阅读

智慧路灯照明管理系统，呈现个性化城市照明效果

【智慧城市】智慧路灯照明管理系统，呈现个性化城市照明效果

发表于 10-28 14:39 •463次阅读

以AI破解个性化客服难题

一文汇集多个行业借助 AI 实现的个性化客服实践

发表于 10-25 09:06 •1974次阅读

高速数字化仪的技术原理和应用场景

高速数字化仪是一种用于采集高速模拟信号，并将其转换为数字信号进行处理和储存的设备。以下是对其技术原理和应用场景的详细介绍：一、技术原理采样：高速数字化仪的采样率是指每秒钟采样多少次，采样率越高

发表于 10-21 14:34

高校转型数字化的原因有哪些

作为知识传播和创新的重要场所，必须紧跟科技发展的步伐，通过数字化转型来适应这一趋势，确保自身在激烈的竞争中保持领先地位。提升教学质量与效率： 数字化技术为教学提供了更加丰富、灵活和个性化的手段。通过在线课程、

发表于 09-26 10:39 •357次阅读

Meta发布Imagine Yourself AI模型，重塑个性化图像生成未来

Meta公司近日在人工智能领域迈出了重要一步，隆重推出了其创新之作——“Imagine Yourself”AI模型，这一突破性技术为个性化图像生成领域带来了前所未有的变革。在社交媒体与虚拟现实技术

发表于 08-26 10:59 •755次阅读

雷拓科技｜专业智慧酒店音视频整体解决方案，打造个性化优质服务

多样化、个性化的优质服务，利用智能化的系统提高效率、智慧型的管理模式降低人工成本，以及对资源的合理配置以提升酒店的竞争力。智慧酒店是指酒店拥有—套完善的智能化体系，依托大数据、云计算

发表于 05-30 13:53 •561次阅读

亚马逊推出个性化AI歌单功能Maestro，进军音乐市场

据亚马逊公司透露，其音乐应用程序 Amazon Music 已开始向少量美国用户推出 AI 生成歌单功能 Maestro 的测试版服务。这项服务允许用户利用多样化的提示信息（如文本、表情符号及其组合等），迅速生成个性化的歌单。

发表于 04-17 16:48 •690次阅读

大型企业采用无纸化交互系统，推动数字化转型

随着数字化浪潮的席卷，大型企业纷纷加速自身的数字化转型进程，以适应日益激烈的市场竞争和客户需求。在这一过程中，讯维无纸化交互系统以其高效、便捷、环保等特点，成为众多大型企业推动数字化转

发表于 03-21 15:07 •387次阅读

激光打标机：精准定位，实现个性化标识需求

激光打标机：精准定位，实现个性化标识需求激光打标机，以其精准定位的特性，成为实现个性化标识需求的得力工具。在现代制造业中，个性化标识已成为产品差异化、品牌塑造和提升附加值的重要手段。激光打标机通过其

发表于 03-19 19:43 •606次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

揭秘语音交互：个性化AI打造“数字化的你”

评论

Melexis LED驱动方案助力汽车制造商打造个性化车内空间

数字化领航：打造设备管理新生态

三星发布Vision AI，打造个性化AI屏幕体验

解锁个性化语音交互新时代：九芯智能语音云平台，让创意声音触手可及！

语音芯片赋能可穿戴设备：开启个性化音频新体验

4G模组PWM调光入门：打造个性化呼吸灯

智慧路灯照明管理系统，呈现个性化城市照明效果

以AI破解个性化客服难题

高速数字化仪的技术原理和应用场景

高校转型数字化的原因有哪些

Meta发布Imagine Yourself AI模型，重塑个性化图像生成未来

雷拓科技｜专业智慧酒店音视频整体解决方案，打造个性化优质服务

亚马逊推出个性化AI歌单功能Maestro，进军音乐市场

大型企业采用无纸化交互系统，推动数字化转型

激光打标机：精准定位，实现个性化标识需求