智能座舱的语音交互系统技术应用

动机

出于学习-总结的目的，在我从什么是智能座舱、智能座舱的发展驱动因素、智能座舱的构成要素三个方面梳理我对智能座舱的基础认识之后，为了加深“智能座舱产品入门”课程中语音交互部分知识的理解，我从什么是语音交互、语音交互的底层技术、智能座舱的语音交互等方面，对智能座舱语音交互系统相关的知识进行了梳理与总结。

一.什么是语音交互

语音交互：语音是方式，交互的对象是任何的智能设备，顾名思义，即通过语音的方式完成人与机的交互。

在现今的各种智能化场景中，语音交互已成为一种非常关键的人机交互方式。从用户的角度来看，语音交互的核心价值主要体现在释放用户的双手，使得人与机之间的交互变的更高效便捷。

然而，从用户发出语音指令到实现与智能设备的交互，其过程并不像其名词描述的那么简单，要实现通过语音来完成人机交互，要解决解决三个关键问题，如何让机器听清用户的语音内容？如何机器理解用户的意图？如何让机器执行用户的意图？，解决这些问题的的过程是复杂的，其背后涉及到多个复杂的技术环节，如语音识别、自然语言理解、对话管理、自然语言生成、语音合成等。

二.语音交互的底层技术

(一).语音识别

在语音交互系统中，用户的语音信号需要经过多个处理阶段才能得出正确的结果，而语音识别是实现语音交互的第一步，其在语音交互系统中负责对用户的语音信号进行前置处理，通过对用户语音信息的预处理、解码等关键任务，最终得到语音信号对应的文本内容，从而实现机器听清的用户的语音内容。

1.语音输入：用户通过麦克风输入内容语音，例如：打开空调

‍2.预处理：预处理是语音识别过程中的一个基础性步骤，它的意义在于对录音文件进行分帧、去除噪音、语音增强、加窗等预处理，提取出有效的声音特征，用于后续的语音内容分析处理。

去除噪音：由于用户环境因素影响，MIC设备录制的声音，除了人声，可能还会包各种噪音，那么为了语音识别的准确性，在识别前就需要先处理掉原始音频中的噪音部分。去除噪音的实现过程大体可以理解为：首先提取原始音频中声音的频率、时域、能量等特征，通过对这些特征的对比分析区分原始音频中的人声和其他声音，然后通过滤波、降噪算法（基于频域的傅里叶变换、小波变换，或者基于时域的信号平滑法）等手段，实现去除噪声的目标。

预加重：在语音输入的过程中，由于环境和距离等影响因素，MIC录制声音可能会出现高频衰减和低频增益等失真现象，这将会影响后续语音识别的结果。

例如：用户的语音内容为“apple”，由于高频信号被衰减掉，录制的声音中可能只留下了“p”和“l”的较强信号，这将导致语音识别系统误认为说的是“pl”而不是“apple”。针对这种现象，预加重通过加强高频成分的能量和减少低频成分的能量，让不同频率的音频信号能够在信号处理过程中均衡化，从而提高语音识别的准确性。

为了更形象的理解“预加重”，可以将其类比于在图像中的“锐化”，使得边缘更为清晰。

分帧：原始语音信号是一个连续的波形，是一种时间和频率上都变化较快的信号，在语音识别的过程中，如直接对连续且长的语音进行计算处理，会增加计算的难度降低识别的准确性。因此，为了提高语言识别结果的准备性，需要将连续且长的语音信号分为若干个固定长度的帧，分帧后每帧内的信号的频谱变化就会较为缓慢、稳定。

例如：以“打开空调”为例，假设录制的语音时长为2秒，采样率为16000Hz，那么原始语音信号就是一个长度为32000的一维向量，如果直接对这个声音信息进行语音识别，计算量会非常大，而且由于语音信号的频率和幅度变化非常快，很难进行有效的特征提取。

特征提取：完成去噪、预加重、分帧等前端处理后的语音信号，不能直接用于识别，还需要将其变换到频域，然后利用线性预测倒谱系数(LPCC)和 Mel 倒谱系数(MFCC)等方法，从语音信号中提取用来描述语音信号的各种特征，以便识别模型能够更好地对其进行分析和区分，这些特征包括：帧能量、音调（调子、语气等）、基音频率、音周期、共振峰、谐波结构、声道特性等。

为了更加形象的理解“特征提取”，可以将其类比为制作抖音电影解说短视频，在制作的过程中，你需要从完整的电影中筛选出最精彩、最有代表性的片段，需要对整部电影进行剪辑，然后把这些片段组成一部短视频，以便于快速地展现电影的精华和主题。

其他：原始音频的预处理，除了去除噪音、预加重、分帧，还有加窗、语音信号能量归一化、频率滤波、动态特征等，具体可以参考专业资料。

3.解码：在完成原始音频信号的预处理与特征提取之后，需要将提取到的特征输入语音识别模型中通过声学模型、词典、语音模型的协同计算来得到最终的识别结果。

声学模型：声学模型负责对语音信号进行特征提取和处理，生成一系列特征向量，然后使用这些特征向量来计算每个可能的音素的得分，并根据得分选出最可能的音素序列。

词典：在生活中，我们有认识的字的时候，可能会通过网络搜索或查字典的方式去寻找答案。在语音识别系统中，也有需要一个词典，用于识别音素对应的汉字（词）或者单词。语音识别系统中的词典包括了一系列的词语和它们对应的音素序列，这些音素序列反映了词语在语音信号中的语音学特征和发音方式，通过将语音信号的实际发音与词典中存储的发音进行匹配，语音识别系统可以推算出说话人所说的词语。

语言模型：在通过声学模型与词典，得到一组候选词语或句子的情况下，最后需要通过语言模型得到符合用户表达内容的结果。语音模型的作用就是通过统计文本中词与词之间的关系和概率，预测一个词语或句子出现的概率大小，从而对识别出的多个文本候选结果进行打分、排序和筛选，最终，得分最高的结果就是系统认为最符合用户表达内容的结果。

举个例子，如果用户说的是“我想要一杯咖啡”，在语音识别的过程中，可能会产生如下多个候选句子：我向要一杯咖啡我想要一辈咖啡我想要一杯可菲我向要一杯咖啡色菲语言模型通过预测每个识别候选结果的概率大小，就可以计算出每个候选结果的得分，从而筛选出最符合用户表达内容的最终结果，“我想要一杯咖啡”。‍

4.输出结果：指最终输出识别结果，即转换后的文本或指令等形式的结果。

(二)自然语言处理

1.自然语言理解

在完成用于语音内容的识别之后，要让设备能顺利执行用户的意图，还需要自然语言处理（NLP）算法模型对计算机可识别的文本进行分析和处理，以理解用户语言的含义和意图，并根据需要进行相应的回答或操作，一般情况下，NLP算法模型对文本的处理过程包括包括词法分析、句法分析、语义分析等多个环节。

预处理：为了降低文本处理的复杂度，提高算法的精度和效率，文本本输入自然语言理解模型前，需要先进行预处理，如去掉句子中的特殊字符、停用词、将所有字母变成小写等。

例如：停用词是指一些在自然语言中使用比较频繁但实际上并不具有实际含义，对于句子的语义理解贡献较小的一些词语，比如一些代词、介词、连词等等（如“的”、“和”、“就”、“在”、“用”等），这些停用词虽然常常出现在文本中，但是对于计算机理解句子的真实含义并没有太大帮助，只会增加文本处理的复杂度，降低算法的精度和效率。

分词：自然语言理解模型，在理解在自然语言文本时，不是整句直接分析的，而时通过对自然语言文本的每个组成部分（如单词、短语等）的含义进行深入的分析和理解，进而确定整个文本的含义。因此，在对文本进行预处理之后，需要对文本进行分词操作，将文本按照一定的规则切分成一个个词语，它的目的是将文本转化为计算机可以处理的离散的词语序列。举个例子：以“导航去宝安机场”为例，通过分词，可以得到以下词语序列：导航 / 去 / 宝安机场。

词性标注：对每个词语进行词性标注，即确定每个词语在句子中的词性，通过对每个词语进行词性标注，可以确定词在句子中的语法角色和含义，从而更准确地进行语义分析、句法分析等任务。常见的词性包括名词、动词、形容词、副词、介词、连词、代词、数词、量词、助词、叹词等。

‍举个例子：以”导航去宝安机场“为例，”导航”：名词、“去”：动词，“宝安”：名词，“机场”：名词，通过这样的词性标注，可以分析出“导航”为主语，“去”为动词，表示导航的动作，“宝安”、“机场”由于都是名词，可以确定它们是导航的目的地。

实体识别：指从文本中识别特定实体，例如如人名、地名、组织机构名等，通过实体识别，计算机可以更准确地理解文本中的内容。

‍举个例子：以”导航去宝安机场“为例，实体识别可以识别出“宝安机场”是一个地名实体，通过这一步得到的结果，计算机可以更好地理解用户的意图。

句法分析：对句子的语法结构进行分析，确定句子中各个词语之间的关系，其意义在于理清句子中的语法结构和词语关系以便于计算机进一步理解语音交互中的用户意图。举个例子：以“导航去宝安机场”为例，句法分析可以将这个句子分析为“导航去宝安机场”，从中获取到“导航”是动作， “去”是一个方向，“宝安机场”是具体的地点信息，这些信息对于计算机进行后续处理是非常重要的。

语义分析：在完成预处理、分词、词性标注、实体识别、句法分析等前置任务之后，接下来就需要进行最后的语义分析，例如：情感分析、主体提取、语义联想、语义角色标注、槽位信息等，其主要意义是更全面地理解用户输入的意图，帮助计算机能够更好地理解用户输入的内容，从而根据用户意图执行相应的操作。

举个例子：以“导航去宝安机场”为例，经过语义分析后，计算机可以清晰地理解用户的意图，即需要进行导航操作，并且目的地是宝安机场。

结果输出：将经过预处理、分词、词性标注、实体识别、句法分析、语义分析处理后的结果，按结构输出给自然语言处理中的对话管理模块，进行进一步处理。举个例子：以“导航去宝安机场”为例，自然语言理解最终输出的结果为“动作-导航，目的地-宝安机场，起点-当前位置。”

2.对话管理

在自然语言理解对语音识别的文本进行分析处理之后，需要对话管理系统进行意图识别，确定用户想要做什么，并且根据所处的对话状态进行状态跟踪，决定下一步需要执行的操作或回复用户的方式，这个过程包括根据用户输入的信息选择相应的策略、控制多轮对话流程、解决歧义等。对话管理系统是基于一个预先定义好的对话模型工作，对话模型中定义了对话流程、对话状态、对话策略等，在对话管理过程中，系统会使用这个对话模型来处理用户的请求。

意图识别：在通过自然语言理解对文本的分析处理，得到用户意图的关键词之后，对话管理系统负责将用户意图的关键词与预设的意图库（或指令库）进行对比来确定用户的意图，并进一步决定下一步的操作。举个例子：以“打开空调”为例，语音助手接收到语音信号后，会先进行语音识别，将语音信号转化为文本，然后，自然语言理解系统会对转化后的文本进行解析，提取其中的关键词和语义信息，比如“打开空调”，理解用户的意图，接下来，对话管理系统会根据用户的意图进行响应。

‍

对话状态跟踪：指的是记录和维护整个对话过程中的各个状态信息，以便在后续的对话中进行参考、分析和处理，状态信息包括上下文、用户意图、技能选择等等。

举个例子：当用户询问“今天下雨吗？”，对话管理系统可以通过状态跟踪，结合当前的用户意图和上下文信息，快速准确地回答用户问题。

3.自然语言生成

在语音交互系统中，当对话管理系统确定要继续与用户对话或反馈执行结果的时候，此时需要自然语言生成模块根据对话管理系统的指令，从相关的知识库或语料库中提取信息，以及根据语境和上下文信息，将结构化数据转化为自然、逻辑连贯的文本，以人类语言回答用户的问题、提供建议或执行任务，其生成自然语言的过程一般包括：句法分析、语义分析、语法分析、信息抽取、输出文本等步骤。

举个例子，当用户询问“明天的天气如何？”时，自然语言生成模块可能会根据当前的时间和位置信息，生成类似于“明天的天气为晴天，最高气温27℃，最低气温18℃”的文本回复内容。

(三).语音合成

在通过语音识别、自然语言理解、对话管理、自然语言生成对用户的语音信息进行分析处理之后，最后想要机器开口与人交流，则需要语音合成系统将自然语言文本转化为语音并通过输出设备输出给用户。

语音合成系统既是语音交互的终点也是起点，是语音交互系统的的重要底层技术之一,它基于语言模型、声学模型、音频处理等技术，通过文本前置处理、声学特征生成和音频合成等关键步骤，将自然语言文本合成为高质量、自然流畅的人类语音。

1.文本前置处理：在计算机获得一段文本之后，要让计算机像人类一样开口讲这段文本讲出来，首先需要让机器知道文本中字、词如何发音和文本要表达的意思与文本里蕴含的情绪。因此，在语音合成系统中，第一个关键任务对文本的前置处理，具体包括：分词、词性标注、句法分析、韵律预测、字形转音素、对音字与变调分析等。举个例子：举个例子，比如输入一段文本：“明天下雨，出门记得带伞。”在文本前置处理的过程中，可能需要经过分词、音素标注和添加天气标签的处理，变成：“明天/t 下雨/v ，出门/v 记得/v 带/v 伞/n ，天气/t 标签/rainy。”

2.声学特征生成：要想让机器像人类一样将自然语言文本内容有韵律、顿挫、情感地说出来，就需要让机器知道自然语言文本中每个音素的声学特征，包括基频、时长、频谱形态等，这些声学特征是语音信号的特征，用于描述和控制语音信号的音色、音高、节奏等方面。因此，在完成文本预处理后，要将自然语言文本内容合成为最近人类表达的语音内容，就需要先将自然语言文本转换成发音单元（音素），然后利用特定的算法将音素序列转化为对应的声学特征。

3.音频合成：这一步是将前面处理好的声学特征和文本信息进行结合，最终合成音频文件，作为语音合成系统的输出。具体来说，关键任务包括：波形合成、合成后处理等。

小结：以上我从产品的视角，基于课程内容、专业资料结合自身的理解，梳理的我对语音交互系统底层关键技术的理解，目的不在于学习语言交互相关的具体技术知识，而是知其大概原理。如存在歧义，欢迎交流，并建议参考相关的专业书籍与资料。

三.智能座舱的语音交互

(一).语音交互对智能座舱的意义

在传统的汽车座舱内，存在着大量的传统机械和电子设备，驾乘人员在执行驾驶任务或使用汽车功能时，需要不断地操作各种控制器和按钮，以控制车辆的速度、方向、功能等，这些操作可能同时占用驾乘人员的双手、手眼、双脚，不仅繁琐和复杂，还容易导致驾驶疲劳和注意力不集中，从而增加驾驶安全的风险。

因此，为了提高汽车驾驶的安全性和舒适性，语音交互系统被应用在汽车智能座舱中。语音交互系统通过语音交互的方式来代替部分驾驶操作，从而可以让驾乘人员的双手、手眼、双脚更多地用于安全驾驶和应急操作。例如，驾乘人员可以使用语音指令来操控空调、导航系统、音乐播放器等，而不需要手动操作控制面板，减少了驾驶员的分心和疲劳，在一定程度上提高了驾驶安全性和方便性。

从消费者的角度来看，语音交互系统不仅可以通过被动的接收用户的指令，帮用户高效地完成人与车交互，而且可以为通过主动式的交互为用户带来更智能化、情感化的人车交互体验。在当前“人机共驾”阶段，语音交互是座舱内最直接、最人性化、最完全的交互方式。

从厂商的角度来看，由于语音交互系统具备较大个性化、自定义空间，厂商可以基于结合品牌定位与用户需求，为用户打造具有差异化特征语言交互系统，在品牌差异化发展中发挥着重要的作用。另外，基于用户的个性化需求，在基础语音服务的基础上衍生除很多付费服务场景，例如，在samrt精灵1号上，付费的语音助手形象，付费的音助手装扮。

(二).智能座舱语音交互场景

基于用户、场景、需求，以语音交互系统为起点，我们可以将智能座舱语音交互的场景抽象的分为主动交互场景和被动交互场景。

1.被动交互场景：当我们在讨论“人机交互”时，大部分情况讨论的是“被动式交互”，它的实现逻辑很简单，即由人给机器发号施令，机器执行并输出结果反馈给人。如，传统的被动式语音交互，是由用户主动向机器输入语音指令，然后由机器对用户的音指令进行分析、处里并执行，以实现特定的功能，其能为用户提供的最大价值仅仅是“君子动口不动手”。

在人与车的交互场景中，被动式的语音交互，仅能实现的是“不动手”地去实现车身功能、信息娱乐的功能的控制。这种被动式的交互，在某些情况下还是会分散用户的注意力，从而造成安全隐患，例如：用户在发起语言指令的时候，视线和注意力可能会从驾驶任务上转移。

2.主动交互场景：不同于被动式交互，主动式交互以机器为起点，机器可以自己主动地输入信息，主动输出执行结果或建议给用户。

在人与车的交互场景中，语音交互系统可以与其他模态交互融合，基于人、车状态和内外部环境，通过传感器、摄像头等设备主动输入信息进行决策判断，为用户提供主动的服务，例如：主动关怀服务、提醒服务、推荐服务等，主动式的语音交互，在一步提高人车交互效率的同时，还可以为用户提供更加智能化、情感化的人交互体验。

(三).智能座舱语音交互系统基础框架

智能座舱的语音交互系统是一个高度复杂的综合系统，它不仅需要精密的硬件与软件协同配合，同时需要专业的运营管理来保障其可靠性和稳定性。总的来看，整个系统可以分为硬件层、服务层、应用层和运营管理平台四个组成部分。

1.硬件层：在语音交互系统中，硬件层是智能座舱语音交互系统的物理基础，关键的硬件设备包括输入/输出设备和音频处理芯片，其中输入/输出设备负责采集用户的语音指令和反馈信息，主要包括：麦克风阵列、扬声器、摄像头、传感器、灯光等，芯片部分主要负责音频信号的处理与分析，主要包括数字信号处理器(DSP)、音频解码器、音频放大器等。

2.服务层：服务层是智能座舱语音交互系统的核心，它承担着语音、图像等信息的处理和解析，并提供必要反馈和响应的重要任务。主要包括自然语言处理(NLP)引擎、语音识别引擎、语音合成引擎、声纹识别、云端服务、API服务、业务逻辑处理服务等模块。

3.应用层：应用层是指基于服务层提供的核心能力与用户的实际需求相结合，为用户提供的具体应用程序，以帮助用户通过语音交互实现具体的功能控制。例如，车身控制模块中的空调控制、座椅控制、车窗控制等应用，以及信息娱乐模块中娱乐、通讯、导航等应用。

4.运营管理平台：用户在使用语音交互系统的过程中，会产生大量的用户行为数据与音频、文本、图像数据，运营管理平台通过对这些数据的统计分析，为语音交互系统与各种AI模型的持续优化提供数据支持。从业务角度分类，运营管理平台主要分为两大核心模块：用户数据统计分析和模型数据运营。

用户数据统计分析模块，可以对实车用户使用语音交互系统的行为数据进行统计和分析，从而生成不同维度、不同粒度的分析报表。这些报表可以帮助我们深入了解用户使用习惯和偏好，及时发现并解决系统存在的问题，为语音交互系统的优化提供数据依据。

模型数据运营模块，可以通过对用户在使用语音交互系统过程中产生的大量音频、文本、图像数据的定期回收与采集、标注，生产出各个AI模型需要的数据，为模型训练提供数据支持。

编辑：黄飞

阅读全文

语音交互(27795) 语音交互(27795)
智能座舱(15904) 智能座舱(15904)

语音交互技术为更好智能硬件而来

核心来谈智能硬件那都是在耍流氓。而语音识别作为特别自然、学习成本低的交互方式势必会成为智能硬件主流技术，同时也是整个物联网的关键部分。

2015-11-12 18:37:27

1970

智能座舱人机交互技术发展与座舱检测的传感器模块应用探讨

人脸；指纹识别、语音/手势交互、多屏联动等高科技技术，目前的汽车智能座舱在环境感知、信息收集与处理的能力得到显著增强，成为人类驾驶的“智能小助手”。智能座舱告别简单电子化进入智能助理阶段的一个显著标志是人与

2022-07-04 19:06:08

2621

智能交互新入口——语音识别【技术周刊】

虚拟现实技术无疑是今年科技圈关注的焦点，其交互方式也引发了多方讨论。除了虚拟现实，智能家居、智能汽车等也不再满足于现有的交互方式，语音识别技术为这些应用带来了新选择。通过本技术周刊，你不仅能了解语音识别的发展及原理，还能掌握行业动态，同时也可以获得语音识别开发的芯片和平台资源。

2016-12-01 18:05:56

8170

智能汽车的交互战场：AR-HUD量产上车，智能座舱加速升级

电子发烧友网（文/莫婷婷）随着语音识别、人脸手势识别等技术的快速发展，汽车座舱内的交互体验也在不断升级。在智能汽车迈向高阶自动驾驶过程中，全系影像技术开始进入车载显示领域，开启人车交互新窗口

2021-11-14 08:21:47

4999

作为第三生活空间，智能座舱如何先声夺人？

的听觉体验和反馈，也会在音响系统方面大幅改进。综合而言，目前声学系统在智能座舱的应用主要分为两个方面，其一是智能语音交互，其二是沉浸式音响系统。智能座舱的语音交互系统智能座舱的语音系统被称为VOS（语音操作

2022-11-08 09:30:44

1649

智能座舱交互体验持续升级，传感器件功不可没

卖点。智能座舱是基于智能化、万物互联通过整合驾驶信息和车载应用，利用车载系统的强大信息数据处理能力，为驾驶者提供高效且科技感的驾驶体验的概念。智能座舱由硬件、软件、交互三大部分组成。智能交互与智能表面在智能座舱的

2023-10-10 00:08:00

880

智能硬件开发，我们需要知道哪些技术

开放的第三方语音云平台为开发者提供了良好契机。其中讯飞开放平台作为全球首个面向开发者提供智能交互服务的领先平台，全面开放了业界最领先的语音合成、语音识别、语义理解、语音唤醒等技术，只需开发集成

2015-06-18 10:27:16

智能音箱混战远场语音交互只是开始

　　导读：远场语音交互开始是智能音响，但是将来绝对不仅仅是智能音响，技术还会扩展到很多其他的产品。　　7月5日，阿里推出了自己的首款消费级AI产品天猫精灵X1，同日百度也宣布了DuerOS开放

2017-07-17 09:37:59

语音交互系统

能帮我写语音交互程序吗？硬件：MCU为STC89C52；SYN6288 TTS 语音合成模块；语音识别模块 LD3320芯片非特定语音；SD卡储存。要求：用SD 卡储存语音数据（txt格式）其中

2013-05-11 16:00:38

语音接口技术了解

语音接口已经成为一个改变人机交互方式的全新切入点。这些系统如何工作？打造这样一款设备在硬件方面有什么要求？随着语音控制接口变得越来越普及，德州仪器（TI）的一位工程师对此技术进行了深入的了解，并分享了其对这项技术的认识和看法。

2019-07-19 08:45:54

语音识别技术的概念及应用前景

智能语音技术是人工智能应用最成熟的技术之一，并拥有交互的自然性，就是让智能设备听懂人类的语音。它是一门涉及数字信号处理、人工智能、语言学、数理统计学、声学、情感学及心理学等多学科交叉的科学。智能语音

2023-05-27 09:41:03

语音识别系统在智能家庭系统中的应用是什么？

2021-05-31 06:54:34

AITO问界M5率先搭载HarmonyOS智能座舱

座舱,重构智能便捷安全AITO问界M5最让人津津乐道的就是HarmonyOS智能座舱,它的神奇之处到底体现在哪些方面?首先是在操控的体验上,HarmonyOS智能座舱带来了极简交互、统一的通知和控制中心

2021-12-29 13:56:28

Azero + SoundPi 智能语音交互软硬一体化开发套件

://azero.soundai.com/二、SoundPi是啥？SoundPi Mini Board是智能语音交互软硬一体化开发板，支持Linux操作系统。为开发者和中小企业客户提供低成本的语音进入

2020-06-28 17:55:59

HarmonyOS智能座舱体验是怎样炼成的？立即查看

交互之外，可以利用的还有车内的音响、灯光、空调、座椅、车窗等硬件，以及人脸识别，位置识别、光线识别等能力。下面用两个实际案例为大家介绍HarmonyOS智能座舱内软硬件联合体验——小憩模式、K歌

2023-01-11 11:03:11

【平头哥CB5654语音开发板试用连载】智能取货机器人语音交互模组

项目名称：智能取货机器人语音交互模组试用计划：申请理由本人在机器人控制有七年多的学习和开发经验，曾参与设计过类似巡检机器人，参与语音交互硬件开发，对语音识别技术有过深入的学习和探索。想借助发烧友论坛

2020-02-25 16:05:31

【Gokit 3试用体验】通过Lark 7618模组实现语音交互+语音交互UI设计理念

语言是人类交互最自然最舒适的方法，而今天，机智云Gokit 3上Lark7618智能语音识别模块提供了一个很好的外围音频实时采集电路，以及快速的音频合成输出系统，有这两样，加持Gokit板载的上位机

2016-08-28 13:46:16

【MYD-Y6ULX申请】语音交互前端信号处理板

技术/语音信号前端处理技术有过深入的学习和探索。想借助发烧友论坛和米尔MYD-Y6ULX探索高性价比的语音交互前端信号处理的商业化。项目计划①根据文档，对米尔MYD-Y6ULX快速入门②通过学习米尔

2018-01-22 10:34:52

【润和软件DAYU200开发板体验】DAYU200开发板搭建智能座舱开发

常新。整个鸿蒙智能座舱不仅包括HarmonyOS基础平台，还有华为的UIUX人机交互、HarmonyOS分布式能力、HarmonyOS智慧能力、华为车载智慧屏和HUAWEI SOUND车载音响系统。这

2022-11-06 19:43:23

云知声-蜂鸟-智能语音

蜂鸟系列芯片是云知声专为离在线远场语音交互场景设计的高性能，高集成度，低成本的语音智能 IoT 芯片，围绕蜂鸟所搭载的软硬件方案，可应用于多种智能家电终端。基于蜂鸟芯片的深度定制算法，云知声离线语音

2020-05-27 10:47:46

介绍一套支持语音交互的车载导航系统

本文在课题组的车载导航系统和国内两款语音引擎的基础上，开发了一套支持语音交互的车载导航系统。

2021-05-14 06:28:33

几何 G6 / M6 汽车官图曝光，均搭载基于鸿蒙 HarmonyOS 开发的数智座舱

近日，几何汽车官方公布了旗下几何G6、几何M6部分车型信息。从目前公布的信息来看，几何G6、几何M6将搭载Harmony OS系统，在智能座舱、智能安全、智能续航等方面创新升级，为用户带来更好

2022-08-09 10:16:08

基于智能语音交互芯片的模拟训练器示教与回放系统设计

解决上述问题，模拟训练应运而生。为进一步提高训练效果，本文利用智能语音交互芯片设计了某模拟训练器的示教与回放系统。示教系统为操作人员生动的演示标准操作流程及相应的操作现象，极大地缩短了对操作人员的培训时间

2019-07-01 08:07:36

基于语音合成技术的车载终端系统该怎样去设计？

什么是语音合成技术？基于语音合成技术的车载终端系统该怎样去设计？

2021-05-12 07:25:05

基于语音识别的人机交互方式浅析

0 引言传统的人机交互依靠复杂的键盘或按钮来实现，随着科技的发展，一些新型的人机交互方式也随之诞生，带给人们全新的体验。基于语音识别的人机交互方式是目前热门的技术之一。但是语音识别功能算法复杂、计算

2022-01-25 07:00:22

如何去设计智能防超载及语音提示系统？

什么是智能防超载及语音提示系统？智能防超载及语音提示系统的硬件部分是怎样构成的？智能防超载及语音提示系统的软件部分是怎样构成的？

2021-05-13 06:35:24

如何去设计一种汽车智能语音报警系统？

一种基于ADPCM算法的汽车智能语音报警系统的设计

2021-05-19 06:15:13

如何去设计一种汽车智能语音报警系统？

一种基于ADPCM算法的汽车智能语音报警系统设计

2021-05-17 06:41:35

如何开发智能家居语音控制方案

协议。解决方案与采用技术启英泰伦第三代语音控制芯片应用框图系统方案设计简单，功能强大，性价比超高如上图所述，启英泰伦第三代智能语音芯片集成度更高，外围可扩展更丰富应用，通过串口可扩展上位机MCU

2023-05-31 09:50:06

对语音交互技术感兴趣的童鞋戳进来！

`随着非接触经济的到来，语音交互技术的应用即将迎来爆发期。而受疫情的影响，语音交互技术以便捷性、简单性、避免接触式交叉感染的特点得到人们广泛的关注。本期华秋创服硬创直播室<资事通鉴

2020-03-11 14:19:54

嵌入式语音交互技术在智能家居中有哪些应用？

的生活方式与工作习惯，使得家居系统的智能化成为一种消费需求，基于嵌入式语音交互技术的智能家居系统越来越被重视。

2019-08-28 08:11:47

怎么实现基于语音控制的智能家居控制系统的设计？

如何实现基于语音控制的智能家居控制系统的设计？

2022-01-25 07:50:09

怎么设计基于嵌入式系统的语音口令识别系统？

随着计算机技术和信息技术的迅速发展，语音口令识别已经成为了人机交互的一个重要方式之一。语音口令识别系统将根据人发出的声音、音节或短语给出响应，如通过语音口令控制一些执行机构、控制家用电器的运行或做出

2019-09-03 08:27:23

怎样去设计一种基于STM32F429的语音识别交互系统

基于STM32F429的语音识别交互系统有哪些具体功能？怎样去设计一种基于STM32F429的语音识别交互系统？

2021-10-20 06:58:05

树莓派语音交互如何实现开关灯？

2021-11-08 07:08:19

请问怎样去设计一种车载导航人机语音交互系统？

2021-05-17 07:09:16

车联网语音识别技术发展与应用

延伸。但是对于高速行驶、行为受限的车载应用场景中，社交功能的实现存在很大的挑战。智能设备的交互方式中按键交互和触摸屏交互应用最广也最为成熟，但对于车辆驾驶是“危险的动作”。在此背景下基于语音识别技术

2013-07-26 15:40:55

车载导航人机语音交互系统的实现

的技术基础，特别是文语转换TTS技术和基于中小词汇量的语音命令识别技术已经达到比较实用的程度。本文在课题组的车载导航系统和国内两款语音引擎的基础上，开发了一套支持语音交互的车载导航系统。车载语音导航系统

2008-08-15 21:27:56

车载导航人机语音交互系统的设计和实现

和基于中小词汇量的语音命令识别技术已经达到比较实用的程度。本文在课题组的车载导航系统和国内两款语音引擎的基础上，开发了一套支持语音交互的车载导航系统。车载语音导航系统结构车载语音导航系统从功能上分为

2019-05-07 07:00:21

长虹首台ciri语音智能电视在渝发布

，进入到智能元年，长虹颇具勇气的打造了一个实用、便捷、妙趣横生的语音智能工具——ciri，这将大大丰富电视机用户的使用体验。发布会当天笔者看到，长虹最近推出了“内置ciri语音智能交互”的语音电视，它

2012-03-05 17:12:23

随着人工智能领域的发展，语音芯片也将迎来“爆发”

有数据显示，到2020年，全球语音市场规模预计将达到 191.7 亿美元。语音识别作为研究人工智能的方向之一，随着语音交互技术的发展，语音AI芯片也随之诞生。现在不论是互联网巨头，还是AI 初创公司

2019-06-26 02:08:55

鸿蒙座舱子品牌来了，华为发布 HarmonySpace：万物互联的智能出行空间

HarmonySpace 子品牌以及 HarmonyOS 应用和硬件生态合作战略。并提出以“硬件模块化、接口标准化、系统平台化”的发展战略，与生态合作伙伴一同构建开放共赢的 HarmonyOS 智能座舱

2021-12-23 14:40:26

基于Internet的语音交互系统的设计和实现

　描述了实现Internet语音交互系统的关键技术，即利用Windows的多任务机制，结合Windows MDK低层音频服务、Windows Sockets和语音压缩等技术，实现了PCto PC的实时通话。

2009-05-10 13:14:04

1340

体验上汽推出的iVoka语音交互技术

目前上汽推出了一个应用于汽车上且类似Siri系统的iVoka语音云交互技术，中文的语音系统让国人可以率先体验到人机交互系统的乐趣与魅力。

2012-07-19 11:34:36

2136

交互式智能家居系统设计论文

基于Arduino单片机的语音交互式智能家居系统设计

2017-04-26 09:25:21

暴风推有语音交互逻辑X5 ECHO人工智能电视主打语音交互

昨日，暴风正式发布了其旗下X5 ECHO人工智能电视，并称这款电视有着一套完整的语音交互逻辑。除了最基本的键入式搜索以外，拟人化的语音交互是这款电视最大的特点，暴风则称其为人工智能。

2017-05-13 11:24:53

1165

详细剖析汉云通信——人工智能语音交互系统

2018年汉云通信以“人工智能交互语音系统，让人回归人的价值，把人从重复脑力劳动中解放出来”为核心，开启真人语音、智能交流、支持打断的智能化服务模式，为企业创建最佳呼叫场景。

2018-02-07 16:40:31

6250

智能语音交互在汽车上的应用有哪些

企业把智能语音交互技术落地在了汽车上。时年，智能汽车的概念风靡一时，科技范儿的企业层出不穷，力求从各方面把汽车变聪明。那么，作为底层技术之一，CES上亮相的企业对智能语音交互在汽车上的应用贡献了哪些新产品。

2018-04-18 01:06:00

13926

智能语音交互是怎么实现交互流程中的输入输出呢?

智能语音交互是人工智能的分支，相当于语音助手，属于一款智能型的手机应用，通过智能对话与即时问答的智能交互，实现帮助用户解决问题的功能。

2018-03-13 15:49:28

11785

除了语音交互，未来的座舱智能化有什么样的转变？

“我们对于未来的座舱，更多的从用户的角度出发，从用户的体验和需求上来看整个座舱系统的开发。”李思霓表示，未来座舱的定义必须是通用，同时也是个性化的选择。

2018-05-15 15:34:38

5356

如何加快座舱智能交互落地进程

随着车辆智能化的发展,车内交互也成为了一项热门的技术，包括液晶屏显、HUD、语音交互等，各种交互方式因为技术成熟度、产业链完善程度的不同，在整个行业内的发展情况也不尽相同。

2018-11-14 09:55:39

3286

探析智能语音交互应用和技术

北京声加科技CEO邱锋海受邀以《声加万物、聆听未来：智能语音交互应用和技术》为题，分享了目前正在爆发的智能语音交互市场中的各项明星产品和其技术链条。

2018-11-23 09:54:52

4553

冠林全新推出新一代智能语音交互工具全力打造家居语音交互新体验

语音交互作为物联网智能终端主流的交互方式已越来越普及，让机器听懂用户发出的指令，享受更为轻松、舒适的智能生活。为此，冠林全新推出了新一代智能语音交互工具——小慧，打破传统设计，将语音控制功能导入开关面板形态，全力打造家居语音交互新体验。

2019-03-28 13:39:23

809

论智能语音技术在安防行业的应用前景

智能语音技术在安防行业的应用，不止停留在语音交互上那么简单。

2019-04-26 15:09:05

2960

Qeexo核心触控技术不会被语音交互技术取代

Qeexo奇手的下一代“触控交互”平台。Sang是Qeexo奇手的联合创始人兼CEO，如今语音交互趋势立现，公司的核心仍是触控技术，他似乎并不担心触控技术会被语音交互技术所取代。

2019-06-18 10:28:43

1604

思必驰专注智能语音交互技术，打造最实用、有趣的人机交互体验

龙梦竹向品途商业评论表示，严格来说，思必驰也并不是纯粹的B2B公司，而是B2B2C。思必驰提供的智能语音交互技术，应用于智能硬件产品，最终为消费者用户使用。

2019-08-06 16:23:24

6472

语音交互技术为我们的生活带来哪些改变

随着众多搭载人工智能技术的产品问世，AI从一个概念性的技术变成大多数人都能够接触到的东西，这其中受众最多的要数语音交互技术，包括国外的“四大天王”苹果、谷歌、亚马逊、微软以及国内的科大讯飞、百度、阿里、搜狗等科技公司相继布局智能语音交互市场,先后在智能家居。

2019-08-26 10:12:45

1358

医疗智能语音识别系统的研发与应用

结合语音识别技术构建医疗智能语音识别系统，达到减轻医护人员日常工作负担，减少重复性劳动，提高诊疗质量的目的。基于语音识别的关键技术和海量的医疗数据，开发电子病历与检查报告智能语音录入、移动护理智能语音录入、非接触式智能语音数据交互系统。

2019-10-21 16:46:27

3262

语音交互技术存在什么利与弊

在人工智能异常火热的今天，从 Siri 到小度，从小冰到小娜，语音交互正悄无声息的融入我们的生活之中。

2019-10-24 14:58:51

8730

智能语音在未来会有怎样的地位

智能语音技术不断创新进步，众多的企业投身其中，中天智领的智能AI语音交互系统，让交互“说”出来。

2019-11-04 14:47:58

777

掌握声音前处理核心技术，让语音交互更智能

除了最常用的智能手机外，智能音箱、智能家居、智能机器人等众多智能终端设备的语音应用不断涌现，使得智能语音技术成为智能设备交互的主要手段。

2019-12-26 11:26:08

821

未来的智能座舱是什么样子？

8月26日，在仙豆智能举行的智能座舱公开课上，仙豆智能用户体验设计专家于吉良坦言，如同智能手机，智能座舱的发展趋势同样是硬按键越来越少，屏幕越来越大。与此同时，语音、眼球、面部追踪、触控、手势、AR虚拟现实技术的引入，致使人机交互方式在不断增加。

2020-08-28 11:39:34

3204

语音交互技术在AIoT场景中的应用趋势是怎样的

过去几年，语音交互无疑是人工智能领域发展的热门方向，不管是科技巨头大力推广的智能音箱，还是各种智能设备都在植入语音交互能力，我们看到语音已经成为一种通用能力，并逐步演变为人机交互的新入口。根据

2020-10-24 11:08:17

1929

深度解读智能座舱系统

银河os”，通过3块大屏实现了出色的人机交互。强强联手Team 自2018年起，伟世通、亿咖通科技与高通技术公司就开始联合开发这套智能座舱系统，可以说是集合了多家企业的技术优势，真正意义上实现了智能化、网联化。技术优势Tech 硬件采用了伟世通的SmartCo

2021-09-22 16:44:38

4061

汽车智能化过程给座舱带来了新的要求

随着语音识别、人脸手势识别等技术的快速发展，汽车座舱内的交互体验也在不断升级。在智能汽车迈向高阶自动驾驶过程中，全系影像技术开始进入车载显示领域，开启人车交互新窗口。在HUD技术中，AR-HUD结合

2021-11-15 09:07:10

2557

德赛西威携手高通打造第四代智能座舱系统

德赛西威与高通技术公司宣布，双方将基于第4代骁龙座舱平台，共同打造德赛西威第四代智能座舱系统。

2022-01-05 14:25:23

3200

智能座舱人机交互模式的未来发展趋势

随着智能座舱AI算力的提高，沉浸式交互使得交互指令的输入方式更加类人化，同时交互的发起方也不再仅限于人类。通过多种传感器的支持，座舱可主动发起交互，让驾乘人员感受到座舱的主动关怀，使驾乘体验更温暖

2022-01-06 10:01:46

6595

智能座舱人机交互技术的发展趋势

当前，汽车不仅在动力源、驱动方式和驾驶体验上发生了改变，座舱也告别了传统枯燥的机械和电子空间，智能化水平飙升，已经成为继家庭和办公室之外的人们生活中的“第三空间”。通过人脸；指纹识别、语音/手势交互

2022-03-26 17:13:55

4157

未来智能座舱市场容量智能座舱主流芯片820A

智能座舱是指搭载了智能化、网联化的车载设备和服务，诸如车载信息娱乐系统、仪表盘、抬头显示（HUD）、流媒体后视镜、语音交互系统等汽车电子系统。

2022-03-31 15:28:19

5763

如何提升智能座舱的多屏联动和语音交互体验

如今，技术创新正在为整个汽车行业带来颠覆性影响，智能化逐步成为定义产品体验的关键要素。其中，智能座舱作为驾乘者当下最容易感知的部分，已经成为购车的重要关注点之一。

2022-06-06 09:43:50

1467

诚迈科技智能座舱EX5.0软件平台

从最初的独立车载信息娱乐系统到发展至今的5G时代智能导航信息娱乐系统，作为人机交互的接口，汽车座舱承载的功能与数字信息大幅度增加。座舱通过搭载智能化/网联化车载设备或服务，可以逐步实现人、车、路、云智能交互，从多角度应用场景出发构建人机交互智能座舱系统，以获得体验与消费价值的双重升级。

2022-06-09 09:22:44

2404

语音交互设备中的ASR和TTS技术

手机、手表、音箱等智能设备极大地便利了我们的生活，随着语音交互设备的发展，智能交互依然面临很多挑战。

2022-06-16 17:23:48

2970

作为第三生活空间，智能座舱如何先声夺人？

2022-11-08 07:15:09

623

关于智能座舱中RTC应用介绍

智能座舱主要组成：智能座舱由三大部分组成：硬件（仪表盘、流媒体后视镜、HUD、中控屏幕、后座娱乐系统、空调、座椅、音响等）、软件、人机交互（语音、人脸、触摸、手势、生物等识别），融合了T-Box、DMS系统、ADAS系统、高精定位系统以及未来的V2X，为用户提供更加便捷、智能、温馨、舒适的体验。

2022-12-16 10:49:53

1308

瑞声科技发布首个智能座舱与智能驾驶感知交互解决方案

瑞声科技以汽车音响、触觉反馈、语音采集、感知交互等四大模块为着力点，将消费电子领域的感知体验需求洞察和技术积累拓展至汽车圈，发布了行业首个智能座舱与智能驾驶感知交互解决方案。

2022-12-30 10:47:00

431

什么是多模交互智能座舱为什么要做多模交互

语音交互在实际应用中是不可见的，如果不与其他模态进行融合，很难预判出他们发出的指令处于哪个状态。

2023-01-10 09:46:02

1295

340秒语音芯片,轻松实现语音交互，畅享智能生活WTV380语音ic方案

随着智能家居、安防报警、宠物用品等，智能设备的普及，语音交互技术正在逐渐成为人机交互的主要方式之一。而如何实现稳定高效的语音交互，就需要借助先进的语音芯片技术。今天，我们介绍的是一款高性能的语音芯片——WTV380

2023-03-08 15:19:18

174

技术前沿：智能座舱的交互技术

智能座舱定义及组成对于智能座舱的概念或定义，行业内主要存在两种主流的观点。第一种观点将智能座舱定义一种智能服务系统，能主动洞察和理解用户需求，又能满足用户需求：从终端消费者需求及应用场景出发，乘客不仅无需担忧驾驶和出行，还能在智能座舱中获得舒服的体验。

2023-04-12 10:16:49

2345

助力打造更加便捷、清晰的车载语音交互新体验

、个性化的用户体验，车企提“智”升级，对车载语音交互系统的功能和性能提出了更高的要求。在此背景下，车载语音识别等技术逐渐成为了车载语音交互系统的重要组成部分。车载语音识别技术是车载语音交互系统中的另一个

2023-04-17 09:31:08

479

锐思华创与思必驰达成战略合作，推动智能座舱多模交互发展

，双方将基于各自资源优势，在智能车载中的多模交互展开深度合作，共建智能座舱新生态。锐思华创与思必驰达成战略合作，推动智能座舱多模交互发展关于锐思华创锐思华创技术有限公司成立于2019年，是智慧交通、辅助驾驶与 AR 显示的整体解决方案提供商，致力于打造以创新

2023-04-21 14:41:11

378

车企提“智”升级，车载语音识别技术成就语音交互新体验

、个性化的用户体验，车企提“智”升级，对车载语音交互系统的功能和性能提出了更高的要求。在此背景下，车载语音识别等技术逐渐成为了车载语音交互系统的重要组成部分。车载语音识别技术是车载语音交互系统中的另一个重

2023-04-23 15:15:38

380

车企提“智”升级，车载语音识别技术成就语音交互新体验

2023-04-23 18:13:41

423

智能座舱人机交互技术发展趋势

智能座舱告别简单电子化进入智能助理阶段的一个显著标志是人与座舱的交互从被动式进入主动式，而这个“被动”和“主动”是围绕座舱本身定义的。过往的信息交流主要由人发起，现在人与机器都可以发起，人机交互水平已经成为定义智能座舱产品档次的重要标志。

2023-05-18 10:27:12

1548

智能座舱进入大模型时代，语音遥控器的交互即将成为过去式

百度Apollo展示了其最新已量产的语音产品体验，小度车载语音SDK基于大模型本地化，持续推动座舱极致交互体验。流畅的免唤醒多路同时交互、全页面所见所说、全域毫秒级响应，让用户像是拥有了一个随时待命的私人助理，能靠说的绝不动手，坐在主副驾和后排的每一个人都可以同时进行畅快的交互体验。

2023-05-24 09:43:43

607

智能座舱仿真测试解决方案

过程中智能座舱系统的测试与验证。经纬恒润结合通信信息、人工智能、工业控制、硬件在环等技术，开发了一套智能座舱仿真测试系统，实现了对整车电气、人机交互、交通场景和座舱体

2021-12-19 14:00:51

1529

340秒语音芯片,轻松实现语音交互，畅享智能生活WTV380语音ic方案

2023-03-08 16:55:15

365

智能座舱的七大趋势

作为智能座舱最重要的交互手段之一，智能语音是智能座舱的核心功能之一。目前，智能语音的高识别率已成为标配，分区语音识别及交互逐渐成为主流，领先车型已经能够非常准确地识别语音指令来自车内哪个方位，并且执行相应的操作。

2023-06-29 16:37:40

1677

语音识别唤醒词-开启智能化的语音交互时代

语音识别唤醒词是指在语音交互系统中使用的特定词语或短语，用于唤醒系统并启动语音识别功能。这项技术的出现为智能化的语音交互带来了革命性的改变，使得我们能够更便捷、自然地与智能设备进行交流。在传统

2023-07-09 00:53:53

771

智能座舱仿真测试解决方案

过程中智能座舱系统的测试与验证。经纬恒润结合通信信息、人工智能、工业控制、硬件在环等技术，开发了一套智能座舱仿真测试系统，实现了对整车电气、人机交互、交通场景和座舱体验的仿真模拟。系统通过提供触控模拟，智能

2021-12-14 10:40:30

660

智能座舱HMI自动化测试之语音交互专项测试

随着人工智能和物联网技术的迅猛发展，智能座舱已经成为现代汽车中的重要组成部分。语音交互作为智能座舱的核心功能之一，正日益受到用户和汽车制造商的关注。车载语音交互具备的独特优势：降低驾驶者对车内

2023-09-04 16:58:58

1501

圆满落幕 | 智能座舱人机交互关键技术创新分论坛

10月21日，由中国汽车工程学会主办的【融合座舱生态，智享未来出行】2023国际汽车智能座舱大会，智能座舱人机交互关键技术创新分论坛在苏州圆满落幕。东舟技术产品总监黄世富受邀出席论坛，并发表“智能

2023-10-24 16:26:06

1024

情感语音识别技术在人机交互中的应用与挑战

一、引言随着人工智能技术的不断发展，人机交互已经成为了研究的热点之一。情感语音识别技术作为人机交互中的重要组成部分，能够通过识别人的语音情感，实现更加智能化和个性化的交互体验。本文将探讨情感语音

2023-11-09 15:27:27

333

情感语音识别技术在人机交互中的应用与展望

一、引言随着人工智能技术的不断发展，人机交互已经渗透到日常生活的方方面面。情感语音识别作为人机交互中的关键技术之一，能够通过分析人类语音中的情感信息实现更加智能化和个性化的人机交互。本文将探讨

2023-11-22 10:40:59

274

泰克智能座舱测试白皮书发布

伴随智能座舱领域数字化、智能化的趋势，多屏联动、语音识别、手势控制、增强现实、云交互成为主流，座舱在实现丰富功能的同时也给测试带来很多新的挑战，例如各种高速接口的测试，域控制器的测试等。

2024-01-10 11:36:34

371

智能座舱包含哪些功能智能座舱测试包括哪些方面？

功能测试：测试座舱的各种功能是否正常，如智能控制系统、人机交互系统等。故障诊断测试：测试座舱在工作过程中是否能够及时检测和诊断出故障，并给出相应的提示和建议。性能测试：测试座舱在行驶中的性能和响应速度，同时测试涉及到座舱的硬件、软件和连接个个方面，如连接的音响、蓝牙、无线网络等的稳定性。

2024-01-16 10:57:25

596

已全部加载完成

搜索历史

智能座舱的语音交互系统技术应用

评论