借助 NVIDIA GPU,亚马逊Alexa语义识别模型的识别准确度提高了15%-电子发烧友网

近期，来自于约翰霍普金斯大学（John Hopkins University）和亚马逊（Amazon）的研究人员们发布了一篇论文，介绍他们是如何通过训练一个深度学习系统来帮助亚马逊Alexa语音助手识别并忽略那些并非是对她说的话，从而将其语义识别模型的识别准确度提高了15%。

研究人员在他们的论文中指出，“诸如Amazon Echo和Google Home的这类家用声控设备都面临着一个问题，那就是当周围存在干扰声源的时候，设备如何能够照常地识别指令。”

为了让Alexa更好地识别指令，研究人员训练了一个神经网络，来匹配和识别“唤醒词”（通常是“Alexa”）以及紧随其后的指令，并忽略那些来自于其他人或媒体设备的干扰。

研究人员介绍说：“这项任务的挑战在于需要从含有特定词汇的话语片段中学习使用者的语言习惯。借助于两种不同的神经网络架构，我们最终实现了这一目标。两个神经网络架构都是具有注意机制的序列到序列编码器 - 解码器网络的变体。”

借助于NVIDIA V100 GPU和OpenSeq2Seq工具，用于序列到序列模型的分布式和混合精度训练，使用TensorFlow建立，团队用1,200小时来自于Amazon Echo的实时英文数据训练他们的算法。

通过改进所开发的基线网络，该团队还添加了一个额外的输入端，能够通过优先处理类似于锚字的语音来增强注意机制。研究人员总结说： “在训练期间，注意机制会自动学习唤醒词的哪些声学特征，以便在随后的演讲中寻找。”

该团队还开发了一个mask-based模型，该模型能够更加明确地将输入语音与锚字的声学轮廓相匹配。

最后的测试结果显示：第一种方法的性能更好，达到了15%的改进；第二种模型也达到了13%的改进。

根据研究人员介绍，该算法在训练和推理过程中都采用了NVIDIA GPU。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

NVIDIA

NVIDIA

+关注

关注
14

文章
4985

浏览量
103032
亚马逊

亚马逊

+关注

关注
8

文章
2663

浏览量
83342

原文标题：借助AI研究，将亚马逊Alexa语义识别准确度提高15%

文章出处：【微信号：NVIDIA-Enterprise，微信公众号：NVIDIA英伟达企业解决方案】欢迎添加关注！文章转载请注明出处。

《CST Studio Suite 2024 GPU加速计算指南》

监控/利用率、选择可用GPU卡子集等内容。 6. 故障排除：针对NVIDIA驱动安装、多GPU设置、GPU模式、硬件识别、CUDA错误、TC

发表于 12-16 14:25

语音识别技术在医疗领域的应用

转换医疗病历。这一过程不仅提高了病历的准确性和完整性，还方便了医生和患者的随时查阅。电子病历还可以实现自动分类和归档，极大地提高了医疗管理效率。此外，医生可以通过口述快速记录患者信息，节省手写时间，从而将更多

发表于 11-26 09:35 •299次阅读

语音识别技术的应用与发展

语音识别技术的发展可以追溯到20世纪50年代，但直到近年来，随着计算能力的提升和机器学习技术的进步，这项技术才真正成熟并广泛应用于各个领域。语音识别技术的应用不仅提高了工作效率，也极大地改善了用户

发表于 11-26 09:20 •413次阅读

ASR与传统语音识别的区别

识别技术。构建更深更复杂的神经网络模型，利用大量数据进行训练。 提高了语音识别的准确率和稳定性。传统语音

发表于 11-18 15:22 •459次阅读

亚马逊基于人工智能的Alexa发布计划延期至明年

11月1日外媒报道称，亚马逊已将基于人工智能技术全新打造的正版Alexa发布计划延期至明年。　　亚马逊最初于去年9月公开了新版Alexa的规划，意在通过集成AI大

发表于 11-01 15:19 •538次阅读

隧道门禁人脸识别系统是专为隧道安全管理设计的先进技术系统

，有效防止了误识别和漏识别的情况发生。多角度识别：支持多角度的人脸采集和识别，施工人员在不同的行走姿态和角度下靠近门禁时，系统都能快速准确

发表于 10-29 14:51 •244次阅读

隧道门禁人脸<b class='flag-5'>识别</b>系统是专为隧道安全管理设计的先进技术系统

GPU深度学习应用案例

能力，可以显著提高图像识别模型的训练速度和准确性。例如，在人脸识别、自动驾驶等领域，GPU被广泛

发表于 10-27 11:13 •393次阅读

AI大模型在图像识别中的优势

大模型借助高性能的计算硬件和优化的算法，能够在短时间内完成对大量图像数据的处理和分析，显著提高了图像识别的效率。识别

发表于 10-23 15:01 •651次阅读

【飞凌嵌入式OK3576-C开发板体验】RKNN神经网络-车牌识别

LPRNet基于深层神经网络设计，通过轻量级的卷积神经网络实现车牌识别。它采用端到端的训练方式，不依赖字符分割，能够直接处理整张车牌图像，并输出最终的字符序列。这种设计提高了识别的实时性和准确

发表于 10-10 16:40

魔搭社区借助NVIDIA TensorRT-LLM提升LLM推理效率

“魔搭社区是中国最具影响力的模型开源社区，致力给开发者提供模型即服务的体验。魔搭社区利用NVIDIA TensorRT-LLM，大大提高了大语言模型

发表于 08-23 15:48 •449次阅读

基于高光谱数据的典型地物分类识别方法研究

随着成像光谱仪器的广泛应用，利用光谱数据进行物质分类与识别已经成为一项重要的研究内容，研究不同分类算法对最终的目标识别准确度具有重要意义。

发表于 07-18 14:43 •319次阅读

人脸识别模型训练是什么意思

人脸识别模型训练是指通过大量的人脸数据，使用机器学习或深度学习算法，训练出一个能够识别和分类人脸的模型。这个模型可以应用于各种场景，如安防监

发表于 07-04 09:16 •595次阅读

基于毫米波雷达的手势识别神经网络

（LSTM）架构来捕获时间和空间信息，有效地增强了手势识别。然而，CNNLSTM模型通常需要大量的内存使用，具有较高的计算复杂性，并且高度依赖于环境因素。为了应对这些挑战，提高识别的

发表于 05-23 12:12

水尺读数监测识别摄像机

监测通常需要人工观测水位，并记录读数。这种方法不仅费时费力，而且容易出现误差。而利用水尺读数监测识别摄像机，可以实现自动化监测，大大提高了监测的效率和准确性。水尺读

发表于 04-15 10:12 •343次阅读

AI车牌监测识别摄像机

嫌疑车辆。AI车牌监测识别摄像机在实际应用中发挥着重要作用。首先，它可以自动识别车辆牌照，无需人工干预，大大提高了工作效率并减少了人力成本。其次，当有嫌疑车辆出现时，

发表于 04-02 09:55 •453次阅读

搜索历史

借助 NVIDIA GPU,亚马逊Alexa语义识别模型的识别准确度提高了15%

评论

《CST Studio Suite 2024 GPU加速计算指南》

语音识别技术在医疗领域的应用

语音识别技术的应用与发展

ASR与传统语音识别的区别

亚马逊基于人工智能的Alexa发布计划延期至明年

隧道门禁人脸识别系统是专为隧道安全管理设计的先进技术系统

GPU深度学习应用案例

AI大模型在图像识别中的优势

【飞凌嵌入式OK3576-C开发板体验】RKNN神经网络-车牌识别

魔搭社区借助NVIDIA TensorRT-LLM提升LLM推理效率

基于高光谱数据的典型地物分类识别方法研究

人脸识别模型训练是什么意思

基于毫米波雷达的手势识别神经网络

水尺读数监测识别摄像机

AI车牌监测识别摄像机