NVIDIA通过NeMo 1.0加速会话AI从研究到生产过程-电子发烧友网

NVIDIA 发布了世界级的语音识别功能，可为企业生成高精度的转录本， NeMo 1.0 包括用于民主化和加速对话人工智能研究的最新语音和语言模型。

世界级语音识别

NVIDIA Riva 世界级语音识别是一种现成的语音服务，可以轻松部署在任何云或数据中心。企业可以使用迁移学习工具包（ TLT ）跨各种行业和用例定制语音服务。通过 TLT ，开发人员可以将定制语音和语言模型的开发速度提高 10 倍。

语音识别模型是高度精确的，并在电信、金融、医疗保健、教育以及各种专有和开源数据集的领域无关词汇上进行训练。此外，它还接受了噪声数据、多种采样率（包括呼叫中心 8khz ）、各种口音和对话的训练，所有这些都有助于提高模型的准确性。

使用 Riva 语音服务，您可以在 10 毫秒内生成一个转录。它在多个专有数据集上进行评估，准确率超过 90% ，并且可以适应各种各样的用例和领域。它可以在几个应用程序中使用，例如在呼叫中心、视频会议和虚拟助理中转录音频。

T-Mobile 是美国最大的电信运营商之一，它利用 Riva 提供卓越的客户服务。

T-Mobile 负责产品和技术的副总裁 Matthew Davis 说：“借助 NVIDIA Riva 服务，利用 T-Mobile 数据进行微调，我们正在构建产品，以帮助我们实时解决客户问题。”。

“在评估了几种自动语音识别解决方案后， T-Mobile 发现 Riva 能够以极低的延迟提供高质量的模型，实现客户喜爱的体验。”

您可以从 NGC 目录下载 Riva 语音服务，现在就开始构建自己的转录应用程序。

NeMo 1.0 版本

NVIDIA NeMo 是一个开源工具包，供研究人员开发最先进的（ SOTA ）会话人工智能模型。它包括自动语音识别（ ASR ）、自然语言处理（ NLP ）和文本到语音（ TTS ）的集合，使研究人员能够快速试验新的 SOTA 神经网络，以便创建新的模型或在现有模型的基础上进行构建。

PyTorch 与 NeMo 、 PyTorch Lightning 和 Hydra 框架紧密耦合。这些集成使研究人员能够结合 PyTorch 和 PyTorch 闪电模块开发和使用 NeMo 模型和模块。此外，借助 Hydra 框架和 NeMo ，研究人员可以轻松定制复杂的会话人工智能模型。

此版本的亮点包括：

增加了对多种语言的语音识别支持，以及新的 CitriNet 和 Conformer CTC ASR 模型

从英语到西班牙语、俄语、普通话、德语和法语的五种语言支持双向神经机器翻译模型

新的语音合成模型，如 Fastpitch 、 Talknet 、 Fastspeech2 ，以及端到端模型，如 Fastpitch + HiFiGAN 和 Fastspeech2 + HiFiGAN

用于自动执行反文本规范化和反规范化以及基于 CTC 分割的数据集生成和探索语音数据集的功能

此外，大多数 NeMo 模型可以导出到 NVIDIA Riva ，用于产品部署和高性能推断。

关于作者

About Sirisha Rella是 NVIDIA 的技术产品营销经理，专注于计算机视觉、语音和基于语言的深度学习应用。 Sirisha 获得了密苏里大学堪萨斯城分校的计算机科学硕士学位，是国家科学基金会大学习中心的研究生助理。

审核编辑：郭婷

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

NVIDIA

NVIDIA

+关注

关注
14

文章
4985

浏览量
103027
语音识别

语音识别

+关注

关注
38

文章
1739

浏览量
112650

NVIDIA助力企业创建定制AI应用

NVIDIA 近日宣布与众多技术领导者一同使用最新NVIDIA NIM Agent Blueprint以及NVIDIA NeMo和NVIDIA

发表于 11-20 09:12 •341次阅读

NVIDIA加速AI在日本各行各业的应用

企业借助基于 NVIDIA AI Enterprise 与 Omniverse 工业 AI 构建的创新中心和服务加速 AI 转型。

发表于 11-19 15:45 •230次阅读

赖耶科技通过NVIDIA AI Enterprise平台打造超级AI工厂

与 NVIDIA 技术团队保持合作。赖耶科技通过NVIDIA AI Enterprise平台打造的超级 AI 工厂，致力于

发表于 11-19 14:55 •379次阅读

日本企业借助NVIDIA产品加速AI创新

日本领先企业和大学正在使用 NVIDIA NeMo、NIM 微服务和 NVIDIA Isaac 加速 AI 创新。

发表于 11-19 14:34 •296次阅读

详解MES系统的生产过程实时监控与异常处理

万界星空科技的MES系统能实时监控生产过程，检测异常情况并自动纠正，确保生产过程的连续性和稳定性。通过可视化界面，管理人员可以实时查看生产进度和设备状态。预警机制一旦检测到异常情况，会

发表于 10-28 15:57 •218次阅读

MES系统如何实现生产过程的全流程追溯

万界星空科技的MES系统通过实时采集、传输、处理、监控和追溯管理，实现了生产过程的实时跟踪，为企业提供了决策支持。

发表于 10-12 10:51 •398次阅读

NVIDIA在加速计算和生成式AI领域的创新

在最新发布的公司 2024 财年可持续发展报告开篇的一封信中，NVIDIA 创始人兼首席执行官黄仁勋介绍了 NVIDIA 在加速计算和生成式 AI 领域的创新，以及

发表于 09-09 09:18 •557次阅读

借助NVIDIA NIM加速AI应用部署

大语言模型（LLM）在企业组织中的应用日益广泛，许多企业都将其整合到 AI 应用中。虽然从基础模型着手十分高效，但需要花费一定的精力才能将它们整合到生产就绪型环境中。NVIDIA NI

发表于 08-23 16:38 •392次阅读

Mistral AI与NVIDIA推出全新语言模型Mistral NeMo 12B

Mistral AI 和 NVIDIA 于近日共同发布了一款全新的领先语言模型Mistral NeMo 12B。开发者可以轻松定制和部署该模型，令其适用于支持聊天机器人、多语言任务、编码和摘要的企业应用。

发表于 07-27 11:04 •659次阅读

NVIDIA AI Foundry 为全球企业打造自定义 Llama 3.1 生成式 AI 模型

Foundry 提供从数据策管、合成数据生成、微调、检索、防护到评估的全方位生成式 AI 模型服务，以便部署自定义 Llama 3.1 NVIDIA NIM 微服务和新的

发表于 07-24 09:39 •708次阅读

科普 EVASH Ultra EEPROM 晶圆生产过程

科普 EVASH Ultra EEPROM 晶圆生产过程

发表于 06-26 10:16 •461次阅读

HPE 携手 NVIDIA 推出 NVIDIA AI Computing by HPE，加速生成式 AI 变革

by HPE 包含了可持续的加速计算产品组合以及全生命周期服务，将简化 AI 创造价值的过程，加速生成式 AI 的发展步伐。

发表于 06-21 14:39 •366次阅读

NVIDIA推出NVIDIA AI Computing by HPE加速生成式 AI 变革

简化 AI 创造价值的过程，加速生成式 AI 的发展步伐。 NVIDIA AI Computin

发表于 06-20 17:36 •719次阅读

助力科学发展，NVIDIA AI加速HPC研究

科学家和研究人员正在利用 NVIDIA 技术将生成式 AI 应用于代码生成、天气预报、遗传学和材料科学领域的 HPC 工作。

发表于 05-14 09:17 •412次阅读

利用NVIDIA Holoscan 1.0开发生产就绪型AI传感器处理应用

边缘 AI 开发者正在构建用于安全关键型和受监管用例的 AI 应用和产品。借助 NVIDIA Holoscan 1.0，这些应用可在几毫秒内整合实时洞察和加工处理。

发表于 04-25 09:58 •455次阅读