0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

Sensory Cloud利用NVIDIA Triton运行语音和视觉模型

NVIDIA英伟达企业解决方案 来源:NVIDIA英伟达企业解决方案 作者:NVIDIA英伟达企业解 2022-07-10 09:37 次阅读

企业可以使用混合模型改进唤醒词、语音转文本、设备安全等。

你可能不了解 Todd Mozer,但却很有可能已经体验过该公司的技术——该公司已经为全球数十亿消费电子设备实现了语音和视觉 AI

Sensory于 1994 年创立于硅谷,致力于为行业巨头的移动设备提供先进的紧凑模型。如今,Sensory 为各种语音电子产品提供了互动性。LG 和三星不仅在手机,还在冰箱、遥控器和可穿戴设备中使用 Sensory。

CEO 兼创始人 Mozer 表示:“当我想让我的语音微波炉连接网络搜索食谱,并为我读出这个食谱时,混合计算方法就可以发挥作用。”

混合计算是一种结合云和本地计算资源的方法。

该公司的最新成果依靠于用于建立先进对话式 AI 模型的工具包NVIDIANeMo以及用于其SensoryCloud混合计算单元的NVIDIATriton 推理服务器。

电子设备更智能

设备正在变得越来越强大。虽然市场上正在出现各种专用的推理加速器,但越好的模型往往越大,而且需要的内存也越多,所以基于边缘的处理有时并不一定是最好的解决方案。

而将设备连接到云可以为这些紧凑模型提供更好的性能。Mozer 表示,可穿戴设备、手机、汽车等设备都可以进行无线更新。

他表示:“云连接可以为更小、更准确的设备端模型提供更新。”

这实现了设备端的许多功能改进。Sensory 为客户提供语音转文字、文字转语音、唤醒词验证、自然语言理解、面部身份识别以及扬声器和声音识别等功能。

Sensory 还使用NVIDIAJetson边缘 AI 模块将 Sensory Cloud 的力量带给更大的设备。

利用Triton进行推理

该公司的 Sensory Cloud 利用NVIDIA Triton运行语音和视觉模型。Sensory 围绕 Triton 构建的自定义云模型管理基础架构,使不同的客户能够运行不同的模型版本、部署自定义模型、启用自动更新并监控使用情况和错误。

Sensory 的客户可以将它作为一个容器部署到本地或云端,也可以完全用于私人用途,不向 Sensory 发送任何数据。

Triton 为 Sensory 提供了一个用于所有 Triton 通信和以最少的编码快速部署新模型的专用机器学习任务库。它还实现了一个方便新管道组装和扩展的异步动作管道。Triton 的动态批处理功能帮助提高 GPU 吞吐量并进行性能分析,以此实现推理优化。

Sensory 是NVIDIA初创加速计划的成员。这项全球计划为领先的初创企业提供支持。

将NeMo运用于混合云模型

Sensory 在NVIDIA NeMo的基础上进行了扩展,提升其所有云技术的准确性和功能。

NeMo 所改进的功能包括专有的特征提取器、音频流优化、可定制的词汇表、多语言模型等。

NeMo 模型现在支持 17 种语言。该公司称,凭借 Sensory 专有的功能改进,语音转文字的单词错误率很低,并始终处于最佳水平。

Mozer 表示:“Sensory 通过 NVIDIA Triton 硬件和 NVIDIA NeMo 软件实现了各项特征和功能的改进。这类混合云设置为客户提供了全新的 AI 功能。”

审核编辑:汤梓红

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4936

    浏览量

    102812
  • AI
    AI
    +关注

    关注

    87

    文章

    30117

    浏览量

    268406
  • Sensory
    +关注

    关注

    0

    文章

    4

    浏览量

    6115

原文标题:Sensory通过NeMo将NVIDIA AI运用于语音和视觉应用

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NVIDIA CorrDiff生成式AI模型能够精准预测台风

    NVIDIA GPU 上运行的一个扩散模型向天气预报工作者展示了加速计算如何实现新的用途并提升能效。
    的头像 发表于 09-13 17:13 657次阅读

    NVIDIA助力提供多样、灵活的模型选择

    在本案例中,Dify 以模型中立以及开源生态的优势,为广大 AI 创新者提供丰富的模型选择。其集成的 NVIDIAAPI Catalog、NVIDIA NIM和Triton 推理服务器
    的头像 发表于 09-09 09:19 434次阅读

    NVIDIA NIM微服务带来巨大优势

    新服务通过热门 AI 模型为数百万开发者带来高达 5 倍的 token 效率提升,使他们能够立即访问在 NVIDIA DGX Cloud运行的 NIM 微服务。
    的头像 发表于 08-23 15:20 442次阅读

    聆思CSK6视觉语音模型AI开发板入门资源合集(硬件资料、大模型语音/多模态交互/英语评测SDK合集)

    本帖最后由 jf_40317719 于 2024-6-18 17:39 编辑 视觉语音模型 AI 开发套件( CSK6-MIX )是围绕 CSK6011A 芯片设计的具备丰富语音
    发表于 06-18 17:33

    NVIDIA加速微软最新的Phi-3 Mini开源语言模型

    NVIDIA 宣布使用 NVIDIA TensorRT-LLM 加速微软最新的 Phi-3 Mini 开源语言模型。TensorRT-LLM 是一个开源库,用于优化从 PC 到云端的 NVID
    的头像 发表于 04-28 10:36 487次阅读

    NVIDIA宣布推出基于Omniverse Cloud API构建的全新软件框架

    NVIDIA 在 GTC 大会上宣布推出基于 Omniverse Cloud API(应用编程接口)构建的全新软件框架。
    的头像 发表于 03-25 09:09 492次阅读

    全新NVIDIA Omniverse Cloud API有何亮点?

    NVIDIA Omniverse Cloud API 使开发者能够将 Omniverse 技术集成到其设计与仿真工具和工作流中。
    的头像 发表于 03-20 13:42 430次阅读

    NVIDIA宣布将以API形式提供Omniverse™ Cloud

    NVIDIA Omniverse Cloud API 使开发者能够将 Omniverse 技术集成到其设计与仿真工具和工作流中。
    的头像 发表于 03-20 09:45 420次阅读

    NVIDIA发布Omniverse Cloud API,为众多工业数字孪生软件工具提供助力

    Ansys、Cadence、Hexagon、微软、罗克韦尔自动化、西门子、Trimble采用Omniverse技术帮助客户设计、模拟、构建和运行符合物理学的数字孪生     NVIDIA
    发表于 03-19 09:40 419次阅读
    <b class='flag-5'>NVIDIA</b>发布Omniverse <b class='flag-5'>Cloud</b> API,为众多工业数字孪生软件工具提供助力

    使用NVIDIA Triton推理服务器来加速AI预测

    这家云计算巨头的计算机视觉和数据科学服务使用 NVIDIA Triton 推理服务器来加速 AI 预测。
    的头像 发表于 02-29 14:04 545次阅读

    利用NVIDIA产品技术组合提升用户体验

    本案例通过利用NVIDIA TensorRT-LLM加速指令识别深度学习模型,并借助NVIDIA Triton推理服务器在
    的头像 发表于 01-17 09:30 653次阅读

    什么是Triton-shared?Triton-shared的安装和使用

    经过前面几章关于triton在nv gpu上调优的讲解,我们这章开始来看看triton的一个third_party库,该库是为了让triton去支持更多其他的backend。该项目的地址如下所示
    的头像 发表于 12-19 09:47 1111次阅读
    什么是<b class='flag-5'>Triton</b>-shared?<b class='flag-5'>Triton</b>-shared的安装和使用

    在线研讨会 | 大模型时代语音 AI 模型的训练、优化与应用

    AI 大模型语音识别、自然语言处理等领域已经取得了令人瞩目的成就。语音 AI(Speech AI)技术已经广泛应用在数字人、实时翻译、语音搜索、客户服务应答等多个业务场景,
    的头像 发表于 12-15 15:50 564次阅读
    在线研讨会 | 大<b class='flag-5'>模型</b>时代<b class='flag-5'>语音</b> AI <b class='flag-5'>模型</b>的训练、优化与应用

    NVIDIA ACE 中使用 AI 动画和语音功能打造逼真的虚拟形象

    NVIDIA 近日公布了 NVIDIA Avatar Cloud Engine(ACE) 的一系列技术,增强了 AI 虚拟形象和数字人的真实感和可访问性,这些新的动画和语音功能实现了更
    的头像 发表于 12-15 15:50 540次阅读
    在 <b class='flag-5'>NVIDIA</b> ACE 中使用 AI 动画和<b class='flag-5'>语音</b>功能打造逼真的虚拟形象

    如何在NVIDIA ACE中使用AI动画和语音功能打造逼真的虚拟形象呢?

    NVIDIA 近日公布了 NVIDIA Avatar Cloud Engine(ACE)的一系列技术,增强了 AI 虚拟形象和数字人的真实感和可访问性,这些新的动画和语音功能实现了更自
    的头像 发表于 12-15 15:48 623次阅读
    如何在<b class='flag-5'>NVIDIA</b> ACE中使用AI动画和<b class='flag-5'>语音</b>功能打造逼真的虚拟形象呢?