0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA推出在一天之内打造类似真人的定制语音工具

NVIDIA英伟达 来源:NVIDIA英伟达 作者:NVIDIA英伟达 2021-11-15 16:07 次阅读

NVIDIA Riva 定制语音软件为虚拟助理、呼叫中心语音和其他基于语音的应用程序提供支持;Riva 企业版适用于大规模部署

NVIDIA 宣布推出一款工具,只需 30 分钟的音频数据,即可在一天之内打造类似真人的定制语音。

NVIDIA Riva 定制语音是 NVIDIA Riva 语音 AI 软件的一项功能,它提供强大的功能,使数百万公司使用少量数据即可在几小时而不再是几周内开发富有表现力的定制语音。

企业可以使用 Riva 定制语音打造具有专属语音的虚拟助理。呼叫中心可以借其快速开发具有辨识度的品牌语音,为客户提供服务。开发者可以借其创建各种各样的应用程序,为有语言障碍的人提供支持。

NVIDIA AI软件产品管理副总裁Kari Briski表示:“长期以来,模仿类似真人的互动一直是AI面临的一项巨大挑战,特别是对于那些具有行业术语的公司而言。现在,这些公司能够使用语音 AI 倾听客户,并且以他们品牌专属的、富有表现力的语音回复客户,推动更有趣味、更加愉悦的互动。”

最新版的 NVIDIA Riva 语音 AI 软件开发套件提供 Riva 定制语音。Riva SDK 包括先进的自动语音识别和文本到语音转换功能,可根据不同的口音和领域进行定制。它还能够将语音服务扩展到云、数据中心及边缘的数十万串流。

生态系统之声

在不到三年的时间里,NVIDIA 的对话式 AI 软件已实现 25 万次以上的下载量,在众多行业得到广泛应用。

RingCentral 是全球企业云通信视频会议、协作和客服中心解决方案的优秀供应商,正在借助 Riva 自动语音识别提供视频会议实时字幕功能,打造更具吸引力的会议体验。

RingCentral 执行副总裁兼产品和工程总经理 Nat Natarajan 表示:“我们的目标是让会议更智能,现在借助 NVIDIA Riva,能够基于 NVIDIA GPU 训练实时转录模型,提高不同口音的准确性。未来,我们预计会有多个并发串流,Riva 可以轻松扩展,在 300 毫秒内实时处理这些串流。我们很高兴能与 NVIDIA 合作,一起展望未来。”

中国平安是全球最大的金融服务公司之一,正通过虚拟代理人来减少等待时间,改善客户体验。借助 Riva,它可以构建实时语音应用程序,不断提高准确性。

中国平安首席科学家肖京表示:“中国平安每天使用聊天机器代理人处理数百万客户查询。借助 NVIDIA 面向自动语音识别的预训练模型,在我们的数据上进一步微调,我们的系统在准确性方面提高了 5%,让我们能够提供更具吸引力、更加可靠的服务。”

此外,还有数十家软件制造商在生产中使用 NVIDIA 对话式 AI。Gosoft Contact Center 正在与 CP All 合作,后者拥有 20 多个业务领域,其零售领域在泰国涵盖 10000 多家 7-11 便利店。高度准确的 AI 语音机器人在泰语方面经过训练,每天总计可以帮助处理 24 万次呼叫。

Plabook Education 和 Data Monsters 正在与美国各地的学区合作,帮助孩子们学习通过 AI 数字虚拟形象阅读助理进行阅读,该助理可以帮助识别发音错误的单词并衡量其阅读准确性。

供货情况和定价

针对小型研发,NVIDIA Riva 在 NVIDIA NGC 容器仓库上免费提供。开发者可以加入 Riva 开放测试计划,立即试用软件并且接收相关功能更新通知。

对于具有大规模部署和寻求 NVIDIA 专家技术支持的客户,NVIDIA 还宣布 NVIDIA Riva企业版计划,该计划预计将于明年初推出。

Riva亮相GTC

在GTC主题演讲中,NVIDIA创始人兼首席执行官黄仁勋展示了Riva的语音AI能力,其中包括在Riva自定义语音的演示中,展示了只需30分钟的数据就能创造出类似人类的新的声音。

Riva还通过Project Tokkio、DRIVE Concierge和Project Maxine在Omniverse Avatar(一个创建交互虚拟形象的平台)中得以展现。Project Tokkio和DRIVE Concierge展示了客户服务和车内环境中的虚拟形象,而Project Maxine则强调了实时翻译并转录到多种语言。

在GTC上,有二十多场专注于对话式AI的演讲,包括Hugging Face、Snap、T-Mobile等公司的演讲。演讲主题涉及开发和整合GPU加速的语音和语言AI应用等方面最先进的算法、工具、挑战以及效果等。

责任编辑:haq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4930

    浏览量

    102792
  • AI
    AI
    +关注

    关注

    87

    文章

    30095

    浏览量

    268352

原文标题:GTC21 | NVIDIA 语音 AI 突破,使企业为品牌打造专属声音成为可能

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NVIDIA助力企业创建定制AI应用

    NVIDIA 近日宣布与众多技术领导者同使用最新NVIDIA NIM Agent Blueprint以及NVIDIA NeMo和NVIDIA
    的头像 发表于 11-20 09:12 222次阅读

    使用NVIDIA Jetson打造机器人导盲犬

    Selin Alara Ornek 是名富有远见的高中生。她使用机器学习和 NVIDIA Jetson边缘 AI 和机器人平台,为视障人士打造了机器人导盲犬。
    的头像 发表于 11-09 13:51 169次阅读

    OpenAI将推出在线搜索工具“SearchGPT”

    科技巨头OpenAI正悄然酝酿场搜索领域的变革,其最新推出的在线搜索工具“SearchGPT”正悄然挑战着Alphabet旗下谷歌的搜索霸主地位。这款被寄予厚望的新工具,目前正处于紧
    的头像 发表于 07-26 16:54 639次阅读

    英伟达推出全新NVIDIA AI Foundry服务和NVIDIA NIM推理微服务

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服务和 NVIDIA NIM 推理微服务,与同样刚推出的 Llama 3.1
    的头像 发表于 07-25 09:48 665次阅读

    NVIDIA推出用于支持在全新GeForce RTX AI笔记本电脑上运行的AI助手及数字人

    》中。NVIDIA 还发布专为 NVIDIA ACE 数字人平台打造的首个基于 PC 的 NVIDIA NIM 推理微服务。 这些技术由 NVIDI
    的头像 发表于 06-04 10:19 690次阅读

    赛轮思与NVIDIA合作,利用生成式AI打造代车内体验

    AI 驱动的移动出行创新企业与 NVIDIA 合作,打造代车内体验。
    的头像 发表于 05-23 10:12 1205次阅读

    Edge Impulse发布新工具,助 NVIDIA 模型大规模部署

    借助 Edge Impulse 和 NVIDIA TAO 工具包的协同效应,工程师得以快速构建并部署至边缘优化硬件(如上述型号)的计算机视觉模型。该平台还支持用户运用经由 GPU 优化的 NVIDIA TAO 模型(如 YOLO
    的头像 发表于 03-25 16:00 682次阅读

    宁德时代市值一天暴增千亿

    宁德时代市值一天暴增千亿 就在业界讨论AI的尽头是光伏和储能之时,摩根士丹利上调宁德时代的评级至“超配”,并将宁德时代的目标价上调14%,宁德时代的股价迎来久违的大涨,宁德时代市值一天暴增千亿。 3
    的头像 发表于 03-12 17:43 919次阅读

    虹科分享 | 用Redis为LangChain定制AI代理——OpenGPTs

    OpenAI最近推出了OpenAI GPTs——个构建定制化AI代理的无代码“应用商店”,随后LangChain开发了类似的开源工具Ope
    的头像 发表于 01-18 10:39 325次阅读
    虹科分享 | 用Redis为LangChain<b class='flag-5'>定制</b>AI代理——OpenGPTs

    用Redis为LangChain定制AI代理——OpenGPTs

    OpenAI最近推出了OpenAIGPTs——个构建定制化AI代理的无代码“应用商店”,随后LangChain开发了类似的开源工具Open
    的头像 发表于 01-13 08:03 805次阅读
    用Redis为LangChain<b class='flag-5'>定制</b>AI代理——OpenGPTs

    琢磨了一天的CAN协议

    最新公司需要利用J1939的CAN协议进行数据通信,琢磨了一天,才明白,现在整理成笔记,内容如下:1.数据帧格式数据帧格式应遵循CAN29位标识符的扩展帧格式,CAN数据帧由很多域组成(仲裁域+控制
    的头像 发表于 01-10 08:00 535次阅读
    琢磨了<b class='flag-5'>一天</b>的CAN协议

    NVIDIA ACE 中使用 AI 动画和语音功能打造逼真的虚拟形象

    NVIDIA 近日公布了 NVIDIA Avatar Cloud Engine(ACE) 的系列技术,增强了 AI 虚拟形象和数字人的真实感和可访问性,这些新的动画和语音功能实现了更
    的头像 发表于 12-15 15:50 539次阅读
    在 <b class='flag-5'>NVIDIA</b> ACE 中使用 AI 动画和<b class='flag-5'>语音</b>功能<b class='flag-5'>打造</b>逼真的虚拟形象

    如何在NVIDIA ACE中使用AI动画和语音功能打造逼真的虚拟形象呢?

    NVIDIA 近日公布了 NVIDIA Avatar Cloud Engine(ACE)的系列技术,增强了 AI 虚拟形象和数字人的真实感和可访问性,这些新的动画和语音功能实现了更自
    的头像 发表于 12-15 15:48 622次阅读
    如何在<b class='flag-5'>NVIDIA</b> ACE中使用AI动画和<b class='flag-5'>语音</b>功能<b class='flag-5'>打造</b>逼真的虚拟形象呢?

    WTN6080-8S语音芯片引领多功能早餐机:智能声音提示播放IC开启美好一天

    开启一天的美好生活。1.人性化欢迎提示多功能早餐机启动时,WTN6080-8S语音芯片通过欢迎提示如“早上好,欢迎使用XXX品牌多功能早餐机”,为用户带来愉悦的早晨
    的头像 发表于 12-08 09:05 535次阅读
    WTN6080-8S<b class='flag-5'>语音</b>芯片引领多功能早餐机:智能声音提示播放IC开启美好<b class='flag-5'>一天</b>

    离线语音识别及控制是怎样的技术?

    可以在没有网络连接的情况下进行使用,适用于些特殊场景,如旅行、户外等无法连接网络的环境。  6. 开发周期短:在客户的产品已经完善的情况下,可以快速接入离线语音识别。使用深圳雷龙发展有限公司的推出的LSYT201B模组,最快
    发表于 11-24 17:41