0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

利用NVIDIA产品技术组合提升用户体验

NVIDIA英伟达 来源:NVIDIA英伟达 2024-01-17 09:30 次阅读

案例简介

本案例通过利用NVIDIA TensorRT-LLM加速指令识别深度学习模型,并借助NVIDIA Triton推理服务器在NVIDIA V100 GPU上进行高效部署,帮助必优科技的文档智能体 UTalk-Doc 将用户指令识别服务吞吐量提升了 5 倍,单个请求响应时间缩减了三分之一,大幅提升服务运行效率,提升资源利用率。Triton 模型分析能力还协助必优科技,将寻找最佳推理配置所需的时间从数周减少到数小时。

智能体迭代和

用户增长的并发压力

必优科技旗下 UTalk-Doc 是新一代协助用户进行表达的办公产品。其中“用户指令识别”能力是产品组成中十分重要的一环。目前该能力主要由底层指令识别深度学习模型提供服务支持。

深度学习模型在运行过程中需要较大的计算量,在用 Pytorch 进行模型的推理时,一方面时延特别大,导致用户体验受损;另一方面,显存占用很大,导致推理请求的并发数上不去,请求失败的概率太高,只能通过增加机器的方式来提高并发能力,业务部署成本较高;再次,使用的模型经常变化,而业务需要更换后的模型能够快速地加速和上线部署。NVIDIA GPU 硬件和软件框架的强大性能帮助企业解决了海量计算需求,满足了必优科技多模态 office 智能体的迭代和用户几何倍增长的并发压力。

利用 NVIDIA产品技术组合

提升用户体验

基于以上挑战,必优科技选择了采用 NVIDIA 的 TensorRT-LLM SDK 对模型进行推理加速,并利用 NVIDIA Triton推理服务器在 V100 GPU 上进行在线部署,在提升用户体验的同时,大幅降低了服务成本。

通过使用 TensorRT-LLM 对指令识别深度学习模型进行加速,在都使用 FP32 的情况下,与 Pytorch 相对,时延降低 50% 左右。

使用 TensorRT-LLM 结合 NVIDIA V100 GPU 的 FP16 Tensor Core,在保证精度的同时,模型推理的时延进一步降低了 40%。

Triton 的 dynamic batch 及多实例特性,在满足时延要求的同时,提高了系统整体的并发能力。

TensorRT-LLM 可以对模型进行快速地加速,Triton 则可以对加速后的模型进行快速地部署,满足了业务对修改后的模型进行快速部署的需求,同时也大大减少了工程人员的工作量。

NVIDIA 赋能文档智能体

在 NVIDIA 技术和初创加速生态的加持中,必优科技旗下应用产品 ChatPPT(UTalk-Doc)在短短几个月内自然注册用户破 100 万,同时通过内容表达场景(如 PPT 演示),赋能了如金融、教育、医疗等垂直行业领域客户,并且在硬件生态合作等方面也做了更多的探索,共同推进整个 AI 行业的快速发展。

“NVIDIA 提供的 GPU 解决方案,解决了深度学习和机器学习的技术难题,是我们公司人工智能道路上一路狂飙所不可或缺的一环。”必优科技创始人兼 CTO 陈润天博士表示。

必优科技成立于 2020 年,是国内较早期就专注于人工智能领域的智能内容生成技术的科技型公司,公司目前主要围绕智慧办公场景做相关业务开发服务,如 2023 年 3 月上线的 Chatppt(AI 生成 PPT)6 个月用户过百万;全新下一代产品 UTalk-Doc——不拘泥于格式、自由切换文档格式的产品,将彻底颠覆、改变和引领下一代 office 产品,帮助用户更好地进行表达。

NVIDIA 初创加速计划

必优科技是 NVIDIA 初创加速计划 (NVIDIA Inception) 会员企业。NVIDIA 初创加速计划为免费会员制,旨在培养颠覆行业格局的优秀创业公司。该计划联合国内外知名的风投机构,创业孵化器,创业加速器,行业合作伙伴以及科技创业媒体等,打造创业加速生态系统。能够提供产品折扣,技术支持,市场宣传,融资对接,业务推荐等一系列服务,加速创业公司的发展。

审核编辑:汤梓红
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4929

    浏览量

    102788
  • gpu
    gpu
    +关注

    关注

    28

    文章

    4700

    浏览量

    128672
  • 深度学习
    +关注

    关注

    73

    文章

    5491

    浏览量

    120958

原文标题:NVIDIA GPU 解决方案加速必优科技新一代文档智能体

文章出处:【微信号:NVIDIA_China,微信公众号:NVIDIA英伟达】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    金融科技公司利用NVIDIA技术加强金融服务应用

    通过 NVIDIA NIM 微服务和加速计算,Ntropy、Contextual AI、NayaOne 和 Securiti 增强了用于欺诈检测、财务规划等领域的 AI 应用。
    的头像 发表于 10-31 15:20 305次阅读

    Foxconn利用NVIDIA AI和Omniverse训练机器人

    全球最大电子制造商 Foxconn 正准备制造 NVIDIA 最复杂的产品之一,并开始使用 NVIDIA Omniverse 和 Isaac 平台驱动的数字孪生。
    的头像 发表于 10-10 09:40 351次阅读

    利用NVIDIA RAPIDS加速DolphinDB Shark平台提升计算性能

    DolphinDB 是一家高性能数据库研发企业,也是 NVIDIA 初创加速计划成员,其开发的产品基于高性能分布式时序数据库,是支持复杂计算和流数据分析的实时计算平台,适用于金融、电力、物联网和零售等行业。
    的头像 发表于 09-09 09:57 404次阅读
    <b class='flag-5'>利用</b><b class='flag-5'>NVIDIA</b> RAPIDS加速DolphinDB Shark平台<b class='flag-5'>提升</b>计算性能

    初创公司SEA.AI利用NVIDIA边缘AI和计算机视觉技术变革航海安全系统

    总部位于奥地利林茨的初创公司正在利用 NVIDIA 边缘 AI 和计算机视觉技术变革航海安全系统,让每一次出海变得更安全。
    的头像 发表于 09-09 09:32 462次阅读

    NVIDIA 在 Hot Chips 大会展示提升数据中心性能和能效的创新技术

    、在处理器及系统架构师领域的深度技术盛会,Hot Chips 已经成为价值万亿美元的数据中心计算市场的一个重要论坛。 在本周举行的 Hot Chips 2024 上,NVIDIA 的高级工程师们展示了
    的头像 发表于 08-28 16:38 326次阅读
    <b class='flag-5'>NVIDIA</b> 在 Hot Chips 大会展示<b class='flag-5'>提升</b>数据中心性能和能效的创新<b class='flag-5'>技术</b>

    NVIDIA赋能理想汽车共同推进智能驾驶和智能座舱技术创新

    智能化已成为汽车行业发展的新引擎,NVIDIA 正在赋能理想汽车共同推进智能驾驶和智能座舱技术创新。   作为中国新能源汽车制造商和造车新势力头部企业之一,理想汽车深耕智能驾驶领域。通过利用
    的头像 发表于 07-01 18:21 1671次阅读

    NVIDIA 通过 Holoscan 为 NVIDIA IGX 提供企业软件支持

    Enterprise-IGX软件现已在NVIDIA IGX平台上正式可用,以满足工业边缘对实时 AI 计算日益增长的需求。它们将共同帮助医疗、工业和科学计算领域的解决方案提供商利用企业级软件和支持来加快开发
    的头像 发表于 06-04 10:21 458次阅读

    沃尔沃利用英伟达的SoC和AI来提升自动驾驶的安全性

    在2024年英伟达GPU技术大会(NVIDIA GTC 2024)上,沃尔沃介绍了如何利用人工智能和日益提升的算力来提升自动驾驶的安全性。
    的头像 发表于 05-08 14:38 1121次阅读

    利用NVIDIA组件提升GPU推理的吞吐

    本实践中,唯品会 AI 平台与 NVIDIA 团队合作,结合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)将推理的稠密网络和热 Embedding 全置于 GPU 上进行
    的头像 发表于 04-20 09:39 633次阅读

    SAP与NVIDIA携手加速生成式AI在企业应用中的普及

    SAP SE 和 NVIDIA 宣布深化合作,致力于加速企业客户在 SAP 云解决方案和应用组合利用数据和生成式 AI 的变革力量。
    的头像 发表于 03-22 10:02 563次阅读

    如何选择NVIDIA GPU和虚拟化软件的组合方案呢?

    NVIDIA vGPU 解决方案能够将 NVIDIA GPU 的强大功能带入虚拟桌面、应用程序和工作站,加速图形和计算,使在家办公或在任何地方工作的创意和技术专业人员能够访问虚拟化工作空间。
    的头像 发表于 01-12 09:26 999次阅读
    如何选择<b class='flag-5'>NVIDIA</b> GPU和虚拟化软件的<b class='flag-5'>组合</b>方案呢?

    AMD升级视频技术提升画质应用FSR

    去年10月,NVIDIA已向全体RTX显卡用户推出了利用AI技术实现更高清晰度的RTX视讯超解析功能(简称RTXVSR),该项技术可消除原生
    的头像 发表于 01-11 14:20 756次阅读

    如何提升单片机开发技术

    单片机开发是现代电子技术中的重要分支,其在各个领域都有着广泛的应用。单片机开发技术提升不仅可以提高工作效率,还可以提高工作质量和创新能力。那么,如何提升单片机开发
    发表于 01-05 10:14

    NVIDIA 知乎精彩问答甄选 | 查看关于 NVIDIA Omniverse 的相关精彩问答

    框架、资源和服务,以加速通用场景描述(即 OpenUSD)的采用。 NVIDIA 正在通过 NVIDIA Omniverse 与新的技术组合、ChatUSD 和 RunUSD 等云应用
    的头像 发表于 12-01 18:40 444次阅读
    <b class='flag-5'>NVIDIA</b> 知乎精彩问答甄选 | 查看关于 <b class='flag-5'>NVIDIA</b> Omniverse 的相关精彩问答

    利用封装、IC和GaN技术提升电机驱动性能

    利用封装、IC和GaN技术提升电机驱动性能
    的头像 发表于 11-23 16:21 545次阅读
    <b class='flag-5'>利用</b>封装、IC和GaN<b class='flag-5'>技术</b><b class='flag-5'>提升</b>电机驱动性能