0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何最大化推理性能?Triton 社区技术交流活动与您畅聊

NVIDIA英伟达企业解决方案 来源:未知 2023-02-15 16:10 次阅读

由蚂蚁集团和 NVIDIA 携手举办的“Triton Meetup 2023”将于 2 月 25 日在北京举行。该活动是 Triton 社区首次正式举办的线下技术交流活动。来自美团、京东、蚂蚁、NVIDIA 的技术专家将带来 AI Infra推理引擎相关的专题分享,包括目前各企业面临的模型推理挑战、Triton 的应用及落地的具体方案等,现身说法,干货十足。此外,还有来自蔚来的特邀嘉宾,带来“AI 推理服务的当下与未来”圆桌主题讨论,欢迎到现场的小伙伴积极参与!

活动地点

北京 BCos 共享办公--多功能厅

(北京 WFC 环球金融中心办公店)

活动时间

2023 年 2 月 25 日

14:00 - 18:00

活动报名

长按扫描下方二维码

或点击文末“阅读原文

即可预约报名!

890b3a2e-ad07-11ed-bfe3-dac502259ad0.png

Triton Meetup 2023 活动流程

14:00 - 14:05

开场

14:05 - 14:45

NVIDIA Triton Inference Server的现在和未来

14:45 - 15:25

Triton 在蚂蚁全场景落地的优化

15:25 - 15:40

NVIDIA & 蚂蚁开源社区共建启动仪式

15:40 -16:20

Triton 在美团数据中心的应用

16:20 - 17:00

Triton 在京东零售的应用与实践

17:00 - 17:20

圆桌讨论:AI 推理服务的当下与未来

下面一起来看看嘉宾阵容吧!

议题一:NVIDIA Triton
Inference Server 的现在和未来

申意

NVIDIA 解决方案架构师

891f8a88-ad07-11ed-bfe3-dac502259ad0.png

负责为消费互联网行业提供 GPU 计算解决方案。包括编解码,数据前后处理,模型推理及服务化等。

议题简介:

  • Triton 简介

  • Triton 重要 Feature 简介和 Roadmap 更新

  • Triton 的成功案例

议题二:Triton 在蚂蚁全场景落地的优化

饶星

蚂蚁集团高级技术专家

89495a84-ad07-11ed-bfe3-dac502259ad0.jpg

蚂蚁集团推理团队技术负责人,负责蚂蚁集团全部业务场景的推理服务,长期专注在推理相关的架构和性能优化。

议题简介:

  • Triton 在搜索、推荐、广告业务场景的解决方案

  • Triton 在认知业务的解决方案

  • 结合业务场景,蚂蚁进一步的优化方案

议题三:Triton 在美团数据中心的应用

王新

美团机器学习平台预测引擎团队

技术负责人

8968707c-ad07-11ed-bfe3-dac502259ad0.png

美团机器学习平台预测引擎团队技术负责人,长期专注于机器学习预测引擎相关的开发工作。

议题简介:

  • 机器学习模型在美团落地的痛点

  • Triton 落地的具体方案

  • 使用 Triton 的业务收益与效果

议题四:Triton 在京东零售的应用与实践

杨培军

京东零售算法中台技术架构师

89a674c6-ad07-11ed-bfe3-dac502259ad0.jpg

长期从事机器学习平台/深度学习推理加速和框架的研发,曾负责阿里妈妈搜索广告预估平台、Bigo 机器学习平台的建设。

议题简介:

  • 京东零售的多元化算法需求给模型推理带来的挑战

  • 介绍京东算法中台在面向 CV/NLP 场景基于 Triton 二次开发的高性能推理框架

  • 阐述推理框架的架构演进和性能优化工作

圆桌讨论:AI 推理服务的当下与未来

特邀嘉宾:郭城

蔚来自动驾驶研发平台 (NADP)资深工程师

89baadc4-ad07-11ed-bfe3-dac502259ad0.jpg

负责搭建 NADP 云上推理系统,模型 CICD。

交通指引 & 防疫政策

1. 自驾到场:

开车行进至“环球金融中心”,在大楼南侧地下停车场进入。

2. 地铁前往:

地铁 10 号线至“金台夕照”站,从 A 口出,步行 3-5 分钟,从环球金融中心南门进入。


原文标题:如何最大化推理性能?Triton 社区技术交流活动与您畅聊

文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 英伟达
    +关注

    关注

    22

    文章

    3523

    浏览量

    89051

原文标题:如何最大化推理性能?Triton 社区技术交流活动与您畅聊

文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    紫光同芯出席“走进理想”技术展览及交流活动

    6月27日,“走进理想”技术展览及交流活动在北京圆满落幕。紫光同芯受邀出席,与行业专家、业界精英共聚一堂,围绕电动化、智能化、轻量化等关键领域核心技术,深入探讨智能汽车发展进程中的创新路径。
    的头像 发表于 07-02 14:45 232次阅读

    法雷奥集团技术交流活动圆满结束!

    交流,共同探讨目前行业热点及最新技术。“活动现场本次技术交流会得到法雷奥集团的大力支持,各个部门工程师都积极参与。同星智能针对当前客户的相关需求,在本次
    的头像 发表于 06-08 08:22 115次阅读
    法雷奥集团<b class='flag-5'>技术交流</b>日<b class='flag-5'>活动</b>圆满结束!

    自然语言处理应用LLM推理优化综述

    当前,业界在将传统优化技术引入 LLM 推理的同时,同时也在探索从大模型自回归解码特点出发,通过调整推理过程和引入新的模型结构来进一步提升推理性能
    发表于 04-10 11:48 263次阅读
    自然语言处理应用LLM<b class='flag-5'>推理</b>优化综述

    使用GaN HEMT设备最大化OBCs的功率密度

    随着电动汽车(EVs)的销售量增长,整车OBC(车载充电器)的性能要求日益提高。原始设备制造商正在寻求最小化这些组件的尺寸和重量以提高车辆续航里程。因此,我们将探讨如何设计、选择拓扑结构,以及如何通过GaN HEMT设备最大化OBCS的功率密度。
    的头像 发表于 12-17 11:30 756次阅读
    使用GaN HEMT设备<b class='flag-5'>最大化</b>OBCs的功率密度

    用上这个工具包,大模型推理性能加速达40倍

    作者: 英特尔公司 沈海豪、罗屿、孟恒宇、董波、林俊 编者按: 只需不到9行代码, 就能在CPU上实现出色的LLM推理性能。 英特尔  Extension for Transformer 创新
    的头像 发表于 12-01 20:40 790次阅读
    用上这个工具包,大模型<b class='flag-5'>推理性能</b>加速达40倍

    2023年电子工程师大会暨第三届社区年度颁奖活动圆满结束

    华秋·电子发烧友将于2023年11月23日在深圳举办一场盛大的技术交流活动,即“2023年电子工程师大会暨第三届社区年度颁奖活动”。本次活动邀请了各大高校教授、企业高管、行业专家和电子
    的头像 发表于 11-25 08:22 349次阅读
    2023年电子工程师大会暨第三届<b class='flag-5'>社区</b>年度颁奖<b class='flag-5'>活动</b>圆满结束

    Nvidia 通过开源库提升 LLM 推理性能

    加利福尼亚州圣克拉拉——Nvidia通过一个名为TensorRT LLM的新开源软件库,将其H100、A100和L4 GPU的大型语言模型(LLM)推理性能提高了一倍。 正如对相同硬件一轮又一轮改进
    的头像 发表于 10-23 16:10 415次阅读

    最新MLPerf v3.1测试结果认证,Gaudi2在GPT-J模型上推理性能惊人

    英特尔产品在全新MLCommons AI推理性能测试中尽显优势 今日,MLCommons公布针对 60 亿参数大语言模型及计算机视觉与自然语言处理模型GPT-J的 MLPerf推理v3.1 性能基准
    的头像 发表于 09-12 17:54 301次阅读
    最新MLPerf v3.1测试结果认证,Gaudi2在GPT-J模型上<b class='flag-5'>推理性能</b>惊人

    求助,为什么将不同的权重应用于模型会影响推理性能

    生成两个 IR文件(相同的 .xml 文件,但不同的 .bin 文件) 具有不同重量的类似模型,以不同的 fps (27fps 和 6fps) 运行 更多样化的权重是否会影响 Myriad X 上的推理性能
    发表于 08-15 07:00

    如何提高YOLOv4模型的推理性能

    使用 PyTorch 对具有非方形图像的 YOLOv4 模型进行了训练。 将 权重转换为 ONNX 文件,然后转换为中间表示 (IR)。 无法确定如何获得更好的推理性能
    发表于 08-15 06:58

    有奖活动 | 大咖论道:一同鸿蒙生态

    活动简介 即日起-2023年9月5日,参与本期活动与大咖一起聊聊鸿蒙新生态,您可以在社区写下对鸿蒙生态的畅想,也可以学习相关课程并获取证书,完成活动任务即可参与精美礼品抽奖。
    发表于 08-08 16:30

    最大化数据库性能在虚拟Red Hat Enterprise Linux环境

    电子发烧友网站提供《最大化数据库性能在虚拟Red Hat Enterprise Linux环境.pdf》资料免费下载
    发表于 08-03 11:06 0次下载
    <b class='flag-5'>最大化</b>数据库<b class='flag-5'>性能</b>在虚拟Red Hat Enterprise Linux环境

    英特尔® AMX 助力百度ERNIE-Tiny AI推理性能提升2.66倍,尽释AI加速潜能

    科技赋能千行百业 人民网携手英特尔启动“数智加速度”计划 WAIC 2023:英特尔以技术之力推动边缘人工智能发展,打造数字化未来“芯”时代 英特尔 AMX 加速AI推理性能,助阿里电商推荐系统成功应对峰值负载压力 原文标题:英特尔® AMX 助力百度ERNIE-T
    的头像 发表于 07-14 20:10 309次阅读
    英特尔® AMX 助力百度ERNIE-Tiny AI<b class='flag-5'>推理性能</b>提升2.66倍,尽释AI加速潜能

    英特尔® AMX 加速AI推理性能,助阿里电商推荐系统成功应对峰值负载压力

    达沃斯论坛|英特尔王锐:AI驱动工业元宇宙,释放数实融合无穷潜力 英特尔研究院发布全新AI扩散模型,可根据文本提示生成360度全景图 英特尔内部代工模式的最新进展 原文标题:英特尔® AMX 加速AI推理性能,助阿里电商推荐系统成功应对峰值负载
    的头像 发表于 07-08 14:15 385次阅读
    英特尔® AMX 加速AI<b class='flag-5'>推理性能</b>,助阿里电商推荐系统成功应对峰值负载压力

    如何使用NVIDIA Triton 推理服务器来运行推理管道

    使用集成模型在 NVIDIA Triton 推理服务器上为 ML 模型管道提供服务
    的头像 发表于 07-05 16:30 1235次阅读
    如何使用NVIDIA <b class='flag-5'>Triton</b> <b class='flag-5'>推理</b>服务器来运行<b class='flag-5'>推理</b>管道