搜索历史

清空

搜索热词

0

聊天消息
系统消息
评论与回复

查看更多

查看更多

查看更多

VIP于到期续费

登录后你可以

下载海量资料
学习在线课程
观看技术视频
写文章/发帖/加入社区

会员中心

创作中心

发布

创作活动

完善资料让更多小伙伴认识你，还能领取20积分哦，立即完善>

3天内不再提示

如何最大化推理性能？Triton 社区技术交流活动与您畅聊

由蚂蚁集团和 NVIDIA 携手举办的“Triton Meetup 2023”将于 2 月 25 日在北京举行。该活动是 Triton 社区首次正式举办的线下技术交流活动。来自美团、京东、蚂蚁、NVIDIA 的技术专家将带来 AI Infra、推理引擎相关的专题分享，包括目前各企业面临的模型推理挑战、Triton 的应用及落地的具体方案等，现身说法，干货十足。此外，还有来自蔚来的特邀嘉宾，带来“AI 推理服务的当下与未来”圆桌主题讨论，欢迎到现场的小伙伴积极参与！

活动地点：

北京 BCos 共享办公--多功能厅

（北京 WFC 环球金融中心办公店）

活动时间：

2023 年 2 月 25 日

14:00 - 18:00

活动报名：

长按扫描下方二维码

或点击文末“阅读原文”

即可预约报名！

Triton Meetup 2023 活动流程

★

14:00 - 14:05

开场

14:05 - 14:45

NVIDIA Triton Inference Server的现在和未来

14:45 - 15:25

Triton 在蚂蚁全场景落地的优化

15:25 - 15:40

NVIDIA & 蚂蚁开源社区共建启动仪式

15:40 -16:20

Triton 在美团数据中心的应用

16:20 - 17:00

Triton 在京东零售的应用与实践

17:00 - 17:20

圆桌讨论：AI 推理服务的当下与未来

下面一起来看看嘉宾阵容吧！

议题一：NVIDIA Triton
Inference Server 的现在和未来

申意

NVIDIA 解决方案架构师

负责为消费互联网行业提供 GPU 计算解决方案。包括编解码，数据前后处理，模型推理及服务化等。

议题简介:

Triton 简介
Triton 重要 Feature 简介和 Roadmap 更新
Triton 的成功案例

议题二：Triton 在蚂蚁全场景落地的优化

饶星

蚂蚁集团高级技术专家

蚂蚁集团推理团队技术负责人，负责蚂蚁集团全部业务场景的推理服务，长期专注在推理相关的架构和性能优化。

议题简介:

Triton 在搜索、推荐、广告业务场景的解决方案
Triton 在认知业务的解决方案
结合业务场景，蚂蚁进一步的优化方案

议题三：Triton 在美团数据中心的应用

王新

美团机器学习平台预测引擎团队

技术负责人

美团机器学习平台预测引擎团队技术负责人，长期专注于机器学习预测引擎相关的开发工作。

议题简介:

机器学习模型在美团落地的痛点
Triton 落地的具体方案
使用 Triton 的业务收益与效果

议题四：Triton 在京东零售的应用与实践

杨培军

京东零售算法中台技术架构师

长期从事机器学习平台/深度学习推理加速和框架的研发，曾负责阿里妈妈搜索广告预估平台、Bigo 机器学习平台的建设。

议题简介:

京东零售的多元化算法需求给模型推理带来的挑战
介绍京东算法中台在面向 CV/NLP 场景基于 Triton 二次开发的高性能推理框架
阐述推理框架的架构演进和性能优化工作

圆桌讨论：AI 推理服务的当下与未来

特邀嘉宾：郭城

蔚来自动驾驶研发平台 (NADP)资深工程师

负责搭建 NADP 云上推理系统，模型 CICD。

交通指引 & 防疫政策：

1. 自驾到场：

开车行进至“环球金融中心”，在大楼南侧地下停车场进入。

2. 地铁前往：

地铁 10 号线至“金台夕照”站，从 A 口出，步行 3-5 分钟，从环球金融中心南门进入。

原文标题：如何最大化推理性能？Triton 社区技术交流活动与您畅聊

文章出处：【微信公众号：NVIDIA英伟达企业解决方案】欢迎添加关注！文章转载请注明出处。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

英伟达

英伟达

+关注

关注
22

文章
3857

浏览量
92146

原文标题：如何最大化推理性能？Triton 社区技术交流活动与您畅聊

文章出处：【微信号：NVIDIA-Enterprise，微信公众号：NVIDIA英伟达企业解决方案】欢迎添加关注！文章转载请注明出处。

评论

相关推荐

使用NVIDIA推理平台提高AI推理性能

NVIDIA推理平台提高了 AI 推理性能，为零售、电信等行业节省了数百万美元。

的头像

发表于 02-08 09:59 •245次阅读

使用NVIDIA<b class='flag-5'>推理</b>平台提高AI<b class='flag-5'>推理性能</b>

解锁NVIDIA TensorRT-LLM的卓越性能

Batching、Paged KV Caching、量化技术 (FP8、INT4 AWQ、INT8 SmoothQuant 等) 以及更多功能，确保您的 NVIDIA GPU 能发挥出卓越的推理性能。

的头像

发表于 12-17 17:47 •323次阅读

光伏发电如何实现能效最大化

光伏发电实现能效最大化是一个综合性的问题，需要从多个方面入手。以下是一些关键措施：一、选用优质设备太阳能板：选用具有高光电转化效率和稳定性的太阳能板是基础。例如，单晶硅太阳能板通常比多

的头像

发表于 12-05 11:06 •393次阅读

赛力斯与奥托立夫技术交流日顺利举行

近日，奥托立夫首次走进赛力斯，在其重庆总部举办了一场规模盛大的全方位技术交流活动，并把前沿的安全黑科技和安全系统集成解决方案带到了赛力斯。借此活动，双方加深了对彼此在研发与市场方向的认知，深化了合作关系，共同携手打造了一场高水准、高品质、高规格的汽车安全产业

的头像

发表于 12-02 14:25 •344次阅读

润和软件2024南京开源生态发展交流活动回顾

基金会OpenHarmony项目群初始成员单位、A类捐赠人、核心共建单位，以及南京本地引领开源生态发展与技术创新的重点企业，与母公司江苏润和软件股份有限公司（以下简称“润和软件”）共同参与承办“2024南京开源生态发展交流活动”，并受邀出席“2024‘才汇金陵’高层次软件

的头像

发表于 09-23 16:03 •890次阅读

开箱即用，AISBench测试展示英特尔至强处理器的卓越推理性能

近期，第五代英特尔®至强®可扩展处理器通过了中国电子技术标准化研究院组织的人工智能服务器系统性能测试（AISBench）。英特尔成为首批通过AISBench大语言模型（LLM）推理性能测试的企业

的头像

发表于 09-06 15:33 •446次阅读

开箱即用，AISBench测试展示英特尔至强处理器的卓越<b class='flag-5'>推理性能</b>

魔搭社区借助NVIDIA TensorRT-LLM提升LLM推理效率

“魔搭社区是中国最具影响力的模型开源社区，致力给开发者提供模型即服务的体验。魔搭社区利用NVIDIA TensorRT-LLM，大大提高了大语言模型的推理性能，方便了模型应用部署，提高

的头像

发表于 08-23 15:48 •546次阅读

赛力斯与意法半导体技术交流日活动成功举办

‍‍‍‍‍‍‍近日，中国新能源汽车行业的领军企业赛力斯(Seres)与意法半导体，在重庆联合举办技术交流日活动。

的头像

发表于 08-01 10:18 •1664次阅读

奥托立夫与深蓝汽车技术交流活动圆满落幕

2024年7月23日，奥托立夫深入合作伙伴深蓝汽车重庆总部，成功举办了一场以“智驭安全·共筑未来”为核心议题的技术交流活动。此次活动不仅深化了双方在汽车安全领域的合作纽带，更彰显了双方携手并进、共筑汽车安全新高地的坚定信念。

的头像

发表于 07-24 09:58 •653次阅读

0706线下活动 I DDR4/DDR5内存技术高速信号专题设计技术交流活动

01活动主题DDR4/DDR5内存技术高速信号专题设计技术交流活动时间：2024年7月6日（本周六）10：00地点：深圳市南山区科技南十二路曙光大厦1002（深圳地铁1号线，高新园地铁站D出口200

的头像

发表于 07-06 08:12 •413次阅读

0706线下<b class='flag-5'>活动</b> I DDR4/DDR5内存<b class='flag-5'>技术</b>高速信号专题设计<b class='flag-5'>技术交流活动</b>

紫光同芯出席“走进理想”技术展览及交流活动

6月27日，“走进理想”技术展览及交流活动在北京圆满落幕。紫光同芯受邀出席，与行业专家、业界精英共聚一堂，围绕电动化、智能化、轻量化等关键领域核心技术，深入探讨智能汽车发展进程中的创新路径。

的头像

发表于 07-02 14:45 •577次阅读

法雷奥集团技术交流日活动圆满结束！

交流，共同探讨目前行业热点及最新技术。“活动现场本次技术交流会得到法雷奥集团的大力支持，各个部门工程师都积极参与。同星智能针对当前客户的相关需求，在本次

的头像

发表于 06-08 08:22 •410次阅读

法雷奥集团<b class='flag-5'>技术交流</b>日<b class='flag-5'>活动</b>圆满结束！

2024瑞萨技术交流日进行中，米尔诚邀您参观

2024年5月28日，全球半导体解决方案供应商瑞萨电子举办的“2024年瑞萨技术交流日”在深圳拉开序幕。米尔作为领先的嵌入式处理器模组厂商将出席此次活动米尔电子在现场展出瑞米派RemiPi，以及米尔

的头像

发表于 05-30 08:01 •529次阅读

2024瑞萨<b class='flag-5'>技术交流</b>日进行中，米尔诚邀<b class='flag-5'>您</b>参观

自然语言处理应用LLM推理优化综述

当前，业界在将传统优化技术引入 LLM 推理的同时，同时也在探索从大模型自回归解码特点出发，通过调整推理过程和引入新的模型结构来进一步提升推理性能。

发表于 04-10 11:48 •700次阅读

自然语言处理应用LLM<b class='flag-5'>推理</b>优化综述

使用NVIDIA Triton推理服务器来加速AI预测

这家云计算巨头的计算机视觉和数据科学服务使用 NVIDIA Triton 推理服务器来加速 AI 预测。

的头像

发表于 02-29 14:04 •650次阅读