由蚂蚁集团和 NVIDIA 携手举办的“Triton Meetup 2023”将于 2 月 25 日在北京举行。该活动是 Triton 社区首次正式举办的线下技术交流活动。来自美团、京东、蚂蚁、NVIDIA 的技术专家将带来 AI Infra、推理引擎相关的专题分享,包括目前各企业面临的模型推理挑战、Triton 的应用及落地的具体方案等,现身说法,干货十足。此外,还有来自蔚来的特邀嘉宾,带来“AI 推理服务的当下与未来”圆桌主题讨论,欢迎到现场的小伙伴积极参与!
活动地点:
北京 BCos 共享办公--多功能厅
(北京 WFC 环球金融中心办公店)
活动时间:
2023 年 2 月 25 日
14:00 - 18:00
活动报名:
长按扫描下方二维码
或点击文末“阅读原文”
即可预约报名!
![890b3a2e-ad07-11ed-bfe3-dac502259ad0.png](https://file1.elecfans.com//web2/M00/99/13/wKgaomTnYsqAJYrvAAA5RxIVQBM851.png)
Triton Meetup 2023 活动流程
★
14:00 - 14:05
开场
14:05 - 14:45
NVIDIA Triton Inference Server的现在和未来
14:45 - 15:25
Triton 在蚂蚁全场景落地的优化
15:25 - 15:40
NVIDIA & 蚂蚁开源社区共建启动仪式
15:40 -16:20
Triton 在美团数据中心的应用
16:20 - 17:00
Triton 在京东零售的应用与实践
17:00 - 17:20
圆桌讨论:AI 推理服务的当下与未来
下面一起来看看嘉宾阵容吧!
议题一:NVIDIA Triton
Inference Server 的现在和未来
申意
NVIDIA 解决方案架构师
![891f8a88-ad07-11ed-bfe3-dac502259ad0.png](https://file1.elecfans.com//web2/M00/99/13/wKgaomTnYsqAJFLuAAFtnmbgGxQ317.png)
负责为消费互联网行业提供 GPU 计算解决方案。包括编解码,数据前后处理,模型推理及服务化等。
议题简介:
-
Triton 简介
-
Triton 重要 Feature 简介和 Roadmap 更新
-
Triton 的成功案例
议题二:Triton 在蚂蚁全场景落地的优化
饶星
蚂蚁集团高级技术专家
![89495a84-ad07-11ed-bfe3-dac502259ad0.jpg](https://file1.elecfans.com//web2/M00/99/13/wKgaomTnYsqAUy2MAABCF1i83mY469.jpg)
蚂蚁集团推理团队技术负责人,负责蚂蚁集团全部业务场景的推理服务,长期专注在推理相关的架构和性能优化。
议题简介:
-
Triton 在搜索、推荐、广告业务场景的解决方案
-
Triton 在认知业务的解决方案
-
结合业务场景,蚂蚁进一步的优化方案
议题三:Triton 在美团数据中心的应用
王新
美团机器学习平台预测引擎团队
技术负责人
![8968707c-ad07-11ed-bfe3-dac502259ad0.png](https://file1.elecfans.com//web2/M00/99/13/wKgaomTnYsqAU0aaAANNrqlJJaY489.png)
美团机器学习平台预测引擎团队技术负责人,长期专注于机器学习预测引擎相关的开发工作。
议题简介:
-
机器学习模型在美团落地的痛点
-
Triton 落地的具体方案
-
使用 Triton 的业务收益与效果
议题四:Triton 在京东零售的应用与实践
杨培军
京东零售算法中台技术架构师
![89a674c6-ad07-11ed-bfe3-dac502259ad0.jpg](https://file1.elecfans.com//web2/M00/99/13/wKgaomTnYsqAGslrAAAnLyNSp-Y322.jpg)
长期从事机器学习平台/深度学习推理加速和框架的研发,曾负责阿里妈妈搜索广告预估平台、Bigo 机器学习平台的建设。
议题简介:
-
京东零售的多元化算法需求给模型推理带来的挑战
-
介绍京东算法中台在面向 CV/NLP 场景基于 Triton 二次开发的高性能推理框架
-
阐述推理框架的架构演进和性能优化工作
圆桌讨论:AI 推理服务的当下与未来
特邀嘉宾:郭城
![89baadc4-ad07-11ed-bfe3-dac502259ad0.jpg](https://file1.elecfans.com//web2/M00/99/13/wKgaomTnYsqANz7gAAAhpj89HjY062.jpg)
负责搭建 NADP 云上推理系统,模型 CICD。
交通指引 & 防疫政策:
1. 自驾到场:
开车行进至“环球金融中心”,在大楼南侧地下停车场进入。
2. 地铁前往:
地铁 10 号线至“金台夕照”站,从 A 口出,步行 3-5 分钟,从环球金融中心南门进入。
原文标题:如何最大化推理性能?Triton 社区技术交流活动与您畅聊
文章出处:【微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。
-
英伟达
+关注
关注
22文章
3857浏览量
92146
原文标题:如何最大化推理性能?Triton 社区技术交流活动与您畅聊
文章出处:【微信号:NVIDIA-Enterprise,微信公众号:NVIDIA英伟达企业解决方案】欢迎添加关注!文章转载请注明出处。
发布评论请先 登录
相关推荐
解锁NVIDIA TensorRT-LLM的卓越性能
光伏发电如何实现能效最大化
赛力斯与奥托立夫技术交流日顺利举行
润和软件2024南京开源生态发展交流活动回顾
开箱即用,AISBench测试展示英特尔至强处理器的卓越推理性能
![开箱即用,AISBench测试展示英特尔至强处理器的卓越<b class='flag-5'>推理性能</b>](https://file1.elecfans.com/web2/M00/05/87/wKgZombasFCAOb28AAQWiisN-UI496.png)
魔搭社区借助NVIDIA TensorRT-LLM提升LLM推理效率
赛力斯与意法半导体技术交流日活动成功举办
奥托立夫与深蓝汽车技术交流活动圆满落幕
0706线下活动 I DDR4/DDR5内存技术高速信号专题设计技术交流活动
![0706线下<b class='flag-5'>活动</b> I DDR4/DDR5内存<b class='flag-5'>技术</b>高速信号专题设计<b class='flag-5'>技术交流活动</b>](https://file.elecfans.com/web2/M00/27/37/poYBAGHBmA2AD7e7AAAahjWuYP4250.jpg)
紫光同芯出席“走进理想”技术展览及交流活动
2024瑞萨技术交流日进行中,米尔诚邀您参观
![2024瑞萨<b class='flag-5'>技术交流</b>日进行中,米尔诚邀<b class='flag-5'>您</b>参观](https://file.elecfans.com/web2/M00/08/64/pYYBAGDwFEGADIPWAAFlJOlmLxg664.jpg)
自然语言处理应用LLM推理优化综述
![自然语言处理应用LLM<b class='flag-5'>推理</b>优化综述](https://file1.elecfans.com/web2/M00/C8/A0/wKgaomYWEl2AF7LLAAAS-FUCvm4140.png)
评论