0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

NVIDIA系统团队三连胜的秘诀都在这篇

世强SEKORM 来源:NVIDIA英伟达中国 作者:NVIDIA英伟达中国 2021-08-02 14:17 次阅读

在应对重大行业挑战方面拥有大量成功经验的 NVIDIA 专家分享了打造出色推荐系统的制胜诀窍。

“三连胜”之战已经到了最后的冲刺关头。

在截止时间前五分钟,这支团队提交了竞赛作品,这是今年第三次也是难度最高的一次推荐系统数据科学竞赛。它叫做 RecSys,是计算机科学一个相对较新的分支,它催生了机器学习领域常用的应用程序之一,这一程序帮助数百万人找到他们想看、想买和想玩的内容。

该团队共使用了六个 AI 模型,达到了比赛规定的 20 千兆字节上限,所有这些模型都是根据他们研究 7.5 亿个数据点的经验精挑细选出来的。这次比赛有一项不同寻常的规则,要求模型必须基于一个云端 CPU 的单一内核运行,并且运行时间不能超过 24 小时。

他们按下了提交按钮,静静等待。

23 小时 40 分钟后,一封电子邮件送来捷报:他们位列榜首。

紧扣截止时间

根据 6 月 28 日正式宣布的比赛结果,这支由七人组成的 NVIDIA 参赛团队第二次赢得 ACM RecSys 2021 挑战赛。

“这封电子邮件的到来可以说是紧扣截止时间 – 如果再晚 20 分钟,我们就超出 24 小时的运行时间了,” Chris Deotte 说道,他是参赛小组的成员之一,也是被视为线上数据科学界的奥林匹克的卡格尔比赛的大师级人物。

“我们当时真的很紧张,” Benedikt Schifferer 说,他是帮助设计 NVIDIA Merlin 框架的团队成员之一,该框架可以帮助用户快速建立自己的推荐系统。

GPU 本可以在很短的时间内完成推理工作。这支团队中常驻巴西的卡格尔比赛大师 Gilberto Titericz 表示,让推理工作去适应 CPU 核心“就好像回到了远古时代”。

事实上,比赛一结束,该团队就展示了在 CPU 核心上花费近 24 小时的推理工作,在单个 NVIDIA A100 Tensor Core GPU 上运行只需 7 分钟。

在每天 4 千万个数据点中找出推荐项

在比赛中,Twitter 在 28 天内每天向参与者提供数百万个数据点,并要求他们预测用户会点赞或转推哪些推文。这是这一针对 RecSys 的领先技术会议发起的行业实力挑战,吸引了来自 Facebook、Google、Spotify 等公司的优秀工程师

这个学科领域真的很难,但也非常实用。推荐系统为我们的数字经济提供发展动力,通过比传统搜索更快、更智能的方式提供建议。

行业挑战赛有助于推动这一领域的发展,让每个人都能从中受益,不论他们是在为配偶寻找完美的礼物,还是尝试在网上寻找一位老朋友。

五个月,三连胜

今年早些时候,NVIDIA 团队在 Booking.com 挑战赛的 40 支参赛小组中拨得头筹。他们使用数百万个匿名数据点来准确的预测了欧洲度假者最终将选择前往的城市。

今年 6 月,另一项顶级 RecSys 大赛SIGIR 电子商务数据挑战赛设置了更高的门槛。

信息检索特别兴趣小组 SIGIR 的年度会议吸引了来自阿里巴巴和沃尔玛实验室的专家。其 2021 年挑战赛提供了 3700 万个在线购物会话的数据点,并要求参赛者预测用户会购买哪些产品

由于这场比赛与 ACM RecSys挑战赛的时间重叠,NVIDIA 团队不得不兵分两路,各有侧重地参与不同的比赛。一些团队成员在此压力下正埋头为 ACM RecSys 会议撰写论文。

“快攻”艺术

其中一只 NVIDIA 团队共包含五名成员,分别身处巴西、加拿大、法国和美国在每个排行榜中这只团队均排名第一或第二。能取得这样出色的整体表现,主要有两个因素。

其一,他们在 Transformer 模型上下了很大功夫,这些模型是为自然语言处理开发的,并越来越多地被 RecSys 所采用。

其二,他们深谙轮班工作的工作方法。“在一名成员将要入睡时,另一名身处不同时区的成员就可以接手工作,”Merlin 团队负责人 Even Oldridge 说。

“在一切顺利时,这种做法非常有效,我很惊讶我们在过去一年中取得的成就,这不但培养了我们的内部知识,也树立了我们在 RecSys 社区中的地位,让我们能够在 5 个月内赢得三场重要比赛。”

尊重用户隐私

这项比赛要求模型在对用户没有任何背景了解的情况下对用户进行预测,参赛者对于用户的所知仅限于其当前浏览会话。

位于圣保罗的领导 NVIDIA SIGIR 团队的 Merlin 资深研究员 Gabriel Moreira表示:“这是一项重要的任务,因为有时用户希望匿名浏览,并且一些隐私法限制了对于用户历史信息的访问。”

这场比赛标志着该团队首次在挑战赛的关键部分只使用 Transformer 模型。Moreira 的团队致力于让每一位 Merlin 客户更轻松地获享庞大的神经网络

从三连胜到四连胜

6 月 30 日,NVIDIA在 RecSys 挑战赛取得四连胜。行业基准组织 MLPerf 宣布,NVIDIA及 其合作伙伴在其所有最新训练基准测试中均创下新纪录,其中包括一个有关推荐系统的基准测试。

参赛团队描述了他们取得的成果——即在不到一分钟内训练基于 14 个NVIDIA DGX系统的推荐系统,与一年前提交的成果相比,速度加快了 3.3 倍。

分享经验心得

这些竞赛激发了新技术的创意,这些新技术被纳入像 Merlin 这样的 RecSys 框架,以及 NVIDIA 深度学习学院所拥有的相关工具、论文和在线课程。以达到最终目标:帮助每个人取得成功。

在采访中,NVIDIA 的 RecSys 专家自由地分享了他们的技术诀窍 —— 一半是艺术,一半是科学。

关于如何打造出色 RecSys 的

专业小贴士

一种最佳实践是使用多种模型,并使其协同工作。

在 ACM RecSys 挑战赛中,团队同时使用了树状和神经网络模型。一个阶段的输出成为了下一个阶段的输入,这一过程称为推叠。

NVIDIA 卡格尔比赛大师团队的新成员 Bo Liu 表示:“单个模型可能会因为数据错误或收敛问题而出错,但如果把几个模型结合起来,那么力量就会无比强大。”

编辑:jq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4994

    浏览量

    103193

原文标题:NVIDIA推荐系统团队三连胜的获胜秘诀:想你所想

文章出处:【微信号:sekorm_info,微信公众号:世强SEKORM】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    NVIDIA加速全球大多数超级计算机推动科技进步

    。 在今年的最新 TOP500 榜单中,有 384 个系统采用了 NVIDIA 技术。在新上榜的 53 个系统中,有 46 个系统(占比 87%)采用了
    的头像 发表于 11-24 14:38 335次阅读
    <b class='flag-5'>NVIDIA</b>加速全球大多数超级计算机推动科技进步

    使用NVIDIA AI平台确保医疗数据安全

    井物产株式会社子公司借助 NVIDIA AI 平台实现数据集的安全共享并使用在这些数据集上建立的强大模型加速药物研发。
    的头像 发表于 11-20 09:37 189次阅读

    科纳米即将科创板IPO上会

    近日,上交所官网发布重要公告,科纳米(苏州)股份有限公司(简称“科纳米”)将于2024年11月22日迎来科创板首发上会。此举标志着科纳米有望成为第一家在科创板上市的专业半导体第
    的头像 发表于 11-19 18:03 423次阅读

    NVIDIA新增生成式AI就绪系统认证类别

    借助全新的 NVIDIA Spectrum-X Ready 和 NVIDIA IGX 认证,领先的制造业合作伙伴将提供高性能系统,帮助客户轻松部署 AI。
    的头像 发表于 10-10 09:44 387次阅读

    艾毕MS4931相无刷电机驱动技术特点

    在科技飞速发展的今天,电机驱动技术不断推陈出新,其中艾毕 MS4931 相无刷电机驱动 以其卓越的性能和创新的设计,在众多领域崭露头角。接下来,让我们一同深入了解这款令人瞩目的技术。 一、艾毕
    的头像 发表于 09-03 16:54 420次阅读

    喜报|Amass连接器助力电子科技大学机器人队荣耀夺冠

    7月中旬,在第23届全国大学生机器人大赛ROBOCON暨2024年亚太大学生机器人大赛国内选拔赛中,电子科技大学机器人队力压群雄,以全胜战绩夺得三连冠。这一辉煌成绩,不仅是团队智慧与汗水的结晶,也是Amass连接器品质的见证!
    的头像 发表于 08-19 10:40 717次阅读
    喜报|Amass连接器助力电子科技大学机器人队荣耀夺冠

    一年三连降,苹果没招了

    iPhone15系列发布后,就一直没能逃脱降价的魔咒。从去年双11、今年春节,到618大促,苹果不到一年时间,已经上价格杠杆以期提振销量,但均效果有限。一众网友们,面对苹果的“挤牙膏”式创新
    的头像 发表于 06-05 08:05 170次阅读
    一年<b class='flag-5'>三连</b>降,苹果没招了

    NVIDIA 通过 Holoscan 为 NVIDIA IGX 提供企业软件支持

    美敦力、SETI 协会以及领先制造商正在构建 NVIDIA IGX 系统,为 AI 在工业边缘赋能。   NVIDIA 于6月2日宣布,集成NVIDIA Holoscan的
    的头像 发表于 06-04 10:21 519次阅读

    Green500全球最节能超级计算机榜单:采用NVIDIA技术包揽前

    NVIDIA 系统在 Green500 榜单上的强势表现进一步验证了 NVIDIA 平台为节能型计算机所打造。
    的头像 发表于 05-24 10:59 651次阅读

    Nvidia Jetson Nano + CYW55573/AWXB327MA-PUR M.2无法使用操作系统内置的网络管理器管理Wi-Fi如何解决?

    我们使用的是 Nvidia Jetson Nano + CYW55573/AWXB327MA-PUR M.2 ,请参阅 Nvidia Jetson 与英飞凌 AIROC Wi-Fi 6
    发表于 05-23 06:47

    利用NVIDIA组件提升GPU推理的吞吐

    本实践中,唯品会 AI 平台与 NVIDIA 团队合作,结合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)将推理的稠密网络和热
    的头像 发表于 04-20 09:39 747次阅读

    基于NVIDIA Megatron Core的MOE LLM实现和训练优化

    本文将分享阿里云人工智能平台 PAI 团队NVIDIA Megatron-Core 团队在 MoE (Mixture of Experts) 大语言模型(LLM)实现与训练优化上的创新工作。
    的头像 发表于 03-22 09:50 799次阅读
    基于<b class='flag-5'>NVIDIA</b> Megatron Core的MOE LLM实现和训练优化

    SIM卡座选二接器的工作原理

    随着科技的不断进步和智能化趋势的加速,SIM卡座连接器作为连接移动设备与通信网络的重要桥梁,其生产发展也日新月异。在这个过程中,多功能SIM卡座的需求量日益增长,尤其是SIM卡座选二
    的头像 发表于 03-15 16:48 1505次阅读
    SIM卡座<b class='flag-5'>三</b>选二<b class='flag-5'>连</b>接器的工作原理

    巨头豪购35万块NVIDIA最强GPU H100

    NVIDIA AI GPU无疑是当下的硬通货,从科技巨头到小型企业都在抢。
    的头像 发表于 01-29 09:58 1113次阅读
    巨头豪购35万块<b class='flag-5'>NVIDIA</b>最强GPU H100

    国轩高科“三连签”!

    近些年,新能源商用车行业需求处于加速释放阶段,并于2022年也迈入了10%的渗透率节点。预计未来数年将迎来新能源商用车需求爆发期,到2030年中国商用车新能源基本场景渗透率能达到30%以上。
    的头像 发表于 01-10 16:38 555次阅读