0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

想你所想:推荐系统团队建议获胜策略

西西 来源:厂商供稿 作者:NVIDIA 2021-07-21 14:55 次阅读

在应对重大行业挑战方面拥有大量成功经验的NVIDIA 专家分享了打造出色推荐系统的制胜诀窍。

“三连胜”之战已经到了最后的冲刺关头。

在截止时间前五分钟,这支团队提交了竞赛作品,这是今年第三次也是难度最高的一次推荐系统数据科学竞赛。它叫做 RecSys,是计算机科学一个相对较新的分支,它催生了机器学习领域常用的应用程序之一,这一程序帮助数百万人找到他们想看、想买和想玩的内容。

该团队共使用了六个 AI 模型,达到了比赛规定的 20 千兆字节上限,所有这些模型都是根据他们研究 7.5 亿个数据点的经验精挑细选出来的。这次比赛有一项不同寻常的规则,要求模型必须基于一个云端 CPU 的单一内核运行,并且运行时间不能超过 24 小时。

他们按下了提交按钮,静静等待。

23 小时 40 分钟后,一封电子邮件送来捷报:他们位列榜首。

紧扣截止时间

根据 6 月 28 日正式宣布的比赛结果,这支由七人组成的NVIDIA 参赛团队第二次赢得ACM RecSys 2021 挑战赛。

“这封电子邮件的到来可以说是紧扣截止时间 – 如果再晚 20 分钟,我们就超出 24 小时的运行时间了,”Chris Deotte 说道,他是参赛小组的成员之一,也是被视为线上数据科学界的奥林匹克的卡格尔比赛的大师级人物。

“我们当时真的很紧张,”Benedikt Schifferer 说,他是帮助设计NVIDIA Merlin框架的团队成员之一,该框架可以帮助用户快速建立自己的推荐系统。

GPU 本可以在很短的时间内完成推理工作。这支团队中常驻巴西的卡格尔比赛大师 Gilberto Titericz 表示,让推理工作去适应 CPU 核心“就好像回到了远古时代”。

事实上,比赛一结束,该团队就展示了在CPU核心上花费近24小时的推理工作,在单个NVIDIA A100 Tensor Core GPU上运行只需7分钟。

在每天 4 千万个数据点中找出推荐项

在比赛中,Twitter 在 28 天内每天向参与者提供数百万个数据点,并要求他们预测用户会点赞或转推哪些推文。这是这一针对 RecSys 的领先技术会议发起的行业实力挑战,吸引了来自Facebook、Google、Spotify 等公司的优秀工程师

图注:RecSys 挑战团队的部分成员(从左上角开始,按顺时针次序依次为):Bo Liu、Benedikt Schifferer、Gilberto Titericz 和 Chris Deotte。

这个学科领域真的很难,但也非常实用。推荐系统为我们的数字经济提供发展动力,通过比传统搜索更快、更智能的方式提供建议。

行业挑战赛有助于推动这一领域的发展,让每个人都能从中受益,不论他们是在为配偶寻找完美的礼物,还是尝试在网上寻找一位老朋友。

五个月,三连胜

今年早些时候,NVIDIA 团队在 Booking.com 挑战赛的 40 支参赛小组中拨得头筹。他们使用数百万个匿名数据点来准确的预测了欧洲度假者最终将选择前往的城市。

今年 6 月,另一项顶级 RecSys 大赛SIGIR 电子商务数据挑战赛设置了更高的门槛。

信息检索特别兴趣小组 SIGIR 的年度会议吸引了来自阿里巴巴和沃尔玛实验室的专家。其 2021 年挑战赛提供了 3700 万个在线购物会话的数据点,并要求参赛者预测用户会购买哪些产品

由于这场比赛与 ACM RecSys挑战赛的时间重叠,NVIDIA 团队不得不兵分两路,各有侧重地参与不同的比赛。一些团队成员在此压力下正埋头为 ACM RecSys 会议撰写论文。

“快攻”艺术

其中一只NVIDIA团队共包含五名成员,分别身处巴西、加拿大、法国和美国在每个排行榜中这只团队均排名第一或第二。能取得这样出色的整体表现,主要有两个因素。其一,他们在 Transformer 模型上下了很大功夫,这些模型是为自然语言处理开发的,并越来越多地被 RecSys所采用。其二,他们深谙轮班工作的工作方法。“在一名成员将要入睡时,另一名身处不同时区的成员就可以接手工作,”Merlin 团队负责人 Even Oldridge 说。

“在一切顺利时,这种做法非常有效,我很惊讶我们在过去一年中取得的成就,这不但培养了我们的内部知识,也树立了我们在 RecSys 社区中的地位,让我们能够在 5 个月内赢得三场重要比赛。”

尊重用户隐私

这项比赛要求模型在对用户没有任何背景了解的情况下对用户进行预测,参赛者对于用户的所知仅限于其当前浏览会话。

位于圣保罗的领导 NVIDIA SIGIR 团队的 Merlin 资深研究员 Gabriel Moreira表示:“这是一项重要的任务,因为有时用户希望匿名浏览,并且一些隐私法限制了对于用户历史信息的访问。”

这场比赛标志着该团队首次在挑战赛的关键部分只使用 Transformer 模型。Moreira 的团队致力于让每一位 Merlin 客户更轻松地获享庞大的神经网络

从三连胜到四连胜

6 月 30 日,NVIDIA在 RecSys 挑战赛取得四连胜。行业基准组织 MLPerf 宣布,NVIDIA及 其合作伙伴在其所有最新训练基准测试中均创下新纪录,其中包括一个有关推荐系统的基准测试。

参赛团队描述了他们取得的成果——即在不到一分钟内训练基于 14 个NVIDIA DGX系统的推荐系统,与一年前提交的成果相比,速度加快了 3.3 倍。

分享经验心得

这些竞赛激发了新技术的创意,这些新技术被纳入像 Merlin 这样的 RecSys 框架,以及NVIDIA 深度学习学院所拥有的相关工具、论文和在线课程。以达到最终目标:帮助每个人取得成功。

在采访中,NVIDIA 的 RecSys 专家自由地分享了他们的技术诀窍 – 一半是艺术,一半是科学。

关于如何打造出色 RecSys 的专业小贴士

一种最佳实践是使用多种模型,并使其协同工作。

在 ACM RecSys 挑战赛中,团队同时使用了树状和神经网络模型。一个阶段的输出成为了下一个阶段的输入,这一过程称为推叠。

NVIDIA 卡格尔比赛大师团队的新成员 Bo Liu 表示:“单个模型可能会因为数据错误或收敛问题而出错,但如果把几个模型结合起来,那么力量就会无比强大。”

在线结识 Recsys 专家

7 月 29 日,可以在线结识来自 Facebook、NVIDIA 和 TensorFlow 的RecSys 专家,进一步了解如何创建出色的推荐系统。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • NVIDIA
    +关注

    关注

    14

    文章

    4930

    浏览量

    102794
  • 推荐系统
    +关注

    关注

    1

    文章

    43

    浏览量

    10073
收藏 人收藏

    评论

    相关推荐

    高级顾问宣布离职!OpenAI解散“AGI筹备”团队

    近日,OpenAI宣布解散其“AGI筹备”团队,该团队主要负责向公司提供关于人工智能发展的战略建议,以及评估全球对该技术的准备情况。这一消息引起了业界的广泛关注。 AGI筹备团队的高级
    的头像 发表于 10-29 15:16 316次阅读

    35kV线路故障诊断装置|提前布局‌|多元供电|防护策略建议

    35kV线路故障诊断装置|提前布局‌|多元供电|防护策略建议 在现代电力系统中,35kV配网作为连接高压输电与低压配电的关键环节,其安全性和稳定性直接关系到整个电网的运行质量。然而,随着电网规模
    的头像 发表于 09-24 11:04 152次阅读

    TCS系统的核心控制策略与方法

    策略与方法 控制策略:TCS系统运用了一系列高级控制理论,包括逻辑阈值、比例积分微分(PID)控制、模糊逻辑和神经网络技术。这些控制策略使系统
    的头像 发表于 08-29 11:25 484次阅读

    微电网能量管理系统策略控制怎么实现

    , MEMS)作为微电网的大脑,其策略控制如何实现,直接关系到微电网的稳定运行和能源的高效利用。本文将从策略控制的角度出发,深入探讨微电网能量管理系统的实现原理与深度思考。   1 微电网能量管理
    的头像 发表于 07-03 18:29 454次阅读

    电机控制系统的神经网络优化策略

    电机控制系统作为现代工业自动化的核心组成部分,其性能直接影响到整个生产线的效率和稳定性。随着人工智能技术的快速发展,神经网络在电机控制系统中的应用越来越广泛。神经网络优化策略通过模拟人脑神经元的连接
    的头像 发表于 06-25 11:46 571次阅读

    探究电池储能系统恒功率削峰填谷策略

    摘要: 以南方电网MW级电池储能示范工程为背景,以求解采用恒功率充放电策略运行的电池储能系统削峰填谷策略为目的,提出了电池储能系统恒功率削峰填谷优化模型及求解该模型的实用简化算法。该算
    的头像 发表于 05-23 15:14 1529次阅读
    探究电池储能<b class='flag-5'>系统</b>恒功率削峰填谷<b class='flag-5'>策略</b>

    谷歌解散整个Python团队

    近日,谷歌Python工程师Thomas Wouters在社交媒体上透露,谷歌对其Python团队进行了架构调整,整个团队被解散。这一变动可能源于公司的成本优化策略,涉及团队重组和裁员
    的头像 发表于 05-06 10:50 591次阅读

    基于结构微流体创新的谱系细胞单克隆自动化获取策略

    近期,中国科学院广州健康院张骁研究员团队提出一种基于结构微流体创新的谱系细胞单克隆自动化获取策略
    的头像 发表于 04-22 17:13 606次阅读
    基于结构微流体创新的谱系细胞单克隆自动化获取<b class='flag-5'>策略</b>

    鸿蒙原生应用/元服务实战-AGC团队账户

    多人及内外结合去开发运营鸿蒙原生应用元服务时,需要用到团队账户,AGC提供了强大的团队角色与权限分工能力。 团队帐号是开发者联盟为实名开发者提供的多个成员帐号登录与权限管理服务。当前团队
    发表于 01-18 16:38

    OpenAI组建AI价值观新团队

    近日,人工智能领域的领军企业OpenAI宣布,他们正在组建一个全新的团队,名为“集体对齐”(Collective Alignment)。这个团队主要由研究人员和工程师组成,旨在设计和实施一套系统性的流程,以收集和利用公众意见,帮
    的头像 发表于 01-17 15:00 630次阅读

    逆变电路的控制策略与方法介绍

    逆变电路的控制策略与方法主要包括脉冲宽度调制(PWM)、空间矢量脉宽调制(SVPWM)、谐振软开关(RRS)等。这些控制策略和方法可以实现对逆变电路输出电压的稳定、高效和低谐波控制,提高整个系统
    的头像 发表于 12-27 17:14 1620次阅读
    逆变电路的控制<b class='flag-5'>策略</b>与方法介绍

    ESD静电的原理与整改建议

    ESD静电的原理与整改建议?|深圳比创达电子EMC
    的头像 发表于 12-07 10:12 845次阅读
    ESD静电的原理与整改<b class='flag-5'>建议</b>?

    redis的淘汰策略

    Redis是一种基于内存的键值存储系统,为了充分利用内存,Redis采用了一些淘汰策略来管理内存空间。淘汰策略的作用是当内存空间不足时,选择合适的数据对象进行淘汰,释放出更多的内存空间,以供后续
    的头像 发表于 12-04 16:23 521次阅读

    成长靠老板,强大靠团队 ——发挥团队力量,共创企业辉煌

    十天左右,快的一星期。大货订单往往就是从开发到交货就是一个月,哪有时间去做一个完美的原理图。花了无数心血做一个完美的电路图,连修理都很少用。公司为此花费五十多万升级的物料管理系统,没有开发工程师执行
    发表于 12-03 13:55

    TogetherROS系统更新和CPU调频策略配置

    远程软件源 $ sudo apt full-upgrade #升级所有可以升级的软件包 弹出如下对话,我们选择“Y”,回车; 这样我们就完成了对系统更新的检查,并安装好了更新包。 CPU调频策略 第三个配置,设置CPU的调频策略
    的头像 发表于 12-01 15:44 871次阅读
    TogetherROS<b class='flag-5'>系统</b>更新和CPU调频<b class='flag-5'>策略</b>配置