0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

使用机器学习对Spotify主页面进行个性化设置

Tensorflowers 来源:TensorFlow 作者:TensorFlow 2020-11-18 17:26 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

机器学习是我们在 Spotify 所做一切的核心所在。特别是在 Spotify 的主页面上,它使我们能够提供个性化的用户体验,并为数十亿粉丝提供欣赏艺术家作品并从中获得启发的机会。这就是 Spotify 的独到之处。

在我们的工程部门,我们正在努力联合自主团队,通过建立工具和方法上的最佳实践来提升工作效率。我们最近采用的标准化机器学习基础架构为我们的工程师提供了能够快速创建和迭代模型的环境和工具。我们称其为 “铺平道路” 方法,其中包括利用 TensorFlow,Kubeflow 和 Google Cloud Platform 的服务。

加入 Spotify 之前,我曾在 Netflix 从事个性化算法和主页面内容的工作。我以前的经验与现在我在 Spotify 担任工程副总裁兼机器学习负责人的工作非常相似。但是,个性化 Spotify 的主页面会带来一系列新的挑战,我将稍后分享。

机器学习使我们能够推荐艺术家,歌单和播客,从而使用户变得更佳活跃并更有可能长期订阅。理论上这些都很棒,但是怎样能使我们比竞争对手做得更好呢?毕竟,我们并不是唯一一家试图构建定制化着陆页,以其独特价值吸引用户的内容流媒体平台。

Spotify 的主页面

答案:个性化的力量

与 Netflix 一样,我们使用一系列的卡片和架子来组织主页面。卡片是用来展示歌单,播客,专辑,艺术家页面等内容的方形图像。架子是用来将这些卡片打包并排成一行。您可以将它想象为一个书橱(Spotify 主页面)在使用书架(架子)来保存和展示图书(卡片)。

以此类推,每个人的书架都会根据他们的兴趣和阅读历史来进行特别的布置。但是,与实体书架不同,Spotify 使用机器学习根据用户之前喜欢或可能喜欢的内容来个性化架子和卡片,并向数百万用户个性化地展示。

我们将机器学习与用户的数据相结合,包括他们的播放历史、音乐口味、播放时长以及他们对推荐内容的喜好程度。这样的结合使得我们拥有了高级别的个性化能力,能够实时创建个性化主页面满足多达 2.48 亿月活跃用户 (MAU, Monthly Active Users) 的需求。我们要说的是,并没有“一个”真正的 Spotify。实质上,该产品有 2.48 亿个版本,每个用户都在使用专属于他们的独特版本!

卡片和架子

参与度与基于研究的推荐

从机器学习的角度来看,我们使用 Multi-Armed Bandit 作为框架解决利用与探索的难题。在工程领域之外,“利用”可能具有负面含义。但是,在制造个性化内容体验的推荐系统中,“利用”表示应用程序会根据用户先前选择的音乐或播客提供推荐内容。“探索”通过推荐未知内容,根据用户与推荐内容的互动反馈以进一步了解用户的喜好。“利用”与“探索”大不相同,后者基于不确定的用户参与度,并且更多的被用作研究工具。这种平衡框架确保我们在面对无论是新用户还是老用户都能实现个性化设置。我们还采用反事实训练和推理来评估我们的算法,而无需 A/B 测试或随机实验。

利用与探索
https://dl.acm.org/doi/10.1145/3240323.3240354

借助来自用户的数据,我们得以呈现您喜欢的内容,这些数据包括最近播放的专辑,反复播放的曲目和订阅的播客等。同时,我们会根据收听历史记录推荐新的曲目和艺术家。这些曲目打包成歌单的形式,例如歌单“更加喜欢”,“为您推荐”和“为您定制”。尽管主界面看起来自然且连续,但是您看到的几乎所有内容都是由“利用与探索” (Exploitation and Exploration) 方法生成的。

当然,只有在不间断地使用大量数据进行实验时,此方法才有效。为了让您直观地感受到规模上的差别,我们再次将 Spotify 主页面与 Netflix 的主页面进行比较。两个主页面都有相似的设置和挑战,对吗?不完全对。最大的区别在于用户和内容数据的规模大小,随之而来的便是我们必须扩展机器学习的规模以匹配如此大规模的需求。

数字说明了一切。Netflix 拥有约 1.58 亿用户,在 Spotify,我们有 2.48 亿用户。最重要的是,Netflix 在所有地区共计拥有约 5,800 部电影和节目,而 Spotify 却拥有超过 5,000 万首音乐曲目和 500,000 个播客电台。

还要注意的是,单集 Netflix 的内容的时长是从半小时(类似于情景喜剧)到长达几个小时(电影)。而 Spotify 上面的一支曲目的典型时长大概是三分半钟。考虑到需要索引的内容数据的频率和数量,这会导致在规模上的巨大差异。

结果呢?就是我们需要一个高度可扩展的环境,让我们可以运行大量、不间断的实时实验,从而使我们能够更好地利用我们的数据,为听众提供出色的体验。

从脆弱到牢不可破

在 Spotify 成立之初,我们编写了许多自定义资料库和 API,以推动我们的个性化工作背后的机器学习算法。这向机器学习团队提出了一些挑战。在尝试扩展我们的机器学习实践时,支持多个系统对于我们的工程师而言并不是理想的维护方式,并且与我们当前为提高工程师生产力所做的努力不符。

例如,我们需要研究 Multi-Armed Bandit 框架下的不同学习模型,包括逻辑回归,提升树 (Boosted Tree) 和更复杂的模型,如最新的深度神经网络体系结构。我们一直在不断重写代码,以使系统的各部分保持一致。完成一项实验后,留给我们的是一个有隐患而脆弱的系统,扩展性也很差,还需要在快速的生产环境中支持多个框架。在这种环境下是很难进行迭代和创新的。

这就是为什么我们转向标准化机器学习基础架构如此宝贵和及时的原因。TensorFlow Estimators 和 Tensorflow Data Validation 帮助我们最大程度地减少许多以前需要人工自定义的工作量。借助 TensorFlow Estimators,我们可以比以前更快地训练和评估模型,从而大大加快了迭代过程。

此外,迁移到 Kubeflow 非常有价值,因为它帮助我们更好地管理工作负载,并加快实验和产出 (Roll out) 的速度。现在,更快的自动训练显著加速了我们的机器学习算法的训练过程。

使用 Tensorflow Data Validation,我们无论在开发过程中还是在评估和产出期间均可以发现数据流水线和机器流水线中的错误。现在,借助仪表板,我们可以快速观察到流水线中存在的任何数据缺失或不一致之处,这要归功于仪表板所绘制的不同数据集上的要素和计数的分布图。

在一种情况下,我们看到训练数据中缺少付费会员的样本,而评估流程中缺少了免费用户的数据样本。从机器学习的角度来看,丢掉这些有价值的数据集是很可怕的,所幸我们可以用 TFDV 快速捕获它。更棒的是,我们还可以配置仪表板针对特定阈值触发警报,因此我们的工程师不必担心数据流水线的错误会流入系统。

架构升级带飞研发

为用户创建个性化主页的体验代价不菲。以前,我们的工程师花费大量时间来维护数据和后端系统。后来我们使用前文提到的工具(TensorFlow Extended、Kubeflow 和 Google Cloud Platform 生态系统)对我们的 ML 基础架构进行标准化。ML 架构标准化让我们在工程实践和生产力方面有了更好的理解。我们新近建立的最佳实践有一个显著优势,即它可以帮助我们在短期内大大提高用户满意度(对比基于流行度的基线)。

话虽如此,我们的实践只是初出茅庐。我们决定继续研究如何掌控机器学习与 AI 的力量,为我们的用户提供更加个性化的体验。

投资技术就是投资工程师

我们对这些技术的投资也是对机器学习工程师及其生产力的投资。我们希望我们的工程师专注于创新,并在 Spotify 推动机器学习的发展,而不是参与耗时的基础架构维护工作。我们的工程文化围绕着尽可能高产和高效的原则来帮助我们继续扩展平台,同时也为创作者和消费者创造了良好的用户体验。

定制 Spotify 主页面只是 Spotify 个性化的冰山一角。机器学习是一个令人兴奋的创新领域,我们仍在不断努力解决创建个性化体验方面的挑战。如果您有兴趣帮助我们解决机器学习工程方面的挑战,欢迎查看招聘职位并加入我们的团队。

责任编辑:lq

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    91

    文章

    40982

    浏览量

    302534
  • 机器学习
    +关注

    关注

    67

    文章

    8561

    浏览量

    137208
  • Spotify
    +关注

    关注

    0

    文章

    26

    浏览量

    2911

原文标题:案例分享 | 悦耳为君:使用机器学习对 Spotify 主页面进行个性化设置

文章出处:【微信号:tensorflowers,微信公众号:Tensorflowers】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    申矽凌与高通合作打造个性化智能穿戴体验

    申矽凌近日宣布,公司正与高通技术公司合作,在其Snapdragon Wear Elite平台上实现微型高精度温度传感。此举正值业界致力于通过新一代智能可穿戴设备实现传感领域能够更好地理解用户需求,提供主动服务,并带来高度个性化的体验。
    的头像 发表于 03-09 13:51 1655次阅读

    广州唯创电子WTR096A-16S语音芯片:丰富IO口实现个性化定制功能详解

    设计,为多行业提供了全新的定制化解决方案。本文将深入解析该芯片如何通过丰富的IO口实现个性化功能,满足用户对智能、人性产品的需求。二、强大的硬件支持:IO口的多样
    的头像 发表于 11-12 08:42 625次阅读
    广州唯创电子WTR096A-16S语音芯片:丰富IO口实现<b class='flag-5'>个性化</b>定制功能详解

    红外测温传感器在智能马桶中的创新应用:领麦微技术驱动的节能与个性化升级

    智能马桶已从基础功能设备升级为集健康监测、节能环保与个性化体验于一体的智能终端。其中,领麦微红外测温传感器凭借其高精度、毫秒级响应、非接触式测温等核心技术优势,成为破解传统马桶圈“能耗高、体验差
    的头像 发表于 10-22 15:35 818次阅读
    红外测温传感器在智能马桶中的创新应用:领麦微技术驱动的节能与<b class='flag-5'>个性化</b>升级

    全开放配置革新:WT588F02A-16S录音芯片开启个性化定制新纪元

    在标准个性化需求并存的电子市场中,广州唯创电子WT588F02A-16S以全面开放的参数配置,为产品差异化设计提供无限可能01灵活分段配置:精准掌控录音存储结构1.1智能分段管理机制
    的头像 发表于 10-14 10:29 964次阅读
    全开放配置革新:WT588F02A-16S录音芯片开启<b class='flag-5'>个性化</b>定制新纪元

    蘑菇街 API 接口:开启时尚电商个性化推荐新潮流

    在当今数字化时代,时尚电商平台正经历着前所未有的变革。蘑菇街作为中国领先的时尚社交电商平台,凭借其创新的 API 接口,正在引领个性化推荐的新潮流。这篇文章将逐步解析蘑菇街 API 接口的核心
    的头像 发表于 09-04 15:19 800次阅读

    利用小红书电商 API 接口,实现小红书店铺商品推荐个性化

    ​ 在当今电商竞争激烈的环境下,个性化商品推荐已成为提升用户体验和转化率的关键策略。小红书(Xiaohongshu)作为领先的社交电商平台,提供了强大的电商 API 接口,允许开发者访问用户数
    的头像 发表于 08-27 15:31 1267次阅读
    利用小红书电商 API 接口,实现小红书店铺商品推荐<b class='flag-5'>个性化</b>

    复杂装备研发设计中利用数据实现大规模个性化定制

    在复杂装备研发设计中,利用数据实现大规模个性化定制已成为提升企业竞争力、满足多样市场需求的关键路径。其核心在于通过数据驱动的个性化需求识别、模块设计、柔性生产、智能决策及闭环反馈,
    的头像 发表于 08-06 17:17 847次阅读

    利用API提升电商用户体验:个性化推荐系统

      在当今竞争激烈的电商环境中,个性化推荐系统已成为提升用户粘性和转化率的核心工具。通过API(Application Programming Interface)集成,电商平台能够高效接入先进
    的头像 发表于 07-14 14:45 736次阅读
    利用API提升电商用户体验:<b class='flag-5'>个性化</b>推荐系统

    2025年电商API发展趋势:智能个性化

    ​ 引言 随着数字经济的深化,电商API(应用程序接口)已成为连接平台、商家与用户的核心枢纽。2025年,在人工智能与大数据驱动下,电商API将加速向 智能决策 与 个性化服务 演进,重构用户
    的头像 发表于 07-11 14:26 733次阅读
    2025年电商API发展趋势:智能<b class='flag-5'>化</b>与<b class='flag-5'>个性化</b>

    【汇思博SEEK100开发板试用体验】06 天气app--使用组件导航实现设置页及页面跳转

    1 前言 本次要完成组件导航跳转页面功能,实现设置页和主页的跳转。 2 组件导航 (Navigation) 2.1 简介 组件导航(Navigation)主要用于实现页面间以及组件内部
    发表于 07-09 16:57

    AIBOX 产品矩阵:支持主流大模型的私有部署,满足个性化 AI 应用需求

    AIBOX系列产品具备高性能、低功耗、环境适应性强等特点,算力覆盖6-157TOPS,通过搭配多样深度学习算法,体积小巧,能够支持主流大模型的私有部署,为多个智慧行业进行数字化赋能
    的头像 发表于 06-25 16:32 2009次阅读
    AIBOX 产品矩阵:支持主流大模型的私有<b class='flag-5'>化</b>部署,满足<b class='flag-5'>个性化</b> AI 应用需求

    声纹解锁个性化!启明云端硅思物语AI平台让设备“认准你的声音”

    启明云端依托旗下硅思物语AI平台,通过声纹采集技术,在ESP32-S3潮玩手办伴侣上构建的个性化智能助手的真实落地应用场景。声纹采集:你的声音就是“生物密码”什么是声纹?声纹如同指
    的头像 发表于 06-17 18:02 1782次阅读
    声纹解锁<b class='flag-5'>个性化</b>!启明云端硅思物语AI平台让设备“认准你的声音”

    EM储能网关 ZWS智慧储能云应用(13) — 企业个性化配置

    储能公有云平台,企业用户如何自主个性化配置?ZWS智慧储能云通过灵活的多级配置功能,实现个性化系统配置,帮助强化储能企业独特性。简介储能企业在使用智慧储能云平台时,常面临企业个性化和品牌展示
    的头像 发表于 05-23 11:39 995次阅读
    EM储能网关 ZWS智慧储能云应用(13) — 企业<b class='flag-5'>个性化</b>配置

    赋能个性化表达!eSUN易生3D打印材料在时尚设计领域的应用

    3D打印技术可以突破传统材料和工艺的限制,为用户提供个性化且高效便捷的使用体验。从华丽的T台到人们的日常生产生活,3D打印技术都正在发挥更大的作用。eSUN易生丰富多样的3D打印材料也一起见证了许多优质应用的诞生!
    的头像 发表于 05-20 14:11 941次阅读
    赋能<b class='flag-5'>个性化</b>表达!eSUN易生3D打印材料在时尚设计领域的应用

    个性化医疗的挑战,微流液体监测

    的诊断等。个性化医疗考虑的是个体患者的疾病模式、体质和性别以及这些因素对疗法和药物的影响。其总体目标是创建适合个体患者的疗法,并在必要时根据疾病的进展情况进行调整和
    的头像 发表于 05-19 13:25 670次阅读
    <b class='flag-5'>个性化</b>医疗的挑战,微流液体监测