0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

两篇大厂CTR预估最新工作

深度学习自然语言处理 来源:圆圆的算法笔记 2023-03-03 11:17 次阅读

今天带大家读两篇AAAI 2023关于CTR预估的两篇工作。一篇是华为发表的Adaptive Low-Precision Training for Embeddings in Click-Through Rate Prediction,提出了一种CTR预估中embedding量化压缩的方法;另一篇是美团发表的Decision-Making Context Interaction Network for Click-Through Rate Prediction,通过在CTR预估模型中引入显示和隐式的上下文信息提升预估效果。

1华为:Embedding量化

4f76d3b8-b91e-11ed-bfe3-dac502259ad0.png

CTR预估中占用参数量最大的就是embedding table,尤其user、item等特征的embedding表,由于实体数量很大,导致这些特征的embedding表非常大,占用了非常巨大的存储开销。因此,对embedding table进行压缩是一个值得研究的领域。

目前业内关于embedding table的压缩主要有NAS-based embedding dimension search、Embedding pruning、Hashing三种方法。前两者都需要额外的存储和训练步骤来确定最优的embedding维度和剪枝方法,而hashing方法由于冲突问题会严重影响压缩后的模型效果。

针对前面方法的不足,华为提出了一种基于量化的端到端CTR模型训练方法。量化方法是将模型高精度float参数映射到离散化的值上,模型结构保持不变,极大节省了存储空间。之前的文章中介绍过量化相关的工作。

本文提出的量化基本的训练框架如下图中的b所示。以往的量化压缩方法为图a,需要保存全精度的参数,在前向传播过程中对全精度参数量化,基于量化后的参数计算梯度,再更新到全精度参数上,节省了计算资源。而本文提出的b方法,直接在量化后的参数上进行更新,而不用保存全精度的参数,适合本文提出的embedding存储压缩的场景。先把量化参数还原成全精度参数,再在全精度参数行梯度反传更新,最后将更新后的参数还原回量化参数,完成一轮训练。

4f91eb26-b91e-11ed-bfe3-dac502259ad0.png

量化中存在两个核心问题,一个是如何确定离散化两个值之间的step size,另一个是使用什么方法把float映射到离散化值。

针对第一个问题,文中提出了一种Adaptive low-precision training的方法,自动学习step size。具体的算法逻辑如下表,核心是在训练过程中有两阶段的优化,第一阶段更新模型的参数,第二阶段优化step size。

4fb76ff4-b91e-11ed-bfe3-dac502259ad0.png

针对第二个问题,业内主要有DR和SR两种方式。DR直接根据四舍五入,确定性的将float离散化,而SR则是以一定概率随机的将float离散化到距离最近的两个整数之间。虽然之前的一些工作在实验角度验证了SR效果更好,但是没有给出具体的理论证明。本文作者填补了这部分的空白,从理论上证明了SR的离散化方法具有更快的收敛性和更好的准确率,因此本文采用了SR的离散化方法。

在实验阶段,文中对比了不同压缩方法的运行效率和效果,验证了本文提出的方法的优越性:

4fd8d91e-b91e-11ed-bfe3-dac502259ad0.png

2美团:上下文建模

4ff48fc4-b91e-11ed-bfe3-dac502259ad0.png

这篇文章提出在CTR中引入显示和隐式的上下文信息来提升CTR预估模型效果。

先说说显示上下文信息。以往的CTR预估模型重点在于用户历史行为序列建模,而忽略了用户历史行为中的上下文信息。比如下图左侧的例子,是某个用户某次历史搜索的行为,点击了蓝色框中的汉堡。以往的行为建模模型中,直接将这个汉堡加入到历史行为中,判断和当前商品的匹配情况。而上下文指的是用户历史搜索中,除了蓝色框以外红色框的部分。这部分信息引入的好处是,能够确定用户历史行为产生的原因。例如点击红色框的汉堡,是和蓝色框其他汉堡在价格、款式等维度上进行对比后,用户做出的决策。

再说隐式上下文信息,指的是上游的匹配、打分链路中,根据用户个性化信息建模流入下游的候选商品。如果流入下游的候选商品汉堡较多,那么表明用户可能更喜欢吃汉堡。将这部分信息引入进来,有利于提升用户喜好的建模。

50164dda-b91e-11ed-bfe3-dac502259ad0.png

基于以上出发点,本文提出了考虑用户显示隐式上下文信息的ctr预估模型。对于显示上下文,使用CIU模块进行编码,主要包括对上下文中不相关商品的过滤,以及利用上下文中相关商品信息增强用户的兴趣建模。对于隐式上下文信息,即前面模型送到ctr预估模型打分的候选item,也使用CIU模块进行有效信息的提取。最后,显示信息和隐式信息经过CIU的结果会经过一层AIAU进行融合,AIAU主要和MLP+self-attention的结构,用于融合经过显示、隐式增强后的用户兴趣信息。

50494c6c-b91e-11ed-bfe3-dac502259ad0.png

本文提出的模型上线后,经过A/B test实验,取得了CTR+2.9%/CPM+2.1%/GMV+1.5%的比较明显的效果收益。

审核编辑 :李倩

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 高精度
    +关注

    关注

    1

    文章

    534

    浏览量

    25567
  • 模型
    +关注

    关注

    1

    文章

    3400

    浏览量

    49436
  • CTR
    CTR
    +关注

    关注

    0

    文章

    37

    浏览量

    14183

原文标题:AAAI'23 | 两篇大厂CTR预估最新工作

文章出处:【微信号:zenRRan,微信公众号:深度学习自然语言处理】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    相关推荐

    CTR热敏电阻

    CTR热敏电阻   临界温度热敏电阻CTR(CritiCal Temperature Resistor)具有负电阻突变特性,在某一温度下,电阻值随温度的增加激剧减小,具有很大的负温度系数.构成
    发表于 11-12 10:02 7260次阅读

    光耦隔离电路的CTR参数设计

    光耦隔离电路的CTR参数设计
    的头像 发表于 04-30 11:16 2.6w次阅读
    光耦隔离电路的<b class='flag-5'>CTR</b>参数设计

    二极管(PN结)的工作原理

    前面已经写了两篇介绍放大器应用和MOSFET作驱动的文章。但是对它们的工作原理并没有进一步研究一下,今天写下这篇文章,主要是介绍二极管的工作原理,为后面的三极管和MOSFET工作原理的
    发表于 02-07 16:43 7253次阅读
    二极管(PN结)的<b class='flag-5'>工作</b>原理

    光电耦合器的转换效率即(CTR)

    输入到LED的电流(IF)受室温的影响。它随工作时间(年龄)而改变因而,有交流电流输入能力的光耦合器在输入端有个LED(光发射二极管),所以每个LED都存在CTR值。如果具有相同正负电流值IF输入
    发表于 07-02 15:05

    日本东京大学的两篇关于无线充电的文章,需要的拿去,...

    日本东京大学的两篇关于无线充电的文章
    发表于 03-08 15:08

    电子创新工作室招募活动

    物理与电子工程系举办电子创新工作室招募活动 为积极响应第三节大学生科技文化艺术节号召,努力提高我校大学生科技创新意识和能力,物理与电子工程系电子创新工作室于3月29、30日在东、西区餐厅门口举办招募
    发表于 05-12 14:09

    红外遥控设计的两篇文档

    路红外遥控器的,也想请大家关注一下。这两篇文档是我设计前期先阅读的文档,一仔细看了,一备用的,分享给大家。
    发表于 01-10 15:07

    盘点:日本被动元件大厂投资设厂的最新进展

    美元提升2成产能同年9月25日,全球MLCC龙头厂村田制作所在官网发布公告,计划在日本岛根县兴建MLCC新工厂,预估投资额约400亿日元,该座新厂将在2018年10月动工,预估2019年内完工,目标在
    发表于 10-10 16:13

    【技术杂谈】备战秋招:国内大厂技术面试指南,GitHub六千星

    最近,GitHub 上有一个项目很火,这个项目主要介绍了阿里、腾讯、百度、美团、今日头条等国内互联网大厂的面试题,还配备有答案和出题人分析等信息。这个项目或许对大家找工作面试有所帮助。项目
    发表于 07-23 09:52

    PCB设计资料大全,49干货共1476页,含各硬件大厂工程师使用资料

    `49PCB设计教程及规范文档,共1476页,有实操经验、有知识点、有规范;资料完整、文档丰富,揽括各大厂一线工程师们的设计心得、技巧,值得用心收藏学习。资料涵盖知识面广,内容详实,有图有文有案例。<span]需要的可自行下载。`
    发表于 04-26 10:24

    什么是转换效率CTR

    什么是转换效率CTR
    发表于 05-31 11:13 3013次阅读
    什么是转换效率<b class='flag-5'>CTR</b>?

    Python自然语言处理实战:两篇文章相似度清晰透明

    用训练好的词向量和段落向量对两篇关于天津全运会的新闻进行向量化,并计算两篇新闻的相似度~~
    的头像 发表于 07-09 09:22 6111次阅读

    深度强化学习给推荐系统以及CTR预估工业界带来的最新进展

    所以,Google这两篇强化学习应用于YouTube推荐论文的出现给大家带来了比较振奋人心的希望。首先,论文中宣称效果对比使用的Baseline就是YouTube推荐线上最新的深度学习模型;
    的头像 发表于 07-18 11:11 8816次阅读
    深度强化学习给推荐系统以及<b class='flag-5'>CTR</b><b class='flag-5'>预估</b>工业界带来的最新进展

    什么是光耦的CTRCTR受那些因素影响 

    CTR表示电流传输比,当输出电压保持恒定时,它等于直流输出电流IC与直流输入电流IF的百分比。光耦的CTR的范围大多为20%~300%甚至有的可达600%。
    发表于 09-20 09:39 2.2w次阅读
    什么是光耦的<b class='flag-5'>CTR</b>?<b class='flag-5'>CTR</b>受那些因素影响 

    光耦合器的CTR是什么

    ,而If则是流向光耦合器二极管侧的电流。通过这一公式,我们可以直观地了解到光耦合器在不同工作状态下的电流传输能力。 从物理层面来看,光耦合器的CTR反映了二极管侧与晶体管侧之间的电流传输关系。二极管侧通过器件电流传输比链接到晶体管侧,实现了电信号的隔离
    的头像 发表于 09-19 10:58 4453次阅读
    光耦合器的<b class='flag-5'>CTR</b>是什么