机器学习算法那家强因子分解机（FM算法）工业落地能力最强-电子发烧友网

文 | 石塔西

源 | 夕小瑶的卖萌屋

尽管BERT为代表的预训练模型大肆流行，但是身处工业界才会知道它落地有多难，尤其是QPS动辄几百的在线推荐、搜索系统，哪怕在大厂也很难在线上系统见到它们。

今天就想反其道而行之，谈谈工业界搜索、推荐、广告这类核心场景中落地能力最强的算法（之一）：因子分解机（FM）。我不敢说它是最简单的（FM的确很简单），但是作为一个推荐算法调参工程师，掌握FM一定是性价比最高的。我推崇FM算法的原因，有以下三点：

功能齐全

众所周知，推荐算法有三个应用领域：召回、粗排、精排。推荐算法千千万，但是有的算法只能用于召回，有的算法只能用于排序。像FM这样实现三个领域全覆盖的多面手，目前为止，孤陋寡闻的我尚不知道有第二个。但是需要强调的是，我们不能只训练一个FM排序模型，然后直接拿这个排序模型用于召回。尽管都是基于FM算法，但是FM召回与排序，有以下不同：

使用的特征不同

FM召回，由于未来要依赖Faiss进行线上检索，所以不能使用user与doc的交叉特征。只有如此，我们才能独立计算user embedding与doc embedding

FM排序，则没有这方面的限制，可以使用user与doc的交叉特征。是的，你没看错。因为FM所实现自动二阶交叉，仅能代表“共现”。但是user与doc之间还有其他形式的交叉，比如user tag与doc tag之间的重合度，喂入这样的交叉，对于排序性能提升，仍然有很大帮助。

使用的样本不同

训练FM做排序时，必须使用“曝光未点击”这样的“真负”样本。

训练FM做召回时，起码不能只使用“曝光未点击”做负样本。大部分的负样本必须通过随机采样得到。个中原因见我的文章《负样本为王：评Facebook的向量化召回算法》。

使用的Loss不同

FM排序时，由于负样本是真实的，可以采用CTR预估那样的point-wise loss

FM召回时，由于负样本是随机采样得到的，存在一定的噪声，最好采用BPR, hinge这样的pair-wise loss。

性能优异

推荐系统的两大永恒主题，“记忆”与“扩展”，FM也能实现全覆盖。

FM存在一阶项，实际就是LR，能够“记忆”高频、常见模式

FM存在feature embedding。如我在《无中生有：论推荐算法中的Embedding思想》据说，Embedding是提升推荐算法“扩展性”的法宝。FM通过feature embedding，能够自动挖掘低频、长尾模式。在这一点上，基于embedding的二阶交叉，并不比DNN的高阶交叉，逊色多少。

便于上线

现在深度学习是推荐领域的宠儿，LR/FM/GBDT这样的传统机器学习算法，不招人待见。

DNN虽然性能优异，但是它有一个致命缺点，就是上线困难。训练的时候，各位调参侠，把各种酷炫的结构，什么attention, transformer, capsule，能加上的都给它加上，看着离线指标一路上涨，心里和脸上都乐开了花，却全然无视旁边的后端工程师恨得咬紧了牙根。模型越复杂，离线和线上指标未必就更好，但是线上的时间开销肯定会增加，轻则影响算法与后端的同事关系（打工人何苦为难打工人），重则你那离线指标完美的模型压根没有上线的机会。虽说，目前已经有TF Serving这样的线上serving框架，但是它也不是开箱即用的，也需要一系列的性能调优，才能满足线上的实时性要求。

所以，如果你身处一个小团队，后端工程人员的技术能力不强，DNN的线上实时预测，就会成为一个难题，这个时候，FM这样的传统机器学习算法，就凸显出其优势。

FM排序，虽然理论上需要所有特征进行二阶交叉，但是通过公式化简，可以在 O(n)的时间复杂度下完成。n是样本中非零的特征数目，由于推荐系统中的特征非常稀疏，所以预测速度是非常快的。

召回，由于候选集巨大，对于实时性的要求更高。很多基于DNN的召回算法，由于无法满足线上实时生成user embedding的需求，只能退而离线生成user embedding ，对于用户实时兴趣的捕捉大打折扣。FM召回，这时就显现其巨大的优势。事先把doc embedding计算好，存入Faiss建立索引，user embedding只需要把一系列的feature embedding相加就可以得到，再去faiss中进行top-k近邻搜索。FM召回，可以实现基于用户最新的实时兴趣，从千万量级候选doc中完成实时召回。

总结与参考

由于以上优点，我心目中，将FM视为推荐、搜索领域的"瑞士军刀"。风头上虽然不及DNN那么抢眼，但是论在推荐系统中发挥的作用，丝毫不比DNN逊色，有时还能更胜一筹。FM有如此众多的优点，优秀的调参侠+打工人，还等什么，还不赶快学起来。想迅速掌握FM，我推荐如下参考文献：

掌握FM原理，推荐读美团的博客《深入FFM原理与实践》。FFM的部分可以忽略，在我看来，FFM更像是为了Kaggle专门训练的比赛型选手，损失了FM的很多优点。这就好比，奥运会上的射击冠军，未必能够胜任当狙击手一样。

FM用于召回，推荐读《推荐系统召回四模型之：全能的FM模型》。注意，如我所述，FM虽然万能，但是FM排序与FM召回，在特征、样本、Loss都存在不同，不可能训练一个FM排序就能直接拿来做召回。这一点，《全能FM》一文没有提到，需要读者特别注意。

如果想亲手实践，可以尝试alphaFM。该项目只不过是作者八小时之外的课外作品，却被很多公司拿来投入线上实际生产环境，足见该项目性能之优异和作者功力之深厚，令人佩服。强烈建议不满足只当“调参侠”的同学，通读一遍alphaFM的源代码，一定收获满满。

[1] https://zhuanlan.zhihu.com/p/165064102

[2] https://zhuanlan.zhihu.com/p/320196402

[3] https://link.zhihu.com/?target=https%3A//tech.meituan.com/2016/03/03/deep-understanding-of-ffm-principles-and-practices.html

[4] https://zhuanlan.zhihu.com/p/58160982

[5] https://link.zhihu.com/?target=https%3A//github.com/CastellanZhang/alphaFM

原文标题：谈谈工业界落地能力最强的机器学习算法

文章出处：【微信公众号：深度学习自然语言处理】欢迎添加关注！文章转载请注明出处。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

算法

算法

+关注

关注
23

文章
4622

浏览量
93065
FM

FM

+关注

关注
1

文章
182

浏览量
59221
机器学习

机器学习

+关注

关注
66

文章
8425

浏览量
132775
dnn

dnn

+关注

关注
0

文章
60

浏览量
9061

原文标题：谈谈工业界落地能力最强的机器学习算法

文章出处：【微信号：zenRRan，微信公众号：深度学习自然语言处理】欢迎添加关注！文章转载请注明出处。

华为云 Flexus X 实例部署安装 Jupyter Notebook，学习 AI，机器学习算法

前言由于本人最近在学习一些机器算法，AI 算法的知识，需要搭建一个学习环境，所以就在最近购买的华为云 Flexus X 实例上安装了

发表于 01-02 13:43 •102次阅读

华为云 Flexus X 实例部署安装 Jupyter Notebook，<b class='flag-5'>学习</b> AI，<b class='flag-5'>机器</b><b class='flag-5'>学习</b><b class='flag-5'>算法</b>

传统机器学习方法和应用指导

在上一篇文章中，我们介绍了机器学习的关键概念术语。在本文中，我们会介绍传统机器学习的基础知识和多种算法特征，供各位老师选择。 01 传统

发表于 12-30 09:16 •271次阅读

传统<b class='flag-5'>机器</b><b class='flag-5'>学习</b>方法和应用指导

NPU与机器学习算法的关系

在人工智能领域，机器学习算法是实现智能系统的核心。随着数据量的激增和算法复杂度的提升，对计算资源的需求也在不断增长。NPU作为一种专门为深度学习

发表于 11-15 09:19 •519次阅读

AIGC算法解析及其发展趋势

、AIGC算法解析核心基础人工智能算法：AIGC技术的基础和灵魂，如深度学习、机器学习等算法

发表于 10-25 15:35 •472次阅读

LIBS结合机器学习算法的江西名优春茶采收期鉴别

以庐山云雾茶和狗牯脑茶的明前茶、雨前茶为对象，研究激光诱导击穿光谱结合机器学习的茶叶鉴别方法。将茶叶茶，水数据融合可有效鉴别春茶采收期，且数据融合后表现出更好的稳定性和鲁棒性，LIBS结合机器

发表于 10-22 18:05 •265次阅读

深度学习算法在嵌入式平台上的部署

随着人工智能技术的飞速发展，深度学习算法在各个领域的应用日益广泛。然而，将深度学习算法部署到资源受限的嵌入式平台上，仍然是一个具有挑战性的任务。本文将从嵌入式平台的特点、深度

发表于 07-15 10:03 •1524次阅读

深度学习在工业机器视觉检测中的应用

识别等任务。传统的机器视觉检测方法通常依赖于手工设计的特征和固定的算法，难以应对复杂多变的工业环境。而深度学习的引入，为工业

发表于 07-08 10:40 •1111次阅读

深度学习的基本原理与核心算法

随着大数据时代的到来，传统机器学习方法在处理复杂模式上的局限性日益凸显。深度学习（Deep Learning）作为一种新兴的人工智能技术，以其强大的非线性表达能力和自

发表于 07-04 11:44 •2227次阅读

神经网络反向传播算法的优缺点有哪些

神经网络反向传播算法（Backpropagation Algorithm）是一种广泛应用于深度学习和机器学习领域的优化算法，用于训练多层前馈

发表于 07-03 11:24 •1090次阅读

神经网络算法的优缺点有哪些

的优点自学习能力：神经网络算法具有强大的自学习能力，能够从大量数据中自动提取特征，无需人工干预。这使得神经网络

发表于 07-03 09:47 •1481次阅读

机器学习算法原理详解

机器学习作为人工智能的一个重要分支，其目标是通过让计算机自动从数据中学习并改进其性能，而无需进行明确的编程。本文将深入解读几种常见的机器学习

发表于 07-02 11:25 •1140次阅读

机器学习的经典算法与应用

关于数据机器学习就是喂入算法和数据，让算法从数据中寻找一种相应的关系。Iris鸢尾花数据集是一个经典数据集，在统计学习和

发表于 06-27 08:27 •1681次阅读

名单公布！【书籍评测活动NO.35】如何用「时间序列与机器学习」解锁未来？

应用，将理论基础与实践案例相结合，作者凭借扎实的数学功底及其在企业界的丰富实践经验，将机器学习与时间序列分析巧妙融合在书中。全书书共分为8章，系统介绍时间序列的基础知识、常用预测方法、异常检测算法

发表于 06-25 15:00

运动控制算法有哪些

。应用：广泛应用于工业自动化、机器人控制、航空航天等领域。模糊控制算法 (Fuzzy Logic Control) 原理：模

发表于 06-13 09:17 •2674次阅读

AI算法的本质是模拟人类智能，让机器实现智能化

视觉等领域。 AI 算法的核心是实现智能化的决策和行为 AI算法的本质在于模拟人类智能的能力，让计算机能够对现实世界进行模拟和模仿，从而达到智能化的目的。具体来说，AI算法可以

发表于 02-07 00:07 •5863次阅读

搜索历史

机器学习算法那家强因子分解机（FM算法）工业落地能力最强

评论

华为云 Flexus X 实例部署安装 Jupyter Notebook，学习 AI，机器学习算法

传统机器学习方法和应用指导

NPU与机器学习算法的关系

AIGC算法解析及其发展趋势

LIBS结合机器学习算法的江西名优春茶采收期鉴别

深度学习算法在嵌入式平台上的部署

深度学习在工业机器视觉检测中的应用

深度学习的基本原理与核心算法

神经网络反向传播算法的优缺点有哪些

神经网络算法的优缺点有哪些

机器学习算法原理详解

机器学习的经典算法与应用

名单公布！【书籍评测活动NO.35】如何用「时间序列与机器学习」解锁未来？

运动控制算法有哪些

AI算法的本质是模拟人类智能，让机器实现智能化

搜索历史

机器学习算法那家强 因子分解机（FM算法）工业落地能力最强

评论

机器学习算法那家强因子分解机（FM算法）工业落地能力最强