0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

购物篮分析模型原理

数据分析与开发 来源:数据分析与开发 作者:数据分析与开发 2022-10-24 10:55 次阅读

要想做好数据分析必定要理解和熟悉掌握各类数据分析模型,但大部分文章只是给你罗列出了有哪几种数据分析模型及对应理论,并未用实例来辅助说明

很多时候这些模型都进了收藏夹吃灰,大家也没有深刻理解这种分析模型,等到下次要开始分析数据了,又是一脸懵,然后再去收藏夹里翻文章。

学东西在精不在多,今天就分享1个常用的数据分析模型——购物篮分析模型,并附上应用实例,希望能让大家真正掌握这个分析模型,并在之后分析数据时能自己把模型灵活用起来!

购物篮分析模型原理

据说上个世纪九十年代,沃尔玛的超市管理人‎‎员分析销售数据时发现了一‎‎个令人难于理解的现象,婴儿的纸尿裤和啤酒放通常会出现在一个订单里,经过数据分析发现,买尿不湿的家长以父亲居多,如果他们在买尿不湿的同时恰好看到了啤酒,就会有很大的概率购买,从而就能提高啤酒的销售量。

当然,这个案例现在已被证实是虚构的,但这个故事仍让可以给我们很大的启发,商品之间的关联关系是客观存在的,这种通过研究用户消费数据,将不同商品之间进行关联,并挖掘二者之间联系的分析方法,就叫做商品关联分析法,也叫作“购物篮分析”。

看到这,你可能会觉得这不是常识吗?为什么还是个数据分析模型。

其实不然。虽然这种现象你看过去是常识,但这种通过研究用户消费数据,将不同商品之间进行关联,并挖掘二者之间联系的分析方法,就叫做商品关联分析法,即购物篮分析模型。需要通过「支持度」、「置信度」、「提升度」三个指标判断商品之间的关联程度,常用于零售行业。

这个模型一般是用来找出顾客购买行为的模式:

①比如用户买了A商品,是否会对B商品产生什么影响?
②不同的用户是否具有不同的购买模式?
③哪些产品应该放在一起进行捆绑销售?

在分析案例前,先解释下这三个指标分别代表的意思和计算方法。

1 「支持度」

A商品和B商品同时被购买的概率,显然支持度越大,商品间关联性越强。

计算公式:同时购买A和B订单数 / 总购买订单数

今天共有10笔订单,其中同时购买可乐和薯片的次数是7次,那么可乐+薯片组合的支持度就是7/10=70%。

2 「置信度」

因为购买了A所以购买了B的概率,注意与支持度区分。

计算公式:同时购买A和B订单数 / 购买A的订单数

今天共有10笔订单,其中购买可乐的次数是4,同时购买可乐和薯片的次数是3,则其置信度是3/4=75%

3 「提升度」

先购买A对购买B的提升作用,用来判断商品组合方式是否具有实际价值,大于1说明该组合方式有效,小于1则说明无效。

计算公式:支持度 / ( (购买A次数/总购买订单数)*(购买B次数/总购买订单数) )

今天共有10笔订单,购买可乐的次数是8,购买薯片的次数是6,购买可乐+薯片的次数是6,那么提升度是0.6 /(0.8*0.6)>1,因此可乐+薯片的组合方式是有效的。

讲完购物篮模型的原理和计算公式,只能大概掌握一些皮毛,接下来就带你用实例来应用一下购物篮分析模型,加深印象。

案例分析

以我们最为熟悉的超市为例。

案例背景是A集团超市最近在准备周年大促,需要根据近3个月A集团超市旗下各门店商品销售明细,来确定哪些商品需要组合起来捆绑促销。

先不急着分析,先理清一下思路,要解决这个问题,我们需要从以下五个步骤进行思考。

第一步
确定使用工具、数据来源

使用工具:FineBI数据分析工具
数据来源:A集团超市商品销售总表(已脱敏处理)

2cf6016a-528a-11ed-a3b6-dac502259ad0.png▲A超市商品销售总表▲

第二步
计算指标

根据上述计算公式可知,我们需要计算:

①总购买订单数 ②同时购买A和B的订单数 ③分别购买A和B的订单数

接下来,我们就在FineBI的自助数据集中逐个计算。

①总购买订单数

要计算总购买订单数,首先我们要先勾选「单据编码」,添加分组汇总,设置汇总方式为「去重计数」,对单据编码个数求和,从而轻松计算出总购买订单数。

2d14a49e-528a-11ed-a3b6-dac502259ad0.png

②计算同时购买A和B订单数

要计算同时购买A和B的订单数,就需要复制一列相同的商品类别,将两列合并在一起,就可以分出比如A+A、A+B、B+A等的商品组合。

让表左右合并,而后选择并集合并,合并依据为单据编码。

2d58d0c4-528a-11ed-a3b6-dac502259ad0.png

将商品名称作为A商品,集团商品总表-商品名称作为B商品。显然,不需要类似 A+A 的组合,因此需要将该数据过滤掉,输入函数【商品名称!=集团商品销售总表-商品名称】即可。

③计算分别购买A和B的订单数

添加左右合并,并将合并结果命名为「购买A的次数」,B商品同理计算。

2d733e6e-528a-11ed-a3b6-dac502259ad0.png

第三步
计算支持度、置信度、提升度

得到上面三个指标后,我们就可以开始计算支持度、置信度、提升度了。

支持度=同时购买A和B订单数/总购买订单数,新增列。置信度,提升度同理,就不列举了。

2dd8e76e-528a-11ed-a3b6-dac502259ad0.png

第四步
数据分析

计算得到支持度、置信度、提升度的结果后,我们就可以开始进行数据分析了。

使用FineBI的自定义图表,分析商品间的关联程度,用颜色的深浅和具体计算数字来表示关联程度的高低。

2e305116-528a-11ed-a3b6-dac502259ad0.png▲商品关联分析▲ 2ea08954-528a-11ed-a3b6-dac502259ad0.png▲商品支持度分析▲ 2ec399d0-528a-11ed-a3b6-dac502259ad0.png▲商品置信度分析▲ 2fae5358-528a-11ed-a3b6-dac502259ad0.png▲商品提升度分析▲

第五步
得出分析结论

(1)微爽日用卫生巾和家之寓圆形夹晒架的支持度(同时购买概率)最高,为5.95。且购买家之寓圆形夹晒架后又购买微爽日用卫生巾的置信度较高,为0.27,大于平均置信度,因此两者被一起购买的概率很大,可放置在货架的相邻位置,刺激顾客购买欲。

(2)本地小白菜和香妃蜜瓜的置信度最高,为0.42。因此可将小白菜和香妃蜜瓜放在果蔬货架的相邻位置或捆绑销售。

(3)青葱和雪碧的提升度最高,为8.44。即购买雪碧后对购买青葱有较大的提升作用,但考虑到青葱和雪碧的购买量都较大,且都为常备品,基于实际情况来说,不适合捆绑销售。

(4)盐津铺子和嘉士利威化饼的提升度较高,为4.54,大于1。两个都为零食货柜商品,因此可考虑捆绑销售。

总结

经过上述五个步骤,我们可以得出初步的分析结论。当然,最后的零售促销方案还是得根据超市的实际情况来判断合不合适(例如分析结论中的青葱和雪碧),数据只能辅助我们的决策,而不能直接给予决策。

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    3171

    浏览量

    48711
  • 数据分析
    +关注

    关注

    2

    文章

    1427

    浏览量

    34012

原文标题:数分必备:购物篮分析模型实例

文章出处:【微信号:DBDevs,微信公众号:数据分析与开发】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    126.126 购物篮分析与运用 #硬声创作季

    代码程序开发
    充八万
    发布于 :2023年07月20日 02:06:26

    轿车参数化分析模型的构造研究及应用

    轿车参数化分析模型的构造研究及应用概念设计阶段是车身结构设计中保证性能的重要阶段这个阶段留下的缺陷往往很难在后续的设计中弥补因而在车身开发中受到广泛重视目前国内外在这方面都展开了详细的研究尤其是国外
    发表于 04-16 13:40

    怎么实现基于GSM模块的移动购物系统的设计?

    在借鉴其他基于GSM的短信应用的基础上,设计了基于GSM的移动购物系统,对其构架、功能、接口和短信分解算法做了阐述和分析,通过测试得到了比较理想的结果。
    发表于 06-04 06:51

    Case-Control 关联分析模型

    一、Case-Control关联分析模型 (第一部分主要是在人类中)卡方检验举例逻辑回归逻辑混合模型 二、(动植物)数量性状关联分析模型加性
    发表于 07-23 07:03

    分析模型?自带分析模型的bi系统了解一下吗?

    个人做数据可视化就算了,但凡上升到部门级的、企业级的,都少不了搭建数据分析模型,但数据分析模型不是那么好搭建的,经验不足、考虑不周都将影响到后续的数据可视化
    发表于 05-17 10:03

    基于图论的化学分子数据挖掘研究

    近年来,人们提出了很多频繁图模式挖掘的算法。首先分析了贪婪搜索策略,然后对各种不同的图数据挖掘的方法进行比较。受购物篮分析的影响,基于ILP 方法引起了人们的
    发表于 09-14 15:58 25次下载

    大数据_数据挖掘技术分类及应用

    “大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。数据挖掘的应用有,电信:流失;银行:聚类(细分),交叉销售;百货公司/超市:购物篮分析
    发表于 12-29 16:04 1.8w次阅读
    大数据_数据挖掘技术分类及应用

    人工智能无处不在 看看它如何改变我们的世界

    缺货的上品,帮助员工来补充库存。这款机器人还能够记录物品的位置,这样可以使消费者随时找到自己喜欢的商品。因为需要记录商品的位置,机器人的感知能力是必要的,扫秒货架、商品、购物篮等等。
    发表于 07-05 16:47 573次阅读

    荣耀手环5球版高清图赏

    在9月4日晚举办的荣耀20S发布会上,荣耀还带来了全新的荣耀手环5球版,专为篮球爱好者打造,售价129元。
    发表于 09-05 14:46 1449次阅读

    数字货币Libra为什么要选择一子货币项目

    Libra选择一子货币目的非常简单,因为他们希望让这个稳定币价值更加一致,一子货币中任何一个货币价格的上涨或下跌对Libra价值产生影响都比较有限。
    发表于 10-15 10:37 1451次阅读

    零售物联网相关的10项卓越创新

    长时间的排队等候可能会导致顾客流失。另一方面,维持大规模的员工队伍来应对大量等候结账的顾客可能在经济上不可行。借助物联网,您可以建立一个系统,在顾客出现在收银台或离开商店时,甚至在他们将商品放入购物篮/购物车时,读取每件商品的标签。
    的头像 发表于 07-04 09:16 1704次阅读

    宇视推出“AI+零售”解决方案应用案例

    新零售的一个著名案例:沃尔玛对其顾客的购物行为进行购物篮关联规则分析后发现,啤酒与尿布经常被一起购买!完全出乎了人们的常识。沃尔玛后来把这两种商品放在一起,大大提高了商品的销售量和顾客满意度。这是
    发表于 07-14 15:21 1470次阅读

    电商平台用户再购物行为的预测研究分析

    不同的行为预测特征,基于可视化等方法对比分析了预测特征的重要性和特点,进行了属性筛选;然后,基于提出的预测特征设计使用了多种不同算法训练预测模型。实验硏究表明,多 lightgbm模型的融合方法能够达到很高的再
    发表于 06-17 14:21 6次下载

    CRM客户关系管理分析模型——RFM模型

    CRM客户关系管理系统的分析模式中,RFM模型是被最广泛使用的。下面简单介绍一下RFM模型,包括RFM模型的缺陷及解决方案。 RFM模型 R
    的头像 发表于 08-10 14:17 1479次阅读

    智能制造——现代工厂如何打造“会思考的机器”?

      SmartFactory洞察力博客系列 你是否曾想过 商店是如何理货的? 又是如何知道要把黄油放在面包旁边的? Netflix是如何根据观看历史推荐电影的? 这些就是基于数据提取技术的“购物篮
    的头像 发表于 11-24 18:25 1214次阅读