统计假设测试、多臂老虎机方法，揭示了多臂老虎机在实践中的优势-电子发烧友网

编者按：Cheng-Tao Chu简要概述了统计假设测试、多臂老虎机（汤普森采样）方法后，揭示了多臂老虎机在实践中的优势。

随着精益创业和大数据的兴起，越来越多的公司开始拥抱A/B测试。尽管业界开始基于数据统计测试特性这一点很是振奋人心，但很少有公司意识到多臂老虎机这一优于传统统计假设测试的替代方案。本文将概述为何在大多数应用中，多臂老虎机优于假设测试。不熟悉为何基于数据测试特性很重要的读者，可以看看我之前写的博客文章 Bridging the gap between lean startup in theory and in prac tice。需要社会认同的读者，Google Analytics用的就是多臂老虎机方案。

统计假设测试概述

A/B测试的假设测试的目标是查明观测到的转化率差异是否有运气以外的解释。标准方法如下：

计算零假设（null hypothesis）下的采样分布

计算采样分布下观测到的似然，并

将概率与预先确定的阈值比较

尽管初看起来很直观，实际上它需要不少统计学知识来恰当地设计试验及解释结果。例如：

如何约束第二类错误？

如何同时测试两个以上的实验组？

需要多少项观测？

正确的阈值是多少？

能不能提前查看结果并及早终止试验？

多臂老虎机概述

“多臂老虎机”这一名称描述了这样一个场景：一名赌徒面对着几台“单臂老虎机”，每台老虎机的期望返水不同。目标是最大化一系列拉杆操作的总回报。为了达成这一目标，多臂老虎机动态平衡通过拉动不确定的摇杆收集信息的代价（探索）和拉动已知回报丰厚的拉杆的累计回报（利用）。

在A/B测试的语境下，每台老虎机代表试验中的一个实验组，每次拉动摇杆代表一个实验组的一次曝光，累计回报代表累计转化。多臂老虎机问题有很多不同的算法，比如UCB、Epsilon-Greedy等，本文将聚焦于一种名为“汤普森采样”的算法。

汤普森采样概述

汤普森采样的思路非常简单。该算法维护每臂的返水率的后验分布，按照在该后验分布下给定臂最优的概率，成比例地拉动拉杆，接着根据新观测更新后验。例如，对两个观测到转化率为10/150和5/100（转化数/曝光）的实验组而言，其后验转化率分布为Beta(10, 140)和(5, 95)。根据转化率，后续的测试应该在第一个实验组上进行，因为该组的转化率较高。但汤普森采样并不采用这种确定的方法，而是基于当前的后验转化率分布随机取样，决定在哪个实验组上进行，两者的概率分别为P(第一组是最佳实验组)和P(第二组是最佳实验组)。最后，根据新观测数据更新后验分布。致不熟悉贝叶斯统计的读者，贝塔分布经常用作伯努利分布（用来建模转化率）的共轭先验分布。

比较

现在我们已经基本了解统计假设测试和多臂老虎机（汤普森采样），让我们比较一下两者。

汤普森采样更简单。要恰当地解释统计假设测试，从业者需要对基本的统计学测试具有良好的理解，例如，提前查看结果需要了解功效分析、偏差修正，处理多实验组同样需要了解偏差修正，等等。另一方面，从业者只需理解基本的贝叶斯统计就可以理解汤普森采样。解释结果时，较简单的概念不容易出错。

汤普森采样直接估计哪个臂最优的概率。统计假设测试试图回答“假定所有实验组转化率相同的极端情形下，观测到当前状况的概率”。而汤普森采样则试图回答“给定这些观测，给定的每个臂最优的概率”。尽管这两个问题都是合理的，汤普森采样要容易理解得多，并自然而然地折衷第一类错误和第二类错误。

多臂老虎机通常更快收敛。由于多臂老虎机方案是自适应的，识别最佳臂（如果它存在）所需的试验数通常远低于统计假设测试所需的试验数。然而，它也意味着，当所有实验组一样的时候，需要一个单独的停止标准。

多臂老虎机可以自然地推广至多实验组。这是多臂老虎机真正出彩之处。由于多臂老虎机是自适应的，它可以很快决定哪个臂不太可能是最优的，并以较低的概率拉动这些较差的拉杆。另一方面，在统计假设测试中，每个实验组分配到的试验数目是一样的（由试验之前的功效分析决定）。

总结一下，在实践中，相比传统统计假设测试，多臂老虎机有许多优势。它通常更快收敛，误解的空间更小，能更好地推广至多实验组，需要调节的参数也较少。向认真对待A/B测试的创业公司强烈推荐多臂老虎机方法。

如果你喜欢这篇博客文章，可以在Twitter上关注我（chengtao_chu）或者订阅我的博客ML in the Valley。另外，特别感谢 Ian Wong（ihat）和Bob Ren (bobrenjc93) 审阅本文草稿。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

算法

算法

+关注

关注
23

文章
4646

浏览量
93709
大数据

大数据

+关注

关注
64

文章
8926

浏览量
138244

原文标题：A/B测试：对比统计假设测试与多臂老虎机

文章出处：【微信号：jqr_AI，微信公众号：论智】欢迎添加关注！文章转载请注明出处。

模拟老虎机程序分享

自己做了个模拟老虎机，还有很多不足，请各位高手点评

发表于 01-13 22:29

请问sst89e516rd插在51开发板上却不能下载，请问这是为什么？如何才能使用？

前几天在路上拣到一老虎机主板，上有sst89e516rd，把它插在51开发板上却不能下载，求教大侠告诉我怎么才能使用它

发表于 07-13 04:16

老虎机源程序

点击下载

发表于 04-29 09:40

CAD建筑制图入门加老虎窗

`下面具体介绍CAD建筑制图入门加老虎窗，建筑设计有不同窗，有一种老虎窗是经常使用到，浩辰CAD软件里面专门提供了此功能，下面具体介绍一下CAD制图初学入门加老虎窗具体操作步骤。CAD

发表于 03-26 16:53

【社区之星】王培瑞：电子人的成长之路——注重在实践中学习

嘉宾介绍：王培瑞 2013年7月毕业于西安工程大学自动化专业！参加工作后一直从事于自动化相关专业！拥有丰富的软硬件开发测试经验，注重在实践中学习，善于应用不同的开发工具完成不同业务需求！曾就职于台达

发表于 02-16 11:10

【Start_DSC28034PNT湖人开发板免费体验】（开源）控制机械臂小游戏3

一个选项。根据规则判断谁是获胜者或平局。规则如下：老虎吃鸡鸡吃虫虫拱杠子杠子打老虎玩家和计算机做出选择后，会自动根据游戏规则进行判断并输出相应的结果，不同的结果机械臂就会有不同的动作。根据

发表于 07-30 14:48

基于单片机的多机并行通信设计

单片机的多机串行通信应用十分广泛，但在串行口被占用又要进行多机通信时就要采取其它措施。本文介绍了

发表于 10-27 15:00 •2248次阅读

基于单片<b class='flag-5'>机</b>的<b class='flag-5'>多</b><b class='flag-5'>机</b>并行通信设计

表面电容式触摸屏让老虎机和桌游机更有趣

在全球范围内，人们已经习惯用触摸屏来实现与各种电子设备之间的互动了。虽然触摸屏技术从多年前开始就已被应用于老虎机，但随着游戏行业对大型个性化显示的需求，触摸屏技术在这个行业内的应用得到了更大的发展

发表于 09-13 20:03 •0次下载

蒙特卡洛模拟方法

蒙特卡洛是摩纳哥大公国的一座知名赌城，里面遍布轮盘赌、掷骰子和老虎机等游戏，类似的，蒙特卡洛方法的建模机制也基于随机数和统计概率。

发表于 06-05 11:13 •9832次阅读

基于多假设跟踪框架的多摄像机多目标跟踪方法

为提高摄像机目标跟踪精度，提岀基于多假设跟踪（MH）框架的采用轨迹树层次关系模型多摄像机多目标跟踪方法

发表于 04-12 16:05 •38次下载

中型C形臂X光机的应用及优势

C形臂X光机大家对于这款放射科设备，估计都不太陌生，可是C形臂的种类较多，主要分为：大C、中C和小C等，针对不同的类型的C形臂，其主要的临床

发表于 07-20 09:52 •2190次阅读

平板小C臂的优势特点是怎样的

小C臂又称C形臂X光机、骨科C臂，是指机架为C型的X线影像设备，用于手术中的实时动态成像。说起平板小C臂

发表于 01-20 10:14 •2775次阅读

MindSpore 首发：隐私保护的 Bandit 算法，实现电影推荐

老虎机（Bandit）问题是强化学习中一类重要的问题，由于它定义简洁且有大量的理论分析，因此被广泛应用于新闻推荐，医学试验等实际场景...

发表于 01-25 18:07 •0次下载

带涡轮开关的插槽车控制器电路

电子爱好者和爱好者通常喜欢拼搭和玩玩具车。如果您是其中之一，这里有一个可以控制老虎机车的电路。“老虎机车”使用轨道上的插槽和汽车下方的销来帮助引导它们在赛道上行驶。他们通常有两辆车。这个老虎机汽车

发表于 07-02 10:43 •961次阅读

使用Arduino实现老虎机自动化

电子发烧友网站提供《使用Arduino实现老虎机自动化.zip》资料免费下载

发表于 07-06 11:47 •0次下载

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

统计假设测试、多臂老虎机方法，揭示了多臂老虎机在实践中的优势

评论

模拟老虎机程序分享

请问sst89e516rd插在51开发板上却不能下载，请问这是为什么？如何才能使用？

老虎机源程序

CAD建筑制图入门加老虎窗

【社区之星】王培瑞：电子人的成长之路——注重在实践中学习

【Start_DSC28034PNT湖人开发板免费体验】（开源）控制机械臂小游戏3

基于单片机的多机并行通信设计

表面电容式触摸屏让老虎机和桌游机更有趣

蒙特卡洛模拟方法

基于多假设跟踪框架的多摄像机多目标跟踪方法

中型C形臂X光机的应用及优势

平板小C臂的优势特点是怎样的

MindSpore 首发：隐私保护的 Bandit 算法，实现电影推荐

带涡轮开关的插槽车控制器电路

使用Arduino实现老虎机自动化