分类问题统计指标入门：混淆矩阵、召回、误检率、AUROC-电子发烧友网

缩写

AUC曲线下面积（Area Under the Curve）

AUROC接受者操作特征曲线下面积（Area Under the Receiver Operating Charac teristic curve）

大多数时候，AUC都是指AUROC，这是一个不好地做法，正如Marc Claesen指出的那样，AUC有歧义（可能是任何曲线），而AUROC没有歧义。

AUROC解释

AUROC有一些等价的解释：

均匀抽取的随机阳性样本排名在均匀抽取的随机阴性样本之前的期望

阳性样本排名在均匀抽取的随机阴性样本之前的期望比例

若排名在一个随机抽取的随机阴性样本前分割，期望的真阳性率

阴性样本排名在均匀抽取的随机阳性样本之后和期望比例

若排名在一个均匀抽取的随机阳性样本后分割，期望的假阳性率

更多阅读：如何推导AUROC的概率解释（https://stats.stackexchange.com/questions/180638/how-to-derive-the-probabilistic-interpretation-of-the-auc/277721#277721）

AUROC计算

假设我们有一个概率二元分类器，比如逻辑回归。

在讨论ROC曲线（接受者操作特征曲线）之前，我们需要理解混淆矩阵（confusion matrix）的概念。一个二元预测可能有4个结果：

我们预测0，而真实类别是0：这被称为真阴性（True Negative），即，我们正确预测类别为阴性（0）。比如，杀毒软件没有将一个无害的文件识别为病毒。

我们预测0，而真实类别是1：这被称为假阴性（False Negative），即，我们错误预测类别为阴性（0）。比如，杀毒软件没有识别出一个病毒。

我们预测1，而真实类别是0：这被称为假阳性（False Positive），即，我们错误预测类别为阳性（1）。比如，杀毒软件将一个无害的文件识别为病毒。

我们预测1，而真实类别是1：这被称为真阳性（True Positive），即，我们正确预测类别为阳性（1）。比如，杀毒软件正确地识别出一个病毒。

我们统计模型做出的预测，数一下这四种结果各自出现了多少次，可以得到混淆矩阵：

在上面的混淆矩阵示例中，在分类的50个数据点中，45个分类正确，5个分类错误。

当比较两个不同模型的时候，使用单一指标常常比使用多个指标更方便，下面我们基于混淆矩阵计算两个指标，之后我们会将这两个指标组合成一个：

真阳性率（TPR），即，灵敏度、命中率、召回，定义为TP/(TP+FN)。从直觉上说，这一指标对应被正确识别为阳性的阳性数据点占所有阳性数据点的比例。换句话说，TPR越高，我们遗漏的阳性数据点就越少。

假阳性率（FPR），即，误检率，定义为FP/(FP+TN)。从直觉上说，这一指标对应被误认为阳性的阴性数据点占所有阴性数据点的比例。换句话说，FPR越高，我们错误分类的阴性数据点就越多。

为了将FPR和TPR组合成一个指标，我们首先基于不同的阈值（例如：0.00; 0.01, 0.02, …, 1.00）计算前两个指标的逻辑回归，接着将它们绘制为一个图像，其中FPR值为横轴，TPR值为纵轴。得到的曲线为ROC曲线，我们考虑的指标是该曲线的AUC，称为AUROC。

下图展示了AUROC的图像：

在上图中，蓝色区域对应接受者操作特征曲线（AUROC）。对角虚线为随机预测器的ROC曲线：AUROC为0.5. 随机预测器通常用作基线，以检验模型是否有用。

如果你希望得到一些第一手的经验：

Python:http://scikit-learn.org/stable/auto_examples/model_selection/plot_roc.html

MATLAB:http://www.mathworks.com/help/stats/perfcurve.html

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

矩阵

矩阵

+关注

关注
0

文章
425

浏览量
34691

原文标题：分类问题统计指标入门：混淆矩阵、召回、误检率、AUROC

文章出处：【微信号：jqr_AI，微信公众号：论智】欢迎添加关注！文章转载请注明出处。

什么是误码率和误符号率？

什么是误码率和误符号率？它们用于衡量系统可靠性。误码率或误比特率(BER：bit error ratio)是指在经过系统传输后，送给用户的接收码流中发生错误的比特数占信源发送的原始码

发表于 05-30 15:52

电能质量指标运行合格率的标准

以及用户用电特性等因素，各项电能质量指标运行合格率标准为：（1）连续运行统计期（年、季、月）内电网频率合格率应不低于99.5%（2）连续运行统计

发表于 10-22 16:34

谁有关于 memory用LDPC 的校检矩阵？

请问哪位好心人有关于 memory用LDPC 的校检矩阵，可以给一个吗或者 code rate 是15/16的校检矩阵！！！！

发表于 10-11 19:17

使用单值评估指标进行优化

，又译作召回率）的组合并不能作为单值评估指标，因为它给出了两个值来对你的分类器进行评估。3多值评估指标提高了在算法之间进行优劣比较的难度，假

发表于 12-12 11:33

清洗误标注的开发集和测试集样本

，则有可能在评估中引入偏差。假设你有 1000 个开发集样本，同时分类准确率为 98%，那么检查20 个误分类的样本会比检查 980 个正确分类

发表于 12-19 09:48

BPSK调制通信系统的误比特率仿真

clc a=round(rand(1,1000))%生成消息码f=2;%假设载波频率为2for SNR=0:15%给出信噪比范围，求误比特率 cp=[];%存储BPSK映射后的消息序列 sigma

发表于 10-15 15:47

系统误符号率的变化(G)

系统误符号率的变化(G)：Model { Name "ofdm_gito" Version

发表于 02-08 14:46 •0次下载

分类器的分类性能评价指标

通过具体应用实例，指出目前普遍使用的正确率和错误率评价指标在不平衡数据集、语义相关多分、不同错分代价等分类问题中评价分类器性能时存在的缺陷。

发表于 05-03 16:51 •0次下载

机器学习实用指南——准确率与召回率

受试者工作特征（ROC）曲线是另一个二分类器常用的工具。它非常类似与准确率/召回率曲线，但不是画出准确率对

发表于 06-19 15:20 •2.1w次阅读

AI垃圾分类的准确率和召回率达到99%

这套逻辑和人类用眼睛、大脑、手臂工作的逻辑差不多，而且效率也足够了。以塑料瓶为例，AI垃圾分类的准确率和召回率达到99%，单张图片的识别时间不到半秒钟。

发表于 06-16 15:10 •3378次阅读

一文搞懂深度学习的精密率和召回率

这里，我们将讨论两个重要的度量指标，即精度和召回率，它们被用于度量分类模型（即分类器）的性能。特别地，我们将讨论如何用这两个

发表于 07-06 09:54 •4724次阅读

CCD视觉检测外观缺陷，漏检率和误检率如何评估

CCD视觉检测外观缺陷，漏检率和误检率该怎么评估机器视觉筛选机做缺陷检测的用户都希望筛选机设备的误检

发表于 07-07 17:34 •6959次阅读

如何识别指纹锁的拒绝率和误识别率

如何识别指纹锁的拒收率和错误识别率？指纹锁是电子元件和机械部件的精确组合。安全、方便、时尚。指纹锁的拒识率和误识率无疑是指纹锁的重要指标，

发表于 02-28 17:08 •1332次阅读

矩阵键盘-单片机入门课件

矩阵键盘-单片机入门课件

发表于 03-18 11:12 •0次下载

模型任务的评价指标体系

全面了解一个任务的评价指标体系。在二分类任务评价指标（上）中，我们已经学习了如何利用混淆矩阵来计算二分

发表于 01-11 10:10 •937次阅读

林超文PCB设计：PADS教程，PADS视频教程	郑振宇老师：Altium Designer教程，Altium Designer视频教程
张飞实战电子视频教程	朱有鹏老师：海思HI3518e教程，HI3518e视频教程
李增老师：信号完整性教程，高速电路仿真教程	华为鸿蒙系统教程，HarmonyOS视频教程
赛盛：EMC设计教程，EMC视频教程	杜洋老师：STM32教程，STM32视频教程
唐佐林：c语言基础教程，c语言基础视频教程	张飞：BUCK电源教程，BUCK电源视频教程
正点原子：FPGA教程，FPGA视频教程	韦东山老师：嵌入式教程，嵌入式视频教程
张先凤老师：C语言基础视频教程	许孝刚老师：Modbus通讯视频教程
王振涛老师：NB-IoT开发视频教程	Mill老师：FPGA教程，Zynq视频教程
C语言视频教程	RK3566芯片资料合集
朱有鹏老师：U-Boot源码分析视频教程	开源硬件专题

搜索历史

分类问题统计指标入门：混淆矩阵、召回、误检率、AUROC

评论

什么是误码率和误符号率？

电能质量指标运行合格率的标准

谁有关于 memory用LDPC 的校检矩阵？

使用单值评估指标进行优化

清洗误标注的开发集和测试集样本

BPSK调制通信系统的误比特率仿真

系统误符号率的变化(G)

分类器的分类性能评价指标

机器学习实用指南——准确率与召回率

AI垃圾分类的准确率和召回率达到99%

一文搞懂深度学习的精密率和召回率

CCD视觉检测外观缺陷，漏检率和误检率如何评估

如何识别指纹锁的拒绝率和误识别率

矩阵键盘-单片机入门课件

模型任务的评价指标体系