0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

分类问题统计指标入门:混淆矩阵、召回、误检率、AUROC

zhKF_jqr_AI 来源:未知 作者:李建兵 2018-03-17 10:37 次阅读

缩写

AUC曲线下面积(Area Under the Curve)

AUROC接受者操作特征曲线下面积(Area Under the Receiver Operating Characteristic curve)

大多数时候,AUC都是指AUROC,这是一个不好地做法,正如Marc Claesen指出的那样,AUC有歧义(可能是任何曲线),而AUROC没有歧义。

AUROC解释

AUROC有一些等价的解释:

均匀抽取的随机阳性样本排名在均匀抽取的随机阴性样本之前的期望

阳性样本排名在均匀抽取的随机阴性样本之前的期望比例

若排名在一个随机抽取的随机阴性样本前分割,期望的真阳性率

阴性样本排名在均匀抽取的随机阳性样本之后和期望比例

若排名在一个均匀抽取的随机阳性样本后分割,期望的假阳性率

更多阅读:如何推导AUROC的概率解释(https://stats.stackexchange.com/questions/180638/how-to-derive-the-probabilistic-interpretation-of-the-auc/277721#277721)

AUROC计算

假设我们有一个概率二元分类器,比如逻辑回归。

在讨论ROC曲线(接受者操作特征曲线)之前,我们需要理解混淆矩阵(confusion matrix)的概念。一个二元预测可能有4个结果:

我们预测0,而真实类别是0:这被称为真阴性(True Negative),即,我们正确预测类别为阴性(0)。比如,杀毒软件没有将一个无害的文件识别为病毒。

我们预测0,而真实类别是1:这被称为假阴性(False Negative),即,我们错误预测类别为阴性(0)。比如,杀毒软件没有识别出一个病毒。

我们预测1,而真实类别是0:这被称为假阳性(False Positive),即,我们错误预测类别为阳性(1)。比如,杀毒软件将一个无害的文件识别为病毒。

我们预测1,而真实类别是1:这被称为真阳性(True Positive),即,我们正确预测类别为阳性(1)。比如,杀毒软件正确地识别出一个病毒。

我们统计模型做出的预测,数一下这四种结果各自出现了多少次,可以得到混淆矩阵:

在上面的混淆矩阵示例中,在分类的50个数据点中,45个分类正确,5个分类错误。

当比较两个不同模型的时候,使用单一指标常常比使用多个指标更方便,下面我们基于混淆矩阵计算两个指标,之后我们会将这两个指标组合成一个:

真阳性率(TPR),即,灵敏度、命中率、召回,定义为TP/(TP+FN)。从直觉上说,这一指标对应被正确识别为阳性的阳性数据点占所有阳性数据点的比例。换句话说,TPR越高,我们遗漏的阳性数据点就越少。

假阳性率(FPR),即,误检率,定义为FP/(FP+TN)。从直觉上说,这一指标对应被误认为阳性的阴性数据点占所有阴性数据点的比例。换句话说,FPR越高,我们错误分类的阴性数据点就越多。

为了将FPR和TPR组合成一个指标,我们首先基于不同的阈值(例如:0.00; 0.01, 0.02, …, 1.00)计算前两个指标的逻辑回归,接着将它们绘制为一个图像,其中FPR值为横轴,TPR值为纵轴。得到的曲线为ROC曲线,我们考虑的指标是该曲线的AUC,称为AUROC。

下图展示了AUROC的图像:

在上图中,蓝色区域对应接受者操作特征曲线(AUROC)。对角虚线为随机预测器的ROC曲线:AUROC为0.5. 随机预测器通常用作基线,以检验模型是否有用。

如果你希望得到一些第一手的经验:

Python:http://scikit-learn.org/stable/auto_examples/model_selection/plot_roc.html

MATLAB:http://www.mathworks.com/help/stats/perfcurve.html

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 矩阵
    +关注

    关注

    0

    文章

    418

    浏览量

    34468

原文标题:分类问题统计指标入门:混淆矩阵、召回、误检率、AUROC

文章出处:【微信号:jqr_AI,微信公众号:论智】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    什么是误码率和符号

    什么是误码率和符号 ?它们用于衡量系统可靠性。误码率或比特(BER:bit error ratio)是指在经过系统传输后,送给用户的接收码流中发生错误的比特数占信源发送的原始码
    发表于 05-30 15:52

    电能质量指标运行合格的标准

    以及用户用电特性等因素,各项电能质量指标运行合格标准为:(1)连续运行统计期(年、季、月)内电网频率合格应不低于99.5%(2)连续运行统计
    发表于 10-22 16:34

    谁有关于 memory用LDPC 的校矩阵

    请问哪位好心人有 关于 memory用LDPC 的校矩阵,可以给一个吗 或者 code rate 是15/16的 校矩阵!!!!
    发表于 10-11 19:17

    使用单值评估指标进行优化

    ,又译作召回)的组合并不能作为单值评估指标,因为它给出了两个值来对你的分类器进行评估。3多值评估指标提高了在算法之间进行优劣比较的难度,假
    发表于 12-12 11:33

    清洗标注的开发集和测试集样本

    ,则有可能在评估中引入偏差。假设你有 1000 个开发集样本,同时分类准确为 98%,那么检查20 个分类的样本会比检查 980 个正确分类
    发表于 12-19 09:48

    BPSK调制通信系统的比特仿真

    clc a=round(rand(1,1000))%生成消息码f=2;%假设载波频率为2for SNR=0:15%给出信噪比范围,求比特 cp=[];%存储BPSK映射后的消息序列 sigma
    发表于 10-15 15:47

    系统符号的变化(G)

    系统符号的变化(G):Model {  Name     "ofdm_gito"  Version   
    发表于 02-08 14:46 0次下载

    分类器的分类性能评价指标

    通过具体应用实例,指出目前普遍使用的正确和错误评价指标在不平衡数据集、语义相关多分、不同错分代价等分类问题中评价分类器性能时存在的缺陷。
    发表于 05-03 16:51 0次下载

    机器学习实用指南——准确召回

    受试者工作特征(ROC)曲线是另一个二分类器常用的工具。它非常类似与准确/召回曲线,但不是画出准确
    的头像 发表于 06-19 15:20 2.1w次阅读
    机器学习实用指南——准确<b class='flag-5'>率</b>与<b class='flag-5'>召回</b><b class='flag-5'>率</b>

    AI垃圾分类的准确召回达到99%

    这套逻辑和人类用眼睛、大脑、手臂工作的逻辑差不多,而且效率也足够了。以塑料瓶为例,AI垃圾分类的准确召回达到99%,单张图片的识别时间不到半秒钟。
    的头像 发表于 06-16 15:10 3195次阅读

    一文搞懂深度学习的精密召回

    这里,我们将讨论两个重要的度量指标,即精度和召回,它们被用于度量分类模型(即分类器)的性能。特别地,我们将讨论如何用这两个
    的头像 发表于 07-06 09:54 4507次阅读
    一文搞懂深度学习的精密<b class='flag-5'>率</b>和<b class='flag-5'>召回</b><b class='flag-5'>率</b>

    CCD视觉检测外观缺陷,漏检如何评估

    CCD视觉检测外观缺陷,漏检该怎么评估 机器视觉筛选机做缺陷检测的用户都希望筛选机设备的
    发表于 07-07 17:34 6598次阅读

    如何识别指纹锁的拒绝识别

    如何识别指纹锁的拒收率和错误识别? 指纹锁是电子元件和机械部件的精确组合。安全、方便、时尚。指纹锁的拒识无疑是指纹锁的重要指标
    发表于 02-28 17:08 1225次阅读

    矩阵键盘-单片机入门课件

    矩阵键盘-单片机入门课件
    发表于 03-18 11:12 0次下载

    模型任务的评价指标体系

    全面了解一个任务的评价指标体系。 在二分类任务评价指标(上)中,我们已经学习了如何利用混淆矩阵来计算二
    的头像 发表于 01-11 10:10 824次阅读