0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

一篇看懂图像分类基础知识

新机器视觉 来源:新机器视觉 2023-02-10 15:02 次阅读

基础知识

1.具体领域划分

(1)多类别图像分类

(2)细粒度图像分类

(3)多标签图像分类

(4)弱监督与无监督图像分类

(5)零样本图像分类

2.图像分类问题的3层境界

fa75dddc-a90f-11ed-bfe3-dac502259ad0.png

多类别图像分类在不同物种的层次上识别,往往具有较大的类间方差,而类内则具有较小的类内误差。

fab804f0-a90f-11ed-bfe3-dac502259ad0.png

细粒度图像分类具有更加相似的外观和特征,导致数据间的类内差异较大,分类难度也更高。

fae5327c-a90f-11ed-bfe3-dac502259ad0.png

实例级分类可以看做是一个识别问题,比如人脸识别。

fb0e6cfa-a90f-11ed-bfe3-dac502259ad0.png

3.传统图像分类关键问题

(1)数据预处理 (2)图像特征 (3)分类模型

分为两种: 手工特征+分类器、从数据自动学习特征

fb2d4a8a-a90f-11ed-bfe3-dac502259ad0.png

4.常用的图像分类数据集

(1) MNIST数据集:

发布于1998年,60000张图,10类,分布均匀,数据集中的”hello world”

fb421f28-a90f-11ed-bfe3-dac502259ad0.png

在票据等图像中裁剪出数字,将其放在20 * 20像素的框中,并保持了长宽比率,然后放在28* 28的背景中。

(2) CIFAR10

MNIST的彩色增强版,60000张图片,大小32 * 32,10类,均匀分布,都是真实图片而不是手稿等,图中只有一个主体目标,可以有部分遮挡,但是必须可辨识。

fb54644e-a90f-11ed-bfe3-dac502259ad0.png

(3) CIFAR100

更加细粒度的CIFAR10,共100类,被分成20个超类。

每小类包含600个图像,其中有500个训练图像和100个测试图像。每个图像都带有一个“精细”标签(它所属的类)和一个粗糙的标签(它所属的超类)

fb8e3412-a90f-11ed-bfe3-dac502259ad0.pngfba073c0-a90f-11ed-bfe3-dac502259ad0.png

(4) PASCAL

来源于2005-2012的PASCAL Visual Object Classes(VOC项目),20类,来源于图片社交网站flickr,总共9963张图,24640个标注目标。

fbbec0f0-a90f-11ed-bfe3-dac502259ad0.png

2005年主要用于目标检测,从2007年开始引进了图像分割的标注和人体结构布局的标注,2010年开始引进了行为分类标注。

fbe2051a-a90f-11ed-bfe3-dac502259ad0.png

(5)ImageNet数据集

包含21841个类别,14197122张图片,百万标注框

fc2a1620-a90f-11ed-bfe3-dac502259ad0.png

5 评估指标

(1)正负样本

计标签为正样本,分类为正样本的数目为True Positive,简称TP,标签为正样本,分类为负样本的数目为「False Negative」,简称FN,标签为负样本,分类为正样本的数目为「False Positive」,简称FP,标签为负样本,分类为负样本的数目为「True Negative」,简称TN。

fc5070d6-a90f-11ed-bfe3-dac502259ad0.png

(2)精确率、召回率、F1值

精度(查准率): 被判定为正样本的测试样本中,真正的正样本所占的比例

fc67a724-a90f-11ed-bfe3-dac502259ad0.png

召回率(查全率): 被判定为正样本的正样本占全部正样本的比例

fc78e3fe-a90f-11ed-bfe3-dac502259ad0.png

F1-score是综合考虑了精度与召回率,其值越大模型越好。

fc862ea6-a90f-11ed-bfe3-dac502259ad0.png

(3)PR曲线

精度与召回率是一对相互矛盾的指标,召回率增加,精度下降,曲线与坐标值面积越大,性能越好,对正负样本不均衡敏感。

fc96e91c-a90f-11ed-bfe3-dac502259ad0.png

(4)ROC曲线与AUC

fca523ec-a90f-11ed-bfe3-dac502259ad0.png

横坐标(假阳率)FPR=FP/(FR+TN) 正类中实际负实例占所有负实例的比例。

纵坐标(正阳率) TPR=TP/(TP+FN) 正类中实际正实例占所有正实例的比例。

正负样本的分布变化,ROC曲线保持不变,对正负样本不均衡问题不敏感。

AUC(Area Under Curve): ROC曲线下的面积,表示随机挑选一个正样本以及一个负样本,分类器会对正样本给出的预测值高于负样本的概率。

(5)混淆矩阵

多矩阵分类模型各个类别之间的分类情况。

对于k分类问题,混淆矩阵为k*k的矩阵,元素Cij表示第i类样本被分类器判定为第j类的数量。

fcba9bfa-a90f-11ed-bfe3-dac502259ad0.png

主对角线的元素之和为正确分类的样本数,其他位置元素之和为错误分类的样本数。对角线之和值越大,正确率越高。

混淆矩阵可以很清晰的反映出各类别之间的错分概率,越好的分类器对角线上的值更大。

fcccaa66-a90f-11ed-bfe3-dac502259ad0.png

(6)0-1损失

只看分类的对错,当标签与与类别相等时,loss为0,否则为1。

fcf9e814-a90f-11ed-bfe3-dac502259ad0.png

这个是真实的优化目标,但是无法求导和优化,只有理论意义。

(7)熵与交叉熵(cross entropy)

熵表示热力学系统的无序程序,在信息学中用于表示信息多少,不确定性越大,概率越低,则信息越多,熵越高。

fd0be9f6-a90f-11ed-bfe3-dac502259ad0.png

熵是概率的单调递减的函数。

fd26764a-a90f-11ed-bfe3-dac502259ad0.png

(8)KL散度

用于估计两个分布p和q的相似性

fd380888-a90f-11ed-bfe3-dac502259ad0.png

如果p是一个已知的分布(标签),则-l(p,p)是一个常数,此时KL散度与交叉熵l(p,q)只有一个常数的差异。

KL散度的特性是大于等于0,当且仅当两个分布完全相同时等于0。

fd47ab58-a90f-11ed-bfe3-dac502259ad0.png

审核编辑 :李倩


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 模型
    +关注

    关注

    1

    文章

    3158

    浏览量

    48701
  • 图像分类
    +关注

    关注

    0

    文章

    90

    浏览量

    11903
  • 数据集
    +关注

    关注

    4

    文章

    1205

    浏览量

    24635

原文标题:小白必读!一篇看懂图像分类基础知识

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    鸿蒙移植必备的基础知识

    的脚本:脚本就是把命令写在个文件里MakefileGCC编译命令1.3 芯片相关知识能阅读芯片手册(英文)移植最小系统时,涉及的手册内容不多能看懂硬件原理图移植最小系统时,涉及的原理图内容不多2. 驱动程序
    发表于 07-01 06:35

    铁的基础知识及铁的分类

    铁的基础知识及铁的分类 生铁是指把铁矿石4放到高炉中冶炼5而成的产品,也叫“铣铁”。生铁是高炉产品,可分为6普通生铁和合金生
    发表于 12-24 11:16 1.4w次阅读
    铁的<b class='flag-5'>基础知识</b>及铁的<b class='flag-5'>分类</b>

    电感基础知识大全

    电感基础知识大全 电感的分类按 电感形式 分类:固定电感、可变电感。按导磁体性质分类:空芯线圈、铁氧体线圈
    发表于 07-29 19:05 6235次阅读
    电感<b class='flag-5'>基础知识</b>大全

    半导体基础知识(详细

    半导体基础知识(详细) 2.1.1 概念   根据物体导电能力(电阻率)的不同,来划分导体、绝缘体和半导体。 1.
    发表于 11-09 16:06 2.9w次阅读
    半导体<b class='flag-5'>基础知识</b>(详细<b class='flag-5'>篇</b>)

    HIFI耳机基础知识入门

    HIFI耳机基础知识入门 、耳机是如何分类的? 1、按换能原理(Transducer)分
    发表于 02-02 11:48 3034次阅读

    电源的分类和相关基础知识

    电源的分类和相关基础知识 1、交流稳压电源的分类及其特点:
    发表于 03-08 10:03 491次阅读

    FPGA开发经验与技巧_基础知识学习(1)

    FLC1301T00 基础知识学习希望会对朋友们的学习有帮助!
    发表于 12-16 15:27 3次下载

    电阻基础知识

    电阻基础知识比较详细,分类清楚,适合初学者有个比较全面的了解
    发表于 01-11 14:55 0次下载

    手机基础知识--维修

    手机基础知识--维修。都是些简单的手机维修方面的东西,希望对大家有所帮助。
    发表于 06-20 16:09 12次下载

    三菱PLC分类及型号的基础知识

    三菱PLC分类及型号的基础知识
    发表于 01-02 16:20 2次下载

    117电子基础知识文章大全

    本文档的主要内容详细介绍的是117电子基础知识文章大全。包括了:74系列集成电路的分类及区别,CMOS集成电路的工作原理,LED数码管的识别,MOS场效应管,PTC元件简介,TTL与COMS的区别,TL431的简介,保险丝的基
    发表于 06-02 08:00 7次下载
    117<b class='flag-5'>篇</b>电子<b class='flag-5'>基础知识</b>文章大全

    了解下机器学习中的基础知识

    ,那么机器学习的基础知识都有哪些呢?本文给大家列举下机器学习的基础知识。 (1)准确率的概念,准确率就是分类模型预测准确的比例。 (2)AUC(曲线下面积)则是
    的头像 发表于 03-31 17:08 3788次阅读

    开关电源基础知识

    开关电源基础知识(核达中远通电源技术有限公司上市)-介绍了开关电源、基础知识分类与调制方式
    发表于 09-29 11:00 65次下载
    开关电源<b class='flag-5'>基础知识</b>

    图像处理基础知识及OpenCV入门函数

    图像基础知识** 图像都是由像素(pixel)构成的,即图像中的小方格,这些小方格都有个明确的位置和被分配的色彩数值,而这些
    的头像 发表于 02-08 15:57 780次阅读
    <b class='flag-5'>图像</b>处理<b class='flag-5'>基础知识</b>及OpenCV入门函数

    图像处理基础知识 1

    直都在这里分享计算机基础知识,比如计算机组成原理、数据结构与算法、计算机网络和操作系统等。 不过偶尔我也想写下其他的话题,今天就想和你聊聊图像处理的相关
    的头像 发表于 02-08 17:08 775次阅读
    <b class='flag-5'>图像</b>处理<b class='flag-5'>基础知识</b> 1