0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

什么是计算机视觉,图片处理基础操作

新机器视觉 来源:新机器视觉 作者:吃猫的鱼python 2022-09-22 15:22 次阅读

一、什么是计算机视觉

计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取‘信息’的人工智能系统。这里所指的信息指Shannon定义的,可以用来帮助做一个“决定”的信息。因为感知可以看作是从感官信号中提取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。 视觉是各个应用领域,如制造业、检验、文档分析、医疗诊断,和军事等领域中各种智能/自主系统中不可分割的一部分。由于它的重要性,一些先进国家,例如美国把对计算机视觉的研究列为对经济和科学有广泛影响的科学和工程中的重大基本问题,即所谓的重大挑战(grand challenge)。 计算机视觉的挑战是要为计算机和机器人开发具有与人类水平相当的视觉能力。机器视觉需要图象信号,纹理和颜色建模,几何处理和推理,以及物体建模。一个有能力的视觉系统应该把所有这些处理都紧密地集成在一起。 e9f420ac-3a2b-11ed-9e49-dac502259ad0.png  我们目前如果是在校学生,对于计算机视觉和机器学习的相关知识的学习是非常有用的,无论是对于自己的工作前景还是相关论文的撰写都是非常有用的,而且目前对于计算机的相关知识已经设计到了各个专业领域,其中包括医学领域(计算机视觉分析CT成像)、电学领域(使用matlab及相关领域画图)、人脸识别和车牌识别等等。而且有想要做交叉学科的对于计算机可以和任意领域及进行无障碍交叉。 由于我这个理工男的语文功底并不好,语言组织能力不强,所以我们今天就啰嗦到这里,总结一下就是计算机视觉及机器学习等和计算机相关的东西特别重要!

二、图片处理基础操作

首先我们来看一段简单的计算机视觉相关代码:
import cv2img=cv2.imread('path')#path指图片相关路径cv2.imshow('Demo',img)cv2.nameWindow('Demo')cv2.waitKey(0)cv2.destroyAllWindows()
这段代码就可以在计算机中显示出img的相关图像。接下来我们讲解一下每一步的相关操作。

图片处理:读入图像

相关函数:image=cv2.imread(文件名相关路径[显示控制参数])

文件名:完整的路径。

其中参数包括:

cv.IMREAD_UNCHANGED :表示和原图像一致

cv.IMREAD_GRAYSCALE : 表示将原图像转化为灰色图像。

cv.IMREAD_COLOR:表示将原图像转化为彩色图像。

例如:

															cv2.imread(‘d:image.jpg’,cv.IMREAD_UNCHANGED)
															

图片处理:显示图像

相关函数:None=cv2.imshow(窗口名,图像名)例如:

															cv2.imshow(“demo”,image但是在OpenCV中我们图像显示还是要加上相关约束:

															retval=cv2.waitKey([delay])如果没有这个限制,那么显示的图像就会一闪而过,就会发生错误。其中delay参数包括:dealy=0,无限等待图像显示,直到关闭。也是waitKey的默认数值。delay<0,等待键盘点击结束图像显示,也就是说当我们敲击键盘的时候,图像结束显示。delay>0,等待delay毫秒后结束图像显示。最后我们还需要显示
cv2.destroyAllWindows()
把图像从内存中彻底删除。

图片处理:图像保存

相关函数:retval=cv2.imwrite(文件地址,文件名)
例如

cv2.imwrite(‘D:test.jpg’,img)
将img保存到了路径D: est.jpg

三、图像处理入门基础

图像成像原理介绍

首先我们第一个要深深深深的刻在脑子里的概念就是: eaf91a84-3a2b-11ed-9e49-dac502259ad0.png——图片是由像素点构成的 生动一点表示就是这样: eb511f54-3a2b-11ed-9e49-dac502259ad0.png   这样就可以完美的展示出计算机图像的成像原理,就是用一个个有颜色的像素点拼接而成的。  

图像分类

图像一般分为三类:
一、二值图像
二值图像表示的意思就是每一个像素点只由0和1构成,0表示黑色,1表示白色,而且这里的黑色和白色是纯黑和纯白。所以我们看到的图像也就是这个样子。我们以官网丽娜为例子。 ec0ca968-3a2b-11ed-9e49-dac502259ad0.pngec603a1a-3a2b-11ed-9e49-dac502259ad0.png二、灰度图像
灰度图像就是一个8位的位图。什么意思呢?就是说00000001一直到11111111,这就是二进制表示。如果表示成我们常用的十进制就是0-255。其中0就表示纯黑色,255就表示纯白色,中间就是处于纯黑色到纯白色的相关颜色。我们还是以丽娜为例。 ec795270-3a2b-11ed-9e49-dac502259ad0.png   灰度图像一块像素点:  ece7e87a-3a2b-11ed-9e49-dac502259ad0.png三、彩色图像(RGB) 计算机中所有的颜色都可以由R(红色通道)、G(绿色通道)、B(蓝色通道)来组成,其中每一个通道都有0-255个像素颜色组成。比如说R=234,G=252,B=4就表示黄色。显示出来的也是黄色。所以说彩色图像由三个面构成,分别对应R,G,B。我们还是以丽娜为例子: ed188cd2-3a2b-11ed-9e49-dac502259ad0.pnged442220-3a2b-11ed-9e49-dac502259ad0.png   所以说我们就可以知道复杂程度排序的话就是:彩色图像-灰度图像-二值图像。所以我们在进行人脸项目或者是车牌识别项目中最最最常用的操作就是将彩色图像转化为灰度图像,然后将灰度图像转为最简单的二值图像。        

四、像素处理操作

读取像素

相关函数:返回值=图像(位置参数) 我们先以灰度图像,返回灰度值:

																p=img[88,142]print§
																
																这里我们就可以返回图片坐标[88,142]处的灰度值。
																然后我们以彩色图像为例子:
																我们知道彩色图像由BGR三个通道的值构成。那么我们需要返回三个数值:
blue=img[78,125,0]green=img[78,125,1]red=img[78,125,2]print(blue,green,red) 这样我们就返回了这三个数值。

修改像素

直接暴力修改。 对于灰度图像, img[88,99]=255 对于彩色图像, img[88,99,0]=255 img][88,99,1]=255 img[88,99,2]=255这里也可以写成 img[88,99]=[255,255,255]等同于上方。 改动多个像素点 例如还是以彩色图像为例子:

																i[100:150,100:150]=[255,255,255]
																
																意思也就是将图像横坐标100到150和纵坐标100到150的这个区间全部用白色替代。
																

使用python中的numpy修改像素点

读取像素 相关函数:返回值=图像.item(位置参数) 我们以灰度图像为例: o=img,item(88,142) print(o) 对于彩色图像我们还是: blue=img.item(88,142,0) green=img.item(88,142,1) red=img.item(88,142,2) 然后print(blue,green,red) 修改像 图像名.itemset(位置,新的数值) 我们以灰度图像为例子: img.itemset((88,99),255) 对于BGR图像: img.itemset((88,99,0),255) img.itemset((88,99,1),255) img.itemset((88,99,2),255)

																import cv2import numpy as np i=cv2.imread('path',cv2.IMREAD_UNCHANGED)print(i.item(100100))i.itemset((100100),255)print(i,item(100100))
																通过这段代码我们就可以看得出来像素的更改。 对于彩色图像也是一样。
																
																				

五、获取图像属性

形状

shape可以获取图像的形状,返回值包含行数、列数通道数的元组。 灰度图像返回行数列数 彩色图像返回行数、列数、通道数。

																import cv2img1=cv2.imread('灰度图像')print(img1.shape)
																

像素数目

size可以获取图像的像素数目。 灰度图像:行数列数 彩色图像:行数列数*通道数

图像类型

dtype返回的是图像的数据类型

																import cv2img=cv2.imread('图像名称')print(img.dtype)
																
																				

六、图像ROI

ROI(region of interest)表示感兴趣区域
  • 从被处理的图像中以方框、圆、椭圆或者不规则多边形等方式勾勒出需要处理的区域。

  • 可以通过各种算子(operator)和函数来求ROI,并进行下一步操作。



																import cv2import numpy as npa=cv2.imread('path')b=np.ones((101,101,3))b=a[220:400,250:350]a[0:101,0:101]=bcv2.imshow('o',a)cv2.waitKey()cv2.destroyAllWindows()ee022cde-3a2b-11ed-9e49-dac502259ad0.png
																 
																我们还可以将感兴趣的图像加入到别的图像当中。
																 
																				 

七、通道的拆分与合并

拆分

																import cv2img=cv2.imread('图像名')b = img[ : , : , 0 ]g = img[ : , : , 1 ]r = img[ : , : , 2 ]
																我们在OpenCV中有专门拆分通道的函数: cv2.split(img)

																import cv2import numpy as npa=cv2.imread("imagelenacolor.png")b,g,r=cv2.split(a)cv2.imshow("B",b)cv2.imshow("G",g)cv2.imshow("R",r)cv2.waitKey()cv2.destroyAllWindows()ef272bf0-3a2b-11ed-9e49-dac502259ad0.png
																 合并

																import cv2import numpy as npa=cv2.imread("imagelenacolor.png")b,g,r=cv2.split(a)m=cv2.merge([b,g,r])cv2.imshow("merge",m)cv2.waitKey()cv2.destroyAllWindows()
																我们将上方的拆分图像进行merge合并就可以得到以下结果:
																efc07116-3a2b-11ed-9e49-dac502259ad0.png
															 
											 

审核编辑 :李倩


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器视觉
    +关注

    关注

    161

    文章

    4347

    浏览量

    120125
  • 计算机视觉
    +关注

    关注

    8

    文章

    1696

    浏览量

    45929
  • 图片处理
    +关注

    关注

    0

    文章

    16

    浏览量

    6849

原文标题:计算机视觉及其图像处理操作

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    计算机视觉有哪些优缺点

    计算机视觉作为人工智能领域的一个重要分支,旨在使计算机能够像人类一样理解和解释图像和视频中的信息。这一技术的发展不仅推动了多个行业的变革,也带来了诸多优势,但同时也伴随着一些挑战和局限性。以下是对
    的头像 发表于 08-14 09:49 743次阅读

    机器视觉计算机视觉有什么区别

    机器视觉计算机视觉是两个密切相关但又有所区别的概念。 一、定义 机器视觉 机器视觉,又称为计算机
    的头像 发表于 07-16 10:23 476次阅读

    计算机视觉的五大技术

    计算机视觉作为深度学习领域最热门的研究方向之一,其技术涵盖了多个方面,为人工智能的发展开拓了广阔的道路。以下是对计算机视觉五大技术的详细解析,包括图像分类、对象检测、目标跟踪、语义分割
    的头像 发表于 07-10 18:26 1207次阅读

    计算机视觉的工作原理和应用

    计算机视觉(Computer Vision,简称CV)是一门跨学科的研究领域,它利用计算机和数学算法来模拟人类视觉系统对图像和视频进行识别、理解、分析和
    的头像 发表于 07-10 18:24 1665次阅读

    计算机视觉与人工智能的关系是什么

    引言 计算机视觉是一门研究如何使计算机能够理解和解释视觉信息的学科。它涉及到图像处理、模式识别、机器学习等多个领域的知识。人工智能则是研究如
    的头像 发表于 07-09 09:25 529次阅读

    计算机视觉与智能感知是干嘛的

    引言 计算机视觉(Computer Vision)是一门研究如何使计算机能够理解和解释视觉信息的学科。它涉及到图像处理、模式识别、机器学习等
    的头像 发表于 07-09 09:23 812次阅读

    计算机视觉和机器视觉区别在哪

    计算机视觉和机器视觉是两个密切相关但又有明显区别的领域。 一、定义 计算机视觉 计算机
    的头像 发表于 07-09 09:22 409次阅读

    计算机视觉和图像处理的区别和联系

    计算机视觉和图像处理是两个密切相关但又有明显区别的领域。 1. 基本概念 1.1 计算机视觉 计算机
    的头像 发表于 07-09 09:16 1157次阅读

    计算机视觉属于人工智能吗

    属于,计算机视觉是人工智能领域的一个重要分支。 引言 计算机视觉是一门研究如何使计算机具有视觉
    的头像 发表于 07-09 09:11 1178次阅读

    深度学习在计算机视觉领域的应用

    深度学习技术的引入,极大地推动了计算机视觉领域的发展,使其能够处理更加复杂和多样化的视觉任务。本文将详细介绍深度学习在计算机
    的头像 发表于 07-01 11:38 683次阅读

    机器视觉计算机视觉的区别

    在人工智能和自动化技术的快速发展中,机器视觉(Machine Vision, MV)和计算机视觉(Computer Vision, CV)作为两个重要的分支领域,都扮演着至关重要的角色。尽管它们在
    的头像 发表于 06-06 17:24 1249次阅读

    计算机视觉的主要研究方向

    计算机视觉(Computer Vision, CV)作为人工智能领域的一个重要分支,致力于使计算机能够像人眼一样理解和解释图像和视频中的信息。随着深度学习、大数据等技术的快速发展,计算机
    的头像 发表于 06-06 17:17 854次阅读

    计算机视觉的十大算法

    随着科技的不断发展,计算机视觉领域也取得了长足的进步。本文将介绍计算机视觉领域的十大算法,包括它们的基本原理、应用场景和优缺点。这些算法在图像处理
    的头像 发表于 02-19 13:26 1208次阅读
    <b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>的十大算法

    计算机视觉与图像处理、模式识别、机器学习学科之间的关系

    计算机视觉(computer vision):用计算机来模拟人的视觉机理获取和处理信息的能力。就是指用摄影机和电脑代替人眼对目标进行识别、跟
    的头像 发表于 01-18 16:41 544次阅读

    最适合 AI 应用的计算机视觉类型是什么?

    计算机视觉是指为计算机赋予人类视觉这一技术目标,从而赋能装配线检查到驾驶辅助和机器人等应用。计算机缺乏像人类一样凭直觉产生
    的头像 发表于 12-18 13:09 7181次阅读
    最适合 AI 应用的<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>类型是什么?