0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

介绍新型深度CNN模型——NIMA 它能判断出哪张图片最好看

zhKF_jqr_AI 2017-12-29 14:29 次阅读

谷歌今日发文介绍新型深度CNN模型——NIMA(Neural Image Assessment),它能以接近人类的水平判断出哪张图片最好看。

图像质量和美学的量化一直是图像处理和计算机视觉长期存在的问题。技术质量评估测量的是图像在像素级别的损坏,例如噪声、模糊、人为压缩等等,而对艺术的评估是为了捕捉图像中的情感和美丽在语义级别的特征。最近,用带有标记的数据训练的深度卷积神经网络(CNNs)已被用于解决特殊图像(例如景观)图像质量的主观属性。然而,这些方法通常简单地将图像分为低质量和高质量的两类,范围有些狭窄。为了得到更准确的图像质量预测,我们提出的方法可以得不出同的预测评级,更接近于真实的评级,更适用于一般图像。

在NIMA:Neural Image Assessment这篇论文中,我们介绍了一个深度卷积神经网络,通过训练,它可以判断哪些是用户认为技术精湛的图片(technically),哪些是有吸引力的图片(aesthetically)。正是有了最先进的能够识别物体的深度神经网络,NIMA才能在此基础上理解更多类别的物体,不论有什么变化。我们提出的网络不仅能给图像打一个靠谱的分数、接近人类的感知水准,同时还能用于各种需要大量劳动力和主观任务中,例如智能照片编辑、优化视觉质量,或者在pipeline中发现视觉错误。

背景

一般来说,图像质量评估可分为全参考和无参考两种方法。如果作为参考的理想图片可用,则就会使用诸如PSNR、SSIM等衡量图像质量的尺度。当参考图像不可用时,无参考方法就会依靠统计模型来预测图像质量。这两种方法的主要目标是预测一个与人类感知十分相近的质量分数。在利用深度卷积神经网络对图像质量进行评估时,需要通过在与对象分类器相关的数据集上进行训练(例如ImageNet),以初始化权重。然后对注释数据进行微调,以进行感知质量评估任务。

NIMA

通常判断一幅图像是否有吸引力是将其分成高低两种质量。这忽略了一个事实,即训练数据中的每个图像都与人类评分的直方图相关联,而非简单的二分类。人类评价直方图是评价图像整体质量的指标,也是所有打分者的平均数。而在我们的新方法中,NIMA模型不是简单地将图像分为高或低质量,或者进行回归得到平均分,而是对任意给定的图像产出评级分布——分数从1到10,NIMA计算出各个分数的可能性。这也与训练数据的来源相一致,并且当与其他方法对比时,我们的方法更胜一筹。

接着,就可以使用NIMA的向量分数的各种功能按照吸引力排列图像了。下面展示了利用NIMA排名的图片,他们都来自AVA数据集。在测试中,AVA中的每张图片都由200人共同评分,训练结束后,NIMA对这些图片的美感排名与人类评分员的平均分数非常接近。我们发现NIMA在其他数据集上表现同样很出色,对图像质量的预测和人类接近。

AVA中带有“风景”标签的图片排名。括号中是人类打分,括号外是NIMA的预测分数

NIMA的分数也可以比较经过扭曲的图片与原图的质量差别,以下是TID2013测试集的一部分,其中包含各种类型和级别的图像失真。

图像感知增强(Perceptual Image Enhancement)

正如我们在另一篇论文中所提到的,质量和吸引力分数也可以用来调整图像增强operators。换句话说,将NIMA分数最大化作为损失函数的一部分,能够提升图像增强的感知质量。下图中的例子表明,NIMA可以作为训练损失来调整色调增强算法。我们发现对美感的基准评分可以通过NIMA的评分指导的对比调整来改善。因此,我们的模型能够引导一个深度卷积神经网络滤波器,以找到参数中接近最佳设置的位置,例如亮度、高光和阴影。

用CNN和NIMA改变原图的色调和对比度

展望未来

NIMA的结果表明,基于机器学习的质量评估模型可能用途非常广泛。比如,我们可以让用户很轻易地找出最好的照片,甚至实现在用户拍照时进行实时反馈。在后期处理上,该模型可以产生更优秀的结果。

简单地说,NIMA以及其他类似的网络可以满足人类对图像甚至视频的审美,虽然还不够完美,但已经比较可行了。俗话说,萝卜青菜各有所爱,每个人对一张照片的评价也各不相同,所以想要了解所有人的审美水平是非常困难的。但我们将继续训练测试模型,期待有更多的成果。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 神经网络
    +关注

    关注

    42

    文章

    4769

    浏览量

    100687
  • 图像处理
    +关注

    关注

    27

    文章

    1288

    浏览量

    56709
  • 计算机视觉
    +关注

    关注

    8

    文章

    1698

    浏览量

    45965

原文标题:谷歌发布NIMA,一个有品位的CNN模型

文章出处:【微信号:jqr_AI,微信公众号:论智】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    从AlexNet到MobileNet,带你入门深度神经网络

    深度神经网络运用的方法。AlexNet在研发的时候,使用的GTX580仅有3GB的显存,所以创造性的把模型拆解在两显卡中,架构如下:1.第一层是卷积层,针对224x224x3的输入图片
    发表于 05-08 15:57

    利用工业相机聚焦过程采集的图片,我们怎么判断图最清晰?

    如题,我们们采集下来的图片,用一个什么标准来判断它们的清晰度,求指点!!!
    发表于 05-10 14:36

    大家是怎么压榨CNN模型

    【技术综述】为了压榨CNN模型,这几年大家都干了什么
    发表于 05-29 14:49

    卷积神经网络CNN介绍

    深度学习】卷积神经网络CNN
    发表于 06-14 18:55

    深度学习模型是如何创建的?

    嵌入式系统已被证明可以降低成本并增加各个行业的收入,包括制造工厂,供应链管理,医疗保健等等。本文将介绍有关深度学习嵌入式系统的信息。深度学习模型是如何创建的?创建
    发表于 10-27 06:34

    什么是深度学习?使用FPGA进行深度学习的好处?

    什么是深度学习为了解释深度学习,有必要了解神经网络。神经网络是一种模拟人脑的神经元和神经网络的计算模型。作为具体示例,让我们考虑一个输入图像并识别图像中对象类别的示例。这个例子对应机器学习中的分类
    发表于 02-17 16:56

    一文详解CNN

    数字识别,将数字平移到图像另一个位置,被认为是不同的图片)2. 参数量太大,难以训练,容易陷入局部极值, 这样便有了后来的CNNCNN是减少模型尺寸的利器。 2
    发表于 08-18 06:56

    小米6新增黑、蓝“幽雅”两色,小米6款颜色最好看

    随着小米6越来越多的消息曝光,小米6的配置目前也已经基本确定,小米6将会在国内首发高通骁龙835处理器,骁龙835处理器比上一代骁龙821性能提升了30%。那么小米6有几种颜色?小米6款颜色最好看呢?
    发表于 12-26 17:16 7805次阅读

    深度学习模型优于人类医生?

    2017年,Esteva等人发表论文,宣布他们创建了一种基于卷积神经网络的深度学习模型,可以对图片进行分类,其中CNN无需被人类的标准所限制,它可以将数字
    的头像 发表于 06-30 08:40 2563次阅读
    <b class='flag-5'>深度</b>学习<b class='flag-5'>模型</b>优于人类医生?

    卷积神经网络模型训练步骤

    卷积神经网络模型训练步骤  卷积神经网络(Convolutional Neural Network, CNN)是一种常用的深度学习算法,广泛应用于图像识别、语音识别、自然语言处理等诸多领域。C
    的头像 发表于 08-21 16:42 1696次阅读

    cnn卷积神经网络模型 卷积神经网络预测模型 生成卷积神经网络模型

    cnn卷积神经网络模型 卷积神经网络预测模型 生成卷积神经网络模型  卷积神经网络(Convolutional Neural Network,CNN
    的头像 发表于 08-21 17:11 1230次阅读

    深度神经网络模型cnn的基本概念、结构及原理

    深度神经网络模型CNN(Convolutional Neural Network)是一种广泛应用于图像识别、视频分析和自然语言处理等领域的深度学习
    的头像 发表于 07-02 10:11 9684次阅读

    CNN模型的基本原理、结构、训练过程及应用领域

    卷积神经网络(Convolutional Neural Network,简称CNN)是一种深度学习模型,广泛应用于图像识别、视频分析、自然语言处理等领域。CNN
    的头像 发表于 07-02 15:26 3384次阅读

    图像分割与语义分割中的CNN模型综述

    图像分割与语义分割是计算机视觉领域的重要任务,旨在将图像划分为多个具有特定语义含义的区域或对象。卷积神经网络(CNN)作为深度学习的一种核心模型,在图像分割与语义分割中发挥着至关重要的作用。本文将从
    的头像 发表于 07-09 11:51 797次阅读

    cnn常用的几个模型有哪些

    CNN(卷积神经网络)是一种深度学习模型,广泛应用于图像识别、自然语言处理等领域。以下是一些常用的CNN模型: LeNet-5:LeNet-
    的头像 发表于 07-11 14:58 770次阅读