0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

以深度学习为核心的计算机视觉技术具有视觉美感吗

MZjJ_DIGITIMES 来源:cg 2018-12-21 11:07 次阅读
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

我们看到了智能技术在影像辨识、侦测上的突破,甚至落地为产品。很多人问,这些深度学习为核心的计算机视觉技术也可以具有人类的美感—具有评判、编修、甚至美学创作的能力吗?

智能视觉美感技术大致可以区分为三类:首先为影像(或视讯)编修强化,包括修图(对比、亮度、景深等)、超高分辨率成像、突破压缩技术、改善电视显像质量、加速电影(内容)特效制作、甚至主动改善车辆安全驾驶在低亮度下的视讯质量;其次为照片美学评分、取景,自动挑选具美感的照片或是画面;第三为自动生成不存在的影像。而这些核心技术所启发的应用都已经是进行式,或是即将落地为产品。

相关技术大大改变数位内容产业。梵谷油画电影《梵谷:星夜之谜(Loving Vincent)》耗时6年,动员超过百位来自世界各地的画家才完成这个耗时、耗资的工作。目前已经有软件服务完成类似的功能,可以让一般人自动将影片转换为特定画家的风格,透过画家的经典创作,让卷积网络(CNN)的数千万个参数,学习到影像转换的方式,均衡风格跟影片内容。我们在两年前参与的IBM华生研究中心预告片自动剪辑研究,也同样带来类似产业的突破。

一般的卷积网络架构为设计适合的编码器以及相对的译码器;前者将画面内容解析之后,透过后者生成适切的影像(强化或是编修),大量的卷积网络参数透过事前的训练数据来达成目的。而时常被忽略的是适合的目标函数,通常得同时使用多个,并将领域知识吸纳其中,这是成功与否的重要关键!

在美学评分方面,一般利用卷积网络加上回归函式来逼近美感分数。最大的挑战在于训练的数据。因为严谨的美感牵涉到文化、社会、以及个人的差异,可以取得的训练数据─不管是透过人工标注或是社群网络下载—不全具代表性,很难学习到通用的美感。不过在特定家用照片上,透过自动评分,甚至修正照片(旋转、取景、饱和度等)等都已经落地在国内外的各种应用当中。如果能进一步熟悉应用场域,个人化适性学习,将有更大发挥的空间。

最具挑战的是从无到有生成具美感的影像,一般都尝试利用生成对抗网络(GAN)来实现,但是目前在速度、分辨率、生成质量控制上都还有相当努力的空间。

值得产业注意的是,我们观察到这些视觉美感智能突破也逐渐由云端走入本地端。相机、摄影机、电视等相关芯片都已经看到国内外的公司正逐渐布局。因为提供具美感的生活体验,不正也是智能时代的新产品吗?

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 计算机视觉
    +关注

    关注

    9

    文章

    1716

    浏览量

    47729
  • 深度学习
    +关注

    关注

    73

    文章

    5610

    浏览量

    124647

原文标题:【椽经阁】智能技术可以具有人类的视觉美感吗?

文章出处:【微信号:DIGITIMES,微信公众号:DIGITIMES】欢迎添加关注!文章转载请注明出处。

收藏 人收藏
加入交流群
微信小助手二维码

扫码添加小助手

加入工程师交流群

    评论

    相关推荐
    热点推荐

    人工智能多模态与视觉大模型开发实战 - 2026必会

    课程学员们提供了一个全面、深入学习这一前沿技术的平台。通过从原理到部署的一站式学习,学员们不仅能够掌握视觉大模型的
    发表于 04-15 16:06

    计算机专业408考研科目

    408 跨考零基础:三个月入门到精通路线 站在2026年的节点回望,计算机考研408(计算机学科专业基础综合)早已超越了单纯的知识点考核,它更像是一场对逻辑思维与系统观的深度洗礼。对于跨考且零基
    发表于 04-11 16:44

    传音相关研究成果入选计算机视觉顶会CVPR 2026

    (Mohamed bin Zayed University of Artificial Intelligence,简称MBZUAI)联合开展的“拍照解题”项目研究取得重要进展,相关成果论文已被计算机视觉领域的国际顶级学术会议CVPR 2026正式录用。
    的头像 发表于 04-03 17:45 2966次阅读
    传音相关研究成果入选<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>顶会CVPR 2026

    机器视觉核心技术和应用场景

    机器视觉正通过让机器“看见”并解读视觉数据来行业带来变革,进而提升自动化水平、质量控制效率与运营效能。本文将深入探讨机器视觉技术
    的头像 发表于 12-29 16:32 1055次阅读

    上海计算机视觉企业行学术沙龙走进西井科技

    12月5日,由中国图象图形学学会青年工作委员会(下简称“青工委”)、上海市计算机学会计算机视觉专委会(下简称“专委会”)联合主办,上海西井科技股份有限公司、江苏路街道商会承办的“上海计算机
    的头像 发表于 12-16 15:39 753次阅读

    【团购】独家全套珍藏!龙哥LabVIEW视觉深度学习实战课(11大系列课程,共5000+分钟)

    ,形成\"传统视觉算法→深度学习建模→工业级部署\"的完整技术链,帮助学员掌握从0到1搭建缺陷检测系统的能力,响应制造业\"提质降本增效\"的核心
    发表于 12-04 09:28

    【团购】独家全套珍藏!龙哥LabVIEW视觉深度学习实战课程(11大系列课程,共5000+分钟)

    ,形成\"传统视觉算法→深度学习建模→工业级部署\"的完整技术链,帮助学员掌握从0到1搭建缺陷检测系统的能力,响应制造业\"提质降本增效\"的核心
    发表于 12-03 13:50

    使用代理式AI激活传统计算机视觉系统的三种方法

    当前的计算机视觉系统擅长于识别物理空间与流程中的事件,却难以诠释场景细节及其意义,也无法推理后续可能发生的情况。
    的头像 发表于 12-01 09:44 791次阅读

    STM32计算机视觉开发套件:B-CAMS-IMX摄像头模块技术解析

    STMicroelectronics用于 STM32开发板的B-CAMS-IMX摄像头模块提供强大的硬件集,可处理多种计算机视觉场景和用例。该模块具有高分辨率500万像素IMX335LQN
    的头像 发表于 10-20 09:46 1632次阅读
    STM32<b class='flag-5'>计算机</b><b class='flag-5'>视觉</b>开发套件:B-CAMS-IMX摄像头模块<b class='flag-5'>技术</b>解析

    高能计算机工控产品核心各行业发展落实解决方案

    在当今数字化与智能化飞速发展的时代,各行业对于高效、稳定、智能的计算解决方案需求愈发迫切。工控计算机作为工业领域智能化转型的核心设备,正凭借其卓越的性能、强大的适应性以及不断创新的技术
    的头像 发表于 09-16 09:39 647次阅读

    如何在机器视觉中部署深度学习神经网络

    人士而言往往难以理解,人们也常常误以为需要扎实的编程技能才能真正掌握并合理使用这项技术。事实上,这种印象忽视了该技术机器视觉(乃至生产自动化)带来的潜力,因为
    的头像 发表于 09-10 17:38 1065次阅读
    如何在机器<b class='flag-5'>视觉</b>中部署<b class='flag-5'>深度</b><b class='flag-5'>学习</b>神经网络

    易控智驾荣获计算机视觉顶会CVPR 2025认可

    近日,2025年国际计算机视觉与模式识别顶级会议(IEEE/CVF Conference on Computer Vision and Pattern Recognition,CVPR 2025)在美国田纳西州纳什维尔召开。
    的头像 发表于 07-29 16:54 1385次阅读

    工业相机图像采集卡:机器视觉核心枢纽

    工业相机图像采集卡是用于连接工业相机与计算机的关键硬件设备,主要负责将相机输出的图像信号转换为计算机可处理的数字信号,并实现高速、稳定的数据传输。它在工业自动化、机器视觉、医学影像、科学研究等领域
    的头像 发表于 05-21 12:13 1056次阅读
    工业相机图像采集卡:机器<b class='flag-5'>视觉</b>的<b class='flag-5'>核心</b>枢纽

    【「# ROS 2智能机器人开发实践」阅读体验】视觉实现的基础算法的应用

    必须严谨,并定期重新校准。 OpenCV与ROS2的无缝结合 OpenCV是计算机视觉核心工具,书中介绍了如何在ROS2中调用OpenCV进行图像处理(如边缘检测、颜色空间转换等)。 通过ROS2
    发表于 05-03 19:41