0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

小米夜枭算法团队获大众评审和摄影师评审两项世界冠军

科技绿洲 来源:小米编辑部 作者:小米编辑部 2022-05-09 10:02 次阅读

不久前,小米相机部迎来好消息

小米夜枭算法团队在被誉为“影像算法奥林匹克”的CVPR NTIRE 夜景渲染比赛中,获得了大众评审和摄影师评审的两项世界冠军。消息一出,公司上下,米粉及影像圈内外投来了惊喜、惊叹以及称赞的目光。

于是,这不,活儿就应运而生了。我被委任了一项光荣任务,要和夜枭算法团队的技术专家聊聊,“夜枭”这项技术到底咋(duo)回(niu) 事 (bi) 。文科女孩不怕困难,在肝了2周,流下一些含有技术含量的泪水后,终于,肝出来了!

顶级盛会天花板

夜枭团队双夺冠

首先,来隆重介绍一下有“影像算法奥林匹克”之称的CVPR NTIRE 系列赛。

CVPR,是计算机视觉领域全球最具影响力、内容最全面的顶级学术会议。说得具象一点,与我们耳熟能详的Nature 、Science的学术影响力可等量齐观。NTIRE,是 CVPR中关于影像恢复与增强相关任务的专题研讨会,是世界规模最大、水平最高的图像恢复与增强的研讨会和比赛。

NTIRE 提出业界前沿困难任务,用竞赛形式吸引全球专家学者参与挑战,而竞赛中提出的解决方案也常被学术圈和工业界所借鉴,因而备受关注。今年是第七届NTIRE 比赛,吸引了南开大学、米兰大学、华为等众多国内外顶尖大学、研究机构和公司参加。

小米夜枭团队本次参加的是NTIRE首次提出的比赛赛道,大赛提供单张夜景原始RAW图,参赛者通过研发夜景渲染解决方案,生成夜景视觉效果图像。(RAW图,可以理解为图片的原始档案,是没有被加工,也没有任何损失的一种格式图。)

为兼顾专业性与大众性,最终夜景效果图由大众评审和摄影师评审共同投票评定。这次小米夜枭团队获得的双冠军,可以说是来自专业人士与普通用户的双重肯定。

与 NTIRE 的其他赛道相比,夜景渲染挑战需要参赛者自发摸索和定义目标效果,相当于开放性考试,不仅考验团队的技术能力,也考验“技术审美”,难度更大,更具挑战性。

夜枭算法有多牛

背后技术是一流

首先,来为大家科普一下「夜枭算法」。算法是用计算机解决问题的方法、步骤。解决不同的问题,需要不同的算法。夜枭算法是聚焦于暗光场景,小米自研的深度学习AI拍照算法,用于提升手机相机拍照和视频的画质效果。

引用米粉的描述,小米手机+夜枭算法≈小米“夜视仪”。即在黑暗条件下,手机相机在夜枭算法加持下,突破手机相机感光下限,让照片焕发「光彩」的技术。

打个比方,当原始夜景照遇上夜枭算法,立刻碰撞出火花。照片将在不到3秒的时间里,经历去噪、提亮、色彩还原等环节,最终恢复出一张细节清晰、颜色真实、画面干净的夜景照片。

经过夜枭算法处理的照片,背后调用了数十个核心算法,包括AI噪声估计,AI去噪、AI细节增强、AI颜色还原、AI提亮、AI夜景深度估计、AI场景分割、AI选帧、AI对齐等。

那么让夜景照越夜越美,夜枭算法是如何做的呢?

1 夜太黑,「去噪」辨是非

在伸手不见五指的黑夜,未经算法处理的照片,自然是漆黑一片。

当对照片进行一点提亮,将得到一张噪声很大的照片。噪声,指一切不规则的信号,体现在照片里的即为图片噪声。肉眼看,噪声大的照片有“糊”的感觉,有时候甚至看不到具体的东西。

造成图片噪声的原因有很多,比如夜晚亮度低,灯光复杂,导致采集图像存在噪声。以及图像在手机设备内传输成像的过程,也会产生噪声。

噪声对图像是一种“破坏”,去噪则可理解为去除图像污染,恢复和重建图像数据的过程。小米夜枭算法,通过自主研发夜晚场景噪声标定系统,对夜晚场景噪声的分布和形态进行数学建模,在干净的图像上同样添加噪声,从而补充大量模拟噪声数据,提升训练数据的丰富度,让去噪更有针对性。

与此同时,小米夜枭算法还自主研发了极暗光数据采集系统,使用多种真实相机进行数据采集,补充的数据能让去噪效果更好。

万事开头难,图像去噪是算法处理照片的重中之重,是起点也是重点。

2 夜太美,更需要「完美」的细节

暗光情况下,拍张好看的人像照不容易。有米粉曾提出疑问,小米 11Ultra 在夜晚拍摄人像时,怎么做到把发丝、睫毛拍摄的丝丝分明的?

这其实本质是一个如何在有效去除图像噪声的同时,恢复出更多图像细节的问题。从算法原理上看,需要更好地对齐。

打个比方,当你在夜晚举起手机拍一张夜景照,小米相机里的“算法小机灵鬼”已准备就绪。

当你按下快门,算法其实拍摄了多张照片,它们紧锣密鼓地进行多张照片的画面对齐,并分析每张照片特征,择优录取「真实」的画面部分,从而融合出一张优秀的夜景作品。

通俗解释容易,背后的技术不简单。小米算法团队首次提出自引导的多尺度融合AI去噪算法,当多帧原图输入时,进行亚像素特征对齐和特征级别信息融合,降低拍摄手抖的影响,实现多帧信息的互相补充。

当单帧原图输入时,进行多尺度的特征重建,实现单帧内信息充分利用。结合噪声指导图,还可以引导算法对不同区域进行不同程度的融合去噪,指导局部信息残缺的区域实现细节恢复,在获得更好去噪效果的同时,恢复更加丰富的细节信息。

当我们看到恢复了更多细节的照片,在视觉上能感受到干净、舒服。因为算法区分出了细节和噪声,并保留好细节,比如纹理、发丝、睫毛,而不是直接抹掉。

如果用解一道难题来比喻,夜枭算法相当于在解决暗光拍照这道考题时,发现了8种解题思路,并通过深度学习,融合不同思路的完美之处,最终提交了一个近似“圆满”的答案。

3 夜太深,明暗色彩要分明

夜晚拍摄,由于灯光比较多,发出的光线不均匀,动态范围大。“动态范围大”就是亮度信息太多,从最亮到最暗的幅度大。此时用手机拍摄,可能出现高光的地方很亮但丢失细节,稍微暗点的地方则只剩黑暗。

为处理多种光源混合的情况,夜枭算法提出了基于内容自适应的AI提亮模型。通过对图像中不同的区域进行不同程度提亮,在保证图像对比度同时,保留亮区和暗区的信息,实现让亮度过渡区域更平滑、自然。

图像明暗过渡丝滑后,要想获得更真的“夜感”,还需要准确地还原夜景的颜色。

还原夜色,需要精准的白平衡估计。白平衡就是白色的平衡,我们看到物体的颜色,会随着环境光线出现偏差。夜晚光源较多,比如一只白色的狗在黄色的路灯下会偏黄,出现颜色失真。精确的白平衡估计,是让照片更真实的必要条件。

Xiaomi 12 Pro 夜枭2.0 VS 友商

为让夜景颜色更准确,小米夜枭团队使用deepAWB来实现多光源的白平衡估计,并首提AI色彩还原模型,通过提取图像中有效内容,让不同区域有不同的计算权重,避免受到过亮和过暗区域干扰造成混合光源颜色失真,提升了夜枭算法对环境的自适应能力。

Xiaomi 12 Pro 夜枭2.0 VS 友商

也就是说,夜枭算法中的AI提亮模型和颜色矫正模块,能根据不同环境的亮度和场景中的内容,实现不同程度的亮度提升和色彩还原,最终得出清晰、明亮的图像。

哪些坑

可以不踩

和夜枭算法专家雷老师聊完,我基本对夜枭算法从云里雾里到了五体投地的地步。优秀算法的关键,源自优秀头脑的写就,是一群优秀工程师的技术理想。

夜枭团队已成立近3年,成员多为热爱研究技术的年轻工程师。他们主要负责结合AI 深度学习技术,提升手机相机拍照和视频的画质效果,研究方向包括去噪、高动态、颜色增强等,已经交付了不少深受用户喜爱的研究成果,比如AI大片、夜枭极暗光拍照、夜枭视频、夜景抓拍等多个有自主知识产权的核心算法。

夜枭算法最初筹备时,并非是备受关注的热门项目。当时为解决夜景拍摄的技术难题,5位算法工程师凭借对技术的执着、痴迷,以及对待工作的全力以赴,利用不到半年的时间创造出了夜枭算法1.0。夜枭算法更像是一次技术探索中,意外收获的惊喜。

夜枭算法推出后,很快得到了多方肯定,并从幕后走到台前,登上了发布会。团队的小伙伴们既兴奋又紧张,期待着用户使用后的反馈。一段时间里,工程师们泡在微博、B站等社交媒体平台上,听用户的反馈,有时候听得很高兴,有时候也会有点小失落。“但对改进有用的,还是会认真看的。”

这个年轻的团队始终活力十足,成长速度越来越快,规模也日渐扩大。

当我问算法专家雷老师,能否提供夜景拍摄的技巧时,这其实并不在工程师的射程范围内。对于夜枭算法的专家来说,相比于拍出一张好看的照片,他们更在意的是底层算法的准确性,以及算法对色彩、场景还原的真实性。“准”与“真”是工程师相信的标准。

但他也从算法的逻辑角度,提出了3个小建议

1/ 稳住,才有赢的机会该稳定既是情绪上的稳定,还有就是手要稳,这可以让算法进行更好地对齐。虽然算法已经在一定程度上降低了手抖的影响,但如果拍摄中,手如帕金森般剧烈抖动或者大幅动弹,对于拍摄将毫无益处,稳住,赢的几率更大。

如果你天生手抖,建议可以配一个三脚架或者其他固定工具,用来保持画面的稳定。如果不想配三脚架,也可以把手机放在可以倚靠的固定地方,比如栏杆,或者也可以邀请手部稳定同伴帮忙。

2/ 避免拍摄“亮瞎眼”强光源强光源,不是指光头,而是指光线比较强的物体,当你试图拍强光源或者强光源下的人时,由于光线进入手机相机镜头内,发生了多次的折射与反射,会让画面出现难以预测的意外,以及也可能会让光线跑偏,当然最直接的可能就是被拍摄人打。

3/ 拥有一台夜拍神器最后,要想得到一个细节丰富、纯净度好的照片,最好的办法是拥有一台配置了夜枭算法的小米手机。目前夜枭算法已经应用到小米11 Ultra、小米12 Pro 等小米旗舰手机上,将助力你拍出更美的夜色。

每一次手机影像上的进步,背后都离不开宝藏工程师们。在工程师眼中,代码是语言,是表达的工具,是创新的力量。未来,伴随手机硬件和算法的不断提升,相信小米的工程师们将为手机影像的发展带来更多新的体验。

提到未来的展望,夜枭算法专家雷老师说,手机影像算法不仅会朝着拍照更快、更清晰、颜色更准确、动态范围更高的方向发展,还会根据用户更多元的需求,不断攻坚与创新,为米粉们带来更好的拍照体验。

虽然距离「最好」,还有很长的路要走,但务实的工程师们相信,只要钻研,耐心用时间去实践,总能开创出远大前程。

审核编辑:彭菁
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • AI
    AI
    +关注

    关注

    87

    文章

    29928

    浏览量

    268234
  • 计算机视觉
    +关注

    关注

    8

    文章

    1695

    浏览量

    45914
  • 小米
    +关注

    关注

    69

    文章

    14313

    浏览量

    143781
收藏 人收藏

    评论

    相关推荐

    冠军说|第二届OpenHarmony竞赛训练营冠军团队专访

    实现技术创新,解决现实问题的呢? 高校创新技术人才又将如何助力OpenHarmony技术生态的繁荣与活力? 点击下方视频一起听冠军说 探秘冠军团队与老师的独家幕后分享 OpenHarmony 竞赛
    发表于 10-28 17:11

    如何理解运放的共模输入电压范围和差模输入电压范围这两项参数?

    共模电压范围能不能理解为运放构成跟随器时的最大输入电压,而差模输入电压是运放开环时输入端的差值范围。 还有就是有没有具体的电路来测试这两项参数?
    发表于 08-07 06:30

    概伦电子同时入选两项上证科创板主题指数

    7月26日,上海证券交易所和中证指数有限公司正式发布上证科创板芯片设计主题指数(代码:950162)和上证科创板半导体材料设备主题指数(代码:950125),为市场提供更多科创板半导体产业投资标的。在公布的样本名单中,概伦电子成功入选两项指数,也是本次唯一一家同时入选两项
    的头像 发表于 07-26 10:34 497次阅读

    捷报速递 普罗格连两项重要荣誉

    阳春三月,捷报频传!近日,普罗格凭借自身卓越的数字化转型能力,一举揽两项重要荣誉,收获业内业外的关注与赞誉。
    的头像 发表于 07-22 16:23 342次阅读
    捷报速递  普罗格连<b class='flag-5'>获</b><b class='flag-5'>两项</b>重要荣誉

    华阳与华为达成两项重要合作

    6月21-22日,在华为开发者大会2024(HDC 2024)上,惠州华阳通用电子有限公司(以下简称“华阳”) 、华为终端有限公司(以下简称“华为”)双方签约了两项重要合作:HMS for Car全面合作协议与HUAWEI HiCar集成开发合作协议。
    的头像 发表于 06-25 11:08 611次阅读

    重磅!两项集成电路国家标准正式发布,产业即将迎来新变革

    近日,国家市场监督管理总局(国家标准管理委员会)发布了一重要公告,标志着我国集成电路行业即将迎来两项新的国家标准。这两项标准分别为《大规模集成电路(LSI)-封装-印制电路板共通设计结构》和《集成电路封装设备远程运维状态监测》
    的头像 发表于 05-29 10:01 905次阅读
    重磅!<b class='flag-5'>两项</b>集成电路国家标准正式发布,产业即将迎来新变革

    创新方便的在线评审软件——原理图设计的利器

    概述在当今数字化时代,原理图设计已成为许多领域中不可或缺的一环。然而,对于设计们来说,如何高效地进行评审却是一个挑战。传统的评审方式往往需要多人齐聚一堂,耗时耗力。设计们需要亲自填
    的头像 发表于 05-16 08:34 340次阅读
    创新方便的在线<b class='flag-5'>评审</b>软件——原理图设计的利器

    易华录产品检测中心顺利通过CNAS资质监督评审

    近日,经中国合格评定国家认可委员会评审组现场评审,易华录产品检测中心顺利通过CNAS资质监督评审
    的头像 发表于 05-15 17:26 555次阅读
    易华录产品检测中心顺利通过CNAS资质监督<b class='flag-5'>评审</b>

    SGS助力中兴通讯通过SBTi两项审验

    通讯成为通过SBTi两项审验并评CDP气候变化A级的大型ICT科技企业。 SGS助力中兴通讯通过SBTi两项审验 气候
    的头像 发表于 05-07 15:31 375次阅读
    SGS助力中兴通讯通过SBTi<b class='flag-5'>两项</b>审验

    华润微电子两项产品入选中央企业科技创新成果产品手册

    华润微“SiC JBS器件及系列化产品”“SiC MOSFET器件及系列化产品”两项成果入选电子元器件领域科技创新成果
    的头像 发表于 04-14 09:43 538次阅读

    亿纬液冷户外柜UL9540和UL1973两项国际权威认证!

    近日,亿纬液冷户外柜获得全球最知名的安全认证机构之一UL(Underwriters Laboratories)颁发的UL9540及UL1973两项认证证书。
    的头像 发表于 04-11 09:15 480次阅读

    亿铸科技接连斩获两项大奖

    新年伊始,喜讯连连!刚迈入2024年,亿铸科技便接连斩获两项大奖——2023Venture50新芽榜及2023中国半导体芯片设计创新奖,为新一年蓬勃发展拉开序幕。
    的头像 发表于 01-22 13:42 739次阅读

    Power Integrations荣获两项2023年电源行业配套品牌评选大奖

    由世纪电源网主办的第二届年度电源行业配套品牌评选活动已经落下帷幕,经过激烈的竞争和严格的评审过程,所有奖项的评选工作现已完成。
    的头像 发表于 01-08 15:25 514次阅读

    瑞芯微荣获汽车领域两项重要荣誉

    近日,瑞芯微电子股份有限公司在汽车领域荣获两项重要荣誉,分别是AUTOSEMO颁发的“技术生态合作奖”以及高工智能汽车研究院颁发的“年度智能汽车行业TOP100创新企业”。这两项荣誉不仅彰显了瑞芯微在汽车领域的卓越表现,也突显了公司在推动产业智能化进程中的重要地位。
    的头像 发表于 12-28 15:08 705次阅读

    中软国际出席第二届数字政府建设峰会,连两项荣誉授牌

    两项参编单位荣誉授牌和两项个人荣誉证书。      中软国际参与两项荣誉授牌仪式 直击第二届数字政府建设峰会暨现场 以“创新驱动数字湾区建设数据赋能高质量发展”为主题的第二届数字政府建设峰会暨数字湾区发展论坛近日在广
    的头像 发表于 12-26 21:25 571次阅读
    中软国际出席第二届数字政府建设峰会,连<b class='flag-5'>获</b><b class='flag-5'>两项</b>荣誉授牌