Google Pixel3在相机算法的升级路上越战越勇-电子发烧友网

想要提高拍照效果，想必对于多数手机厂商而言，给手机塞进更多的摄像头似乎成了当前主流做法，例如“普通摄像头+景深摄像头”、“黑白+彩色摄像头”、“广角+长焦摄像头”……不过，偏偏有这么一家企业反其道而行，从发布 Pixel 系列以来，就一直坚持单摄像头，并强调在相机成像算法上的提升。

不久前的一篇《胜过 iPhone XS？Google Pixel 的“夜视功能”是怎样炼成的》文章中，我们介绍了 Google 新款手机 Pixel3 系列的夜景拍摄功能（Night Sight）。果然，读者们对于如何利用机器学习解决弱光条件下的拍摄难点持有很大兴趣。近日，Google Pixel3 在相机算法的升级路上越战越勇，对“人像模型”（Portrait Mode）拍摄功能进行了大幅升级。相比上一代的 Pixel2，Pixel3 的人像模式可为用户提供专业的外景图像拍摄，并通过模糊背景来加强主体对象的清晰度。

去年，Google 团队描述了相位检测自动对焦（PDAF）的技术，该技术使用了传统的非学习立体算法，并通过单个摄像头计算景深。如今，在最新推出的 Pixel 上，Google 将采用机器学习改进景深捕捉，以获取更好的人像效果。

如上图所示，上一代的人像模式主要通过神经网络决定人与背景成像像素，并使用从 PDAF 导出的景深信息来增强这两层人物的分割掩码(segmentationmask）。这意味着能够实现相应的背景虚化效果，更接近于专业相机的效果。

PDAF 通过捕捉场景的两个略微不同的视角进行工作，如下图所示。在两个视角之间翻转，我们看到人是静止的，而背景是水平移动的，这种效果成为视差（parallax）。因为视差是点距相机的距离与两个视点之间距离的函数，我们可以通过将一个视角中的每个点与另一个视角中的对应点进行匹配来估计景深。

图注：左、中的两个 PDAF 图像看起来非常相似，但在右图中，可以看到它们之间的视差

不过，通过立体算法在 PDAF 中找到这些对应关系极具挑战性，因为场景中的点几乎不在视图之间移动。此外，所有的立体声技术都存在孔径问题(Aperture Problem)。也就是说，机器通过小光圈观察场景，无法找到与立体基线平行的线的对应关系，即连接两个摄像头的线。换言之，当观察上图中的水平线（或纵向拍摄的垂直线）时，一个视角相对于另一个视角的任意可能的位移都看起来大致相同。结果，在上一代的人像模式中，以上提到的所有因素都有可能导致景深捕捉错误，产生令人不快的虚假图像。

如何改善景深捕捉？

Pixel3 采用的人像模式，通过利用立体算法产生的视差来修复这些误差。例如，远离焦距平面的点看起来不如较近的点那么清晰锐利，利用了“背景离焦”模式。此外，即使在平面屏幕上观看图像，也能通过物体的大致大小准确判断物体有多远，利用了“语义”模式。

如果构建一种能将以上不同的模式组合起来的算法是非常困难的，但我们可以通过机器学习进行构建，并更好地利用 PDAF 的“视差”。具体来讲，训练一个用 TensorFlow 编写的卷积神经网络，可以将 PDAF 作为输入并进行景深预测。这种新式改进的基于机器学习的景深捕捉方法被应用在了 Pixel3 的人像模式中。

图注：CNN 将 PDAF 图像作为输入，并输出景深图像。该网络使用“编码-解码”架构

如何训练神经网络？

为了训练网络，开发人员需要大量的 PDFA 图像和对应的高质量景深图，并且保证训练数据与用户使用智能手机拍摄的照片内容类似。为了实现这一目标，我们构建了自己的定制“Frankenphone”装备，其中包括五台 Pixel3 手机，以及基于 WiFi 的解决方案，使其能够同时捕捉来自所有手机的图片（在~2 毫秒的容差范围内）。通过这个设备，我们使用来自运动和多视图立体的结构从照片计算出高质量的景深。

图注：左：用于收集训练数据的自定义装备；中：一个捕获五个图像翻转的示例；右：真实景深，低保真点

该装备收集的数据适用于训练网络，主要基于以下五点因素：

五个视点确保在多个方向上存在视差，因此不存在孔径问题；

摄像头的位置要确保图像中的某一点在至少一张图像中是可见的，并一一对应；

基线，即相机之间的距离要比 PDAF 的基线大得多，从而产生更准确的景深捕捉；

摄像头同步确保可以计算上述动态场景的景深；

该装备具有便捷性，确保可捕捉野外照片，模拟用户使用智能手机拍摄的情况。

然而，即使从该装备捕获的数据是理想状态，预测场景中物体的绝对深度仍然极具挑战性，因为取决于镜头特性、焦距等因素，给定的 PDAF 对可以对应一系列不同的景深图像。为了解释这一点，我们改为捕捉场景中物体的相对景深，这足以产生令人满意的人像模式结果。

值得一提的是，这个基于机器学习模式的景深捕捉模型目前主要应用于 Pixel3 手机上。此外，通过使用 TensorFlow Lite 用于在移动和嵌入式设备上运行机器学习模型的跨平台解决方案，可以将得到的景深信息与分割掩码神经网络进行结合。

看到这里，不知道习惯了使用 iOS 系统手机的你，是不是正蠢蠢欲动回归在性能、价位日益提升的 Android 手机呢？

据最新消息称，Google 决定开放自己的相机算法授权给其他 Android 品牌使用，此前 Google 就开源了 Pixel2 系列的相机虚化算法。欢迎留言。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

神经网络

神经网络

+关注

关注
42

文章
4789

浏览量
101528
摄像头

摄像头

+关注

关注
60

文章
4880

浏览量
96701
AI算法

AI算法

+关注

关注
0

文章
253

浏览量
12400

原文标题：三摄正普及，四摄在路上？谷歌逆天AI算法，只做单摄虚化

文章出处：【微信号：rgznai100，微信公众号：rgznai100】欢迎添加关注！文章转载请注明出处。

东风本田300万辆CR-V越战越勇

中国车市依然处在动荡中。在新能源时代的洗礼下，传统车企，尤其是合资车企开始走向衰落，一批批曾经风靡市场的品牌和车型被汰换掉，留下来且还能与新势力一争高下着的属实已经不多见了。东风本田旗下

发表于 01-17 12:28 •854次阅读

康谋方案 | 多源相机数据采集与算法集成测试方案

如何满足不同应用场景下对图像采集和算法测试的多样化需求？本文为您带来多源相机数据采集与算法集成测试方案，通过BRICKplus/BRICK2与ADTF的结合，轻松实现多源相机快速集成和

发表于 12-11 09:59 •3195次阅读

康谋方案 | 多源<b class='flag-5'>相机</b>数据采集与<b class='flag-5'>算法</b>集成测试方案

谷歌Pixel Recorder应用用户参与度显著提升

Google Pixel 的 Recorder 应用允许用户录制、转录、保存和共享音频。为了让用户更轻松地管理和回顾自己的录音，Recorder 的开发者将目光锁定在功能强大的设备端大语言模型

发表于 11-15 13:46 •331次阅读

谷歌正式向Pixel设备推送Android 15稳定版

10月17日最新资讯，谷歌今日已正式向Pixel系列设备推送Android 15稳定版更新。目前，已有部分Pixel设备成功完成升级，而更大范围的推送预计将在本周末进行。

发表于 10-17 16:31 •583次阅读

在双绞线线路上捕获1394个事件

电子发烧友网站提供《在双绞线线路上捕获1394个事件.pdf》资料免费下载

发表于 09-29 09:41 •0次下载

<b class='flag-5'>在</b>双绞线线<b class='flag-5'>路上</b>捕获1394个事件

深视智能3D相机在轴承内径检测的应用

3D相机

深视智能科技

发布于 :2024年07月23日 10:33:54

谷歌Pixel 9系列手机将于8月13日盛大发布

谷歌震撼宣布：Pixel 9系列手机将于2024年8月13日（北京时间为次日凌晨1点）在美国加州山景城总部盛大发布，这一消息瞬间点燃了全球科技迷与消费者的热情。Pixel 9不仅标志着Pixe

发表于 07-16 14:43 •922次阅读

使用google-translate和wwe合并后无法使用google-tts怎么解决？

，在使用唤醒词唤醒后，我想让他使用google-tts说一句话，但是出现以下错误Code: Select all I (16188) wwe_example: rec_engine_cb

发表于 06-28 06:05

谷歌Pixel 10系列手机配备Tensor G5定制芯片，将迎来显著升级

据悉，在 Google Pixel 9 系列尚未正式发布之际，Android Authority已揭晓了其后续产品 Google Pixel

发表于 05-27 16:02 •828次阅读

Koolance 散热器在科学相机中的应用（二）

上一期我们讲到科学相机的成像原理及其散热的重要性，这一期，我们探讨另外一个问题：相机制冷是不是温度越低就越好？目前市面上常见的 CCD 和 SCMOS 科学相机多为制冷

发表于 05-22 15:41 •576次阅读

谷歌：iOS版Chrome浏览器将支持“圈选即搜”功能，整合Google

据了解，截至5月17日，Google已在Galaxy S24及Pixel 8系列智能手机中引入了所谓的“圈选即搜”功能，该功能旨在帮助用户快速寻找关键信息。而日前，有消息透露，Google有意将此项技术引入iOS版Chrome浏

发表于 05-17 10:00 •812次阅读

谷歌Pixel 9系列手机曝光：尺寸与规格各异

据知情人士透露，Google即将于近期推出Pixel 9系列新款智能手机。该系列包括Pixel 9、Pixel 9 Pro及Pixel 9

发表于 05-14 09:54 •908次阅读

谷歌Pixel 8a手机发布：搭载Tensor G3芯片，配备AI功能，5月开始预购

相较于上代产品Pixel 7a，Pixel 8a升级了更快的处理器、更高亮度的屏幕、翻倍的存储空间和全新的AI相机功能。其中，Tensor G3

发表于 05-08 17:03 •968次阅读

Google Pixel 8a新款面世，全新显示屏与AI相机引爆精明消费者

相较于去年的7a，Pixel 8a升级了更快的处理器、更高亮度的屏幕、翻倍的存储空间和全新的AI相机功能。其中，Tensor G3自研处理器内置AI助理Gemini、完美合照、画圈搜索

发表于 05-08 09:58 •666次阅读

谷歌Pixel 8a获FCC认证，三维尺寸及相机岛设计被曝光

据悉，去年一月份以来，谷歌 Pixel 8a 手机的零售包装盒设计已多次被透露，其中展示出采用家族式设计的相机岛以及双摄系统，同时，手机型号也彰显出来——G6GPR（同 FCC 认证信息相符），且支持至高达 27W 的快速充电功能。

发表于 03-19 15:33 •710次阅读

搜索历史

Google Pixel3在相机算法的升级路上越战越勇

评论

东风本田300万辆CR-V越战越勇

康谋方案 | 多源相机数据采集与算法集成测试方案

谷歌Pixel Recorder应用用户参与度显著提升

谷歌正式向Pixel设备推送Android 15稳定版

在双绞线线路上捕获1394个事件

深视智能3D相机在轴承内径检测的应用

谷歌Pixel 9系列手机将于8月13日盛大发布

使用google-translate和wwe合并后无法使用google-tts怎么解决？

谷歌Pixel 10系列手机配备Tensor G5定制芯片，将迎来显著升级

Koolance 散热器在科学相机中的应用（二）

谷歌：iOS版Chrome浏览器将支持“圈选即搜”功能，整合Google

谷歌Pixel 9系列手机曝光：尺寸与规格各异

谷歌Pixel 8a手机发布：搭载Tensor G3芯片，配备AI功能，5月开始预购

Google Pixel 8a新款面世，全新显示屏与AI相机引爆精明消费者

谷歌Pixel 8a获FCC认证，三维尺寸及相机岛设计被曝光