使用超表面的几何图像变换示意图
在一个寒冷晴朗的日子里,你开车行驶在乡村公路上,周围是被雪覆盖的田野。在一瞬间,你的眼睛会处理场景,挑选出单独的物体来聚焦——一个停车标志,一个谷仓——而场景的其余部分则在外围模糊。当你坐在办公桌前时,你的大脑将聚焦和模糊的图像存储为记忆,稍后可以在脑海中描绘出来。
宾夕法尼亚州立大学电气工程研究人员模仿人眼的这种简单、即时的图像处理能力,创造了一种超表面:一种类似于载玻片的光学元件,使用放置在不同角度的微小纳米结构来控制光。在通讯作者、宾夕法尼亚州立大学电气工程与计算机科学Xingjie Ni副教授的带领下,该团队在《自然·通讯》上发表了他们的研究成果。
研究人员表示,人工智能系统需要大量的计算能力和能量,处理图像和识别物体的速度可能很慢。相比之下,超表面可以用于在图像被相机捕捉之前对其进行预处理和变换,从而使计算机和人工智能能够以最小的功率和数据带宽对其进行处理。
超表面的工作原理是将图像从笛卡尔坐标系转换为对数极坐标系,笛卡尔坐标系中图像像素沿x和y轴排列成直线行和直线列,对数极坐标系统使用类似牛眼的像素分布。
Xingjie Ni说:“就像人眼内部光受体的排列一样,超表面拍摄图像并将其排列在对数极坐标系中——中心区域的像素密度更高,聚焦区域的像素更稀疏。这使得照片中更重要的部分能够清晰地显示出来,而其他部分则不那么聚焦,从而节省了数据带宽。”
超表面被放置在相机前面,这样光线首先穿过它,并将图像从笛卡尔坐标系转换为对数极坐标,然后由相机数字化并传输到计算机。由于它使用弯曲光的纳米结构工作,因此超表面不需要任何功率,以光速工作。
Xingjie Ni说:“由于物体的图像可能在大小或方向上有所不同,因此需要对图像进行预处理,使其能够抵抗缩放和旋转的变化。这种预处理有助于人工智能应用程序更容易地将它们识别为同一对象。”
通过在相机前放置不同的超表面,研究人员还可以将对数极坐标图像转换回笛卡尔坐标的原始图像。
研究人员表示,这项发明有许多潜在的应用,包括用于目标跟踪和监视,例如绘制汽车如何在城市中行驶的地图。
Xingjie Ni说:“超表面可以与人工智能系统协同使用作为预处理器,从而更容易从多个街景摄像头中识别同一辆车。或者,如果将其应用于卫星,它可能会跟踪飞机从起飞到降落的过程。”
审核编辑 黄宇
-
图像处理
+关注
关注
27文章
1282浏览量
56646 -
人工智能
+关注
关注
1791文章
46872浏览量
237596
发布评论请先 登录
相关推荐
评论