0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

点云数据详解——点云数据变为图像

新机器视觉 来源:CSDN 2023-03-27 11:08 次阅读


			

点云数据——The Point Cloud Data

点云数据应表示为具有N行和至少3列的numpy数组。每行对应于单个点,其在空间(x,y,z)中的位置使用至少3个值表示。

554efc62-cbdd-11ed-bfe3-dac502259ad0.png

如果点云数据来自LIDAR传感器,那么它可能具有每个点的附加值,例如“反射率”,其是在该位置中障碍物反射多少激光光束的量度。在这种情况下,点云数据可能是Nx4阵列。

图像与点云坐标——Image vs Point Cloud Coordinates

点云的轴与图像中的轴具有完全不同的含义。下图显示了蓝色的图像轴和橙色的点云轴。

556d6d00-cbdd-11ed-bfe3-dac502259ad0.png

关于图像需要注意的一些重要事项:

  • 图像中的坐标值始终为正。

  • 原点位于左上角。

  • 坐标是整数值。

有关点云坐标的注意事项:

  • 点云中的坐标值可以是正数或负数。

  • 坐标可以采用实数值。

  • 正x轴表示向前。

  • 正y轴表示左。

  • 正z轴表示向上。

创建点云数据的Birdseye视图

鸟瞰图的相关轴 为了创建鸟眼视图图像,来自点云数据的相关轴将是x和y轴。

55863c54-cbdd-11ed-bfe3-dac502259ad0.png

但是,正如我们从上图所示,我们必须小心并考虑以下事项: x和y轴意味着相反的事情。 x和y轴指向相反的方向。 您必须移动值,以便(0,0)是图像中可能的最小值。

1.限制矩形看——Limiting Rectangle to Look at

仅关注点云的特定区域通常很有用。因此,我们希望创建一个仅保留我们感兴趣的区域内的点的过滤器。 由于我们正在查看顶部的数据,并且我们有兴趣将其转换为图像,因此我将使用与图像轴更加一致的方向。下面,我指定我想要集中在相对于原点的值的范围。原点左侧的任何内容都将被视为负数,而右侧的任何内容都将被视为正数。点云的x轴将被解释为向前方向(这将是我们的鸟眼图像的向上方向)。 下面的代码将感兴趣的矩形设置为在原点的两侧跨越10米,并在其前面20米处。

side_range=(-10, 10)     # left-most to right-most
fwd_range=(0, 20)       # back-most to forward-most

2.接下来,我们创建一个过滤器,仅保留实际位于我们指定的矩形内的点。

# EXTRACT THE POINTS FOR EACH AXIS
x_points = points[:, 0]
y_points = points[:, 1]
z_points = points[:, 2]


# FILTER - To return only indices of points within desired cube
# Three filters for: Front-to-back, side-to-side, and height ranges
# Note left side is positive y axis in LIDAR coordinates
f_filt = np.logical_and((x_points > fwd_range[0]), (x_points < fwd_range[1]))
s_filt = np.logical_and((y_points > -side_range[1]), (y_points < -side_range[0]))
filter = np.logical_and(f_filt, s_filt)
indices = np.argwhere(filter).flatten()


# KEEPERS
x_points = x_points[indices]
y_points = y_points[indices]
z_points = z_points[indices]

3.将点位置映射到像素位置——Mapping Point Positions to Pixel Positions

目前,我们有一堆带有实数值的点。为了映射这些值,将这些值映射到整数位置值。我们可以天真地将所有x和y值整合到整数中,但我们最终可能会失去很多分辨率。例如,如果这些点的测量单位是以米为单位,则每个像素将表示点云中1x1米的矩形,我们将丢失任何小于此的细节。如果你有一个类似山景的点云,这可能没问题。但是如果你想能够捕捉更精细的细节并识别人类,汽车,甚至更小的东西,那么这种方法就没有用了。

但是,可以稍微修改上述方法,以便我们获得所需的分辨率级别。在对整数进行类型转换之前,我们可以先扩展数据。例如,如果测量单位是米,我们想要5厘米的分辨率,我们可以做如下的事情:

res = 0.05
# CONVERT TO PIXEL POSITION VALUES - Based on resolution
x_img = (-y_points / res).astype(np.int32)  # x axis is -y in LIDAR
y_img = (-x_points / res).astype(np.int32)  # y axis is -x in LIDAR

您会注意到x轴和y轴交换,方向反转,以便我们现在可以开始处理图像坐标。

更改坐标原点——Shifting to New Origin

x和y数据仍未准备好映射到图像。我们可能仍然有负x和y值。所以我们需要将数据移位到(0,0)最小值。

# SHIFT PIXELS TO HAVE MINIMUM BE (0,0)
# floor and ceil used to prevent anything being rounded to below 0 after shift
x_img -= int(np.floor(side_range[0] / res))
y_img += int(np.ceil(fwd_range[1] / res))

现在数据值都为正值

>>> x_img.min()
7
>>> x_img.max()
199
>>> y_img.min()
1
>>> y_img.max()
199

像素值——Pixel Values

我们已经使用点数据来指定图像中的x和y位置。我们现在需要做的是指定我们想要用这些像素位置填充的值。一种可能性是用高度数据填充它。要做的两件事
请记住:
像素值应为整数。
像素值应该是0-255范围内的值。

我们可以从数据中获取最小和最大高度值,并重新缩放该范围以适应0-255的范围。另一种方法,这里将使用的方法是设置我们想要集中的高度值范围,并且高于或低于该范围的任何内容都被剪切为最小值和最大值。这很有用,因为它允许我们从感兴趣的区域获得最大量的细节。

height_range = (-2, 0.5)  # bottom-most to upper-most


# CLIP HEIGHT VALUES - to between min and max heights
pixel_values = np.clip(a = z_points,
                           a_min=height_range[0],
                           a_max=height_range[1])

在下面的代码中,我们将范围设置为原点下方2米,高于原点半米。接下来,我们将这些值重新缩放到0到255之间,并将类型转换为整数。

def scale_to_255(a, min, max, dtype=np.uint8):
    """ Scales an array of values from specified min, max range to 0-255
        Optionally specify the data type of the output (default is uint8)
    """
    return (((a - min) / float(max - min)) * 255).astype(dtype)


# RESCALE THE HEIGHT VALUES - to be between the range 0-255
pixel_values  = scale_to_255(pixel_values, min=height_range[0], max=height_range[1])

创建图像阵列——Create the Image Array

现在我们准备实际创建图像,我们只是初始化一个数组,其尺寸取决于我们在矩形中所需的值范围和我们选择的分辨率。然后我们使用我们转换为像素位置的x和y点值来指定数组中的索引,并为这些索引分配我们选择的值作为前一小节中的像素值。

# INITIALIZE EMPTY ARRAY - of the dimensions we want
x_max = 1+int((side_range[1] - side_range[0])/res)
y_max = 1+int((fwd_range[1] - fwd_range[0])/res)
im = np.zeros([y_max, x_max], dtype=np.uint8)


# FILL PIXEL VALUES IN IMAGE ARRAY
im[y_img, x_img] = pixel_values

预览——Viewing

目前,图像存储为numpy数组。如果我们希望将其可视化,我们可以将其转换为PIL图像,并查看它。

# CONVERT FROM NUMPY ARRAY TO A PIL IMAGE
from PIL import Image
im2 = Image.fromarray(im)
im2.show()

我们作为人类并不善于分辨灰色阴影之间的差异,因此它可以帮助我们使用光谱颜色映射来让我们更容易分辨出价值差异。我们可以在matplotlib中做到这一点。(实际无法正常显示)

import matplotlib.pyplot as plt
plt.imshow(im, cmap="spectral", vmin=0, vmax=255)
plt.show()

559bb93a-cbdd-11ed-bfe3-dac502259ad0.jpg

它实际上编码与PIL绘制的图像完全相同的信息量,因此机器学习学习算法例如仍然能够区分高度差异,即使我们人类不能非常清楚地看到差异。

   import cv2
   #通过cv2显示
    cv2.imshow("im",im)
    cv2.waitKey()
    cv2.destroyAllWindows()

55b3f68a-cbdd-11ed-bfe3-dac502259ad0.png

完整代码——Complete Code

为方便起见,我将上面的所有代码放在一个函数中,它将鸟瞰视图作为一个numpy数组返回。然后,您可以选择使用您喜欢的任何方法对其进行可视化,或者将numpy数组插入到机器学习算法中。

import numpy as np


# ==============================================================================
#                                                                   SCALE_TO_255
# ==============================================================================
def scale_to_255(a, min, max, dtype=np.uint8):
    """ Scales an array of values from specified min, max range to 0-255
        Optionally specify the data type of the output (default is uint8)
    """
    return (((a - min) / float(max - min)) * 255).astype(dtype)


# ==============================================================================
#                                                         POINT_CLOUD_2_BIRDSEYE
# ==============================================================================
def point_cloud_2_birdseye(points,
                           res=0.1,
                           side_range=(-10., 10.),  # left-most to right-most
                           fwd_range = (-10., 10.), # back-most to forward-most
                           height_range=(-2., 2.),  # bottom-most to upper-most
                           ):
    """ Creates an 2D birds eye view representation of the point cloud data.


    Args:
        points:     (numpy array)
                    N rows of points data
                    Each point should be specified by at least 3 elements x,y,z
        res:        (float)
                    Desired resolution in metres to use. Each output pixel will
                    represent an square region res x res in size.
        side_range: (tuple of two floats)
                    (-left, right) in metres
                    left and right limits of rectangle to look at.
        fwd_range:  (tuple of two floats)
                    (-behind, front) in metres
                    back and front limits of rectangle to look at.
        height_range: (tuple of two floats)
                    (min, max) heights (in metres) relative to the origin.
                    All height values will be clipped to this min and max value,
                    such that anything below min will be truncated to min, and
                    the same for values above max.
    Returns:
        2D numpy array representing an image of the birds eye view.
    """
    # EXTRACT THE POINTS FOR EACH AXIS
    x_points = points[:, 0]
    y_points = points[:, 1]
    z_points = points[:, 2]
    # FILTER - To return only indices of points within desired cube
    # Three filters for: Front-to-back, side-to-side, and height ranges
    # Note left side is positive y axis in LIDAR coordinates
    f_filt = np.logical_and((x_points > fwd_range[0]), (x_points < fwd_range[1]))
    s_filt = np.logical_and((y_points > -side_range[1]), (y_points < -side_range[0]))
    filter = np.logical_and(f_filt, s_filt)
    indices = np.argwhere(filter).flatten()
    # KEEPERS
    x_points = x_points[indices]
    y_points = y_points[indices]
    z_points = z_points[indices]
    # CONVERT TO PIXEL POSITION VALUES - Based on resolution
    x_img = (-y_points / res).astype(np.int32)  # x axis is -y in LIDAR
    y_img = (-x_points / res).astype(np.int32)  # y axis is -x in LIDAR
    # SHIFT PIXELS TO HAVE MINIMUM BE (0,0)
    # floor & ceil used to prevent anything being rounded to below 0 after shift
    x_img -= int(np.floor(side_range[0] / res))
    y_img += int(np.ceil(fwd_range[1] / res))
    # CLIP HEIGHT VALUES - to between min and max heights
    pixel_values = np.clip(a=z_points,
                           a_min=height_range[0],
                           a_max=height_range[1])
    # RESCALE THE HEIGHT VALUES - to be between the range 0-255
    pixel_values = scale_to_255(pixel_values,
                                min=height_range[0],
                                max=height_range[1])
    # INITIALIZE EMPTY ARRAY - of the dimensions we want
    x_max = 1 + int((side_range[1] - side_range[0]) / res)
    y_max = 1 + int((fwd_range[1] - fwd_range[0]) / res)
    im = np.zeros([y_max, x_max], dtype=np.uint8)
    # FILL PIXEL VALUES IN IMAGE ARRAY
    im[y_img, x_img] = pixel_values


    return im

审核编辑 :李倩


声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 传感器
    +关注

    关注

    2550

    文章

    51042

    浏览量

    753105
  • 点云数据
    +关注

    关注

    0

    文章

    13

    浏览量

    1508

原文标题:点云数据详解——点云数据变为图像

文章出处:【微信号:vision263com,微信公众号:新机器视觉】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    dlp4500 数据

    大家好: 大神们,指导下我, 我在用dlp4500 获取三维数据,步骤是按照 官方的手册dlpu019a.pdf,在3.8 Calibration Verification这一步骤,验证标定的效果,没有达到官方给出的效果; 我获取的
    发表于 06-21 11:06

    dlp4500数据

    dlp4500 数据
    发表于 08-29 17:39

    从D435获得完整的数据集不完整

    800000-900000左右。假设数据是从图像生成的,则预期完整的具有结构 - 即,理想地,它将根据像素位置的行或列进行排序。一旦某
    发表于 10-30 11:27

    格式主要有哪几种

    由于数据的量非常大,cesium在显示海量数据的时候就非常的吃力,因此需要用到3dtiles。3D Tiles=lod+gltf,专门为大量数据
    发表于 07-12 07:48

    一种多幅数据与纹理序列自动配准方法

    方法将数据生成强度图像,通过特征匹配得到纹理影像与强度图像间的匹配关系,利用RANSAC算法进行匹配关系优化,确定每个纹理影像与强度
    发表于 03-18 10:42 5次下载
    一种多幅<b class='flag-5'>点</b><b class='flag-5'>云</b><b class='flag-5'>数据</b>与纹理序列自动配准方法

    创建数据的Birdseye视图

    如果数据来自LIDAR传感器,那么它可能具有每个的附加值,例如“反射率”,其是在该位置中障碍物反射多少激光光束的量度。在这种情况下,
    的头像 发表于 04-01 14:39 1786次阅读
    创建<b class='flag-5'>点</b><b class='flag-5'>云</b><b class='flag-5'>数据</b>的Birdseye视图

    数据——The Point Cloud Data

    如果数据来自LIDAR传感器,那么它可能具有每个的附加值,例如“反射率”,其是在该位置中障碍物反射多少激光光束的量度。在这种情况下,
    的头像 发表于 04-18 10:23 6419次阅读
    <b class='flag-5'>点</b><b class='flag-5'>云</b><b class='flag-5'>数据</b>——The Point Cloud Data

    图像是如何拼接在一起的?

    理解好图像拼接,需要从相机的模型说起。
    的头像 发表于 07-04 17:05 5554次阅读
    <b class='flag-5'>图像</b>的<b class='flag-5'>点</b><b class='flag-5'>云</b>是如何拼接在一起的?

    的概念以及与三维图像的关系

    概念 与三维图像的关系:三维图像是一种特殊的信息表达形式,其特征是表达的空间中三个维度的
    的头像 发表于 08-17 09:18 7255次阅读
    <b class='flag-5'>点</b><b class='flag-5'>云</b>的概念以及与三维<b class='flag-5'>图像</b>的关系

    十大数据处理技术和应用汇总

    在二维图像上,有Harris、SIFT、SURF、KAZE这样的关键提取算法,这种特征的思想可以推广到三维空间。从技术上来说,关键的数量相比于原始点
    的头像 发表于 01-12 11:55 3983次阅读

    一文详解及三维图像处理技术

    与三维图像的关系:三维图像是一种特殊的信息表达形式,其特征是表达的空间中三个维度的数据,表现形式包括:深度图(以灰度表达物体与相机的距离
    的头像 发表于 03-31 16:07 3000次阅读

    自动驾驶数据标注的步骤有哪些

    以下几个步骤: 数据预处理:在进行数据标注之前,需要对数据进行预处理,如去除噪声、调整图像
    的头像 发表于 04-21 17:50 2839次阅读

    自动驾驶技术中的数据标注步骤和注意事项

    等方面,详细介绍数据标注的步骤和注意事项。 一、数据预处理 在进行
    的头像 发表于 04-23 18:11 5358次阅读

    标注简介及其应用

    标注是一种将三维空间中的数据标注出来的过程,即将
    的头像 发表于 05-26 17:53 6021次阅读

    数据处理技术流程

    随着机载激光雷达技术的日益发展,其在测绘行业的应用越来越成熟,尤其在大比例地形图的应用中,具有无可替代的作用。本文将完整复盘点数据处理技术流程,以高植被山区地区为例。 什么是
    的头像 发表于 06-25 11:30 2609次阅读