0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于大模型的仿真系统研究一——三维重建大模型

赛目科技 来源: 赛目科技 2024-07-30 14:51 次阅读

基于大模型的仿真系统框架

传统的仿真测试验证普遍基于场景,而场景的构建主要由道路和场景编辑器来人工搭建静态场景和动态场景,这种方式费时费力,而且也大大限制了场景要素组合的丰富化。针对此痛点问题,赛目推出了基于大模型的仿真系统,利用机器学习深度学习人工智能技术,不仅推出自动标注大模型、多模态检测大模型和场景生成大模型等模块,并且引入三维重建大模型加强渲染画面真实性。

通过上述模块,赛目的路采场景转换系统实现了以传感器原始数据或者目标集数据为输入,通过感知融合、场景提取和生成等功能,输出仿真测试所需的静态路网和动态场景进行仿真,大大提高了仿真测试的效率。

图:基于大模型的仿真系统框架

三维重建大模型

本文首先介绍三维重建大模型。

三维重建是指根据单视图或者多视图重建三维信息、构建三维模型的过程。传统的计算机图形学的核心通过复杂的物理模型求解渲染方程。需要的不仅仅是场景中物体的几何和材质信息、相机的内外参信息,更需要复杂的光照模型来模拟自然光照的影响。

上述工作的重大突破来自Ben Mildenhall等人于2020发表的神经辐射场(NeRF),根据对同一物体不同观察视角的多张图像,通过隐式的编码表示场景实现三维重建的过程,利用体渲染生成新视角图像。

NeRF训练渲染流程可以总结如下:

1. 对于给定的相机光线,在光线上进行采样,对采样点的空间坐标及观察方向进行编码,用深度复杂网络存获得辐射场信息;

2. 辐射场输出空间点的颜色和密度;

3. 根据2的输出用体素渲染方程获得生成视角图片;

4. 在训练阶段与原视角图片计算损失更新网络。

图:NeRF训练管线[1]

下图表示了辐射场的网络结构,其中PE表示位置编码,x为三维坐标点,d为观察方向,MLP为多层感知机,ReLU和Sigmoid分别为不同激活函数。辐射场网络的输入是空间坐标及方差方向,输出为对应的颜色和密度值传递至体渲染模块。

图:NeRF网络结构

体渲染主要为解决云、烟、果冻等非刚性物体进行渲染建模,将其抽象成一团粒子群,表现了光线穿过时光子和粒子交互的过程,产生的辐亮度的变化。其物理过程包括吸收、外散射、内散射、放射。忽略背景光的影响,体渲染方程为:

上述方法主要针对室内小型场景进行三维重建,对于户外场景、特别是自驾场景还有许多优化的空间,相关内容将在下节讨论。

三维重建大模型-挑战和对应

对于自驾场景,上述Baseline方法面临的挑战包括:

1. 训练和渲染速度:Baseline方法需要花费数小时、甚至数天进行训练和生成,这对于仿真来说是难以接受的,同样不利于算法的迭代优化;

2. 生成画质清晰度:自驾场景包括了静态路网、动态环境参与者、背景建筑物、天空等等,需要同时将远景与近景清晰地渲染生成是一个极大的挑战;

3. 算法训练的过拟合现象:与Baseline对同一物体360°环视图像获取不同,路采车辆一般沿着固定采集路线前进,对于同一物体的信息收集不够充沛,影响最终的渲染质量。

4. 动态物体的添加和删除:利用三维重建大模型能够获得不同主车视角的成像结果,但是对于测试场景生成需要灵活地控制环境参与者,因此需要模型能够自由地对物体进行添加和删除。

基于上述问题,我们提出了下述的研究路线。

图:三维重建技术路线

对于无边界场景,由于可视范围变大的原因通过NDC坐标变化后的采样过程会将近景采样稀疏化,影响最终成像质量导致物体模糊,保持近距离坐标不变,远距离坐标作非线性转换是一种解决思路。坐标转换形式包括了[2-3]:

1.半径为r的球面内保持坐标不变,球面外坐标以单位向量以及逆半径重新定义,具体如下





然后利用线性插值法获得相应分辨率下的特征,输入至多层感知机中进行训练。特征栅格主要流程如下。

通过上述三维重建大模型方法,可以在自动驾驶仿真领域提升模型的训练和渲染速度、重建画质的清晰度、辐射场中物体深度与表面的准确度等等,同时能够动态添加环境车、行人等交通参与者进行场景泛化,实现更灵活的场景生成需求。

参考文献

[1]Mildenhall, Ben, et al. "Nerf: Representing scenes as neural radiance fields for view synthesis." Communications of the ACM 65.1 (2021): 99-106.

[2]Zhang, Kai, et al. "Nerf++: Analyzing and improving neural radiance fields." arXiv preprint arXiv:2010.07492 (2020).

[3]Barron, Jonathan T., et al. "Mip-nerf 360: Unbounded anti-aliased neural radiance fields." Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2022.

[4]Müller, Thomas, et al. "Instant neural graphics primitives with a multiresolution hash encoding." ACM Transactions on Graphics (ToG) 41.4 (2022): 1-15.

赛目科技

专注智能网联汽车测试

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 仿真系统
    +关注

    关注

    1

    文章

    95

    浏览量

    20575
  • 大模型
    +关注

    关注

    2

    文章

    2095

    浏览量

    1897

原文标题:基于大模型的仿真系统研究一——三维重建大模型

文章出处:【微信号:gh_c85a8e3c0f2a,微信公众号:赛目科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    泰来三维|三维扫描技术在虚拟博物馆建设中的应用

    模型修复与着色:基于三维扫描数据,使用3D建模软件进行模型的修复、细化,并添加真实的纹理和颜色,使模型更加逼真。场景构建:根据历史资料和考古发现,构建古代遗址、宫殿、城市等场景的
    的头像 发表于 07-31 11:00 324次阅读

    cad如何进行三维建模

    三维建模是计算机辅助设计(CAD)中的项重要技术,它可以帮助设计师在计算机上创建和编辑三维模型。本文将介绍如何使用CAD软件进行三维建模,
    的头像 发表于 07-09 10:23 366次阅读

    泰来三维|三维激光扫描技术在古建筑保护中的应用

    通过三维激光扫描技术,可以快速获取古建筑的精确三维模型。在文物保护与修复过程中,利用三维模型可以更加全面、准确地记录古建筑的损伤情况,并辅助
    的头像 发表于 06-21 09:15 298次阅读
    泰来<b class='flag-5'>三维</b>|<b class='flag-5'>三维</b>激光扫描技术在古建筑保护中的应用

    三维可视化系统平台介绍及优势

    三维可视化 系统平台是种基于三维技术开发的软件系统,主要用于实现对三维空间中数据、
    的头像 发表于 06-12 16:02 379次阅读
    <b class='flag-5'>三维</b>可视化<b class='flag-5'>系统</b>平台介绍及优势

    泰来三维|文物三维扫描,文物三维模型怎样制作

    文物三维扫描,文物三维模型怎样制作:我们都知道文物是不可再生的,要继续保存传承,需要文物三维数字化保护,所以三维数字化文物保护是非常重要的
    的头像 发表于 03-12 11:10 411次阅读
    泰来<b class='flag-5'>三维</b>|文物<b class='flag-5'>三维</b>扫描,文物<b class='flag-5'>三维</b><b class='flag-5'>模型</b>怎样制作

    泰来三维|见过三维扫描乌贼吗?三维扫描助力仿生设计学研究

    利用双光源手持3D扫描仪EinScan H2三维扫描仪对乌贼整体 重点躯干进行扫描,获取乌贼三维扫描点云模型。扫描过程中通过软件可以实时看到扫描进度以及扫描数据质量。
    的头像 发表于 01-26 11:25 258次阅读

    基于光学计算超表面的全光学目标识别和三维重建技术

    随着物体识别和三维(3D) 重建技术在各种逆向工程、人工智能、医疗诊断和工业生产领域变得必不可少,人们越来越关注与寻求可以简化处理的高效、更快的速度和更集成的方法。
    的头像 发表于 12-22 10:13 431次阅读
    基于光学计算超表面的全光学目标识别和<b class='flag-5'>三维重建</b>技术

    基于深度学习的三维重建技术

    多视图立体几何(Multi-View Stereo,MVS)是计算机视觉中重要的研究领域,也是迈入三维计算机视觉研究的重点问题。它通过利用多张互相重叠的图像恢复出原始三维场景的几何结构
    的头像 发表于 12-04 10:08 788次阅读
    基于深度学习的<b class='flag-5'>三维重建</b>技术

    AIRLOOK与商汤科技强强联合,打造“实景三维与AI大模型”结合的全新盛宴

    实景三维中国建设作为数字中国建设的重要内容之,是项涉及多方面技术支撑的综合性工程,同时作为AI技术在其中发挥着至关重要的作用,AI大模型的发展也将进
    的头像 发表于 11-20 09:06 390次阅读

    RayDF:实时渲染!基于射线的三维重建新方法

    在机器视觉和机器人领域的许多前沿应用中,学习准确且高效的三维形状表达是十分重要的。然而,现有的基于三维坐标的隐式表达在表示三维形状或是渲染二图像时,需要耗费昂贵的计算成本;
    的头像 发表于 11-17 16:23 581次阅读
    RayDF:实时渲染!基于射线的<b class='flag-5'>三维重建</b>新方法

    数字孪生 数字化三维扫描助力实景建模

    三维扫描技术后就直接变成了三维(点云数据)转三维三维模型)的过程。三维扫描技术直接能构建出
    的头像 发表于 11-10 17:11 534次阅读
    数字孪生 数字化<b class='flag-5'>三维</b>扫描助力实景建模

    商汤打出“数字中国”建设大模型组合拳

    提供宏观尺度的解译能力,“洞察地球奥秘”。 以 商汤琼宇SenseSpace高精实景三维重建平台 提供精细化建模能力,“还原真实世界”。 从 二三维的大模型组合拳 ,是商汤科技面
    的头像 发表于 11-09 13:35 432次阅读
    商汤打出“数字中国”建设大<b class='flag-5'>模型</b>组合拳

    风洞模型表面压力分布三维显示技术

    电子发烧友网站提供《风洞模型表面压力分布三维显示技术.doc》资料免费下载
    发表于 11-02 10:38 0次下载
    风洞<b class='flag-5'>模型</b>表面压力分布<b class='flag-5'>三维</b>显示技术

    如何实现超高精度智能化全彩手持三维扫描

    全彩三维扫描仪是基于实时三维重建应用场景设计的高集成度易操作的手持式三维扫描系统,可实现0.03秒高速扫描并键自动完成点云全局注册,去噪融
    的头像 发表于 10-16 15:58 627次阅读
    如何实现超高精度智能化全彩手持<b class='flag-5'>三维</b>扫描

    基于光学成像的物体三维重建技术研究

    三维重建种重要方法,具有成本低、精度高等优点,因此越来越受到人们的关注和青睐。本文就基于光学成像的物体三维重建技术进行研究和探讨。
    的头像 发表于 09-15 09:29 745次阅读
    基于光学成像的物体<b class='flag-5'>三维重建</b>技术<b class='flag-5'>研究</b>