0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

基于大模型的仿真系统研究一——三维重建大模型

赛目科技 来源: 赛目科技 2024-07-30 14:51 次阅读

基于大模型的仿真系统框架

传统的仿真测试验证普遍基于场景,而场景的构建主要由道路和场景编辑器来人工搭建静态场景和动态场景,这种方式费时费力,而且也大大限制了场景要素组合的丰富化。针对此痛点问题,赛目推出了基于大模型的仿真系统,利用机器学习深度学习人工智能技术,不仅推出自动标注大模型、多模态检测大模型和场景生成大模型等模块,并且引入三维重建大模型加强渲染画面真实性。

通过上述模块,赛目的路采场景转换系统实现了以传感器原始数据或者目标集数据为输入,通过感知融合、场景提取和生成等功能,输出仿真测试所需的静态路网和动态场景进行仿真,大大提高了仿真测试的效率。

图:基于大模型的仿真系统框架

三维重建大模型

本文首先介绍三维重建大模型。

三维重建是指根据单视图或者多视图重建三维信息、构建三维模型的过程。传统的计算机图形学的核心通过复杂的物理模型求解渲染方程。需要的不仅仅是场景中物体的几何和材质信息、相机的内外参信息,更需要复杂的光照模型来模拟自然光照的影响。

上述工作的重大突破来自Ben Mildenhall等人于2020发表的神经辐射场(NeRF),根据对同一物体不同观察视角的多张图像,通过隐式的编码表示场景实现三维重建的过程,利用体渲染生成新视角图像。

NeRF训练渲染流程可以总结如下:

1. 对于给定的相机光线,在光线上进行采样,对采样点的空间坐标及观察方向进行编码,用深度复杂网络存获得辐射场信息;

2. 辐射场输出空间点的颜色和密度;

3. 根据2的输出用体素渲染方程获得生成视角图片;

4. 在训练阶段与原视角图片计算损失更新网络。

图:NeRF训练管线[1]

下图表示了辐射场的网络结构,其中PE表示位置编码,x为三维坐标点,d为观察方向,MLP为多层感知机,ReLU和Sigmoid分别为不同激活函数。辐射场网络的输入是空间坐标及方差方向,输出为对应的颜色和密度值传递至体渲染模块。

图:NeRF网络结构

体渲染主要为解决云、烟、果冻等非刚性物体进行渲染建模,将其抽象成一团粒子群,表现了光线穿过时光子和粒子交互的过程,产生的辐亮度的变化。其物理过程包括吸收、外散射、内散射、放射。忽略背景光的影响,体渲染方程为:

上述方法主要针对室内小型场景进行三维重建,对于户外场景、特别是自驾场景还有许多优化的空间,相关内容将在下节讨论。

三维重建大模型-挑战和对应

对于自驾场景,上述Baseline方法面临的挑战包括:

1. 训练和渲染速度:Baseline方法需要花费数小时、甚至数天进行训练和生成,这对于仿真来说是难以接受的,同样不利于算法的迭代优化;

2. 生成画质清晰度:自驾场景包括了静态路网、动态环境参与者、背景建筑物、天空等等,需要同时将远景与近景清晰地渲染生成是一个极大的挑战;

3. 算法训练的过拟合现象:与Baseline对同一物体360°环视图像获取不同,路采车辆一般沿着固定采集路线前进,对于同一物体的信息收集不够充沛,影响最终的渲染质量。

4. 动态物体的添加和删除:利用三维重建大模型能够获得不同主车视角的成像结果,但是对于测试场景生成需要灵活地控制环境参与者,因此需要模型能够自由地对物体进行添加和删除。

基于上述问题,我们提出了下述的研究路线。

图:三维重建技术路线

对于无边界场景,由于可视范围变大的原因通过NDC坐标变化后的采样过程会将近景采样稀疏化,影响最终成像质量导致物体模糊,保持近距离坐标不变,远距离坐标作非线性转换是一种解决思路。坐标转换形式包括了[2-3]:

1.半径为r的球面内保持坐标不变,球面外坐标以单位向量以及逆半径重新定义,具体如下





然后利用线性插值法获得相应分辨率下的特征,输入至多层感知机中进行训练。特征栅格主要流程如下。

通过上述三维重建大模型方法,可以在自动驾驶仿真领域提升模型的训练和渲染速度、重建画质的清晰度、辐射场中物体深度与表面的准确度等等,同时能够动态添加环境车、行人等交通参与者进行场景泛化,实现更灵活的场景生成需求。

参考文献

[1]Mildenhall, Ben, et al. "Nerf: Representing scenes as neural radiance fields for view synthesis." Communications of the ACM 65.1 (2021): 99-106.

[2]Zhang, Kai, et al. "Nerf++: Analyzing and improving neural radiance fields." arXiv preprint arXiv:2010.07492 (2020).

[3]Barron, Jonathan T., et al. "Mip-nerf 360: Unbounded anti-aliased neural radiance fields." Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. 2022.

[4]Müller, Thomas, et al. "Instant neural graphics primitives with a multiresolution hash encoding." ACM Transactions on Graphics (ToG) 41.4 (2022): 1-15.

赛目科技

专注智能网联汽车测试

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 仿真系统
    +关注

    关注

    1

    文章

    97

    浏览量

    20660
  • 大模型
    +关注

    关注

    2

    文章

    2442

    浏览量

    2691

原文标题:基于大模型的仿真系统研究一——三维重建大模型

文章出处:【微信号:gh_c85a8e3c0f2a,微信公众号:赛目科技】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    商汤科技运用AI大模型实现实景三维重建

    近日,在北京建筑大学举行的2024第八届北京国际城市设计大会上,商汤科技把这些“活过来”的文物实景三维也带到了现场。
    的头像 发表于 11-25 16:49 446次阅读

    CASAIM与东北大学达成合作,三维扫描技术助力异形建材模型重建及尺寸精准分析

    近期,CASAIM与东北大学携手合作,以三维扫描技术为核心,为异形建材模型重建及尺寸精准分析提供有力支持,共同推进异形建材领域的应用与发展。
    的头像 发表于 11-13 15:11 164次阅读
    CASAIM与东北大学达成合作,<b class='flag-5'>三维</b>扫描技术助力异形建材<b class='flag-5'>模型</b><b class='flag-5'>重建</b>及尺寸精准分析

    CASAIM与迈普医学达成合作,三维扫描技术助力医疗辅具实现高精度三维建模和偏差比对

    近期,CASAIM与广州迈普再生医学科技股份有限公司(简称:迈普医学)合作,基于CT数据三维重建和设计,在医疗辅具研究开发中实现高精度三维建模和偏差比对,实现与缺损区域的精确匹配。
    的头像 发表于 11-12 14:48 173次阅读

    建筑物边缘感知和边缘融合的多视图立体三维重建方法

    航空建筑深度估计是三维数字城市重建中的项重要任务,基于深度学习的多视图立体(MVS)方法在该领域取得了较好的成果。目前的主要方法通过修改MVS 框架实现建筑物的深度估计,缺乏对建筑物内在结构的考虑,易导致精度不足等问题。
    的头像 发表于 11-07 10:16 206次阅读
    建筑物边缘感知和边缘融合的多视图立体<b class='flag-5'>三维重建</b>方法

    三维可视化技术的应用现状和发展前景

    工程项目的效率与质量。 医学影像 医学领域利用三维可视化技术进行医学影像诊断、手术规划和教育培训。医生可以利用三维重建图像来更好地了解患者病情,规划手术路径,甚至进行虚拟手术模拟,提升治疗效果与安全性。 虚拟现实与游
    的头像 发表于 09-30 17:57 261次阅读

    留形科技借助NVIDIA平台提供高效精确的三维重建解决方案

    本案例中,留形科技借助 NVIDIA Jetson 和 Omniverse 平台,实现边缘设备上的实时、全彩、无损三维重建,从而在建筑细节捕捉、大型基础设施的数字孪生等应用中,大幅提升三维数据采集与处理的效率与精度。
    的头像 发表于 09-09 09:42 450次阅读

    泰来三维|三维扫描技术在虚拟博物馆建设中的应用

    模型修复与着色:基于三维扫描数据,使用3D建模软件进行模型的修复、细化,并添加真实的纹理和颜色,使模型更加逼真。场景构建:根据历史资料和考古发现,构建古代遗址、宫殿、城市等场景的
    的头像 发表于 07-31 11:00 509次阅读

    泰来三维 工厂三维扫描建模技术服务

    通过利用三维扫描技术建立工厂物体的三维模型,可以更加直观地了解物体的形状和尺寸信息,避免传统测量方法的误差和繁琐操作,从而提高生产效率和质量。
    的头像 发表于 07-22 13:14 319次阅读
    泰来<b class='flag-5'>三维</b> 工厂<b class='flag-5'>三维</b>扫描建模技术服务

    cad如何进行三维建模

    三维建模是计算机辅助设计(CAD)中的项重要技术,它可以帮助设计师在计算机上创建和编辑三维模型。本文将介绍如何使用CAD软件进行三维建模,
    的头像 发表于 07-09 10:23 903次阅读

    泰来三维|三维激光扫描技术在古建筑保护中的应用

    通过三维激光扫描技术,可以快速获取古建筑的精确三维模型。在文物保护与修复过程中,利用三维模型可以更加全面、准确地记录古建筑的损伤情况,并辅助
    的头像 发表于 06-21 09:15 530次阅读
    泰来<b class='flag-5'>三维</b>|<b class='flag-5'>三维</b>激光扫描技术在古建筑保护中的应用

    三维可视化系统平台介绍及优势

    三维可视化 系统平台是种基于三维技术开发的软件系统,主要用于实现对三维空间中数据、
    的头像 发表于 06-12 16:02 619次阅读
    <b class='flag-5'>三维</b>可视化<b class='flag-5'>系统</b>平台介绍及优势

    泰来三维|数字化工厂_煤矿三维扫描数字化解决方案

    采用大空间三维激光扫描仪对厂区内部进行架站式精准三维扫描。厂区外部采用无人机倾斜摄影的方式获取彩色模型数据,采集控制点坐标与三维点云进行坐标转换融合点云数据,快速得到厂区内外完整的
    的头像 发表于 05-29 11:55 463次阅读
    泰来<b class='flag-5'>三维</b>|数字化工厂_煤矿<b class='flag-5'>三维</b>扫描数字化解决方案

    泰来三维|文物三维扫描,文物三维模型怎样制作

    文物三维扫描,文物三维模型怎样制作:我们都知道文物是不可再生的,要继续保存传承,需要文物三维数字化保护,所以三维数字化文物保护是非常重要的
    的头像 发表于 03-12 11:10 626次阅读
    泰来<b class='flag-5'>三维</b>|文物<b class='flag-5'>三维</b>扫描,文物<b class='flag-5'>三维</b><b class='flag-5'>模型</b>怎样制作

    泰来三维|见过三维扫描乌贼吗?三维扫描助力仿生设计学研究

    利用双光源手持3D扫描仪EinScan H2三维扫描仪对乌贼整体 重点躯干进行扫描,获取乌贼三维扫描点云模型。扫描过程中通过软件可以实时看到扫描进度以及扫描数据质量。
    的头像 发表于 01-26 11:25 392次阅读

    工业上常见的高精度主动式重建算法

    三维重建目前是最为炙手可热的领域。摄影测量或结构光投影技术可以解决漫反射重建问题,但却无法有效应对镜面反射物体(如玻璃、积水、反光物体和汽车车身)等的重建挑战。
    发表于 01-05 10:46 485次阅读
    工业上常见的高精度主动式<b class='flag-5'>重建</b>算法