资料介绍
描述
介绍
构建对象检测模型可能很棘手,因为它需要大型数据集。有时,数据可能很少或不够多样化,无法训练出稳健的模型。合成数据提供了一种替代方法,可以生成具有良好代表性的数据集来构建质量模型。通过应用域随机化,我们开发了逼真的数据集,训练了神经网络,并使用真实数据集验证了模型。为了创建多样化的数据集,我们创建了各种具有随机属性的模拟环境:不断变化的光照条件、相机位置和材料纹理。我们还表明,合成的随机数据集可以帮助推广模型以适应现实环境。
描述
我们想复制Louis Moreau 的物体检测工作,但这次使用合成数据而不是真实数据。该项目旨在演示如何使用 Nvidia Omniverse Replicator 生成的合成数据集构建和部署 Edge Impulse 对象检测模型。Replicator 是 Nvidia Omniverse 的扩展,它提供了生成物理上准确的合成数据的方法。
为什么要合成数据?
分类、对象检测和分割等计算机视觉任务需要大规模数据集。从一些现实世界的应用程序中收集的数据往往范围狭窄且多样性较低,通常是从单一环境中收集的,有时是不变的并且在大多数时间保持不变。此外,从单一领域收集的数据往往具有较少的尾端场景和罕见事件的示例,我们无法轻易地将这些情况复制到现实世界中。
因此,在单个域中训练的模型很脆弱,并且在部署到另一个环境时经常会失败;因此,它需要另一个训练周期来适应新环境。这就提出了一个问题,我们如何才能有效且廉价地跨多个领域收集广义数据?一个简单但不合理的有效解决方案是Domain Randomization,改变前景物体的纹理和颜色,背景图像,场景中的灯光数量,灯光的姿态,相机位置等。Domain randomization可以进一步提高模拟器中生成的罕见事件的合成数据结构的可变性。
“域随机化的目的是在训练时提供足够的模拟可变性,以便在测试时模型能够推广到真实世界的数据。” - Tobin 等人,用于将深度神经网络从模拟转移到现实世界的域随机化,2017 年
Nvidia Replicator 使我们能够执行域随机化。Replicator 是 Omniverse 系列中的一个模块,它提供工具和工作流程来为各种计算机视觉和非视觉任务生成数据。Replicator 是一种高度互操作的工具,可与 40 多个不同垂直领域的建模/渲染应用程序集成。由于 Pixar 的通用场景描述 (USD),无缝集成成为可能,它作为 Blender、3DMax、Maya、Revit、C4D 等各种应用程序的协议,与 Nvidia Replicator 一起工作。
以数据为中心的工作流程
传统的机器学习工作流程往往以模型为中心,通过迭代改进算法设计等更多地关注模型的开发。在这个项目中,我们选择了以数据为中心的方法,我们固定模型并迭代提高生成的质量数据集。这种方法更加稳健,因为我们知道我们的模型与数据集一样好。因此,该方法系统地改变了 AI 任务的数据集性能。它的核心是从数据而非模型的角度考虑机器学习。
硬件和驱动程序设置
Nvidia Omniverse Replicator 是一个计算密集型应用程序,需要中等大小的 GPU 和不错的 RAM。我的硬件设置包括 32GB RAM、1TB 存储空间和 8GB GPU 以及 Intel i9 处理器。
该应用程序可以在 Windows 和 Linux 操作系统上运行。对于这个实验,我们使用了 Ubuntu 20.04 LTS 发行版,因为从 2022 年 11 月起 Nvidia Omniverse 不再支持 Ubuntu 18.04。此外,我们选择了合适的 Nvidia 驱动程序 v510.108.03 并将其安装在 Linux 机器上。
实验设置和数据生成
实验环境由可移动和不可移动的物体(动态和静态定位物体)组成。不可移动的物体由灯、一张桌子和两个相机组成。同时,可移动的物体是餐具,即勺子、叉子和刀子。我们将使用域随机化来改变一些可移动和不可移动物体的属性。包括对象和场景的资产在 Replicator 中表示为 USD。
Omniverse Replicator 中的每个对象都以美元表示。可以使用 Nvidia Omniverse 的 CAD Importer 扩展将具有不同扩展名(例如 obj、fbx 和 glif)的 3D 模型文件导入 Replicator。该扩展程序将 3D 文件转换为美元。我们通过指定资产路径将我们的资产(桌子、刀、勺子和叉子)导入到模拟器中。
闪电在数据生成中起着至关重要的作用。Nvidia 复制器中有不同的内置照明类型。我们选择两个矩形灯和一个圆顶灯,因为它们为我们提供了更好的照明选项和生成逼真图像的能力。矩形灯模拟面板产生的光,圆顶灯让您动态照亮整个场景。我们随机化了一些光参数,例如温度和强度,并且这两个参数都是从正态分布中采样的。此外,比例参数是从均匀分布中采样的,同时保持灯光的旋转和位置固定。
# Lightning setup for Rectangular light and Dome light
def rect_lights(num=2):
lights = rep.create.light(
light_type="rect",
temperature=rep.distribution.normal(6500, 500),
intensity=rep.distribution.normal(0, 5000),
position=(-131,150,-134),
rotation=(-90,0,0),
scale=rep.distribution.uniform(50, 100),
count=num
)
return lights.node
def dome_lights(num=1):
lights = rep.create.light(
light_type="dome",
temperature=rep.distribution.normal(6500, 500),
intensity=rep.distribution.normal(0, 1000),
position=(0,0,0),
rotation=(270,0,0),
count=num
)
return lights.node
我们固定位置和旋转,选择桌面材料,选择额外的桃花心木材料,并在数据生成过程中交替使用材料。
# Import and position the table object
def table():
table = rep.create.from_usd(TABLE_USD, semantics=[('class', 'table')])
with table:
rep.modify.pose(
position=(-135.39745, 0, -140.25696),
rotation=(0,-90,-90),
)
return table
为了进一步提高我们数据集的质量,我们选择了两个不同分辨率的摄像机,我们将它们战略性地放置在场景中的不同位置。此外,我们在不同版本的数据生成过程中改变了摄像机的位置。
# Multiple setup cameras and attach it to render products
camera1 = rep.create.camera(focus_distance,focal_length,position,rotation...)
camera2 = rep.create.camera(focus_distance,focal_length2,position,rotation...)
# Will render 1024x1024 images and 512x512 images
render_product = rep.create.render_product(camera1, (1024, 1024))
render_product2 = rep.create.render_product(camera2, (512, 512))
最后,对于可移动的物体,包括刀、勺子和叉子,我们确保这些物体只能在桌子的边界内平移。所以我们选择了一个边界位置,在这个位置上,对象会随着桌子平移和旋转。我们从均匀分布中采样位置和旋转,同时将每次迭代生成的可移动对象的数量保持为五个。
# Define randomizer function for CULTERY assets.
def cutlery_props(size=5):
instances = rep.randomizer.instantiate(rep.utils.get_usd_files(knife), size=size, mode='point_instance')
with instances:
rep.modify.pose(
position=rep.distribution.uniform((-212, 76.2, -187), (-62.)),
rotation=rep.distribution.uniform((-90,-180, 0), (-90, 180, 0)),
)
return instances.node
此时此刻,我们已经实例化了场景中的所有对象。我们现在可以运行随机化器在每个合成生成周期生成 50 张图像。
# Register randomization
with rep.trigger.on_frame(num_frames=50):
rep.randomizer.table()
rep.randomizer.rect_lights(1)
rep.randomizer.dome_lights(1)
rep.randomizer.cutlery_props(5)
# Run the simulation graph
rep.orchestrator.run()
为确保生成逼真的图像,我们切换到 RTX 交互(路径追踪)模式,该模式提供高保真渲染。
数据分发和模型构建
遵循以数据为中心的理念,我们生成了三个版本的数据集。第一个版本V1由垂直于相机位置的生成图像组成,而V2表示在桃花心木桌面上与相机位置成 60 度角生成的图像。V3包含垂直于相机位置的图像,同时餐具悬挂在空间中。
Edge Impulse:数据标注与模型构建
我们将生成的图像上传到 Edge Impulse Studio,我们在其中将数据集注释为不同的类。我们仔细注释了每个数据集版本,并使用Yolov5对象检测模型进行了训练。在确定为320之前,我们尝试了 320、512 和 1024 像素的几种输入尺寸。Edge Impulse 为模型提供了一个出色的版本控制系统,使我们能够跟踪不同数据集版本和超参数的模型性能。
用真实物体测试物体检测模型
我们使用 Edge Impulse CLI 工具通过在本地下载、构建和运行模型来评估模型的准确性。相机的位置在实验过程中保持固定。下面的片段显示经过训练的模型不能很好地泛化到真实世界的对象。因此,我们需要通过使用 V2 数据集上传、注释和训练模型来改进模型。
当使用 V2 数据集训练时,我们观察到模型性能有所提高。该模型可以清楚地识别各种物体,尽管当我们改变物体的方向时模型失败了。因此,我们使用剩余的 V3 数据集训练模型以缓解这些问题并增加其他超参数,例如从 500 到 2000 的纪元。我们还测试了我们的对象检测器在具有不同背景纹理的真实对象上的性能,模型表现良好在这些条件下。
在对各种超参数进行多次迭代之后,我们得到了一个可以很好地概括不同方向的模型。
解决 ML 问题的以数据为中心的方法背后的核心思想是围绕模型的故障点创建更多数据。我们通过迭代改进数据生成来改进模型,特别是在模型之前失败的区域。
结论
在这项工作中,我们了解了域随机化方法如何帮助为对象检测任务生成高质量和泛化良好的数据集。我们还展示了以数据为中心的机器学习工作流程在提高模型性能方面的有效性。虽然这项工作仅限于视觉问题,但我们可以将域随机化扩展到其他传感器,如激光雷达、加速度计和超声波传感器。
参考
- TinyML:使用ChatGPT和合成数据检测婴儿哭声
- 用于对象检测的合成数据生成
- Oracle数据库备份文件有效性检测设计方案
- 【LTE实战】LTE小区TAC配置不合理导致CSFB失败处理案例
- LTE小区TAC配置不合理回落失败案例
- LTE小区TAC配置不合理回落失败案例简介
- NR频点重选优先级设置不合理导致概率性NR注册拒绝资料下载
- LTE小区TAC配置不合理回落失败案例 2次下载
- PLC冗余系统的可行性和有效性分析 10次下载
- 如何检查Oracle数据库备份文件是否有效?备份文件有效性检测系统设计资料概述 5次下载
- 新的模糊聚类有效性指标 0次下载
- 高阶微扰法的有效性研究 0次下载
- 变电所继电保护的几处不合理设计
- 基于有效性评价机制的小波包特征提取技术
- 压缩机故障率的有效性估计和维修周期的确定
- 自然语言常用的自回归解码方法 527次阅读
- 过载跳闸的原因及解决方法 9148次阅读
- FPC弯曲半径不合理为什么会导致断裂呢? 592次阅读
- 认知扭曲类别 612次阅读
- 精度、收敛性和网格质量 2368次阅读
- 符合ASIL要求的磁传感器集成电路解析 1469次阅读
- PCB助焊设计的不合理会对PCBA制造工艺造成什么影响 984次阅读
- 反馈抑制器产生的原因 3062次阅读
- 如何使用ZK-SNARK来验证区块的有效性 1287次阅读
- 电阻消振和负反馈电阻电路图 5839次阅读
- 基于电压监控ADC系统的电源域隔离方案 5662次阅读
- 如何合理而有效的进行控制系统冗余设计? 1.1w次阅读
- 为什么要进行数据清洗呢? 2.6w次阅读
- 在开关电源模块中抑制电磁干扰有哪些对策? 1785次阅读
- 选购电源看什么?选购不合理可能出现的后果‘解析’ 1231次阅读
下载排行
本周
- 1PC1013三合一快充数据线充电芯片介绍
- 1.03 MB | 7次下载 | 免费
- 2PCB板EMC/EMI的设计技巧
- 0.20 MB | 3次下载 | 免费
- 32024PMIC市场洞察
- 2.23 MB | 2次下载 | 免费
- 4MCF8315EVM评估模块
- 2.09MB | 1次下载 | 免费
- 5ADI高性能电源管理解决方案
- 2.43 MB | 1次下载 | 免费
- 6UC3842工作原理及开关电源电路
- 0.08 MB | 1次下载 | 免费
- 7JFG-AS02微量程扭矩传感器数据表
- 0.32 MB | 1次下载 | 免费
- 8JFG-3D02三维力传感器数据表
- 0.58 MB | 1次下载 | 免费
本月
- 1XL4015+LM358恒压恒流电路图
- 0.38 MB | 147次下载 | 1 积分
- 2新概念模拟电路第四册信号处理电路电子书免费下载
- 10.69 MB | 65次下载 | 免费
- 3PCB布线和布局电路设计规则
- 0.40 MB | 29次下载 | 免费
- 4智能门锁原理图
- 0.39 MB | 12次下载 | 免费
- 5GB/T4706.1-2024 家用和类似用途电器的安全第1部分:通用要求
- 7.43 MB | 11次下载 | 1 积分
- 6JESD79-5C_v1.30-2024 内存技术规范
- 2.71 MB | 10次下载 | 免费
- 7elmo直线电机驱动调试细则
- 4.76 MB | 9次下载 | 6 积分
- 8PC1013三合一快充数据线充电芯片介绍
- 1.03 MB | 7次下载 | 免费
总榜
- 1matlab软件下载入口
- 未知 | 935115次下载 | 10 积分
- 2开源硬件-PMP21529.1-4 开关降压/升压双向直流/直流转换器 PCB layout 设计
- 1.48MB | 420061次下载 | 10 积分
- 3Altium DXP2002下载入口
- 未知 | 233084次下载 | 10 积分
- 4电路仿真软件multisim 10.0免费下载
- 340992 | 191367次下载 | 10 积分
- 5十天学会AVR单片机与C语言视频教程 下载
- 158M | 183330次下载 | 10 积分
- 6labview8.5下载
- 未知 | 81581次下载 | 10 积分
- 7Keil工具MDK-Arm免费下载
- 0.02 MB | 73806次下载 | 10 积分
- 8LabVIEW 8.6下载
- 未知 | 65985次下载 | 10 积分
评论
查看更多