0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

合成和模拟数据将在数据产业迎来浪潮

如意 来源:百家号 作者:SENSORO升哲 2020-07-03 11:50 次阅读

2018年,在微软(Microsoft Build)一架无人机飞过管道,检查管道是否有泄漏或其他损坏。值得注意的是,无人机的视觉检查模型使用实际数据和模拟数据进行了训练。使用合成数据帮助机器学习模型了解异常值,让微软的研究人员能够更快地训练这款模型,且不需要像其他情况下那样在进行数据采集飞行上花费很多。

如今,这项技术终于开始普及了。今年4月,一家初创公司为其合成传感器数据筹集到337万美元,而另一家初创公司发表了一篇关于如何使用模拟数据训练模型来识别机场跑道上的飞机的论文。

谈到机器学习项目时,壳牌首席数据科学家丹·杰文斯对使用模拟数据感到非常兴奋,因为它有助于构建模型的同时还可以检测一些少见的问题。他说:“我认为这是一种非常有趣的方法,可以获取我们正在努力解决的有关边缘案例的信息。尽管我们有很多数据,但同时我们也面临重大问题是,那就是,我们通常对于要发现的问题,我们只有很少的例子来支持。

在石油行业,工厂和管道的腐蚀是巨大的挑战,因为它可能导致灾难性的故障。企业会小心翼翼不让任何东西腐蚀管道,但这也意味着机器学习模型不能用于现实世界的腐蚀实例。因此,他们使用合成数据来提供帮助。例如,壳牌公司也在使用合成数据,试图解决人们在加油站吸烟的问题。因为摄像机并不总能捕捉到吸烟者的画面,有时候离得太远或者没有面对摄像头,所以在这个研究中并没有很多现成的案例;因此,公司努力将模拟合成数据与真实数据结合起来,建立计算机视觉模型。“我们感兴趣的几乎总是‘边缘案例’,不是一般的标准,而且容易检测到与标准图案不符的边缘,很难检测出想要的具体内容。”

与此同时,另外一家AI公司也在试图了解更多关于合成数据的准确性。该公司发表的论文《稀有飞机:合成数据起飞》阐述了研究人员如何将停放在机场的飞机的卫星图像与机器生成的合成数据相结合。当仅使用合成数据时,该模型的准确率只有55%左右,而当仅使用真实数据时准确率则跃升至73%。但是通过将训练样本的10%作为真实数据,其余部分使用合成数据,模型的准确率达到了69%。

人工智能专家认为合成数据将成为大生意。使用这些数据的公司需要考虑到他们的假数据可能会扭曲模型,但如果他们能做到这一点,他们就能以比依赖真实数据更快、更低的成本获得强健的模型。

因此,即使物联网传感器正在释放数拍字节级别的数据,也不可能对所有数据进行注释并将其用于训练模型。因为这些数据可能并不是你真正想要计算机寻找的情况。换言之,预计合成和模拟数据的浪潮将继续到来。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1800

    文章

    48083

    浏览量

    242164
  • 合成
    +关注

    关注

    0

    文章

    16

    浏览量

    13814
  • 大模拟数据
    +关注

    关注

    0

    文章

    2

    浏览量

    5355
收藏 人收藏

    评论

    相关推荐

    AI赋能边缘网关:开启智能时代的新蓝海

    在数字化转型的浪潮中,AI与边缘计算的结合正掀起一场深刻的产业变革。边缘网关作为连接物理世界与数字世界的桥梁,在AI技术的加持下,正从简单的数据采集传输节点,进化为具备智能决策能力的边
    发表于 02-15 11:41

    光通信在数据中心的应用

    在数字化时代,数据中心作为信息处理和存储的核心,承担着海量数据的传输和处理任务。随着云计算、大数据、人工智能等技术的发展,数据中心的规模和复
    的头像 发表于 01-23 09:33 280次阅读

    Mathematica 在数据分析中的应用

    在数据分析领域发挥着重要作用。 1. 数据导入 在进行数据分析之前,首先需要将数据导入到Mathematica中。Mathematica支持多种
    的头像 发表于 12-26 15:41 295次阅读

    cmp在数据处理中的应用 如何优化cmp性能

    CMP在数据处理中的应用 CMP(并行处理)技术在数据处理领域扮演着越来越重要的角色。随着数据量的爆炸性增长,传统的串行处理方法已经无法满足现代应用对速度和效率的需求。CMP通过将数据
    的头像 发表于 12-17 09:27 538次阅读

    ADS1299+RK3399在数据采样的过程中,有数据丢失的情况怎么解决?

    我们在数据采样的过程中,发现有数据丢失的情况,通过逻辑分析仪发现,出现数据丢失时,时序存在问题。具体见下图: 从图中可以看出,DRDY出现了异常,CS也是异常。有谁遇到过这种情况? android系统 SPI 通讯方式。 有
    发表于 12-16 06:58

    是什么原因导致ADS1262在数据吞吐率提高时会增加它的噪声?

    请问像ADS1262这种32bit,或者24bit的sigma-delta过采样adc,是什么原因导致的在数据吞吐率提高时会增加它的噪声? 1、比如ADS1262我想在输出数据速率4.8Khz
    发表于 11-26 07:27

    宝马集团将OpenUSD用于合成数据生成

    通⽤场景描述,又称为OpenUSD,是⼀个开放且可扩展的⽣态系统,⽤于在 3D 世界中描述、合成模拟和协作。
    的头像 发表于 11-20 10:22 365次阅读

    数据分析在数字化中的作用

    与重要性 数据分析是指使用统计和逻辑方法对数据进行处理和解释的过程。它涉及到数据的收集、清洗、转换、建模和解释,目的是发现数据中的模式、趋势和关联,从而为决策提供支持。
    的头像 发表于 10-27 17:35 790次阅读

    FPGA在数据处理中的应用实例

    FPGA(现场可编程门阵列)在数据处理领域有着广泛的应用,其高度的灵活性和并行处理能力使其成为许多高性能数据处理系统的核心组件。以下是一些FPGA在数据处理中的应用实例: 一、通信协议处理 FPGA
    的头像 发表于 10-25 09:21 786次阅读

    半导体存储器在数据中心中的应用

    半导体存储器在数据中心中的应用是极其重要且广泛的,它们不仅是数据中心存储系统的核心组件,还直接关系到数据处理的效率、可靠性和安全性。以下将详细阐述半导体存储器在数据中心中的具体应用,包
    的头像 发表于 08-20 10:17 953次阅读

    机器学习在数据分析中的应用

    随着大数据时代的到来,数据量的爆炸性增长对数据分析提出了更高的要求。机器学习作为一种强大的工具,通过训练模型从数据中学习规律,为企业和组织提供了更高效、更准确的
    的头像 发表于 07-02 11:22 932次阅读

    中软国际数据服务,筑牢企业坚实数据底座

    当前,以云计算、AI 技术为核心的技术应用正在重塑千行万业。其中大数据作为关键要素,在数浪潮中越发起到关键作用。
    的头像 发表于 05-09 09:34 935次阅读
    中软国际<b class='flag-5'>数据</b>服务,筑牢企业坚实<b class='flag-5'>数据</b>底座

    态势数据如何存储在数据库里面呢

    智慧华盛恒辉态势数据存储在数据库中需要遵循一系列原则和步骤,以确保数据的完整性、一致性、安全性以及可扩展性。以下是关于态势数据如何存储在数据
    的头像 发表于 04-22 16:46 438次阅读

    赛昉科技与超聚变达成战略合作,RISC-V在数据中心迎来历史性跨越

    3月22日,广东赛昉科技有限公司(赛昉科技)与超聚变数字技术有限公司(超聚变)战略合作签约仪式隆重举办。双方就数据中心场景下的RISC-V产业及芯片业务达成战略合作,双方将在香港设立超聚变&
    的头像 发表于 03-23 08:18 1028次阅读
    赛昉科技与超聚变达成战略合作,RISC-V<b class='flag-5'>在数据</b>中心<b class='flag-5'>迎来</b>历史性跨越

    数据赋能:构建数据治理与AI的协同闭环

    在数字化浪潮中,数据已成为企业的新型燃料,而AI则是提炼这种燃料的精炼厂。数据治理与AI的协同作用,正在引领企业迈向更智能、更高效的未来。本文将展示企业如何通过将
    的头像 发表于 03-15 10:47 604次阅读