0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

合成和模拟数据将在数据产业迎来浪潮

如意 来源:百家号 作者:SENSORO升哲 2020-07-03 11:50 次阅读

2018年,在微软(Microsoft Build)一架无人机飞过管道,检查管道是否有泄漏或其他损坏。值得注意的是,无人机的视觉检查模型使用实际数据和模拟数据进行了训练。使用合成数据帮助机器学习模型了解异常值,让微软的研究人员能够更快地训练这款模型,且不需要像其他情况下那样在进行数据采集飞行上花费很多。

如今,这项技术终于开始普及了。今年4月,一家初创公司为其合成传感器数据筹集到337万美元,而另一家初创公司发表了一篇关于如何使用模拟数据训练模型来识别机场跑道上的飞机的论文。

谈到机器学习项目时,壳牌首席数据科学家丹·杰文斯对使用模拟数据感到非常兴奋,因为它有助于构建模型的同时还可以检测一些少见的问题。他说:“我认为这是一种非常有趣的方法,可以获取我们正在努力解决的有关边缘案例的信息。尽管我们有很多数据,但同时我们也面临重大问题是,那就是,我们通常对于要发现的问题,我们只有很少的例子来支持。

在石油行业,工厂和管道的腐蚀是巨大的挑战,因为它可能导致灾难性的故障。企业会小心翼翼不让任何东西腐蚀管道,但这也意味着机器学习模型不能用于现实世界的腐蚀实例。因此,他们使用合成数据来提供帮助。例如,壳牌公司也在使用合成数据,试图解决人们在加油站吸烟的问题。因为摄像机并不总能捕捉到吸烟者的画面,有时候离得太远或者没有面对摄像头,所以在这个研究中并没有很多现成的案例;因此,公司努力将模拟合成数据与真实数据结合起来,建立计算机视觉模型。“我们感兴趣的几乎总是‘边缘案例’,不是一般的标准,而且容易检测到与标准图案不符的边缘,很难检测出想要的具体内容。”

与此同时,另外一家AI公司也在试图了解更多关于合成数据的准确性。该公司发表的论文《稀有飞机:合成数据起飞》阐述了研究人员如何将停放在机场的飞机的卫星图像与机器生成的合成数据相结合。当仅使用合成数据时,该模型的准确率只有55%左右,而当仅使用真实数据时准确率则跃升至73%。但是通过将训练样本的10%作为真实数据,其余部分使用合成数据,模型的准确率达到了69%。

人工智能专家认为合成数据将成为大生意。使用这些数据的公司需要考虑到他们的假数据可能会扭曲模型,但如果他们能做到这一点,他们就能以比依赖真实数据更快、更低的成本获得强健的模型。

因此,即使物联网传感器正在释放数拍字节级别的数据,也不可能对所有数据进行注释并将其用于训练模型。因为这些数据可能并不是你真正想要计算机寻找的情况。换言之,预计合成和模拟数据的浪潮将继续到来。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 人工智能
    +关注

    关注

    1789

    文章

    46576

    浏览量

    236896
  • 合成
    +关注

    关注

    0

    文章

    16

    浏览量

    13774
  • 大模拟数据
    +关注

    关注

    0

    文章

    2

    浏览量

    5323
收藏 人收藏

    评论

    相关推荐

    数据分析在数字化中的作用

    与重要性 数据分析是指使用统计和逻辑方法对数据进行处理和解释的过程。它涉及到数据的收集、清洗、转换、建模和解释,目的是发现数据中的模式、趋势和关联,从而为决策提供支持。
    的头像 发表于 10-27 17:35 408次阅读

    FPGA在数据处理中的应用实例

    FPGA(现场可编程门阵列)在数据处理领域有着广泛的应用,其高度的灵活性和并行处理能力使其成为许多高性能数据处理系统的核心组件。以下是一些FPGA在数据处理中的应用实例: 一、通信协议处理 FPGA
    的头像 发表于 10-25 09:21 115次阅读

    半导体存储器在数据中心中的应用

    半导体存储器在数据中心中的应用是极其重要且广泛的,它们不仅是数据中心存储系统的核心组件,还直接关系到数据处理的效率、可靠性和安全性。以下将详细阐述半导体存储器在数据中心中的具体应用,包
    的头像 发表于 08-20 10:17 471次阅读

    机器学习在数据分析中的应用

    随着大数据时代的到来,数据量的爆炸性增长对数据分析提出了更高的要求。机器学习作为一种强大的工具,通过训练模型从数据中学习规律,为企业和组织提供了更高效、更准确的
    的头像 发表于 07-02 11:22 503次阅读

    态势数据如何存储在数据库里面呢

    智慧华盛恒辉态势数据存储在数据库中需要遵循一系列原则和步骤,以确保数据的完整性、一致性、安全性以及可扩展性。以下是关于态势数据如何存储在数据
    的头像 发表于 04-22 16:46 323次阅读

    赛昉科技与超聚变达成战略合作,RISC-V在数据中心迎来历史性跨越

    3月22日,广东赛昉科技有限公司(赛昉科技)与超聚变数字技术有限公司(超聚变)战略合作签约仪式隆重举办。双方就数据中心场景下的RISC-V产业及芯片业务达成战略合作,双方将在香港设立超聚变&
    的头像 发表于 03-23 08:18 858次阅读
    赛昉科技与超聚变达成战略合作,RISC-V<b class='flag-5'>在数据</b>中心<b class='flag-5'>迎来</b>历史性跨越

    数据赋能:构建数据治理与AI的协同闭环

    在数字化浪潮中,数据已成为企业的新型燃料,而AI则是提炼这种燃料的精炼厂。数据治理与AI的协同作用,正在引领企业迈向更智能、更高效的未来。本文将展示企业如何通过将
    的头像 发表于 03-15 10:47 432次阅读

    集中电源控制器在数据中心的应用

    集中电源控制器在数据中心的应用非常广泛。数据中心通常需要大量的电源来支持服务器、网络设备和存储设备等关键基础设施的运行。集中电源控制器可以提供稳定、可靠的电源供应,确保数据中心的正常运行。
    的头像 发表于 01-30 15:24 428次阅读
    集中电源控制器<b class='flag-5'>在数据</b>中心的应用

    构建高效数据生态:数据库、数据仓库、数据湖、大数据平台与数据中台解析_光点科技

    在数字化的浪潮中,一套高效的数据管理系统是企业竞争力的核心。从传统的数据库到现代的数据中台,每一种技术都
    的头像 发表于 01-17 10:20 330次阅读

    ADUC360 I2Cmaster.c中master handler与实际传送的数据什么关系?需要传送的数据是要放在数组里吗?

    ADUC360 I2Cmaster.c中 master handler 与实际传送的数据什么关系,需要传送的数据是要放在数组里吗?
    发表于 01-15 08:26

    光纤KVM在数据中心的应用与优势

    光纤KVM(键盘、视频、鼠标)在数据中心的应用与优势主要体现在以下几个方面: 来百度APP畅享高清图片 集中管理 :在数据中心,通常需要对大量的服务器进行管理。光纤KVM技术允许管理员在中央控台上
    的头像 发表于 01-11 15:38 333次阅读
    光纤KVM<b class='flag-5'>在数据</b>中心的应用与优势

    磁环在数据线上的应用及选择

    磁环在数据线上的应用及选择 随着科技的进步和发展,数据线已成为人们日常生活和工作中不可或缺的一部分。数据线起着连接设备和传输数据的重要作用。而在数据
    的头像 发表于 01-11 15:24 995次阅读

    液冷数据中心生态建设启动:浪潮信息力推绿色算力产业发展

    "液冷数据中心生态建设",浪潮信息服务器产品线总经理赵帅受邀出席。此次生态建设启动旨在进一步完善液冷数据中心的生态,未来将联合多家产业上下游单位,打通产、学、研、用多层级,通过技术创新
    的头像 发表于 01-07 10:53 610次阅读

    参数在数据转换器中的应用

    电子发烧友网站提供《参数在数据转换器中的应用.pdf》资料免费下载
    发表于 11-27 11:46 0次下载
    参数<b class='flag-5'>在数据</b>转换器中的应用

    智慧经济时代,浪潮信息存储为智慧世界构筑数据基石

    11月12日,第八届中国数据分析行业峰会在京举办,浪潮信息亮相峰会并发表《数据要素驱动智慧时代》主题演讲。在数据的采传用管存销六个环节中,数据
    的头像 发表于 11-17 16:55 347次阅读
    智慧经济时代,<b class='flag-5'>浪潮</b>信息存储为智慧世界构筑<b class='flag-5'>数据</b>基石