0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

工业大数据的范畴,为什么大数据上云要轻量化?

工业互联网前线 来源:未知 作者:李倩 2018-08-06 17:07 次阅读

一、工业大数据的范畴

工业大数据包括制造企业信息化数据、工业物联网数据,以及外部跨界数据。信息化数据包括了ERP中的客户订单、生产计划等信息,工业物联网数据主要是从生产设备上采集到的各种产质耗数据和智能产品上获得的运维数据,而外部跨界数据包括环境数据、市场数据和竞品数据等,而其中从机器设备上得到的数据比重将越来越大。

工业大数据的特征除了大数据的4V(数据量大、类型多、价值密度低、速度快)以外,还有专业性、关联性、和时序性特征。工业大数据应该注意特征背后的物理意义以及特征之间关联性的机理逻辑,互联网上的大数据可以只针对数据本身进行挖掘和关联,而不考虑数据本身的意义,挖掘到什么结果就是什么结果。工业大数据的挖掘必须要有明确的挖掘目标,针对应用的功能在此基础上逐步扩展挖掘的方向。

二、为什么大数据上云要轻量化?

制造企业在构建大数据分析系统时,除了采用传统的自建数据中心架构以外,还可以采用数据存储和分析构建在公有云平台,采用离线训练模型,结合边缘计算在生产现场利用实时数据和已经训练好的模型进行业务应用的两级架构。

两级架构的优点主要体现在以下四个方面:

1、降低存储成本:从设备传感器上采集的数据点往往是时序连续的过程量,随着采集频率的提高和周期延长,数据量是非常大的,如果考虑对海量的数据的存储、备份和还原全生命周期的管理,往往在公有云上成本更低。

2、提高弹性:在公有云上处理大数据,空间和时间灵活性约高,对数据存储和计算资源的要求会随着项目时间越来越长而要求越来越高,而公有云基本能做到想什么时候要就什么时候要,想要多少就要多少。

3、提高容灾性:传统的数据中心的容灾备份往往采用两地三中心的方式,为保证7*24的系统高可用性对系统的要求高,而公有云的IaaS和PaaS的容灾备份机制能实现低成本的低数据丢失率和更短恢复间隔。

4、数据共享更便利:企业应该把自身看成“大数据”价值链中的一部分,那么企业既是贡献者也是受益者,工业大数据的价值可以共享给企业上下游使用, 采用统一的公有云平台,促进数据资源的融会贯通,使得数据共享更方便。

大数据上云以后由于网络带宽的限制、对数据处理的时效性要求高、数据存储成本以及模型训练复杂程度多方面的原因,也要求在企业边缘层对原始数据进行一些轻量化处理,在不损失大数据价值性的基础上减少原始数据量。

三、轻量化的方法

轻量化是在不损失大数据价值性的基础上减少网络传输、存储和训练的数据量,并不是要剔除异常数据。在传统的仪表数据采集的时候都有一个过滤异常数据的操作,会设定一定的阈值去除仪表读数的异常跳变,而轻量化的方法不是采用这样的方法去除异常数据,因为异常的数据有可能对业务分析是有价值的。轻量化的方法是在业务分析人员以价值需求为导向去发现数据和提取数据,主要是通过采样中的特征选取和数据压缩两种方法。

特征选取是在可采集的样本特征集合中选择预测能力强的最佳子集,剔除重复,简化多个特征之间的相互关联。首先可以对多个特征做相关性分析,如果特征的相关性为1,表示两个特征的变化是完全相同的,通过找出两个特征的线性关系,能够通过一个特征还原另外一个特征,一个简单的例子如果产品的中文名称要求是唯一的,那么这个产品的中文名称和它的编码相关性就是1,不存在多个编码的产品取相同的名称,那么在做数据采集、传输、存储和训练的时候只需要保留产品编码,只需要在结果展示的时候通过对应表的方式找出产品名称。如果在训练样本的时候对特征维度有明确的要求,也可以采用PCA方法对特征进行降维,PCA把原先的n个特征用数目更少的m个特征取代,从旧特征到新特征的映射捕获数据中的固有变异性,尽量使新的m个特征互不相关。还有一些特征之间是有特殊规律可循,比如说某个机台生产的班次和班组的关系是完全按照四班三运转模式来排班,这个时候只需要确认班次就可以推导出执行班组信息,这样的规则如果是固定不变的话,可以在模型训练时候直接处理特征,而不需要另外做采集和储存。

采用压缩算法也是常用的轻量化手段,在带有时间戳的时序性连续变量采集中,随着采集频率的提高数据量也成级数上升,可以通过偏差检测处理和罗旋门压缩过滤,既能反映数据实际趋势,所需要采集、传输和保存的数据也显著减少。 下面的三张图简单展示了数据压缩的过程。

而自编码神经网络是结合了以上两种方式,采用自编码神经网络既可以对特征维度进行降维,也会通过编码方式对数据进行压缩。自编码神经网络是一种无监督学习算法,它使用了反向传播算法,并让目标值等于输入值,可以通过设定神经网络的隐藏层节点数量来达到数据压缩的目的。比如我们有100个输入特征,可以设定隐藏层节点数量为50,最终输出层还是还原100个输入特征。模型训练完成后,我们可以用模型的输入层到隐藏层作为压缩算法,把模型的隐藏层到输出层作为解压算法,这样在边缘层进行模型部署进行压缩,在公有云利用模型进行解压。自编码神经网络相对PCA来说可以更好的处理特征之间的非线性关系。

四、结语

在越来越多的制造业把大数据放在云端进行处理的时候,在网络、存储和计算能力有效的情况下,采用对数据进行压缩和对数据特征进行选取的方法进行数据轻量化处理,以满足数据业务分析需求和处理效率的高效。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 传感器
    +关注

    关注

    2548

    文章

    50643

    浏览量

    751752
  • 互联网
    +关注

    关注

    54

    文章

    11094

    浏览量

    102932
  • 工业大数据
    +关注

    关注

    0

    文章

    72

    浏览量

    7824

原文标题:企业实战专家:工业大数据如何轻量化上云

文章出处:【微信号:IndustryIOT,微信公众号:工业互联网前线】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    工业大数据

    工业大数据是未来工业在全球市场竞争中发挥优势的关键。无论是德国工业4.0、美国工业互联网还是《中国制造2025》,各国制造业创新战略的实施基础都是
    发表于 06-19 17:43

    基于阿里数加MaxCompute的企业大数据仓库架构建设思路

    摘要:数加大数据直播系列课程主要以基于阿里数加MaxCompute的企业大数据仓库架构建设思路为主题分享阿里巴巴的大数据是怎么演变以及怎样利用大数
    发表于 03-15 12:43

    工业大数据分析平台的应用价值探讨

    一条很有意思的娱乐新闻——警方在某歌手的演唱会上抓捕了好几个被网上追逃的人。这同样是大数据技术的应用······工业大数据分析平台是利用大数据技术开发搭建的为工业企业服务的一体化信息平
    发表于 11-12 15:56

    WitSight工业大数据云平台如何在技术和架构层面上运作?

    WitSight是什么?WitSight提供了哪些核心功能和优势?WitSight工业大数据云平台如何在技术和架构层面上运作?
    发表于 06-16 09:29

    如何成功实施工业大数据

    如何成功实施工业大数据
    发表于 09-30 08:45

    工业大数据技术综述

    工业大数据工业数据的总称,包括信息化数据、物联网数据以及跨界数据,是
    发表于 03-27 16:10 14次下载

    制造大数据大数据制造,工业大数据有什么特点?

    第三点是实时性。工业大数据是实时的监控和预警,工业大数据需要实时的达到分析和应用。另外行业性。消费的数据一般来讲是比较好理解的,工业数据
    的头像 发表于 05-17 15:37 1.8w次阅读

    工业大数据的概念

    工业大数据是指在工业领域中,围绕典型智能制造模式,从客户需求到销售、订单、计划、研发、设计、工艺、制造、采购、供应、库存、发货和交付、售后服务、运维、报废或回收再制造等整个产品全生命周期各个环节所
    的头像 发表于 03-05 15:18 4026次阅读

    工业大数据应用前景

    打破数据孤岛壁垒,实现人与机器、机器与机器的互联互通,为工业数据的自由汇聚奠定基础,另一方面进 一步增强了工业大数据的应用需求,使得工业大数据
    的头像 发表于 03-05 15:21 5976次阅读

    工业大数据和互联网大数据区别

    工业大数据与互联网大数据最大的区别在于工业大数据有非常强的目的性,而互联网大数据更多的是一种关联的挖掘,是更加发散的一种分析。除此之外,两者在数据
    的头像 发表于 03-28 14:08 1.1w次阅读

    工业大数据前景

    工业大数据正以一种革命风暴的姿态闯入人们视野,其技术和市场在快速发展,而驾驭工业大数据的呼声则一浪高过一浪。于是有人说中国大数据产业有炒作“过热”之嫌,也有人认为大数据投资正当时。随着
    的头像 发表于 03-28 14:08 3826次阅读

    工业大数据如何管理

    从需求侧看,随着智能制造、工业互联网等国家战略的逐一推进,个性化定制、网络化延伸以及智能化设计、生产、服务等新模式不断出现,对于工业大数据技术、产品、平台的需求不断增大,为工业大数据提供了充足的应用场景。
    的头像 发表于 04-21 16:55 2865次阅读

    工业大数据的技术与应用

    产生的各类数据及相关技术和应用的总称。工业大数据是智能制造的核心,以大数据+工业互联网为基础,用计算、
    的头像 发表于 11-23 14:37 5494次阅读

    工业大数据在制造企业的应用场景

    工业大数据是一个新的概念,从字面上理解,工业大数据是指在工业领域信息化应用中所产生的大数据
    的头像 发表于 01-17 12:05 4907次阅读

    智慧农业大数据

    智慧农业,作为未来农业的发展方向,其实现基于种植环境、生长管理、农机设备等数据。农业大数据核心在于技术,包括获取技术和处理数据技术。相比工业大数据技术,获取技术的多样性和复杂程度更高,
    的头像 发表于 07-10 16:18 975次阅读