0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

数据分析的80%的时间都用在了哪里?

博世汽车电子事业部 来源:博世汽车电子事业部 2020-08-10 15:49 次阅读

不可否认,大数据已经在 21 世纪掀起一场惊涛骇浪。很多人怀揣着成为数据科学家的梦想进入数据科学世界,上期我们提到了数据分析。其实,数据分析是一个数据消费的过程,在数据消费之前的数据准备工作,叫做数据工程。

数据是由许多数据源产生的,像生产执行系统MES,各种辅助生产的应用系统,产线的设备。这些数据源产生的数据我们把它叫做原始数据。

为了让业务决策者使用这些数据,需要对其进行采集,清理,转换,存储,组合,聚合,处理过后的数据才是有价值的数据。

设计和实现这些数据处理的过程叫做数据工程。

数据的采集,清洗,转换处理,是整个数据工程的关键,通常我们可以用ETL(Extract-Transform-Load)技术来实现。

随着工厂的发展,各生产线,各部门都会搭建自己的应用系统方便开展自己的业务,随着数字化建设的不断深入,由于业务系统之间各自为政,相互独立造成的数据孤岛现象尤为普遍,业务不集成,数据不共享,给工厂进行数据的报表开发,数据分析,数据挖掘带来了巨大困难。

通过ETL可以连接数据孤岛,将分离的业务数据整合在一起,统一的采集,处理,共享。

数据仓库是工厂的数据中心,所有系统产生的原始数据都流向数据仓库,数据的存储,标准化,组合都在数据仓库中完成,最终把有价值的数据提供给各大数据应用系统。

可以说数据仓库不产生数据,也不消费数据,只是数据的搬运工。

总的来说,如果把数据消费过程比作一盘美味的酸辣土豆丝,那数据工程就是个做菜的过程,土豆、葱姜蒜、干红辣椒、盐、糖、醋这些原材料就是原始数据;去菜场买菜就好比数据采集;数据清理就是洗土豆,削皮;数据转换就好比土豆切成丝,姜葱蒜切末,辣椒切断。然后准备工作做好以后就开始炒菜,放入葱姜蒜末,辣椒段和土豆丝,炒菜过程中会加入适量的醋,盐,糖调味,这就好比在对数据做组合,聚合处理。而这一切都是发生在数据仓库这个大厨房。最后呈现就是一盘美味的酸辣土豆丝啦!

据统计,一个数据分析的项目接近80%的时间会花在准备数据上,这就是数据工程的意义所在。

工业大数据时代,在制造业产品的全生命周期从市场规划、设计、制造、销售、维护等过程都会产生大量的结构化和非结构化数据。

智能工厂利用物联网人工智能云计算、大数据技术提高服务和生产,其本质是实现了人、机器、设备、IT系统的通过数据互联互通。

产生的数据越来越多,数据采集和集成的需求也越来越多,负责数据采集和集成的数据工程在向智能工厂迈进的数字化转型中扮演着举足轻重的角色。

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • MES
    MES
    +关注

    关注

    5

    文章

    916

    浏览量

    29818
  • 数据处理
    +关注

    关注

    0

    文章

    603

    浏览量

    28591
  • 数据分析
    +关注

    关注

    2

    文章

    1451

    浏览量

    34075

原文标题:AE-CN专家月 | 数据分析80%的时间都用在了哪里?

文章出处:【微信号:AE_China_10,微信公众号:博世汽车电子事业部】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    Mathematica 在数据分析中的应用

    数据分析是现代科学研究和商业决策中不可或缺的一部分。随着数据量的爆炸性增长,对数据分析工具的需求也在不断增加。Mathematica,作为一种强大的计算软件,以其独特的符号计算能力和广泛的内置函数库
    的头像 发表于 12-26 15:41 106次阅读

    数据可视化与数据分析的关系

    在当今这个信息爆炸的时代,数据无处不在。无论是企业运营、科学研究还是个人决策,我们都需要从海量的数据中提取有价值的信息。数据分析数据可视化作为两个关键的工具,它们帮助我们理解、解释和
    的头像 发表于 12-06 17:09 357次阅读

    NVIDIA助力百度提升数据分析效能

    数据分析师、运营团队以及销售人员等。过去他们不得不编写繁杂的查询语句,由此耗费掉大量的时间与精力。百度广告业务的重要性和复杂性,致使相关的业务数据每月会有超过 200 个迭代更新,用户唯有掌握丰富的业务领域知识方可成功实施
    的头像 发表于 11-20 10:06 214次阅读

    eda与传统数据分析的区别

    EDA(Exploratory Data Analysis,探索性数据分析)与传统数据分析之间存在显著的差异。以下是两者的主要区别: 一、分析目的和方法论 EDA 目的 :EDA的主要目的是对
    的头像 发表于 11-13 10:52 350次阅读

    raid 在大数据分析中的应用

    RAID(Redundant Array of Independent Disks,独立磁盘冗余阵列)在大数据分析中的应用主要体现在提高存储系统的性能、可靠性和容量上。以下是RAID在大数据分析
    的头像 发表于 11-12 09:44 261次阅读

    SUMIF函数在数据分析中的应用

    在商业和科学研究中,数据分析是一项基本且关键的技能。Excel作为最常用的数据分析工具之一,提供多种函数来帮助用户处理和分析数据。SUMI
    的头像 发表于 11-11 09:14 331次阅读

    云计算在大数据分析中的应用

    云计算在大数据分析中的应用广泛且深入,它为用户提供存储、计算、分析和预测的强大能力。以下是对云计算在大数据分析中应用的介绍: 一、存储和处理海量
    的头像 发表于 10-24 09:18 499次阅读

    IP 地址大数据分析如何进行网络优化?

    一、大数据分析在网络优化中的作用 1.流量分析数据分析可以对网络中的流量进行实时监测和分析,了解网络的使用情况和流量趋势。通过对流量数据
    的头像 发表于 10-09 15:32 247次阅读
    IP 地址大<b class='flag-5'>数据分析</b>如何进行网络优化?

    SLM片内监控IP数据分析显著减少测试成本

    SLM片内监控IP数据分析为高价值应用提供更为自动化的数据分析手法。
    的头像 发表于 07-16 15:05 398次阅读
    SLM片内监控IP<b class='flag-5'>数据分析</b>显著减少测试成本

    数据分析除了spss还有什么

    数据分析是当今世界中一个非常重要的领域,它涉及到从大量数据中提取有用信息、发现模式和趋势,并为决策提供支持。SPSS(Statistical Package for the Social
    的头像 发表于 07-05 15:01 647次阅读

    数据分析的工具有哪些

    开发的一款电子表格软件,广泛应用于数据分析领域。它具有以下特点: 数据整理:Excel提供丰富的数据整理功能,如排序、筛选、查找和替换等。 数据
    的头像 发表于 07-05 14:54 886次阅读

    数据分析有哪些分析方法

    数据分析是一种重要的技能,它可以帮助我们从大量的数据中提取有价值的信息,从而做出更明智的决策。在这篇文章中,我们将介绍数据分析的各种方法,包括描述性分析、诊断性
    的头像 发表于 07-05 14:51 616次阅读

    机器学习在数据分析中的应用

    随着大数据时代的到来,数据量的爆炸性增长对数据分析提出了更高的要求。机器学习作为一种强大的工具,通过训练模型从数据中学习规律,为企业和组织提供
    的头像 发表于 07-02 11:22 650次阅读

    求助,关于AD采集到的数据分析问题

    问题描述:使用AD采集一个10Hz到2MHz的脉冲,脉冲底部可能大于零,由采集到的数据分析出该脉冲的上升时间,幅值和占空比。 备注:在分析的时候已经知道脉冲的频率,精度为2X10^-5. 在
    发表于 05-09 07:40

    态势数据分析系统软件

    处理、分析和挖掘态势数据的工具。它结合数据集成、地图制作、数据分析与挖掘以及可视化展示等多种功能 这类软件能够集成多种来源的地理
    的头像 发表于 04-22 11:36 457次阅读