0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

面向工程师和科学家的大数据

星星科技指导员 来源:嵌入式计算设计 作者:Dave Oswill 2022-10-06 07:52 次阅读

使用大数据正迅速成为科学发现和工程过程中的关键步骤。随着智能传感器物联网IoT) 等技术能够从科学仪器、制造系统、联网汽车和飞机中收集大量详细数据,这种情况正在发生。

这些数据具有重要价值,因为它可以显示重要的物理现象或提供有关系统运行环境、效率和健康状况的信息。借助适当的工具和技术,这些数据可用于进行快速的科学发现,并在您的产品、服务和制造过程中开发和整合更多智能。这可以使您的公司以性能更好的产品或服务脱颖而出,并有助于符合法规要求(例如满足发动机燃油效率标准或提供辅助驾驶能力)。

获得访问权和使用数据可能听起来很有趣,但也很艰巨。由于这些数据的价值和大小,它通常在大型文件共享、数据库或 Hadoop 或 Spark 等大数据系统中存储和管理。不久前,为了将机器学习等先进技术应用于大量数据,具有 IT 系统经验的计算机科学家将与工程和科学专家一起工作。该团队将共同支持一个工作流程,其中包括:

访问文件、数据库或 Hadoop 分布式文件系统 (HDFS) 中的大数据

在专门的计算集群上探索、处理和分析这些数据

创建用于嵌入式系统、业务应用程序和其他服务的算法

如今,MATLAB等软件分析和建模工具已通过处理大数据的新功能得到增强。这使具有领域知识和经验的工程师和科学家能够利用这些数据做出设计和业务决策。然后,工程师和科学家无论身在何处都可以方便地访问这些数据,并使用熟悉的语法和功能轻松使用它。

让我们看一个工程师如何使用大数据的实际示例。贝克休斯的工程师为石油和天然气运营商提供服务的供应商,需要开发一种预测性维护系统,以降低泵设备成本和石油和天然气开采卡车的停机时间。如果活动现场的卡车出现泵故障,贝克休斯必须立即更换卡车以确保连续运行。向每个站点发送备用卡车会使公司损失数千万美元的收入,如果它们在另一个站点积极使用,这些收入可能会在其他地方产生。无法准确预测阀门和泵何时需要维护是其他成本的基础。过于频繁的维护会浪费精力,并导致零件在仍然可用时被更换,而过于不频繁的维护可能会损坏泵而无法修复。

从石油和天然气开采卡车上收集了数 TB 的数据,这些数据用于开发一个应用程序,该应用程序可以预测设备何时需要维护或更换。MATLAB 为 Baker Hughes 的工程师提供了开发预测模型和将多种数据(包括来自专有文件格式的传感器数据)合并到一个分析应用程序中所需的功能。

访问大量数据

处理大数据的第一个挑战是确定如何访问大型数据集,因为它们有多种不同的形式并存储在各种类型的系统中。

文件

许多大型工程和科学数据集由大量中小型文件组成,尽管文件变得越来越大,并且无法放入单台计算机的内存中。这些文件通常位于共享驱动器上的一个或多个目录中,可能包含分隔文本、电子表格、图像、视频和各种专有格式。

数据库

有多种数据库类型可用于存储和管理大量数据:

关系型 (SQL):广泛用于业务应用程序,在 IT 开发人员中很受欢迎。

数据仓库:基于关系 (SQL) 数据库,存储关键业务数据,并为关键业务应用程序提供分析能力和快速访问。

NoSQL:针对不适合关系数据库的数据进行了优化。

数据历史学家:针对通常从工业设备收集的基于时间的生产和过程数据进行了优化。

物联网数据聚合器:通常包括基于云的服务,用于聚合来自连接的传感器和设备的时间序列数据。这些服务通常通过 Web 服务调用来访问。

Hadoop

Hadoop是一种基于分布式计算和存储原理的大数据集存储和处理系统。它由在计算服务器集群上共存的两个主要子系统组成:

HDFS:一种大型、抗故障的文件系统,称为 Hadoop 分布式文件系统。

YARN:管理在 Hadoop 上运行的应用程序,包括批处理框架,例如 MapReduce 和 Spark,以及 SQL 接口,例如 Hive 和 Impala。

为了有效地利用大数据的优势,工程师和科学家需要一个可扩展的工具,例如 MATLAB,以提供对用于存储和管理数据的各种系统和格式的访问。这在可能使用不止一种类型的系统和格式的情况下尤其重要。存储在共享驱动器文件中的传感器或图像数据可能需要与存储在数据库中的元数据相结合;就贝克休斯而言,许多不同格式的数据必须一起使用,以了解系统的行为并开发预测模型。

处理大数据的能力正迅速成为科学发现和工程的一个重要方面。这些数据集中包含宝贵的数据,提供了区分您的产品和服务的方法。作为科学家或工程师,您拥有使用这些数据做出设计和业务决策的领域知识和经验,但可能需要易于使用的软件分析和建模工具。使用 MATLAB 等工具可提供可扩展性和效率,同时为您的公司提供在全球市场上的竞争优势。

审核编辑:郭婷

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 传感器
    +关注

    关注

    2549

    文章

    50817

    浏览量

    752404
  • matlab
    +关注

    关注

    182

    文章

    2963

    浏览量

    230247
  • 大数据
    +关注

    关注

    64

    文章

    8866

    浏览量

    137332
收藏 人收藏

    评论

    相关推荐

    AI for Science:人工智能驱动科学创新》第4章-AI与生命科学读后感

    了传统学科界限,使得科学家们能够从更加全面和深入的角度理解生命的奥秘。同时,AI技术的引入也催生了一种全新的科学研究范式,即数据驱动的研究范式,这种范式强调从大量数据中提取有价值的信息
    发表于 10-14 09:21

    正是拼的年纪|65岁电子工程师上班VLOG #65岁退休 #电子工程师 #搞笑 #上班vlog

    电子工程师
    安泰小课堂
    发布于 :2024年07月25日 11:31:02

    新华社:突破性成果!祝贺我国科学家成功研发这一传感器!

    6月25日,新华社以《突破性成果!祝贺我国科学家》为标题,报道了由我国科学家研发的传感器成果。 我国科学家研发高通道神经探针实现猕猴全脑尺度神经活动监测 神经探针是一种用来记录神经活动的针状电传
    的头像 发表于 06-27 18:03 441次阅读
    新华社:突破性成果!祝贺我国<b class='flag-5'>科学家</b>成功研发这一传感器!

    前OpenAI首席科学家创办新的AI公司

    消息在业界引起了广泛关注,因为苏茨克维曾是OpenAI的联合创始人及首席科学家,并在去年在OpenAI董事会上扮演了重要角色。
    的头像 发表于 06-21 10:42 506次阅读

    嵌入式软件工程师和硬件工程师的区别?

    通常需要具备强大的问题解决能力,以及对新技术的学习和应用能力。他们的工作通常涉及到多个领域,如计算机科学、电子工程、机械工程等。 嵌入式硬件工程师 嵌入式硬件
    发表于 05-16 11:00

    本源量子参与的国家重点研发计划青年科学家项目启动会顺利召开

    2024年4月23日,国家重点研发计划“先进计算与新兴软件”重点专项“面向复杂物理系统求解的量子科学计算算法、软件、应用与验证”青年科学家项目启动会暨实施方案论证会在合肥顺利召开。该项目由合肥综合性国家
    的头像 发表于 05-11 08:22 600次阅读
    本源量子参与的国家重点研发计划青年<b class='flag-5'>科学家</b>项目启动会顺利召开

    大厂电子工程师常见面试题#电子工程师 #硬件工程师 #电路知识 #面试题

    电子工程师电路
    安泰小课堂
    发布于 :2024年04月30日 17:33:15

    谷歌DeepMind科学家欲建AI初创公司

    据知情人士透露,谷歌人工智能部门DeepMind的两名杰出科学家Laurent Sifre和Karl Tuyls正在与投资者商讨在巴黎成立一家新的人工智能初创公司的事宜。
    的头像 发表于 01-22 14:41 472次阅读

    飞腾首席科学家窦强荣获 “国家卓越工程师” 称号

         飞腾首席科学家窦强荣获 “国家卓越工程师” 称号 1月19日上午,首届 “国家工程师奖” 表彰大会在北京人民大会堂隆重举行。81 名个人被授予 “国家卓越工程师” 称号,50
    的头像 发表于 01-19 19:22 1668次阅读
    飞腾首席<b class='flag-5'>科学家</b>窦强荣获 “国家卓越<b class='flag-5'>工程师</b>” 称号

    释放积极信号!“国家工程师奖”首次开评

    近期,国家卓越工程师及卓越工程师团队拟定表彰名单颁布,共包含83位获选为国家卓越工程师、50家团队荣获国家卓越工程师团队称号。从本年度起,首次设立“国家
    的头像 发表于 12-11 11:02 640次阅读