现代化机器学习工具，有助于数据科学开展更多工程功能-电子发烧友网

数据科学的发展日新月异，机器学习的角色正从数据科学的混合角色过渡到更多的工程或面相分析的角色，主要是以下的因素促成了这种变化。

1.机器学习模型更多地被应用到生产系统中，需要数据科学家具有比以前更深入的技术技能。

2.商业产品和用户行为的变化步伐加快，对自动化的需求也增加。

3.还有出于数据合规和监管的要求，增加了对数据的可追溯性和可解释性的预测和决策的需求。

这些变化的因素也导致了数据科学家使用的工具发生了变化。使得他们更多地利用云，自动化，可解释性和可重复过程的方向去发展。

基于云的机器学习。云基础架构和Kubernetes改变了数据科学家进行机器学习的方式。从能够将预构建的解决方案用作Saas应用程序，到能够在Kubernetes上运行完整的机器学习堆栈。

AutoML和编排。AutoML简化了训练模型，提供了一种自动的方法来进行数据准备，特征工程，超参数优化或模型的选择。

可解释且可重复的ML。在过去几年中，出现了一些库和工具来帮助理解模型预测及其背后的权重并赋予其含义。如whatiftools，Lime，Shap或Manifold之类的工具可以帮助数据科学家来实现这一目标。

基于云的机器学习

向云和Kubernetes的迁移是时下的主流方向，这推动了机器学习工程师对更多DevOps或数据操作功能的需求。

深度学习的快速发展推动了机器学习的进步，但深度学习需要更多的计算资源，它的利用率随工作负载变化很大，这迫使Tensorflow执行程序在Kubernetes上运行来支持更弹性和可扩展的基础架构。

另一个因素是机器学习在生产环境中的重要性日益提高。这种转变又增加了在原型堆栈和生产之间紧密结合的需求，并借助各种云的平台，比如AWS SageMaker、Google Cloud ML Engine。这些工具提供了如模型部署和API配置之类的功能，从而简化了流程将模型推向生产的过程。

AutoML和机器学习工作流程

具有生产型机器学习系统的重要性的提高反过来加速了从培训到部署的整个机器学习价值链对自动化的需求。自动化允许更快地迭代和改进模型。

AutoML提供了围绕模型训练过程的自动化层，可以处理其一些重复的任务。它可以处理如超参数优化，功能和模型选择之类的任务。现在，像Tpot或AutoKeras之类的库，以及大多数云提供商的机器学习即服务都将AutoML作为其解决方案的一部分。

对自动化的需求也增加了对工具进行编排的不同部分的需求。工作流工具如，Ai rflow，Kubeflow，MLFlow和MetaFlow是用于帮助实现这一目标的一些关键工具。他们负责将整个机器学习过程作为一条流水线来处理，帮助协调从数据采集到模型服务的端到端流程。

可解释且可重复的ML

合规和监管影响了我们构建机器学习模型的方式。他们推动了可解释和可复制的模型。

在可解释的方面，已经出现了一系列工具，可以帮助数据科学家从其模型中获得意义。这些工具评估不同的方案，分析变量如何互操作，并提供仪表板以帮助解释模型预测。whatiftools，Lime，Shap或Manifold是应对这一挑战的工具。

除了提供可靠的方法来调试模型的优点外，可复制性是受法规影响的另一个方面。总有可能使用工作流工具创建可重复的机器学习管道，但仍出现了一些特定的工具来简化这个过程。

DVC，Dolt，Weight and Biases（WANDB）和Dags Hub等是一些专门的工具，使构建模型，可重复的方式更简单。DVC负责模型和数据集的版本控制，而Dolt严格限于数据集本身。WANDB和Dags Hub则专注于跟踪模型构建/训练的权重和结果。

总结

机器学习工具，已经不仅仅局限于利用一些预测库和Jupyter笔记本。现在，进行数据科学需要掌握更广泛的工具集，其中包括云，工作流工具，解释和版本控制工具。这些增加的现代化工具应有助于数据科学开展更多的工程或业务功能。

声明：本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人，不代表电子发烧友网立场。文章及其配图仅供工程师学习之用，如有内容侵权或者其他违规问题，请联系本站处理。举报投诉

机器学习

机器学习

+关注

关注
66

文章
8373

浏览量
132394
现代化

现代化

+关注

关注
0

文章
18

浏览量
6704
数据科学

数据科学

+关注

关注
0

文章
165

浏览量
10045

智慧农业平台：推动农业现代化的科技力量

随着信息技术的飞速发展，智慧农业平台正逐步成为推动农业现代化、提高农业生产效率和质量的重要力量。智慧农业平台集成了物联网、大数据、云计算、人工智能等多种先进技术，为农业生产和管理提供了全方位、准确化

发表于 10-15 16:25 •235次阅读

【米尔NXP i.MX 93开发板试用评测】3、NXP的MCU工程目录结构和源码分析

环境无缝集成。而NXP的项目工程，可以说是CMake工程的优秀示范。目录结构这种目录结构有助于提高软件开发的效率和质量，特别是在大型项目和团队合作的环境中。通过合理的组织和模块化

发表于 09-21 21:11

高标准农田灌区信息化建设如何促进农业现代化

高标准农田灌区信息化建设如何促进农业现代化 高标准农田灌区信息化建设是推动农业现代化进程的关键一环，它通过集成现代信息技术与传统农业灌溉管理

发表于 08-30 17:40 •476次阅读

高标准农田灌区信息<b class='flag-5'>化</b>建设如何促进农业<b class='flag-5'>现代化</b>

关于一些有助于优化电源设计的新型材料

众所周知，人们对更高电源效率的追求正在推动性能的全方位提升。材料科学的进步对于优化电源设计和开发更高效、更紧凑和更可靠的解决方案发挥着关键作用。下文列出了一些有助于优化电源设计的新材料。

发表于 08-29 15:26 •341次阅读

MSPM0-高级控制计时器有助于实现更好的控制和更好的数字输出

电子发烧友网站提供《MSPM0-高级控制计时器有助于实现更好的控制和更好的数字输出.pdf》资料免费下载

发表于 08-28 11:30 •0次下载

MSPM0-高级控制计时器<b class='flag-5'>有助于</b>实现更好的控制和更好的数字输出

现代化农业生产中，立柱机器人不同规格肥料码垛

在现代化农业生产中，立柱机器人被应用于不同规格肥料的码垛作业，其效高、准确、灵活的特点为农业生产带来了显著的变革。以下是对立柱机器人在不同规格肥料码垛中的具体应用的详细分析：一、立柱机器

发表于 08-26 15:08 •193次阅读

有助于提高网络设备性能的FRAM SF25C20（MB85RS2MT）

有助于提高网络设备性能的FRAM SF25C20（MB85RS2MT）

发表于 07-25 09:49 •242次阅读

机器学习中的数据预处理与特征工程

在机器学习的整个流程中，数据预处理与特征工程是两个至关重要的步骤。它们直接决定了模型的输入质量，进而影响模型的训练效果和泛化能力。本文将从

发表于 07-09 15:57 •291次阅读

爱普生的高精度传感技术有助于监控自动化

Epson、JREast和NaganoKeiki联合开发了一种适用于铁路运营商的实用挠度监测设备-爱普生的高精度传感技术有助于监控自动化-SeikoEpsonCorporation（TSE:6724

发表于 06-27 10:53 •317次阅读

名单公布！【书籍评测活动NO.35】如何用「时间序列与机器学习」解锁未来？

其中的佼佼者。我们在互联网、经济、金融、气象等诸多领域都能见到时间序列数据的身影。有效分析这些随时间变化的数据样本以提炼有价值的信息，不仅有助于企业和机构的决策优化，而且对科学研究

发表于 06-25 15:00

LORA、UNB无线网关物联网锁助力人才公寓智慧化管理

天诚LoRa、UNB双模式通信物联网锁的应用，将有助于构建智慧人才公寓，租住行业现代化发展以及智慧化管理。

发表于 06-17 10:27 •379次阅读

在微芯片上使用3D反射器堆栈有助于加快6G通信的发展

一项新的研究发现，在微芯片上使用3D反射器堆栈可以使无线链路的数据速率提高三倍，从而有助于加快6G通信的发展。

发表于 03-13 16:31 •631次阅读

为微电子设施现代化提供资金

公告，该法案旨在加强美国的制造业、供应链和国家安全。对BAE系统公司的微电子中心进行现代化改造有助于支持这一愿景以及尖端技术的持续开发和制造，以服务于客户的使命。 BAE系统公司的微电子中心是一个占地110,000 平方英尺、获得国防部（DoD）认证的半

发表于 12-28 16:24 •328次阅读

喜报！华为云金融PaaS3.0荣获“2023年应用现代化典型案例”称号

摘要：近日，中国软件行业协会首届“应用现代化产业实践优秀案例”评选结果揭晓，华为云金融PaaS3.0荣获“2023年应用现代化典型案例”称号。中国软件行业协会近期启动了2023“应用现代化产业实践

发表于 11-25 17:34 •562次阅读

ADI全新集成电路有助于监测心率

电子发烧友网站提供《ADI全新集成电路有助于监测心率.pdf》资料免费下载

发表于 11-24 10:38 •0次下载