0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

如何利用好机器学习,数据分析与处理很重要

独爱72H 来源:网络整理 作者:佚名 2020-04-12 22:44 次阅读

(文章来源:网络整理)
机器学习涉及到很多的学科和门类,在我看来,它更像是各个学科的集合体,因此想要学好机器学习,你需要具备很多方面的知识,不过也并不是所有人会用到机器学习的每个细节,因此可以根据自己的专长有针对性的学习。

我目前也在学习相关的技术资料,再加上之前也接触过这方面的工作,所以对于机器学习方面还是有一定的了解,在我看来无论是什么样的机器学习模型、分类、算法都是依托于原始数据的,原始数据的分析和处理是前提也是很重要的部分。

通常我身边的工程师在进行相关设计的时候有一个惯性的思维,先采集一大堆的数据然后用工具分析特征和生成模型,之后通过大量的数据采集来实现模型的修正和完善,这种方式应该也是很多设计人员通常的思路,而且一般的情况下要求硬件采集设备尽可能的提供多种参数,这样可以丰富算法模型的输入参数,理论上可以更好地接近实际的结果,在纯技术的角度上这个是可行的,而且随着样本量的增加,采用机器学习的思路,最终的模型和算法会越来越精确。

这样的设计方法对于已有理想样本或是可以很容易获取样本数据的前提下是非常高效的,但是如果已有样本不是很理想,存在大量干扰成分,样本数据受人为因素或者必须由人工采集获取数据时,传统的方法就没有太大优势了。这个时候需要对数据进行预处理和必要的分析,需要确定几个问题:

一、预先确定几个需要研究的参数,选择参数时需要有一定的依据和相关性,拿红外信号输出信号分析举例,可以从公开的资料中知道红外传感器会受到温度和光谱范围的影响导致输出曲线的变化,那么温度和光谱范围就是需要研究的参数。

二、确定了参数之后,先不要对所有参数进行样本数据采样,而是针对单一参数进行数据采样,彻底明确单一参数对于最终结果的影响程度,也就是权重,用函数关系表示即:Y = F(X), Y为结果,X为样本数据参数,数据处理过程包括平滑、筛选、剔除、插入等基本操作,也就是预处理过程,之后可以生成基本的函数关系或对照表,为后续的大模型的建立提供数据支持。

三、将每种数据参数的影响程度量化之后,我们就获取了所有的参数对照表和函数对应关系,利用这些已有的结果建立整个算法模型和框架结构,在模型中将每种数据的权重设计好,最终形成一个初步的机器学习模式。

四、在实现了以上三步之后,我们最终可以通过大数据样本的采集来实现整个机器学习模型的完善,最终实现之前制定的目标。
(责任编辑:fqj)

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 机器学习
    +关注

    关注

    66

    文章

    8344

    浏览量

    132288
  • 数据分析
    +关注

    关注

    2

    文章

    1410

    浏览量

    33982
收藏 人收藏

    评论

    相关推荐

    数据分析在数字化中的作用

    重要数据分析是指使用统计和逻辑方法对数据进行处理和解释的过程。它涉及到数据的收集、清洗、转换、建模和解释,目的是发现
    的头像 发表于 10-27 17:35 412次阅读

    云计算在大数据分析中的应用

    云计算在大数据分析中的应用广泛且深入,它为用户提供了存储、计算、分析和预测的强大能力。以下是对云计算在大数据分析中应用的介绍: 一、存储和处理海量
    的头像 发表于 10-24 09:18 245次阅读

    使用AI大模型进行数据分析的技巧

    使用AI大模型进行数据分析的技巧涉及多个方面,以下是一些关键的步骤和注意事项: 一、明确任务目标和需求 在使用AI大模型之前,首先要明确数据分析的任务目标,这将直接影响模型的选择、数据收集和
    的头像 发表于 10-23 15:14 357次阅读

    【《时间序列与机器学习》阅读体验】+ 了解时间序列

    收到《时间序列与机器学习》一书,彩色印刷,公式代码清晰,非常精美。感谢作者,感谢电子发烧友提供了一个让我学习时间序列及应用的机会! 前言第一段描述了编写背景: 由此可知,这是一本关于时间序列进行大
    发表于 08-11 17:55

    机器学习中的数据处理与特征工程

    机器学习的整个流程中,数据处理与特征工程是两个至关重要的步骤。它们直接决定了模型的输入质量,进而影响模型的训练效果和泛化能力。本文将从
    的头像 发表于 07-09 15:57 267次阅读

    数据分析除了spss还有什么

    Sciences)是一款非常流行的统计分析软件,但除了SPSS之外,还有许多其他数据分析工具和方法。 引言 数据分析是一个跨学科的领域,涉及到统计学、计算机科学、数据挖掘、
    的头像 发表于 07-05 15:01 497次阅读

    数据分析的工具有哪些

    数据分析是一个涉及收集、处理分析和解释数据以得出有意义见解的过程。在这个过程中,使用正确的工具至关重要。以下是一些主要的
    的头像 发表于 07-05 14:54 716次阅读

    数据分析有哪些分析方法

    数据分析是一种重要的技能,它可以帮助我们从大量的数据中提取有价值的信息,从而做出更明智的决策。在这篇文章中,我们将介绍数据分析的各种方法,包括描述性
    的头像 发表于 07-05 14:51 457次阅读

    机器学习数据分析中的应用

    随着大数据时代的到来,数据量的爆炸性增长对数据分析提出了更高的要求。机器学习作为一种强大的工具,通过训练模型从
    的头像 发表于 07-02 11:22 508次阅读

    国内机器人实际场景使用抽样调查数据分析报告

    国内机器人实际场景使用抽样调查数据分析报告1背景我们通过为时3个月(2024年2月1日-2024年4月30日),针对国内机器人实际使用者发出的1000份报告(收到实际反馈有效报告736份)。根据
    的头像 发表于 05-28 08:14 513次阅读
    国内<b class='flag-5'>机器</b>人实际场景使用抽样调查<b class='flag-5'>数据分析</b>报告

    串口接收不等长的数据如何处理的呢?

    串口是一个很重要的通信方式,但是要用好串口并不是那么简单,比如如何接收不等长的数据等。你们是如何处理的呢?大家来说说你们的做法。
    发表于 05-15 08:02

    求助,关于AD采集到的数据分析问题

    问题描述:使用AD采集一个10Hz到2MHz的脉冲,脉冲底部可能大于零,由采集到的数据分析出该脉冲的上升时间,幅值和占空比。 备注:在分析的时候已经知道脉冲的频率,精度为2X10^-5. 在分析
    发表于 05-09 07:40

    态势数据分析系统软件

    处理分析和挖掘态势数据的工具。它结合了数据集成、地图制作、数据分析与挖掘以及可视化展示等多种功能 这类软件能够集成多种来源的地理
    的头像 发表于 04-22 11:36 391次阅读

    什么是机器学习?它的重要性体现在哪

    任务的解决方法。机器学习重要性体现在几个方面数据处理能力:在当今数字化时代,我们产生了大量的数据机器
    的头像 发表于 01-05 08:27 1323次阅读
    什么是<b class='flag-5'>机器</b><b class='flag-5'>学习</b>?它的<b class='flag-5'>重要</b>性体现在哪

    Get职场新知识:做分析,用大数据分析工具

    数据管理的。 随着原来越多的企业加入了数字化转型的队伍,大数据分析工具也越来越多地被应用于各行各业的业务数据分析中,直至今日,大数据分析工具也成为了
    发表于 12-05 09:36