0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

大数据的高级分析算法有哪些

h1654155282.3538 来源:科技世界杂谈 作者:科技世界杂谈 2021-01-17 10:37 次阅读

当涉及大数据和高级分析的话题时,热闹非凡。顶级分析公司就这些概念所采取的措施可以为数字时代的企业带来革命性的变化进行了广泛的撰写。世界各地的《财富》 500强公司都在大数据和高级分析方面进行了大量投资,并从中受益匪浅。问题在于,许多公司也希望取得令人难以置信的成果,但不确定确切的起点。

高级分析通常始于单个用例。这包括应用新的数据转换和分析方法来发现数据中以前未知的趋势和模式。当将此新信息应用于业务流程和操作规范时,它就有可能改变您的业务。

为了从数据中获取更大的价值,请使用以下五类算法

线性回归

线性回归是高级分析的最基本算法之一。这也使其成为使用最广泛的之一。人们可以轻松地查看其工作方式以及输入数据与输出数据的关系。

线性回归使用两组连续定量度量之间的关系。第一组称为预测变量或自变量。另一个是响应或因变量。线性回归的目标是以公式的形式识别关系,该公式根据自变量描述因变量。一旦这种关系被量化,就可以为自变量的任何实例预测因变量。

时间是最常用的自变量之一。无论您的自变量是收入,成本,客户,使用或生产力,如果您可以定义其与时间的关系,那么可以使用线性回归预测值。

 逻辑回归

Logistic回归听起来与线性回归相似,但实际上专注于涉及分类而不是定量预测的问题。在这里,输出变量值是离散且有限的,而不是连续的,并且具有无限值,就像线性回归一样。

逻辑回归的目标是对输入变量的实例是否适合类别进行分类。Logistic回归的输出值为0到1之间的值。结果接近1表示输入变量更清楚地适合类别。结果接近0表示输入变量可能不适合该类别。

Logistic回归通常用于回答明确定义的是或否问题。客户会再次购买吗?买家信用值得吗?潜在客户会成为客户吗?预测这些问题的答案会在业务流程中产生一系列动作,从而有助于增加未来的收入。

分类和回归树

分类树和回归树使用决策来对数据进行分类。每个决定都是基于与输入变量之一有关的问题。有了每个问题和相应的答案,数据实例就变得更接近以特定方式进行分类了。这组问题和答案以及随后的数据划分创建了一个树状结构。每行问题的末尾都有一个类别。这称为分类树的叶节点。

这些分类树可能变得非常大和复杂。控制复杂性的一种方法是通过修剪树或有意删除问题级别以在精确匹配和抽象之间取得平衡。对于输入值的所有实例(在训练中已知的值和在训练中未知的值)都适用的模型至关重要。要防止此模型过度拟合,就需要在精确拟合和抽象之间达到微妙的平衡。

分类树和回归树的一种变体称为随机森林。随机森林不是构建具有多个逻辑分支的单个树,而是由许多小的树和简单树组成的顶点,每个树都评估数据实例并确定分类。一旦所有这些简单的树完成了其数据评估,该过程将合并单个结果,以基于较小类别的组合来创建类别的最终预测。这通常称为合奏方法。这些随机森林通常在平衡精确匹配和抽象方面做得很好,并且已在许多业务案例中成功实现。

与侧重于是或否分类的逻辑回归相反,分类和回归树可用于预测多值分类。它们也更容易可视化并查看引导算法进行特定分类的确定路径。

 K最近邻法‬(KNN)

K最近邻法‬也是一种分类算法。它被称为“懒惰学习者”,因为该过程的培训阶段非常有限。学习过程由存储的训练数据集组成。在评估新实例时,将评估到训练集中每个数据点的距离,并且基于新数据实例与训练实例的接近程度,就该数据实例属于哪个类别达成共识。

根据训练集的大小和范围,此算法在计算上可能会很昂贵。由于必须将每个新实例与训练数据集的所有实例进行比较并得出距离,因此该过程每次运行都可以使用许多计算资源。

该分类算法允许对数据进行多值分类。另外,嘈杂的训练数据倾向于使分类倾斜。 通常选择K近邻,因为它易于使用,易于训练并且易于解释结果。当您尝试查找相似的项目时,它通常在搜索应用程序中使用。

K均值聚类

K-均值聚类专注于创建相关属性组。这些组称为群集。一旦创建了这些集群,就可以针对它们评估其他实例,以查看它们最适合的位置。

此技术通常用作数据探索的一部分。首先,分析人员指定群集的数量。K-means群集过程基于在称为“质心”的公共集线器周围找到具有相似性的数据点,将数据分解为该数量的群集。这些群集与类别不同,因为它们最初没有业务意义。它们只是输入变量的紧密相关实例。一旦识别并分析了这些集群,就可以将它们转换为类别,并提供具有业务意义的名称。

经常使用K均值聚类是因为它易于使用和解释,并且速度很快。要注意的一个方面是k均值聚类对异常值极为敏感。这些离群值会极大地改变这些聚类的性质和定义,并最终改变分析结果。

#智能制造#, 这些是高级分析计划中使用的一些最受欢迎的算法。每种方法都有优缺点,并且可以有效地利用各种方法来产生业务价值。实施这些算法的最终目标是进一步优化数据,使结果信息可以应用于业务决策。正是此过程为下游流程提供了更精细和更高价值的数据,这对于公司真正利用其数据的价值并实现其所需的结果至关重要。
责任编辑人:CC

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 分析算法
    +关注

    关注

    0

    文章

    5

    浏览量

    6764
  • 大数据
    +关注

    关注

    64

    文章

    8862

    浏览量

    137277
收藏 人收藏

    评论

    相关推荐

    raid 在大数据分析中的应用

    RAID(Redundant Array of Independent Disks,独立磁盘冗余阵列)在大数据分析中的应用主要体现在提高存储系统的性能、可靠性和容量上。以下是RAID在大数据分析
    的头像 发表于 11-12 09:44 140次阅读

    emc技术在大数据分析中的角色

    在当今这个数据驱动的世界中,大数据分析已经成为企业获取洞察力、优化业务流程和提高竞争力的关键工具。随着数据量的爆炸性增长,企业面临着如何有效存储、处理和分析这些
    的头像 发表于 11-01 15:22 214次阅读

    智慧城市与大数据的关系

    的建设需要对海量的数据资源进行收集、整合、存储与分析大数据技术的应用,如智能感知、分布式存储等,使得这些数据能够被高效地处理和利用。 决策支持 : 在智慧城市的建设和运行过程中,
    的头像 发表于 10-24 15:27 452次阅读

    云计算在大数据分析中的应用

    云计算在大数据分析中的应用广泛且深入,它为用户提供了存储、计算、分析和预测的强大能力。以下是对云计算在大数据分析中应用的介绍: 一、存储和处理海量数据 云计算提供了强大的存储和计算能力
    的头像 发表于 10-24 09:18 296次阅读

    IP 地址大数据分析如何进行网络优化?

    一、大数据分析在网络优化中的作用 1.流量分析 大数据分析可以对网络中的流量进行实时监测和分析,了解网络的使用情况和流量趋势。通过对流量数据
    的头像 发表于 10-09 15:32 170次阅读
    IP 地址<b class='flag-5'>大数据分析</b>如何进行网络优化?

    人员轨迹分析算法哪些?

    人员轨迹分析是一项重要的数据分析技术,它可以帮助我们理解和预测人们的行为模式以及他们在特定时间和地点的活动。通过分析人员轨迹数据,我们能够从中获取有价值的信息,例如人们的活动范围、常去
    的头像 发表于 09-26 10:42 286次阅读

    大数据在军事方面的应用

    智慧华盛恒辉大数据在军事方面的应用广泛且深入,涵盖了战争决策、情报分析、装备研发、后勤保障、科研方法、管理水平、作战能力和信息化建设等多个方面。以下是对这些应用的详细归纳: 智慧华盛恒辉一、战争决策
    的头像 发表于 07-16 09:44 855次阅读

    大数据分析平台网站

    大数据分析平台是一种用于处理和分析大规模数据集的系统,旨在从海量数据中提取有价值的信息和洞察。以下是大数据分析平台的主要功能和应用场景: 主
    的头像 发表于 06-28 15:46 578次阅读

    大数据在军事方面的应用哪些

    大数据技术为战争决策提供了全新的思路和工具。军事机关指挥系统通过搜集和分析大量的战场数据,可以建立复杂的决策模型,快速分析敌我态势,评估作战可行性,并推荐最优的战术方案。 利用
    的头像 发表于 06-23 10:34 860次阅读

    大数据在军事训练领域的应用哪些

    智慧华盛恒辉大数据在军事训练领域的应用广泛且深入,以下是具体的应用点及其归纳: 智慧华盛恒辉个性化训练计划: 通过收集和分析每个士兵的训练数据,如射击命中率、行军速度、体能训练成绩等,可以为每个士兵
    的头像 发表于 06-23 10:21 548次阅读

    大数据在部队管理中的运用哪些

    管理、用数据创新的全新管理模式。 智慧华盛恒辉大数据能够提供全样本数据,避免了以往依赖少量数据分析的局限性,使决策更加全面、系统、准确。 前瞻性分析
    的头像 发表于 06-23 09:53 982次阅读

    广告投放公司运用大数据分析,实现精准投放

    广告投放公司运用大数据分析,实现精准投放 随着大数据技术的不断发展,广告投放行业正经历着一场深刻的变革。传统的广告投放方式已经难以满足市场需求,而大数据分析则为广告投放带来了精准、高效的解决方案
    的头像 发表于 04-11 11:23 791次阅读

    大数据技术是干嘛的 大数据核心技术哪些

    的核心技术,包括数据采集、存储与管理、处理与分析等方面。 一、大数据技术背景和概念 1.1 背景 随着互联网技术的迅猛发展,人们可以通过各种途径产生、获取和传输数据,使
    的头像 发表于 01-31 11:07 3057次阅读

    Get职场新知识:做分析,用大数据分析工具

    工具值得推荐? 那就得是奥威BI大数据分析工具。主要原因三: 1、奥威BI方案,开箱即用,立得百张BI报表,大量节省BI报表开发时间,一步到位完成销售、财务、库存、采购、应收、生产六大主题。 2
    发表于 12-05 09:36

    电梯物联网大数据平台是什么意思?

    电梯物联网大数据化平台是将电梯的使用时间和管理中的各项数据进行采集,整合及利用大数据分析能力和计算机视觉技术、结合关联分析、空间分析和多维
    的头像 发表于 11-23 11:01 789次阅读