0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

从四个方面对大数据进行阐述

如意 来源:今日头条 作者:华章科技 2020-11-30 14:42 次阅读

01 大数据概念

数据发展推动科技进步,海量数据给数据分析带来了新的机遇和挑战。大数据是一种强大到在获取、存储、管理、分析方面远远超出传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和较低的价值密度这四大特征。

于是,我们需要新的处理模式来实现更强的数据处理能力以应对多样化的信息资产。

大数据技术追求的不是精确性的样本数据,而是面向全体的数据,这部分数据可能是不精确的、非结构化的,但大数据技术正是利用这些之前未被利用的数据,创造新的价值。

从海量数据中获得的数据处理结果可能是超乎我们的认知逻辑的,但是我们并不需要理解结果背后的因果关系。简言之,我们需要用相关思维替代因果思维。

02 大数据核心技术

大数据在信息系统的生命周期中,从数据源到最终产生有价值的可视化信息,主要经历6个步骤,分别是数据收集、数据存储、资源管理与服务协调、计算框架确定、数据分析和数据可视化,此过程涵盖了海量分布式系统、数据库、并行计算框架、数据挖掘等方面的技术。

图2-1罗列了大数据技术中各个步骤目前所对应的主流技术体系,大数据的相关技术日新月异、层出不穷,由于篇幅限制,不再一一列举。

▲图2-1 大数据的主流技术体系

03 大数据特点

大数据具有海量的数据规模、快速的数据流转、多样的数据类型和较低的价值密度这四大特征,下面将分别进行详细阐述。

1. 海量的数据规模(Volume)

大数据所采集、存储和计算的数据规模都非常大。随着互联网的广泛应用,使用互联网的人和企业等增多,数据的创造者变多,数据量呈几何级增长。近年来,随着数据维度变多、数据类型增加、数据的描述能力增强,数据可以传达的信息也越来越多,越来越准确。

2. 快速的数据流转(Velocity)

大数据不仅增长速度快,处理速度也快,有很强的时效性。在信息时代,人成为网络的核心,每个人每天都在制造新的数据,这些数据再被相应的机构如政府、互联网企业、银行、电信运营商等收集,形成了一个个庞大的数据体系。

面对如此庞大的数据体系,处理数据并得到结果的速度越快,数据的时效性就越强,价值就越高——而大数据和传统数据挖掘最大的区别也在于此,大数据更强调数据处理的实时性和时效性。

3. 多样的数据类型(Variety)

大数据的种类和来源多样化,多样的数据为数据处理带来了挑战。在数据结构上,大数据可以分为结构化数据、半结构化数据和非结构化数据;在具体形式上,大数据可以分为视频音频、图像、博客、社交网络、互联网搜索等。大数据迎接的挑战就是要针对这些结构不一、形式多样的数据,挖掘其中的相关性。而这些前所未有的、来自各个领域的、不同形式的数据,赋予了大数据强大的威力。

4. 较低的价值密度(Value)

大数据的价值密度相对较低。数据的价值密度和数据的规模呈反相关,数据的规模越大,数据的价值密度越低。大数据最大的价值即在于从大量低价值密度数据中挖掘出对分析和预测等有价值的信息。

相较于传统数据挖掘利用结构化的数据类型,大数据把目光也投向了非结构化的、非抽样的、包含全体的数据类型。这为大数据带来了更多的有效信息,但同时也增加了大量无价值的甚至是错误的信息。

04 大数据的通用应用

大数据已经渗透到了全世界市场中的各个领域,彰显着巨大的价值,其在各个领域的详细应用情况如下。

1. 金融领域

大数据在金融领域应用广泛,如针对个人的信贷风险评估,银行根据用户的刷卡、转账、微信评论等数据有针对性地推送广告;理财软件通过大数据为客户有针对性地推荐理财产品。总结来说,大数据在金融领域的应用可以概括为精准营销、风险控制、效率提升、决策支持。

2. 医疗领域

医疗行业拥有大量的病例、检测记录、药物记录、治疗结果记录等,这些数据中蕴含着巨大的价值,如果可以加以利用,将对医疗界产生不可估量的影响。疾病确诊和因人而异的治疗方案设定是医疗领域的重大问题,大数据可以帮助建立针对疾病特点、病人状况以及治疗方案的数据库,为人类健康贡献巨大的力量。

3. 生物领域

各国研究人员正如火如荼地推进着人类基因组计划,这促进了生物数据的爆发式增长。基因检测可以帮助人们对自己现在的以及未来的健康状况有更深刻、全面的认识,甚至可以帮助父母在宝宝出生前就对其健康状况进行检测。因此,人类基因组计划是未来人类战胜疾病的重要工具。

大数据可以整合已有的人类基因的检测结果并进行分析,加速人类基因组研究的进程。

4. 零售领域

零售行业可以利用大数据了解顾客的消费偏好和趋势,用以商品的精准营销和相关产品的精准推销,降低运营成本,提高进货管理和过期产品管理效率。大数据可以帮助零售商预测消费者需求趋势,更高效地提高供应链满足需求的能力。对大数据带来的潜在信息的挖掘和有效利用,将成为未来零售领域的必争之地。

5. 电商领域

电商行业的数据集中、数据规模大,可以利用大数据在很多方面进行有效信息的分析提取,如用户消费趋势、地域消费特点等。

电商领域中的大数据应用已经颇具规模,电商也是最早利用大数据进行精准营销的行业。电商可以根据顾客消费习惯提前备货以提高商品送达效率,还可以通过对客户浏览、收藏、加入购物车和购买记录等数据的分析,对用户进行有效的商品推荐,提高销量。
责编AJX

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    6890

    浏览量

    88826
  • 数据分析
    +关注

    关注

    2

    文章

    1427

    浏览量

    34012
  • 大数据
    +关注

    关注

    64

    文章

    8863

    浏览量

    137293
收藏 人收藏

    评论

    相关推荐

    如何零学大数据

    设计,掌握数据采集到实时计算到数据存储再到前台展示,所有工作一人搞定!并可以架构的层次站在架构师的角度去完成一
    发表于 03-01 15:41

    “阿里巴巴大数据系统体系”大层次

    )。 所以面对如此“量大”、“价值大”的资源,我们需要建立一套数据采集、计算到服务到应用的“大数据体系”,就跟“石油体系’一样有勘探、采集、传输、加工、应用等;由此也萌生出一批“
    发表于 08-29 16:19

    如何在同一库中使用四个Selectio Wizard四个不同的通道中捕获数据

    嗨,大家好,我正在开发一Vivado项目,我想在同一库中使用四个Selectio Wizard(使用iodelay)四个不同的通道中捕
    发表于 08-17 10:31

    什么是大数据大数据的特点有哪些

    大数据(big data)目录1什么是大数据2大数据的定义3大数据的特点[1]4大数据的作用[2]5大数
    发表于 07-12 06:52

    方面对智能电网大数据应用领域进行论述分析

    智能电网是大数据的重要技术应用领域之一。中投顾问发布的《“十三五”数据中国建设下智能电网产业投资分析及前景预测报告》分析认为智能电网大数据结构复杂、种类繁多,具有分散性、多样性和复杂性等特征,这些
    发表于 01-23 11:55 6651次阅读

    大数据时代的四个特征

    常不划算的,对于一平台而言,也许保存的数据只有过去几天或者一月之内,再远的数据就要及时清理,不然代价太大。基于这种情况,大数据对处理速度
    的头像 发表于 12-19 15:51 1.2w次阅读

    2018年智能锁行业的问题大致总结为以下四个方面

    最近,对智能锁行业进行了年终调研,根据企业的反应,智能锁行业的问题大致总结为以下四个方面
    发表于 01-02 10:07 1086次阅读

    浅析大数据在医疗行业四个方面的应用

    随着各行各业对大数据的应用,大数据正在日渐影响着行业的发展,医疗业也不例外。通过对医疗数据的分析,不但能够预测流行疾病的爆发趋势,以此避免感染、降低医疗成本,还能为患者提供更加便利的服务。具体来看,
    的头像 发表于 11-07 15:08 1.3w次阅读

    四个特征定义大数据,完善大数据的定义

    令人生畏的(Intimidating):管理大数据到使用正确的工具获取它的价值,利用大数据的过程中充满了各种挑战。
    发表于 05-17 11:28 3560次阅读

    方面对DDR5进行阐述

    DDR3-DDR5 地址、控制、命令数据、时钟、电源的管脚总体摆放位置只作了小调整,而这个小调整按流程需要在DIE-PKG-PCB间进行Co-Design,以保证信号SI与电源的噪声,这是协同设计的过程。
    的头像 发表于 08-04 16:24 6420次阅读

    四个方面解读PCB射频电路基础特性及重要因素

    此处将从射频界面、小的期望信号、大的干扰信号、相邻频道的干扰四个方面解读射频电路大基础特性,并给出了在 PCB 设计过程中需要特别注意的重要因素。
    发表于 08-07 14:42 926次阅读

    应用这4方面对大数据进行阐述

    大数据在信息系统的生命周期中,数据源到最终产生有价值的可视化信息,主要经历6步骤,分别是数据收集、
    的头像 发表于 12-15 16:21 3044次阅读

    2021年应关注的四个大数据趋势

    以下是2021年应该关注的四个大数据趋势:
    的头像 发表于 12-31 09:56 1759次阅读

    方面阐述Cache

    关于cache,大概可以方面进行阐述:内存到cache的映射方式,cache的写策略,cache的替换策略。 映射方式 内存到cach
    的头像 发表于 11-21 11:09 2508次阅读

    云安全包括哪四个方面

    云安全包括哪四个方面 随着云计算逐渐成为主流,云安全也获得了越来越多的关注,传统和新兴的云计算厂商以及安全厂商均推出了大量云安全产品。但是,与有清晰定义的“云计算”(NIST SP 800-145
    发表于 04-13 13:51 2656次阅读