大数据(big data),指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低的四大特征。
一般认为,大数据主要具有以下4个方面的典型特征,即大量(Volume)、多样(Variety)、高速(Velocity)和价值(Value),即所谓的4V。
1. Volume(大量),大数据的特征首先就是数据规模大。随着互联网、物联网、移动互联技术的发展,人和事物的所有轨迹都可以被记录下来,数据呈现出爆发性增长。
2. Variety(多样)。数据来源的广泛性,决定了数据形式的多样性。大数据可以分为三类,一是结构化数据,如财务系统数据、信息管理系统数据、医疗系统数据等,其特点是数据间因果关系强;一是非结构化的数据,如视频、图片、音频等,其特点是数据间没有因果关系;三是半结构化数据,如HTML文档、邮件、网页等,其特点是数据间的因果关系弱。有统计显示,目前结构化数据占据整个互联网数据量的75%以上,而产生价值的大数据,往往是这些非结构化数据。
3.Velocity(高速),数据的增长速度和处理速度是大数据高速性的重要体现。与以往的报纸、书信等传统数据载体生产传播方式不同,在大数据时代,大数据的交换和传播主要是通过互联网和云计算等方式实现的,其生产和传播数据的速度是非常迅速的。另外,大数据还要求处理数据的响应速度要快,例如,上亿条数据的分析必须在几秒内完成。数据的输人、处理与丢弃必须立刻见效,几乎无延迟。
4.Value(价值),大数据的核心特征是价值,其实价值密度的高低和数据总量的大小是成反比的,即数据价值密度越高数据总量越小,数据价值密度越低数据总量越大。任何有价值的信息的提取依托的就是海量的基础数据。当然目前大数据背景下有个未解决的问题,如何通过强大的机器算法更迅速地在海量数据中完成数据的价值提纯。
本文整合自:传智教育、php中文网
审核编辑:符乾江
-
物联网
+关注
关注
2914文章
45014浏览量
377916 -
大数据
+关注
关注
64文章
8912浏览量
137899
发布评论请先 登录
相关推荐
使用ADS8513芯片进行数据采集,0~4V回读数据对应的十六进制是如何计算的?
缓存对大数据处理的影响分析
ADS1675最大数据吞吐率是是多少?
raid 在大数据分析中的应用
数据准备指南:10种基础特征工程方法的实战教程
![<b class='flag-5'>数据</b>准备指南:10种基础<b class='flag-5'>特征</b>工程方法的实战教程](https://file.elecfans.com/web2/M00/4E/DC/poYBAGLCjeiALm_WAAAYmfR7Qec474.png)
智慧城市与大数据的关系
云计算在大数据分析中的应用
IP 地址大数据分析如何进行网络优化?
![IP 地址<b class='flag-5'>大数据</b>分析如何进行网络优化?](https://file1.elecfans.com/web2/M00/09/50/wKgaomb3fYeADdmbAAEuarp64SY280.png)
使用CYW20829的BLE进行最大数据发送应用,BLE丢失数据如何解决?
大数据在军事方面的应用
大数据采集系统分为几类
特征工程与数据预处理全解析:基础技术和代码示例
![<b class='flag-5'>特征</b>工程与<b class='flag-5'>数据</b>预处理全解析:基础技术和代码示例](https://file.elecfans.com/web2/M00/4E/DC/poYBAGLCjeiALm_WAAAYmfR7Qec474.png)
评论