从本质上说,数据湖就是一个信息资源库。人们常常将数据湖与数据仓库混为一谈,但两者在架构和满足的业务需求上都不一样。尤其是,随着社交媒体数据、物联网机器数据和交易数据持续快速增加,云数据湖成为了现代数据管理战略的重要组成部分。存储、转换和分析各类数据的能力可以为企业发现新业务机会和实现数字化转型铺平道路,而数据湖正好能赋予企业这种能力。
数据湖的定义
数据湖是一个中央数据存储库,可以帮助解决数据孤岛问题。重要的是,数据湖可以存储大量原生或原始格式的原始数据,包括结构化、非结构化和半结构化格式的数据。数据湖,尤其是云端的数据湖,具有成本低、易扩展的特点,并且常与实用机器学习分析工具一起使用。
数据湖 VS 数据仓库
与数据湖相比,数据仓库还提供数据管理功能,而且存储的是经过处理和过滤的数据,这些数据事先基于预定义的业务问题或用例进行了处理。
数据仓库和数据湖对比
数据仓库与数据湖通常互为补充。例如,当需要存储在数据湖中的原始数据来回答业务问题时,可以将其从数据湖中提取出来,进行清理和转换,然后在数据仓库中进一步分析。
“数据湖仓一体”是近几年出现的新概念,还在不断发展,它在传统数据湖的基础上增添了数据管理功能。从本质上讲,数据湖库就是数据湖和数据仓库的融合。
除上述数据类型和流程差异外,下表还列出了数据湖与数据仓库解决方案的一些其他区别。
审核编辑 黄宇
-
数据管理
+关注
关注
1文章
272浏览量
19494 -
数据仓库
+关注
关注
0文章
60浏览量
10408
发布评论请先 登录
相关推荐
数据中台、数据仓库、数据治理与主数据的定位与差异
TC397多核之间数据访问效率有什么区别?本地和全局的效率有什么区别?
构建高效数据生态:数据库、数据仓库、数据湖、大数据平台与数据中台解析_光点科技
![](https://file1.elecfans.com/web2/M00/AF/55/wKgZomVN-8aAFPRIAAsiDHE7JBA408.png)
![](https://file1.elecfans.com/web2/M00/AD/14/wKgZomU_db2AeM-_AAhA_of0gfY902.png)
数据仓库概述及特点
加速Oracle数据仓库 Emulex和博科第6代光纤通道
![加速Oracle<b class='flag-5'>数据仓库</b> Emulex和博科第6代光纤通道](https://file.elecfans.com/web1/M00/D9/4E/pIYBAF_1ac2Ac0EEAABDkS1IP1s689.png)
如何提高数据仓库的性能及优化设计
![](https://file.elecfans.com/web2/M00/AF/8E/poYBAGSmeVGAZb5LAACrIkqzDDI368.png)
![](https://file.elecfans.com/web2/M00/B0/06/pYYBAGSmeTeAEo7_AAFOzNIUTSM485.png)
![](https://file.elecfans.com/web2/M00/B0/04/pYYBAGSmeQiAF70AAAHZujgLChY762.png)
![](https://file.elecfans.com/web2/M00/AF/89/poYBAGSmd7iAX6uyAACv9hgt2Z0061.png)
![](https://file.elecfans.com/web2/M00/B0/01/pYYBAGSmd4qARQZYAACwKuFtLNY808.png)
![](https://file.elecfans.com/web2/M00/AF/89/poYBAGSmd1WAWBwPAAFc_IBjBCY148.png)
评论