0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

星环科技推出湖仓一体解决方案满足个性化数据分析需求

科技绿洲 来源:星环科技 作者:星环科技 2022-05-10 15:20 次阅读

近些年来,随着企业数字化转型持续推进,在数据的分析利用方面,其广度和深度都在不断向外延伸。在分析广度方面,主要体现在所分析数据的类型以及分析场景更加多样化、多元化;在分析深度方面,主要体现在更关注多源异构数据的融合分析以及基于数据科学技术进行数据价值的深度挖掘。

与此同时,为了满足多样化的数据分析需求,企业数据平台架构也在持续演进。单一数据湖和数据仓库已不能顺应数据分析的发展趋势,越来越多企业开始基于“湖(Hadoop技术体系)”+“仓(MPP技术体系)”的混合架构打造自己的企业级数据平台。这种混合架构融合了“湖”和“仓”各自的技术优势,可以在一定程度上支撑企业多样化的数据分析场景,但是在数据平台的易用性、可维护性、数据处理效率以及存储成本方面都存在一定的不足。

星环科技政府与公共事业部系统架构的负责人徐流明介绍说,“湖(Hadoop技术体系)”+“仓(MPP技术体系)”的混合架构是在数据平台架构演进过程中技术向业务妥协的一个产物。Hadoop技术体系在设计之初主要是为了解决海量数据的离线批处理问题,在高并发数据集市、即席查询、事务一致性等方面存在先天不足;而MPP技术体系是从关系型数据库演进而来,对事务一致性、OLAP分析性能都有比较好的支撑,但是在分析场景方面存在比较大的局限性,主要以结构化数据分析为主,无法支撑半/非结构化数据存储、实时计算、机器学习等场景。同时,在前些年,业内又没有比较成熟的技术体系能够同时满足“湖”+“仓”的所有场景,所以才催生了“Hadoop+MPP”的混合架构。

然而,随着多模型数据库技术的兴起,“湖”“仓”之间的技术壁垒有望被打破,湖仓一体的概念也应运而生。所谓湖仓一体,就是融合数据湖和数据仓库的一种新型开放式数据平台架构,将数据湖和数据仓库的优势充分结合,构建在数据湖低成本的数据存储架构之上,又继承了数据仓库的数据处理、分析和管理功能。

从技术角度看,“湖仓一体”架构是以多模型数据平台技术为依托,打破传统Hadoop+MPP混合部署模式,实现湖仓技术架构统一。未来,湖仓一体作为新一代大数据技术架构,将逐渐取代单一数据湖和数据仓库架构。

以需求为牵引,湖仓一体时代来临

任何技术的更新迭代都是以需求为牵引的,数据平台的建设也不例外。近年来,数据分析需求的演进趋势体现在四个方面:

第一,数据类型多元化。由原来的以结构化数据为主,转变为结构化、非结构化、半结构化和实时消息数据共存的情况。

第二,分析场景多样化。由原来的以统计分析为主,转变为统计分析、标签分析、全文检索、 预测分析、甚至是基于图数据的推理分析等共存。

第三,分析时效实时化。由以离线分析为主,转变为实时分析、交互分析、自助分析等。

第四,数据管控统一化。由原来的弱管控模式转变为了强管控,体现在统一数据标准、统一数据存储、统一数据治理以及统一数据视图。

在需求演进的趋势下,企业级数据平台架构也进行不断迭代,主要经历了四个阶段:

数据库阶段。在上个世纪80年代,数据分析主要是基于业务数据库,做一些单系统的简单分析。

数据仓库阶段。到了90年代,数仓的概念开始兴起,各个企业开始构建自己的数据仓库平台,把业务系统数据都抽取到数仓之中,进行一些多维的、关联性的、融合性的BI分析,以辅助决策。

数据湖阶段。到了2010年前后,随着大数据技术的兴起,数据湖的概念随之而来。数据湖不仅支持结构化数据的处理,同时还支持半结构化、非结构化数据的存储和查询。同时,在数据应用场景上,也更加的多元化,出现了实时分析、全文检索、机器学习等一些新型的分析场景。

在这一阶段,大家的关注点在于用不同的技术栈来支撑不同的数据分析场景,对数据平台架构的易用性、可维护性却没有过多的关注,导致很多企业建设的数据平台架构非常之复杂,为后期平台迭代以及运维都造成了很大困扰。

湖仓一体阶段。近两年来,湖仓一体的概念兴起,企业开始逐步关注数据平台架构问题,更强调通过统一的架构,依托一个一站式的多模型数据平台来解决数据湖、数据仓库多样化的数据分析场景。

技术向业务妥协,“湖+仓”混合架构面临多重挑战

在湖仓一体的概念出现之前,其实业内湖+仓的混合架构已经存在了多年,而且有些企业把这种湖+仓的架构也称为湖仓一体,实际上湖仓一体并不等于简单的数据湖+数据仓库。

湖+仓混合架构有几个比较典型的特点:

数据湖和数据仓库是两套相对独立的体系,混合部署在一个数据平台上。数据湖是基于Hadoop技术来实现,主要用于支撑多源异构的数据存储,执行批处理、流处理等工作负载。数据仓库主要基于MPP或者一些关系型数据库来实现,主要支撑结构化数据在OLAP场景下的BI分析和查询需求。湖和仓是互相独立的,通过ETL实现数据的交换。

这种架构可以在一定程度上解决企业多场景的数据分析需求,但是也有一些明显的弊端。

第一,混合部署架构较为复杂,导致架构设计和项目实施交付成本较高,且后期平台运维难度较大。

第二,数据冗余非常明显,增加存储的成本。Hadoop和MPP都属于分布式系统,分布式系统为了保障数据的高可靠性,一般都是通过冗余备份的方式实现的。两种技术本身都已经做了数据的冗余备份,采用混合架构又避免不了有部分的数据既存在Hadoop平台,又存在MPP平台,进一步增加了数据冗余的比例,增加存储的成本。

第三,数据处理的链路过长,影响查询的时效性。通常数据处理要先入湖,进行批处理后再入仓,在数仓中进行主题建模分析,最终为上层提供查询服务,整个加工链路相对比较长,而且中间有湖入仓还要进行一次ETL,影响查询的时效性。

第四,数据的一致性问题,增加了数据校验成本。无论是由湖入仓还是由仓入湖,实际上在混合架构下都是在两种数据平台间的数据迁移,在迁移的过程当中难免会出现数据一致性问题,增加额外的数据校验成本。

湖+仓的混合架构是技术向业务妥协的一个产物,并不是真正意义上的湖仓一体平台。在前些年,业内没有比较成熟的技术体系能够同时满足“湖”+“仓”的所有场景,所以才催生了“Hadoop+MPP”的混合架构。

打破“湖”“仓”技术壁垒,湖仓一体是未来演进趋势,其特点有几个方面:

多模存储:湖仓一体平台具备统一数据存储管理能力,支持结构化、半结构化、非结构化的数据统一存储,同时支持多种数据存储模型;

架构统一:湖仓一体具备4层统一架构。在资源管理层可以实现统一的资源调度框架,支持计算和存储单元弹性伸缩;在存储层具备统一数据存储能力,实现多源异构数据统一管理;在计算层支持统一计算引擎,可以实现跨模态数据的融合分析;在接口层支持统一数据接口,能够为上层应用提供统一易用的查询接口。湖仓一体架构统一,可以避免混合架构带来的开发难、运维难、存储成本高、数据处理效率底等问题。

性能卓越:湖仓一体平台性能更卓越。因为在统一架构下,数据湖和数据仓库都是采用一体化设计,减少了数据加工的链路,增加了资源的复用性,时效性更好。

全面赋能:通过湖仓一体平台,可以同时满足“湖”“仓”的数据分析需求,支持多样化的业务场景,能够为企业级各类业务系统、各种分析场景提供全面赋能。

“湖仓一体”架构以多模型数据平台技术为依托,打破Hadoop+MPP混合部署模式,实现湖仓技术架构统一,属于真正的湖仓一体平台。

自主可控,星环科技“湖仓一体”的解决之道

星环科技推出的湖仓一体解决方案,总体分为五层架构:

第一层是基础设施层,可以兼容信创自主可控的硬件生态,兼容主流X86及ARM架构服务器,支持CentOS、Redhat、麒麟V10、统信UOS等主流操作系统,同时支持ARM与X86架构混合部署。

第二层是统一资源管理层,星环科技推出基于云原生技术的容器化操作系统TCOS,提供统一的资源调度框架,通过容器化编排,能够统一调度计算、存储、网络等各类基础资源。

第三层是统一存储管理层,星环科技研发了统一的分布式数据管理系统TDDMS,为不同存储引擎提供公共的存储管理服务,保障数据一致性,实现数据统一管理运维和高可用。目前分布式数据管理系统接入了9款存储引擎,支持10种数据模型的存储。用户不需要为不同模型建立单独的存储系统,而是通过统一的存储管理,降低了运维管理成本,也避免了数据孤岛。同时分布式数据管理系统的插件特性,也方便后续业务的灵活扩展,可以根据需要接入其他存储引擎。

第四层是统一计算引擎层,基于分布式计算引擎Transwarp Nucleon可以根据不同的存储引擎自动匹配高性能算法,不仅可以支持批处理、流处理等不同类型计算任务,还支持跨模态数据的融合分析,方便用户在一个SQL中使用不同模型的数据,降低开发难度,提升开发效率。

第五层是统一数据操作层,主要提供标准的SQL语法支持,可以实现统一接口处理不同的业务和不同数据模型,只需要简单的SQL语句即可完成各种复合跨模型数据查询,无需访问不同接口即可操作不同的数据模型。对于场景切换、数据库切换而造成接口、开发语言切换的问题就不存在了,开发和迁移成本大大降低。

贯穿这五层架构,星环科技湖仓一体平台还提供了全生命周期的数据管控能力,可以实现多模态数据以及元数据的统一管控,同时还支持统一的多租户管理,可确保在湖仓一体平台上的租户从资源层、数据层、应用层等都能实现完整隔离。

八大特点引领,星环科技湖仓一体平台赋能用户

那么星环科技的湖仓一体平台有什么特点呢?

云原生。基于云原生的架构,提供容器化的底座,可以根据业务负载自动弹性扩缩容,提高整体资源利用率。湖仓一体平台各组件采用微服务架构设计,按照功能模块进行切分,在横向扩展以及版本更新方面都具有更高的灵活性。

多模态异构存储。星环科技提供一个多模型的数据管理平台,能够提升场景的查询效率,针对同一份数据可以采用多种数据模型存放,解决不同场景的效率问题。

1湖N仓多租户体系。面向集团型企业,可以提供1湖加N仓的多租户体系。在集团本部构建一个中心租户,在中心租户中建设集团级数据湖,梳理统一的数据资产目录,形成数据资产视图,同时面向集团层面业务分析需求,建设集团级数据仓库。针对集团下属的业务部门、分子公司,或者一些数据创新团队,可按需建立自有的租户,在租户内有独立的资源环境,有独立的一套数据开发平台和工具,可以通过共享统一数据湖的数据,建设面向自己业务和主题的数据仓库和数据集市,满足个性化的数据分析需求。

自主可控。自主可控主要体现在两个方面,对内,星环科技一直在坚持技术创新,实现全面自主可控。对外,星环科技也在积极的和信创的上下游去做兼容适配,拥抱整个信创生态。

总体而言,星环科技湖仓一体平台的优势包括多模存储、技术创新、批流协同、统一SQL、弹性伸缩、信创自主、全栈工具、降本增效等8大优势。

目前,星环科技湖仓一体解决方案已经在金融、政府、交通、邮政、医疗、能源等行业以及部分大型国有企业落地应用,典型客户包括中化集团、中国邮政集团、广州农商行等。
审核编辑:彭静

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据分析
    +关注

    关注

    2

    文章

    1462

    浏览量

    34203
  • 大数据
    +关注

    关注

    64

    文章

    8912

    浏览量

    137901
  • 星环科技
    +关注

    关注

    0

    文章

    37

    浏览量

    2667
收藏 人收藏

    评论

    相关推荐

    探索场景适配性,总结了适合您的AIO一体机主板解决方案

    一体机场景,并为您推荐相应的一体机主板解决方案。办公场景广泛应用于员工办公、前台接待、会议室,满足基本办公需求:如邮件收发、项目管理、
    的头像 发表于 02-05 17:56 73次阅读
    探索场景适配性,总结了适合您的AIO<b class='flag-5'>一体</b>机主板<b class='flag-5'>解决方案</b>

    戴尔数据助力企业数字转型

    在数字转型的浪潮下,企业正面临着前所未有的数据挑战。从传统的结构数据到如今的非结构数据、半
    的头像 发表于 12-20 09:31 184次阅读

    一体化直流电能表解决方案

    一体化直流电能表的解决方案为了解决检定实施过程中的这些问题,我们提出了一体化直流电能表的解决方案
    的头像 发表于 12-04 18:12 352次阅读
    <b class='flag-5'>一体化</b>直流电能表<b class='flag-5'>解决方案</b>

    物联网水肥一体化系统方案

    概述 物联网水肥一体化系统,将物联网技术、自动控制技术、传感器技术、云计算与大数据分析等现代信息技术,深度融合于农业灌溉与施肥过程中,形成的整套智慧农业解决方案。通过安装在农田中的各类传感器,实时监测土壤水分
    的头像 发表于 10-18 09:54 441次阅读

    IP 地址大数据分析如何进行网络优化?

    。 2.用户行为分析数据分析可以对用户的网络行为进行分析,了解用户的需求和偏好。通过对用户行为数据
    的头像 发表于 10-09 15:32 323次阅读
    IP 地址大<b class='flag-5'>数据分析</b>如何进行网络优化?

    坤输入/输出连接器:简化设计,技术领先,满足个性化连接需求

    在数字化时代,电子设备的复杂性和多样性不断增长,对输入/输出(I/O)连接器的需求也随之提高。中国坤控股有限公司凭借其在连接器领域的深厚技术积累和创新能力,推出系列多样
    的头像 发表于 08-25 11:25 409次阅读

    如何选择合适的边缘ai分析一体解决方案

    解决方案,成为企业决策者亟需解决的问题。本文将从需求分析、技术考量、生态兼容及未来可扩展性四个方面,探讨如何科学合理地选择合适的边缘AI分析一体
    的头像 发表于 08-08 15:25 316次阅读
    如何选择合适的边缘ai<b class='flag-5'>分析</b><b class='flag-5'>一体</b>机<b class='flag-5'>解决方案</b>

    安消一体化平台建设方案

    与消防一体化平台已成为迫切需求。本文古河云科技将详细介绍针对企业安全生产和消防管理需求一体化平台建设方案。 首先,安消
    的头像 发表于 07-26 14:14 491次阅读

    宏集Panorama SCADA:个性化定制,满足多元角色需求

    企业中不同岗位的人员对于SCADA系统的功能需求可能有所差异,宏集Panorama SCADA平台支持针对不同人员角色进行个性化定制,满足多元角色需求,帮助更高效地利用SCADA系统进
    的头像 发表于 06-05 11:34 390次阅读
    宏集Panorama SCADA:<b class='flag-5'>个性化</b>定制,<b class='flag-5'>满足</b>多元角色<b class='flag-5'>需求</b>

    气密性检测仪定制:满足个性化需求

    随着现代工业的不断发展,对产品气密性检测的需求越来越多样。不同的产品和不同的应用场景对气密性检测仪的精度、速度和稳定性有不同的要求。因此,气密性检测仪的定制服务逐渐受到市场的青睐,成为满足
    的头像 发表于 06-04 13:46 334次阅读
    气密性检测仪定制:<b class='flag-5'>满足</b><b class='flag-5'>个性化</b><b class='flag-5'>需求</b>

    激光打标机:精准定位,实现个性化标识需求

    独特的打标方式,能够满足不同行业的个性化标识需求。首先,激光打标机采用先进的激光技术,具备高度的定位精度。无论是在金属、塑料还是玻璃等各种材质上,激光打标机都能实
    的头像 发表于 03-19 19:43 601次阅读
    激光打标机:精准定位,实现<b class='flag-5'>个性化</b>标识<b class='flag-5'>需求</b>

    中国满足各行业个性化需求的互连解决方案

    在当今竞争激烈的市场中,企业要想脱颖而出,除了具备出色的产品和服务,良好的口碑也是关键。中国坤以其卓越的口碑和面向全球的视野,成为了众多行业和个性化需求的互连解决方案的领军者。
    的头像 发表于 03-18 10:17 363次阅读

    水肥一体机远程监控解决方案

    水肥一体机远程监控解决方案 水肥一体机物联网解决方案,作为现代农业技术的尖端代表,深度融合了物联网、大数据分析以及智能控制等前沿科技手段,为
    的头像 发表于 03-13 15:27 575次阅读
    水肥<b class='flag-5'>一体</b>机远程监控<b class='flag-5'>解决方案</b>

    安富利推出基于Sysinno的iAeris室内空气质量一体化解决方案

    在传统的空气质量测量方式中,由于技术限制和操作复杂性,常常面临着耗时耗力、成本高昂、精度和准确性不足等挑战,同时难以满足实时可视需求。针对这问题,安富利凭借深厚的行业经验和技术积
    的头像 发表于 03-07 09:23 814次阅读

    打造专属高清视频转换器:满足个性化视频转换需求

    转换器成为了个理想的选择。 个性化需求满足 每个人都有自己特定的视频转换需求。有些人可能经常需要将某种特定格式的视频转换为另
    的头像 发表于 02-22 14:29 374次阅读