0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

“Spark+Hive”在DPU环境下的性能测评 | OLAP数据库引擎选型白皮书(24版)DPU部分节选

中科驭数 来源:中科驭数 作者:中科驭数 2024-05-30 16:09 次阅读

近年来,大数据行业的蓬勃发展除了来自软件层的持续迭代与创新,更有赖于计算机硬件环境的持续优化,尤其是在芯片操作系统国产化的大趋势下,硬件升级带来的性能提升、成本降低、并行处理能力优化、存储与网络优化、安全风险管控等均为数据引擎的发展提供了阶梯式进步的空间。在奇点云2024年版《OLAP数据库引擎选型白皮书》中,中科驭数联合奇点云针对Spark+Hive这类大数据计算场景下的主力引擎,测评DPU环境下对比CPU环境下的性能提升效果。特此节选该章节内容,与大家共享。

DPU概述

什么是DPU?为什么要关注DPU?

DPU(Data Processing Unit)是以数据为中心构造的专用处理器,采用软件定义技术路线支撑基础设施层资源虚拟化,支持存储、安全、服务质量管理等基础设施层服务。提到DPU,2020年英伟达CEO黄仁勋在其GTC大会上的一句话引起业界高度关注:“DPU 将成为未来计算的三大支柱之一,未来的数据中心标配是“ CPU + DPU + GPU”。NVIDIA GTC 2020(英伟达2020年GPU技术大会)上,其CEO黄仁勋的一句话引起了业界高度关注:“DPU 将成为未来计算的三大支柱之一,未来的数据中心标配是CPU + DPU + GPU。”DPU的设计思路,是将“CPU处理效率低下、GPU处理不了”的负载卸载到专用DPU,提升整个计算系统的效率、降低整体系统的总体拥有成本(TCO,Total Cost of Ownership),以实现底层基础设施的“降本增效”。DPU最直接的作用是作为CPU的卸载引擎,接管网络虚拟化、硬件资源池化等基础设施层服务,释放CPU的算力到上层应用。对比CPU、GPU与DPU:

CPU面向应用程序,负责进行系统管理维持软硬件生态;

GPU面向科学计算,负责进行规则计算支持数据级并行应用;

DPU面向数据中心基础设施,负责进行异构计算支撑卸载网络、存储、安全业务等降低“Datacenter Tax”。

DPU与CPU最大的区别是,DPU是IO密集型,而GPU是计算密集型。CPU通过间接手段来支持网络IO,其前端总线带宽也主要匹配主存(特别是DDR)的带宽,而非网络IO的带宽;DPU的IO带宽则几乎可以与网络带宽等同,其在支持强IO基础上具备强算力。DPU的出现并非偶然,而是IT产业发展到一定阶段的必然选择。随着AI5G等技术的发展,端、边、云各处的计算节点暴露在了剧增的数据量下,CPU的性能增长率与数据量增长率出现了“剪刀差”现象。同时,以数据为中心的新兴应用对数据的实时处理提出了越来越高的要求。DPU则可以在数据流上就近计算,实现数据处理的低时延和高吞吐,更具灵活性与效率。业内越来越多观点认为,CPU+DPU的异构计算解决方案将是应对大数据性能瓶颈的新趋势,DPU也越来越得到数据中心运营商和大数据软件厂商的关注。因此,本书选择“Spark+Hive”(大数据计算场景下的主力引擎)为代表,进行了DPU与CPU环境下的性能对比测评,为读者提供参考。

DPU如何实现加速?有哪些应用场景?

针对Spark+Hive的大数据计算场景测试,本次测评的技术方案中除了引入中科驭数Spark-Race解决方案中最底层的DPU硬件(面向数据中心的专用处理器)、HADOS平台层(异构软件开发平台)外,也包含专门针对Spark的DPU加速层,其最核心的能力就是修改查询计划树。简单来讲就是通过 Spark Plugin的机制(作为Spark插件),把 Spark 查询计划拦截并下发给 DPU来执行,跳过原生 Spark 不高效的执行路径。整体的执行框架仍沿用 Spark 既有实现,包括消费接口、资源和执行调度、查询计划优化、上下游集成等,用户可以直接使用已有的代码,“无痛”享受DPU带来的性能提升。

中科驭数介绍,DPU环境对超大业务表或宽表的join联合查询场景有突破性的优化效果。例如,对于连续join 4张100万条数据的维表,在CPU模式下全部time out(3600s),而DPU模式下只需数百秒即可查询出结果,计算加速比达到8.4倍。在应对涉及复杂SQL多表查询的挑战时,Spark-Race 2.0的优势也尤为突出。因此,本书就“Spark+Hive”引擎(包括高复杂度的数据查询任务场景),进行了测试和检验。

DPU测试方案说明

测评方案概述

DPU测评方案仍沿用引擎测评模型2.0,在相同环境与资源配置前提下,分别在底层硬件资源开启DPU模型与不开启DPU模式下,执行本次测评SQL用例三次,采集SQL执行耗时、整机CPU、整机内存消耗等核心数据进行对比实验。在测试过程中,除底层硬件资源开启/关闭DPU加速功能外,保持DPU和CPU对比实验环境的主机与网络环境一致,大数据计算引擎Hive、Yarn、Spark配置一致,测评工具(即模型2.0)一致,测试表与数据一致。

环境参数说明

机器资源配置:12C/144G/6T 物理机1台;2C/144G/3T物理机2台

测试工具、测试数据集、模型维度、指标与引擎测评模型2.0保持一致,具体参数信息详见附录。

中科驭数DPU性能测试结果

经过对比测试,在数据计算和处理场景中,DPU环境相较于CPU环境下的查询性能提升能达到50%-60%,且DPU环境下整体较CPU环境的峰值性能资源有优化,整机CPU峰值降低24%,内存消耗降低50%且波动更平稳。

数据处理场景下,SQL性能提升50%

在数据处理相关的场景,如TPC-DS标准SQL和行业典型场景SQL的测试用例下,DPU模式下占优的用例数明显高于CPU模式下占优的用例数,且从相同SQL用例的查询耗时数据来看,DPU模式下的耗时相较于CPU模式有50%-60%的提升。

wKgaomZYNDiAXNiyAACUUyvEjrw026.png

注:性能对比计算公式,针对执行结果数据(CPU-DPU)/CPU

表:DPU模式对比CPU模式下SQL查询耗时性能结果表

DPU环境下的整机CPU峰值高位较CPU环境降低24%

从测试过程中采集到的整机CPU峰值数据来看,DPU环境下的整机CPU峰值高位比CPU环境下整机CPU峰值高位低24%左右,配合大数据平台完善的调度体系,可以实现更多的任务并行。

DPU环境较CPU环境可以降低50%的内存配置,内存消耗走势更平稳

测试过程中采集到的内存消耗数据来看,DPU环境在测试执行过程中内存消耗走势更平稳,且整体峰值相较于CPU环境更低。从性能优化的角度来看,DPU环境相较于CPU环境降低50%左右的内存配置,即本次实验DPU环境内存可从128G降为64G。

附录:测评环境与数据详细说明

以下针对本次测评的测试环境、资源参数、测试数据集进行说明:

测试环境 操作系统:CentOS 7.9芯片:Intel Cascade Lake 3.0 16C/64G
机器资源配置 16C/64G/3T物理机2台16C/64G/6T物理机1台
数据规模 总数据量2.8T,213亿行数据
数据类型 业内标准测试数据:400G
• TPC-DS:300G。数据总量22亿5873万,最大表数据量8亿6400万
• PC-H:100G。数据总量约8亿6604万,最大表数据6亿条
各行业构造数据:合计138亿5111万
• 泛零售:最大表数据10亿条,场景合集数据条数:24亿8284万
• 金融:最大表数据10亿条,26亿300万条
• 制造:最大表数据10亿条,75亿300万条
• 政企:最大表数据3亿条,7亿6172万条
• 地产:最大表数据5亿条,5亿100万
标准业务表构造数据:合计43亿2440万
• 业务表:最大表数据20亿条
• 宽表:3亿条,130+维度


审核编辑 黄宇

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据库
    +关注

    关注

    7

    文章

    3643

    浏览量

    63748
  • DPU
    DPU
    +关注

    关注

    0

    文章

    323

    浏览量

    24004
  • OLAP
    +关注

    关注

    0

    文章

    24

    浏览量

    10050
  • SPARK
    +关注

    关注

    1

    文章

    103

    浏览量

    19783
  • hive
    +关注

    关注

    0

    文章

    11

    浏览量

    3806
收藏 人收藏

    评论

    相关推荐

    数据处理器:DPU编程入门》读书笔记

    ,实现了由传统基础设施到现代基于“零信任”环境的转型,可对数据中心的每个用户进行身份认证,保障了企业从云到核心数据中心,再到边缘的安全性,同时效率和
    发表于 12-21 10:47

    数据处理器:DPU编程入门》DPU计算入门书籍测评

    一、DPU计算框架 通过一周多的时间翻阅这本书,基本上这本书是一本比较全面的,面向架构的新手指导数据。它在书中详尽介绍了关于DPU计算机架构中的应用。 对于
    发表于 12-24 10:54

    jAVA语言环境白皮书

    jAVA语言环境白皮书The Java Language Environment (A White Paper)1. Introduction to Java
    发表于 10-14 17:35

    【经典】智能电网白皮书资料汇编

    Xcel能源公司的智能电网白皮书思科白皮书:智能电网电力基础设施减少温室气体排放量方面发挥的作用国家电网:智能电网知识读本智能电网技术综述谈国外智能电网研究对建设中国智能电网的影响
    发表于 12-23 20:15

    最新的智能电网的白皮书资料

    看。IBM 智慧电力解决方案一览(电网部分)ADI:设计提高能效的智能电网系统Maxim公司智能电网方案指南飞思卡尔智能电网、智能电表解决方案手册(2010年)美国Xcel能源公司的智能电网白皮书思科
    发表于 12-23 21:08

    ZigBee白皮书

    ZigBee白皮书
    发表于 08-20 09:50

    分享个白皮书!《PCB设计秘籍》

    精选白皮书——《PCB设计秘籍》分类解答PCB设计过程中的设计技巧及常见问题,包含:1、高度ADC PCB布局布线规则及技巧2、电路散热技巧3、开关稳压器的接地处理4、高温环境的封装考虑因素5、最大程度提高PCB对电源变化抗扰
    发表于 12-24 16:31

    业内首部白皮书DPU技术白皮书》——中科院计算所主编

    将CPU的算力释放给应用程序。DPU的出现也许是体系结构朝着专用化路线发展的又一个里程碑。本白皮书将重点分析DPU产生的背景、技术特征、软硬件参考架构,应用场景、并对目前已经公布的DPU
    发表于 03-14 17:30

    什么是DPU

    DPU则进行数据处理。” 什么是DPU数据处理器 基于行业标准,高性能及软件可编程的多核CPU 高
    发表于 11-03 10:55

    中科驭数等单位牵头发布行业首部DPU评测方法技术白皮书

    专委联合编写发布的《专用数据处理器(DPU性能基准评测方法与实现》技术白皮书隆重发布。 本白皮书针对现阶段
    的头像 发表于 08-02 14:45 1052次阅读
    中科驭数等单位牵头发布行业首部<b class='flag-5'>DPU</b>评测方法技术<b class='flag-5'>白皮书</b>

    芯启源参与撰写的中国移动DPU技术白皮书正式发布

    7月29日,在2022全球数字经济大会“先进计算与智慧核芯发展论坛”中,芯启源参与撰写的《中国移动DPU技术白皮书》正式发布,芯启源董事长、CEO卢笙受邀参加发布仪式。 《中国移动DPU技术
    发表于 08-02 18:23 763次阅读

    被称为数据中心“第三颗主力芯片”,DPU凭什么?

    2021年10月至今,中科院计算所面向全行业先后发布了《专用数据处理器(DPU)技术白皮书》和《专用数据处理器(DPU
    发表于 10-18 15:09 664次阅读
    被称为<b class='flag-5'>数据</b>中心“第三颗主力芯片”,<b class='flag-5'>DPU</b>凭什么?

    DPU在通信云里的重要角色:中国联通白皮书解读

    DPU作为继CPU和GPU之后的第三大核心基础性算力大芯片,之前已有很多解读文章,不过大部分集中在公有云场景,譬如CPU算力卸载和降本增效等。而这篇白皮书肯定了DPU在运营商网络域NF
    的头像 发表于 08-31 16:45 532次阅读
    <b class='flag-5'>DPU</b>在通信云里的重要角色:中国联通<b class='flag-5'>白皮书</b>解读

    中国DPU行业白皮书

    头豹研究院谨此发布《 2022 年中国 DPU 行业白皮书》。本报告旨在分析 DPU 发展现状、产品特点、技术动向及发展趋势,并识别中国芯片厂商与海外芯片厂商的差异,从而判断中国DPU
    发表于 07-07 15:59 37次下载

    中科驭数助力奇点云《2024 OLAP数据库引擎选型白皮书》发布

    5月28日,奇点云2024 StartDT Day数智科技大会暨产品发布会召开,同期发布了2024年版《OLAP数据库引擎选型白皮书》,为业
    的头像 发表于 05-30 09:50 172次阅读
    中科驭数助力奇点云《2024 <b class='flag-5'>OLAP</b><b class='flag-5'>数据库</b><b class='flag-5'>引擎</b><b class='flag-5'>选型</b><b class='flag-5'>白皮书</b>》发布