Spark渐进填充分区映射算法
大小:1.17 MB 人气: 2018-01-14 需要积分:3
标签:SPARK(19784)
分析Spark的作业执行机制,建立了执行效率模型和Shuffle过程模型,给出了分配适应度(AFD,allocation fitness degree)的定义,提出了算法的优化目标。根据模型的相关定义求解,设计了渐进填充分区映射算法(PFPM,progressive filling partitioning and mapping algorithm),通过扩展式分区和渐进填充映射,建立适应Reducer计算能力的数据分配方案,有效缩减Shuffle过程的同步延时,提高集群计算效率。实验表明该算法提高了Shuffle过程数据分配的合理性,优化了并行计算框架Spark的作业执行效率。
非常好我支持^.^
(0) 0%
不好我反对
(0) 0%
下载地址
Spark渐进填充分区映射算法下载
相关电子资料下载
- 天数智芯主导的DeepSpark开源社区发布百大应用开放平台24.06版本 436
- spark运行的基本流程 92
- Spark基于DPU的Native引擎算子卸载方案 180
- 百度前高管景鲲与朱凯华创立AI搜索公司,Genspark产品惊艳上线 458
- 关于Spark的从0实现30s内实时监控指标计算 111
- “Spark+Hive”在DPU环境下的性能测评 | OLAP数据库引擎选型白皮书(24版)DPU部分 212
- 芯科科技和Arduino合作创建SparkFun Thing Plus Matter板 234
- Sparkle撼与科技发布TBX-750FA-V2显卡坞,支持3.5槽厚显 243
- 如何注册星闪Sparklink设备媒体接入层标识、地址码? 246
- 如何利用DPU加速Spark大数据处理? | 总结篇 661