关联性驱动的大数据处理任务调度方案
大小:2.25 MB 人气: 2017-12-25 需要积分:3
目前大数据处理过程较少关注任务所处理数据间的依赖关系,在任务执行过程中可能产生大量数据迁移,影响数据处理效率.为减少数据迁移,提升任务执行性能,从数据关联性及数据本地性两个角度出发,提出了一种数据关联性驱动的大数据处理任务优化调度方案:D3S2(data_dependency_driven scheduling scheme).D3S2由两部分组成:(1)数据关联性感知的数据优化放置机制(dependency-aware placement mechanism,简称DAPM),根据日志信息挖掘数据关联性,进而将强关联的数据聚合并放置于相同机架上,减少了跨机架的数据迁移;(2)数据迁移代价感知的任务优化调度机制(transfer-aware scheduling mechanism,简称TASM),完成数据放置后,以数据本地性为约束,对任务进行统一调度,最小化任务执行过程中的数据迁移代价.DAPM和TASM互相提供决策依据,以任务执行代价最小化为目标不断迭代调整调度方案,直至最优任务调度方案.在Hadoop平台上进行的实验结果表明:较之原生Hadoop,在不增加作业完成时间的基础上,D3S2减少了作业执行过程中的数据迁移量。
非常好我支持^.^
(0) 0%
不好我反对
(0) 0%
下载地址
关联性驱动的大数据处理任务调度方案下载
相关电子资料下载
- 数据分析工具有哪几种模式 83
- 中交兴路入选2024北京“数据要素×”典型案例集 886
- 中国铁塔与海康威视达成战略合作 217
- spark运行的基本流程 91
- 季丰电子与孤波科技携手合作为车规量产提供大数据支持 740
- 智慧园区综合安防系统解决方案 83
- 大数据采集系统分为几类 269
- 如何在数字化时代实现精益生产的创新发展? 117
- 智慧水文监测系统 87
- 大数据分析平台网站 96