基于Supersonic的并行分组聚集
大小:1.22 MB 人气: 2017-12-25 需要积分:2
标签:并行(18782)
针对在分析型联机分析处理( OLAP)应用中频繁出现的数据密集型操作符——分组聚集耗时较多的问题,提出Cache友好的分组聚集算法对该操作进行性能优化。首先,为充分发挥列存储在数据密集型计算方面的优势,采用基于开源的列存储查询执行引擎Supersonic,并在此之上设计Cache友好的分组聚集算法;其次,为加速查询的执行,使用并行技术,将单线程的分组聚集算法改为多线程并行的分组聚集算法。基于Supersonic设计并实现4种并行分组聚集算法:无共享Hash表并行分组聚集(NSHPCA)算法、表锁共享Hash表并行分组聚集(TLSHPGA)算法、桶锁共享Hash表并行分组聚集(BLSHPCA)算法、节点锁共享Hash表并行分组聚集(NLSHPCA)算法,且在不同的分组势集、不同的线程数的情况下,针对上述4种算法做了多组实验。通过对比3种不同粒度的共享Hash表并行分组聚集算法的加速比,得出NLSHPCA算法在加速比和并发度两方面表现最好,部分查询可达到10倍加速比;通过比较NSHPCA算法和NLSHPGA算法的加速比、Cache miss内存使用等情况,得出NLSHPCA算法在分组势榘大于8时,加速比超过NSHPGA算法,并且Cache miss更低,使用的内存更少。
非常好我支持^.^
(0) 0%
不好我反对
(0) 0%