您好,欢迎来电子发烧友网! ,新用户?[免费注册]

您的位置:电子发烧友网>源码下载>数值算法/人工智能>

基于Supersonic的并行分组聚集

大小:1.22 MB 人气: 2017-12-25 需要积分:2

 针对在分析型联机分析处理( OLAP)应用中频繁出现的数据密集型操作符——分组聚集耗时较多的问题,提出Cache友好的分组聚集算法对该操作进行性能优化。首先,为充分发挥列存储在数据密集型计算方面的优势,采用基于开源的列存储查询执行引擎Supersonic,并在此之上设计Cache友好的分组聚集算法;其次,为加速查询的执行,使用并行技术,将单线程的分组聚集算法改为多线程并行的分组聚集算法。基于Supersonic设计并实现4种并行分组聚集算法:无共享Hash表并行分组聚集(NSHPCA)算法、表锁共享Hash表并行分组聚集(TLSHPGA)算法、桶锁共享Hash表并行分组聚集(BLSHPCA)算法、节点锁共享Hash表并行分组聚集(NLSHPCA)算法,且在不同的分组势集、不同的线程数的情况下,针对上述4种算法做了多组实验。通过对比3种不同粒度的共享Hash表并行分组聚集算法的加速比,得出NLSHPCA算法在加速比和并发度两方面表现最好,部分查询可达到10倍加速比;通过比较NSHPCA算法和NLSHPGA算法的加速比、Cache miss内存使用等情况,得出NLSHPCA算法在分组势榘大于8时,加速比超过NSHPGA算法,并且Cache miss更低,使用的内存更少。

基于Supersonic的并行分组聚集

非常好我支持^.^

(0) 0%

不好我反对

(0) 0%

      发表评论

      用户评论
      评价:好评中评差评

      发表评论,获取积分! 请遵守相关规定!