基于MapReduce数据流相似性搜索并行算法
大小:0.92 MB 人气: 2017-12-07 需要积分:2
设计时间序列数据在Hadoop分布式文件系统(HDFS)中的有效存储方式,利用分布式缓存工具Distributed Cache将各子序列分发到Hadoop集群的计算节点上,将动态时间弯曲距离矩阵划分成多个子矩阵,采取并行迭代计算每条反对角线上子矩阵的方法,基于MapReduce编程模型,实现高效并行计算时间序列动态弯曲距离,通过改进剪裁冗余计算方法,设计实现一种数据流多模式相似性搜索并行算法。中国雪深长时间序列数据集的实验结果表明,当每条时间序列的长度达到5000以上时,并行计算动态弯曲距离所需时间少于串行计算所需时间,当每条时间序列的长度达到9000以上时,参与计算的集群节点越多,并行计算所需时间越少;当模式长度达到4000、参与计算的集群节点数达5个以上时,从数据流中并行搜索出与模式匹配的相似子序列所需时间约为串行搜索所需时间的20%。
非常好我支持^.^
(0) 0%
不好我反对
(0) 0%
下载地址
基于MapReduce数据流相似性搜索并行算法下载
相关电子资料下载
- 倍加福打造工业4.0解决方案 实现无缝数据流通 3786
- 比无缝漫游更高级的无感漫游,你听说过吗? 234
- 2024年春节通信行业网络运行安全稳定,移动数据流量与漫游业务大幅增长 363
- 8-1多路复用器有哪些应用场景呢 627
- 实时交换机与非实时交换机的区别是什么? 1703
- 传输控制协议TCP特点及三次握手过程 845
- 可重构数据流计算引领架构创新 639
- labview编写程序的一般步骤 1191
- 《爱立信移动市场报告》:5G强劲成长-全球移动数据流量在未来六年增长三倍 512
- 传输层的主要功能是什么 1802