基于聚类和Spark框架的加权Slope One算法
大小:0.91 MB 人气: 2017-12-03 需要积分:1
针对传统Slope One算法在相似性计算时未考虑项目属性信息和时间因素对项目相似性计算的影响,以及推荐在当前大数据背景下面临的计算复杂度高、处理速度慢的问题,提出了一种基于聚类和Spark框架的加权Slope One算法。首先,将时间权重加入到传统的项目评分相似性计算中,并引入项目属性相似性生成项目综合相似度;然后,结合Canopy-K-means聚类算法生成最近邻居集;最后,利用Spark计算框架对数据进行分区迭代计算,实现该算法的并行化。实验结果表明,基于Spark框架的改进算法与传统Slope One算法、基于用户相似性的加权Slope One算法相比,评分预测准确性更高,较Hadoop平台下的运行效率平均可提高3.5 -5倍,更适合应用于大规模数据集的推荐。
非常好我支持^.^
(0) 0%
不好我反对
(0) 0%
下载地址
基于聚类和Spark框架的加权Slope One算法下载
相关电子资料下载
- 天数智芯主导的DeepSpark开源社区发布百大应用开放平台24.06版本 436
- spark运行的基本流程 91
- Spark基于DPU的Native引擎算子卸载方案 180
- 百度前高管景鲲与朱凯华创立AI搜索公司,Genspark产品惊艳上线 458
- 关于Spark的从0实现30s内实时监控指标计算 111
- “Spark+Hive”在DPU环境下的性能测评 | OLAP数据库引擎选型白皮书(24版)DPU部分 212
- 芯科科技和Arduino合作创建SparkFun Thing Plus Matter板 234
- Sparkle撼与科技发布TBX-750FA-V2显卡坞,支持3.5槽厚显 243
- 如何注册星闪Sparklink设备媒体接入层标识、地址码? 246
- 如何利用DPU加速Spark大数据处理? | 总结篇 661