基于Hadoop平台的LDA算法的并行化实现
大小:0.88 MB 人气: 2017-12-05 需要积分:3
随着互联网的飞速发展,需要处理的数据量不断增加,在互联网数据挖掘领域中传统的单机文本聚类算法无法满足海量数据处理的要求,针对在单机情况下,传统LDA算法无法分析处理大规模语料集的问题,提出基于MapReduce计算框架,采用Gibbs抽样方法的并行化LDA主题模型的建立方法。利用分布式计算框架MapReduce研究了LDA主题模型的并行化实现,并且考察了该并行计算程序的计算性能。通过对Hadoop并行计算与单机计算进行实验对比,发现该方法在处理大规模语料时,能够较大地提升算法的运行速度,并且随着集群节点数的增加,在加速比方面也有较好的表现。基于Hadoop平台并行化地实现LDA算法具有可行性,解决了单机无法分析大规模语料集中潜藏主题信息的问题。
非常好我支持^.^
(0) 0%
不好我反对
(0) 0%
下载地址
基于Hadoop平台的LDA算法的并行化实现下载
相关电子资料下载
- QCC5181QCC3086QCC3084QCC3083 USB Audio 96K/24bit LDAC 738
- QCC5181蓝牙音频发射LDAC APTX 549
- 华为5G移动核心网在GlobalData连续六年摘得桂冠 305
- 华为5G移动核心网在GlobalData连续六年排名第一 363
- QCC5181QCC3083QCC3084支持LDAC APTX LOSSLESS 3429
- Hadoop是什么?其核心由两大部分组成,分别是什么? 1188
- 带分区的大规模LDAP介绍 312
- SLDA副会长单位旭宇光电获“国家知识产权示范企业” 786
- java 8的日期用法 285
- Java时间类转换方案 326