基于话题标签和转发的微博聚类和主题词提取
大小:0.79 MB 人气: 2017-12-23 需要积分:1
标签:聚类(14184)
针对微博聚类正确率不高的问题,在研究微博数据特点的基础上,利用微博hashtag来增强向量空间模型,使用微博之间的转发关系提升聚类的准确性,并利用微博的转发、评论数以及微博发布者信息来提取聚类中的主题词。在新浪微博数据集上进行实验发现,与k-means算法和基于加权语义和贝叶斯的中文短文本增量聚类算法(ICST-WSNB)相比,基于话题标签和转发关系的微博聚类算法的准确率比k-means算法提高了18.5%,比ICST-WSNB提高了6.48%,召回率以及F-值也有了一定的提高。实验结果表明基于话题标签和转发关系的微博聚类算法能够有效地提高微博聚类的正确率,进而获取更加合适的主题词。
非常好我支持^.^
(0) 0%
不好我反对
(0) 0%
下载地址
基于话题标签和转发的微博聚类和主题词提取下载
相关电子资料下载
- 对新辅助TCHP治疗响应的HER2+乳腺癌空间蛋白质组特征 547
- 使用轮廓分数提升时间序列聚类的表现 316
- 基于K-means聚类算法的图像分割 1113
- 介绍一种基于最小化平方误差的聚类算法 498
- 介绍一种基于分层聚类方法的木马通信行为检测模型 1060
- 深度学习聚类的综述 780
- 聚类分析中的机器学习与统计方法综述(二) 679
- 如何在 Python 中安装和使用顶级聚类算法 415
- 聚类分析中的机器学习与统计方法综述(一) 638
- 机器学习之分类分析与聚类分析 3550