结合词向量和聚类算法的话题演进分析
大小:0.74 MB 人气: 2017-11-24 需要积分:0
标签:聚类算法(12092)
话题演进分析主要是挖掘话题内容随着时间流的演进情况。话题的内容可用关键词来表示。利用word2vec对75万篇新闻和微博文本进行训练,得到词向量模型。将文本流处理后输入模型,获得时间序列下所有词汇的词向量,利用K-means对词向量进行聚类,从而实现话题关键词的抽取。实验对比了基于PLSA和LDA主题模型下的话题抽取效果,发现本文的话题分析效果优于主题模型的方法。同时,采集足够大量、内容足够丰富的语料,可训练得到泛化能力比较强的模型,有利于实时话题演进分析研究工作。
非常好我支持^.^
(0) 0%
不好我反对
(0) 0%
下载地址
结合词向量和聚类算法的话题演进分析下载
相关电子资料下载
- 基于K-means聚类算法的图像分割 1113
- 介绍一种基于最小化平方误差的聚类算法 498
- 如何在 Python 中安装和使用顶级聚类算法 415
- 10种聚类算法和Python代码4 1118
- 10种聚类算法和Python代码3 960
- 10种聚类算法和Python代码2 796
- 10种聚类算法和Python代码1 644
- YOLOv5中的autoanchor.py代码解析 1242
- 视觉新范式!COCs:将图像视为点集 636
- 10种顶流聚类算法Python实现(附完整代码) 989