资料介绍
文本分类是文本数据挖掘中一个非常重要的技术,已经被广泛地应用于信息管理、搜
索引擎、推荐系统等多个领域。现有的文本分类方法,大多是基于向量空间模型的算法。这些算法很难适用于大规模的文本数据集。为此,我们提出了一种基于遗传算法和信息熵的文本分类规则抽取方法。在该方法中,信息熵技术用来辅助遗传算法初始种群的生成。遗传算法和信息熵的有效集成,极大地提高了该混合方法的分类效率。实验结果表明,本文方法适用于大规模文本数据集;该方法提取规则的分类正确率较高,分类速度较快。
关键词:文本分类;遗传算法;信息熵;文本挖掘
Extraction Method of Text Classification Rule Based on Genetic Algorithm and Information
Entropy ZHOU Guoping 1, 2, PENG Xiangmei 1, HUANG Guobing 1
(1. Xinyu College, Xinyu, 338031, China;
2. Department of computer science, Nanchang College, Xinyu, 338031, China)
Abstract:Text classification is a very important technique in the field of text mining, and it has been widely applied to the information management, search engine, recommendation systems, and some other fields. Most classification methods are based on vector models, these approaches are highly complicated on computation, and cannot be used on the occasion of classifying a large number of samples. For this reason, a hybrid approach combining genetic algorithm with information entropy is presented for text classification rule extraction. In this hybrid approach, the information entropy technique is applied to assist the generation of initial populations for genetic algorithm. The classification performance of the proposed approach has been improved largely by integrating genetic algorithm with information entropy effectively. The proposed approach can be applied to classify a large number of samples. Experimental results show that both the accuracy and the speed of categorization are high.
Keywords:Text classification; genetic algorithm; information entropy; text mining
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
- 基于注意力机制的新闻文本分类模型 30次下载
- 基于LSTM的表示学习-文本分类模型 18次下载
- 基于主题分布优化的模糊文本分类方法 5次下载
- 一种面向维吾尔语的停用词抽取方法 3次下载
- 基于不同神经网络的文本分类方法研究对比 49次下载
- 融合文本分类和摘要的多任务学习摘要模型 11次下载
- 一种基于BERT模型的社交电商文本分类算法 8次下载
- 集成WL-CNN和SL-Bi-LSTM的旅游问句文本分类算法 6次下载
- 结合BERT模型的中文文本分类算法 6次下载
- 基于深度神经网络的文本分类分析 37次下载
- 如何使用Spark计算框架进行分布式文本分类方法的研究 3次下载
- 融合词语类别特征和语义的短文本分类方法 0次下载
- 基于apiori算法改进的knn文本分类方法 9次下载
- 用于文本分类和文本聚类的特征抽取方法的研究
- 基于文章标题信息的汉语自动文本分类
- 卷积神经网络在文本分类领域的应用 779次阅读
- 人工智能中文本分类的基本原理和关键技术 1361次阅读
- Instruct-UIE:信息抽取统一大模型 1763次阅读
- 基于统一语义匹配的通用信息抽取框架USM 1145次阅读
- 文本分类中处理样本不均衡和提升模型鲁棒性的trick 1076次阅读
- 使用朴素贝叶斯和GPU进行更快的文本分类 1346次阅读
- 如何统一各种信息抽取任务的输入和输出 1317次阅读
- 带你从头构建文本分类器 3640次阅读
- 训练一个机器学习模型,实现了根据基于文本分析预测葡萄酒质量 6187次阅读
- SiATL——最新、最简易的迁移学习方法 3651次阅读
- 探讨深度文本分类之DPCNN原理与代码 3406次阅读
- 如何为文本分类任务选择正确的模型,这里有一个完整流程图! 1.2w次阅读
- 总结Tensorflow纯干货学习资源,分为教程、视频和项目三大板块 1.1w次阅读
- 基于概率的常见的分类方法--朴素贝叶斯 5263次阅读
- 详细解析scikit-learn进行文本分类 4760次阅读
下载排行
本周
- 1电子电路原理第七版PDF电子教材免费下载
- 0.00 MB | 1490次下载 | 免费
- 2单片机典型实例介绍
- 18.19 MB | 93次下载 | 1 积分
- 3S7-200PLC编程实例详细资料
- 1.17 MB | 27次下载 | 1 积分
- 4笔记本电脑主板的元件识别和讲解说明
- 4.28 MB | 18次下载 | 4 积分
- 5开关电源原理及各功能电路详解
- 0.38 MB | 10次下载 | 免费
- 6基于AT89C2051/4051单片机编程器的实验
- 0.11 MB | 4次下载 | 免费
- 7基于单片机和 SG3525的程控开关电源设计
- 0.23 MB | 3次下载 | 免费
- 8基于单片机的红外风扇遥控
- 0.23 MB | 3次下载 | 免费
本月
- 1OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234313次下载 | 免费
- 2PADS 9.0 2009最新版 -下载
- 0.00 MB | 66304次下载 | 免费
- 3protel99下载protel99软件下载(中文版)
- 0.00 MB | 51209次下载 | 免费
- 4LabView 8.0 专业版下载 (3CD完整版)
- 0.00 MB | 51043次下载 | 免费
- 5555集成电路应用800例(新编版)
- 0.00 MB | 33562次下载 | 免费
- 6接口电路图大全
- 未知 | 30320次下载 | 免费
- 7Multisim 10下载Multisim 10 中文版
- 0.00 MB | 28588次下载 | 免费
- 8开关电源设计实例指南
- 未知 | 21539次下载 | 免费
总榜
- 1matlab软件下载入口
- 未知 | 935053次下载 | 免费
- 2protel99se软件下载(可英文版转中文版)
- 78.1 MB | 537791次下载 | 免费
- 3MATLAB 7.1 下载 (含软件介绍)
- 未知 | 420026次下载 | 免费
- 4OrCAD10.5下载OrCAD10.5中文版软件
- 0.00 MB | 234313次下载 | 免费
- 5Altium DXP2002下载入口
- 未知 | 233046次下载 | 免费
- 6电路仿真软件multisim 10.0免费下载
- 340992 | 191183次下载 | 免费
- 7十天学会AVR单片机与C语言视频教程 下载
- 158M | 183277次下载 | 免费
- 8proe5.0野火版下载(中文版免费下载)
- 未知 | 138039次下载 | 免费
评论