首页: 电子电路图,电子技术资料网站首页

电子资料下载: 电子资料下载频道 -- 为电子工程师提供激发创新灵感的新方案、新的参考设计、新的设计构想等可下载的电子资料！

电子技术应用: 电子技术应用频道 -- 为电子工程师提供电子产品设计所需的技术分析、设计技巧、设计工具、测试工具等技术文章！

电子元器件: 专业的电子元器件平台 -- 及时发布大量最新IC、分立器件、模组等电子元器件产品信息！

电子电路图: 电路图频道 -- 提供电子电路图,原理图,汽车电路图,手机电路图,功放电路图,电源电路图等电路图纸

电子技术论坛: 构建电子工程师交流的平台 -- 在交流中进一步学习设计技巧、规划技术人生、提升自我价值！

源码下载: 源码下载频道; uCOS编程 C/C++语言编程 Symbian编程 Linux/uClinux/Unix编程 Windows编程 matlab源程序 php源码下载 asp.net源码下载 java源码下载汇编编程驱动程序单片机编程数值算法/人工智能

您的位置：电子发烧友网>源码下载>数值算法/人工智能>

基于词频信息的改进的IG文本特征选择算法

大小：0.56 MB 人气： 2018-01-25 需要积分：2

推荐 + 挑错 + 收藏(0) + 用户评论（0）

普通下载 VIP下载免积分海量资料下载

分享到:

PCB打样、加工，最快24小时交货

标签：信息(35446)选择算法(8913)

　　向量空间的高维性和文档表示向量的稀疏性不但增加了分类的时间复杂度和空间复杂度，而且还大大影响到分类的精度，因此，特征选择显得特别重要。目前，文本分类研究中常用的特征选择算法主要有：文档频度、互信息、信息增益、开方拟合检验、期望交叉熵、特征权和文本证据权等。Ng等比较了文档频率（ Document Frequency，DF）、信息增益（Information Cain，IG）、互信息（Mutual Information，MI）、开方拟合检验（X2 -test，CHI）和特征权（Term Strength，TS）五种特征选择算法，得出IC、DF和CHI比MI和TS效果好的结论。Yang等研究得出IC是最有效的特征选择算法之一的结论。目前IC已成为文本分类研究中常用的特征选择算法。因此，寻找该方法中的不足，并针对不足作出有效的改进，提高特征提取的效率具有非常重要的现实意义。

　　近年来，一些学者针对IG算法的不足作了一些改进工作。李文斌等提出了三种基于特征信息增益权重的分类算法，通过添加权重系数来平衡“正贡献”和“负贡献”的特征项对分类的影响，但是由于权重系数的设置是根据人为的经验设定．所以存在很大的偶然性，且不适用于各种情形。黄秀丽等针对传统IC算法过分看重高频特征项的缺点，提出一种强调中低频特征项的改进的算法SIC，此算法在一定程度上提高了特征选择的效率，但算法中没有考虑到特征项在不同类别的分布差异对分类能力的影响。郭颂等在以上改进算法的基础上，通过引入特征分布差异因子、类内和类间加权因子，提出一种加权的IC改进算法，该方法比较全面地考虑到了词频对特征提取的作用，但此算法没有考虑到特征项在类内位置上分布对算法的影响。本文针对上述改进算法的不足之处，充分考虑特征项频数对分类能力的作用，提出一种基于词频的改进的IC特征选择算法。

非常好我支持^.^

(0) 0%

不好我反对

(0) 0%

下载地址

不能下载？请通知我们

基于词频信息的改进的IG文本特征选择算法下载

电信下载联通下载

海量PCB软件教程下载华强PCB技术中心，海量PCB软件教程下载！

用户评论

发表评论即可获得积分！ 详见积分规则

基于词频信息的改进的IG文本特征选择算法

下载地址

基于词频信息的改进的IG文本特征选择算法下载

相关电子资料下载

用户评论

发表评论

分享你我的电子世界

实用电子设计资料下载

源码下载排行

热门词