基于IG_ CDmRMR的二阶段特征选择方法
朱文峰; 于舒娟; 何伟
【期刊名称】《《计算机工程》》
【年(卷),期】2019(045)009
【摘要】为提高特征提取方法的文本分类精确度,结合信息增益(IG)和改进的最大相关最小冗余(mRMR),提出一种IG_CDmRMR二阶段文本特征选择方法.通过IG提取与类别相关性较强的特征集合,利用类差分度动态改变mRMR中特征与类别之间的互信息值权重,并筛选最优特征子集,从而得到文本分类结果.实验结果表明,与IG方法、IG mRMR方法相比,在特征数量相同的情况下,该方法可使准确率提升约2%.
【总页数】6页(183-187,193)
【关键词】信息增益; 最大相关最小冗余; 类差分度; 特征选择; 文本分类
【作者】朱文峰; 于舒娟; 何伟
【作者单位】南京邮电大学电子与光学工程学院南京210000
【正文语种】中文
【中图分类】TP391
【相关文献】
1.一种综合的二阶段无监督特征选择方法 [J], 吕靖; 童若锋
2.一种用于阿尔茨海默病分类的二阶段多任务特征选择算法 [J], 杨晨晖; 侯超群
3.基于词频分布信息的优化IG特征选择方法 [J], 刘海峰; 刘守生; 宋阿羚
4.集合CHI与IG的特征选择方法 [J], 王光; 邱云飞; 史庆伟
5.混合CHI与IG的特征选择方法研究 [J], 唐康; 汪海涛; 姜瑛; 陈星