%A 万中英,王明文,左家莉,万剑怡 %T 结合全局和局部信息的特征选择算法 %0 Journal Article %D 2016 %J 《山东大学学报(理学版)》 %R 10.6040/j.issn.1671-9352.1.2015.E17 %P 87-93 %V 51 %N 5 %U {http://lxbwk.njournal.sdu.edu.cn/CN/abstract/article_2596.shtml} %8 2016-05-20 %X 特征选择方法的优劣直接影响到文本分类的效果。传统的特征选择算法是以全局的方式来选取特征,这种方式忽视了局部特征对分类效果的影响,有时候甚至会导致很多训练文档没有特征。因此,在传统的特征选择方法主要考虑文档集全局特征的基础上,增加词对单篇文档的贡献率的考虑,并结合ALOFT方法,提出了一个结合全局和局部信息的特征选择算法(GLFS)。在路透社文档集及复旦文档集上的实验结果表明,本文提出的算法在保证每个文档都有特征词的同时提高了分类效果。最后讨论了对特征权重的确定方法,经过重新计算特征权重后分类效果有了较大的提高。