J4 ›› 2009, Vol. 44 ›› Issue (11): 48-51.
杨玉珍,刘培玉*,朱振方,邱烨
杨玉珍,刘培玉*,朱振方,邱烨
摘要:
在特征项分布不平衡的情况下,传统信息增益算法的分类性能会急剧下降,针对此缺陷提出了一种利用特征项分布信息来改进信息增益公式的计算方法。通过计算特征项分布信息来判定特征项是否存在不平衡性,并利用此信息来平衡特征项不出现时对分类精度的影响。通过实验验证,改进后的计算方法整体上比传统的信息增益算法具有更好的性能。
中图分类号:
[1] | 刘惊雷 王玲玲 张伟. 角色分配格的生成算法[J]. J4, 2009, 44(11): 52-56. |
[2] | 周小强 刘任任. P*4中保二元正则可离关系非最小覆盖的剔除[J]. J4, 2008, 43(12): 24-27. |
|