-
基于次相关特征和邻域互信息的在线多标记特征选择算法
- 程雨轩,毛煜,张小清,曾艺祥,林耀进
-
2024, 59(5):
70-81.
doi:10.6040/j.issn.1671-9352.7.2023.4523
-
摘要
(
372 )
HTML
(
2 )
PDF (7674KB)
(
266
)
收藏
-
参考文献 |
相关文章 |
多维度评价
为了充分地挖掘被单一度量指标算法忽略但对分类结果有利的特征,提出了基于次相关特征和邻域互信息的在线多标记特征选择算法,通过计算得到的新到达特征的重要性以及相关度,分析其显著性的区别,将特征区分为显著特征以及次相关特征。利用邻域交互信息对新到达的特征与已选特征集合进行冗余性分析,剔除依赖度较低的特征,以此逐步提升特征子集的质量。构建了基于全局的线性和非线性关系的度量指标,并以此来计算特征的局部相关度,有效地挖掘次相关特征。充分考虑特征空间中次相关特征存在的问题,将次相关特征从特征集合中剥离并单独保存,使之在冗余分析阶段不会因显著特征对度量指标敏感度高所产生的影响而被剔除出特征集合。建立了特征选择指标,利用迭代策略根据指标进行特征选择。实验结果表明,该算法具有很好的有效性和稳定性。