摘要: 出了根据邮件特征域信息和特征词频进行垃圾邮件过滤的新方法,并介绍在该方法中的文本特征选取、特征词典构造以及基于TF的权值计算等相关技术,以及改进的文本相似度计算概率模型.实验表明该方法在邮件过滤的查全率、查准率等几个性能评价指标上,比传统的Rocchio方法有了明显改善.
刘 慧,马 军,雷景生,连 莉 . 基于特征域词频的邮件过滤方法的研究[J]. J4, 2006, 41(3): 50-53 .
LIU Hui,MA Jun,LEI Jing-sheng,LIAN Li . Research on email filtering by the frequency of the terms in character fields[J]. J4, 2006, 41(3): 50-53 .