您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(理学版)》

J4

• 论文 • 上一篇    下一篇

基于类别核心词的朴素贝叶斯中文文本分类

袁 方,苑俊英   

  1. 河北大学数学与计算机学院, 河北 保定 071002
  • 收稿日期:2006-03-29 修回日期:1900-01-01 出版日期:2006-10-24 发布日期:2006-10-24
  • 通讯作者: 袁 方

Naive Bayes Chinese text classification based on core words of class

YUAN Fang,YUAN Jun-ying   

  1. College of Mathematics and Computer Science, Hebei Univ., Baoding 071002, Hebei, China
  • Received:2006-03-29 Revised:1900-01-01 Online:2006-10-24 Published:2006-10-24
  • Contact: YUAN Fang

摘要: 摘要及关键词中提取类别核心词,通过加权方式,强化它们在文本分类中的作用. 基于朴素贝叶斯分类方法的实验表明,提出的方法能够有效提高中文文本的分类准确率.

关键词: 文本分类, 朴素贝叶斯分类, 类别核心词

Abstract: Abstract:From the view of manual classification, words in title,abstract and key words are more important than others. A classification mode is advanced based on core words of class. This classification mode extracts core words from title, abstract and key words, and these core words' effect is strengthened via the mode of weight. The experiment of Naive Bayes classification indicates that this method can effectively improve classification precision of Chinese texts.

Key words: core words of the class , Naive Bayes classification, text classification

[1] 万中英,王明文,左家莉,万剑怡. 结合全局和局部信息的特征选择算法[J]. 山东大学学报(理学版), 2016, 51(5): 87-93.
[2] 马成龙, 姜亚松, 李艳玲, 张艳, 颜永红. 基于词矢量相似度的短文本分类[J]. 山东大学学报(理学版), 2014, 49(12): 18-22.
[3] 郑妍, 庞琳, 毕慧, 刘玮, 程工. 基于情感主题模型的特征选择方法[J]. 山东大学学报(理学版), 2014, 49(11): 74-81.
[4] 刘伍颖,易绵竹,张兴. 一种时空高效的多类别文本分类算法[J]. J4, 2013, 48(11): 99-104.
[5] 蒋盛益1,庞观松2,张建军3. 基于聚类的垃圾邮件识别技术研究[J]. J4, 2011, 46(5): 71-76.
[6] 黄贤立,罗冬梅. 倾向性文本迁移学习中的特征重要性研究[J]. J4, 2010, 45(7): 13-17.
[7] 袁晓航,杜小勇 . iRIPPER——一种改进的基于规则学习的文本分类算法[J]. J4, 2007, 42(11): 66-68 .
[8] 张华伟,王明文,甘丽新 . 基于随机森林的文本分类模型研究[J]. J4, 2006, 41(3): 139-143 .
[9] 万海平,何华灿,周延泉 . 局部核方法及其应用[J]. J4, 2006, 41(3): 18-20 .
[10] 余俊英,王明文,盛 俊 . 文本分类中的类别信息特征选择方法[J]. J4, 2006, 41(3): 144-148 .
[11] 张国英,沙 芸,江慧娜 . 基于粒子群优化的快速KNN分类算法[J]. J4, 2006, 41(3): 34-36 .
[12] 白如江,王效岳 . 基于粗糙集理论和BP神经网络的文本自动分类方法研究[J]. J4, 2006, 41(3): 70-75 .
[13] 李 森,马 军,赵 嫣,雷景生, . 对数字化科技论文的自动分类研究[J]. J4, 2006, 41(3): 81-84 .
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!