J4 ›› 2013, Vol. 48 ›› Issue (11): 99-104.
刘伍颖,易绵竹,张兴
LIU Wu-ying, YI Mian-zhu, ZHANG Xing
摘要:
低时空复杂度始终是多类别文本分类算法希望达到的性能。新闻文档集中Token频率分布的研究再次验证了Token频率分布普遍服从幂律。据此设计了一种新的多类别Token频率索引数据结构,并基于该数据结构提出了一种低时空复杂度的多类别文本分类算法。在TanCorp数据集上的实验结果表明该算法在多类别新闻文档分类应用中是时空高效的。
中图分类号:
[1] | 刘雅辉1,2,刘春阳3*,张铁赢1,程学旗1. 图索引技术研究综述[J]. J4, 2013, 48(11): 44-52. |
[2] | 于然1,2,刘春阳3*,靳小龙1,王元卓1,程学旗1. 基于多视角特征融合的中文垃圾微博过滤[J]. J4, 2013, 48(11): 53-58. |
[3] | 郑建兴,张博锋*,岳晓冬,成泽宇. 基于友邻-用户模型的微博主题推荐研究[J]. J4, 2013, 48(11): 59-65. |
[4] | 彭庆喜,钱铁云. 基于量化情感的网店垃圾评论检测[J]. J4, 2013, 48(11): 66-72. |
[5] | 黄亮,杜永萍. 基于信任关系的潜在好友推荐方法[J]. J4, 2013, 48(11): 73-79. |
[6] | 张乃洲1, 曹薇2, 陈珂锐1, 李石君3. 一种基于时间感知的搜索引擎模型[J]. J4, 2013, 48(11): 80-86. |
[7] | 陈珂锐,潘君. 基于扩展特征向量空间模型的 多源数据融合[J]. J4, 2013, 48(11): 87-92. |
[8] | 方志军,刘心韵,伍世虔,郑文娟. 基于子带加权融合的多尺度 Retinex图像增强算法[J]. J4, 2013, 48(11): 93-98. |
[9] | 李玉倩 刘林 李金屏. 视频分析中灰度直方图的叠加原理研究[J]. J4, 2009, 44(11): 63-67. |
[10] | 谢桦 林尚垣 任雪芳. 单向粗关系及数据通讯安全[J]. J4, 2009, 44(9): 93-96. |
[11] | 许洁萍1,殷宏宇1,范子文2. 基于近似子乐句的翻唱歌曲识别研究[J]. J4, 2013, 48(7): 68-71. |
|