您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(理学版)》

J4

• 论文 • 上一篇    下一篇

基于兴趣相似性的Web用户聚类

张文东,易轶虎   

  1. 中国石油大学计算机与通信工程学院, 山东 东营 257061
  • 收稿日期:2006-03-29 修回日期:1900-01-01 出版日期:2006-10-24 发布日期:2006-10-24
  • 通讯作者: 张文东

AClustering Web user based on interest similarity

ZHANG Wen-dong,YI Yi-hu   

  1. Institute of Compute & Communication Engineering, China University of Petroleum, Dongying 257061, Shangdong, China
  • Received:2006-03-29 Revised:1900-01-01 Online:2006-10-24 Published:2006-10-24
  • Contact: ZHANG Wen-dong

摘要: 按照访问兴趣对用户进行聚类分析是Web挖掘的一项重要内容. 在用户访问兴趣度量中综合考虑网页内容和浏览路径因素;在聚类分析中,依据访问兴趣定义提出新的相似度计算方法. 利用传递闭包法对用户进行聚类. 算法可以提高用户聚类的准确性,试验结果验证此算法是有效的.

关键词: 访问兴趣, 相似度, 用户聚类

Abstract: It is a key aspect of Web mining to cluster user in terms of browsing interest on Web.The page content and browsing path are takedn into account in measurement of browsing interest. Whereafter, new method is brought forth to calculate similarity of interest and users are clustered by using transitive closure algorithm.Result of experimnet shows new method can efficiently improve precision of clustering.

Key words: user clustering , similarity, browsing interest

[1] 张聪,裴家欢,黄锴宇,黄德根,殷章志. 基于语义图优化算法的中文微博观点摘要研究[J]. 山东大学学报(理学版), 2017, 52(7): 59-65.
[2] 黄栋,徐博,许侃,林鸿飞,杨志豪. 基于词向量和EMD距离的短文本聚类[J]. 山东大学学报(理学版), 2017, 52(7): 66-72.
[3] 黄淑芹,徐勇,王平水. 基于概率矩阵分解的用户相似度计算方法及推荐应用[J]. 山东大学学报(理学版), 2017, 52(11): 37-43.
[4] 马成龙, 姜亚松, 李艳玲, 张艳, 颜永红. 基于词矢量相似度的短文本分类[J]. 山东大学学报(理学版), 2014, 49(12): 18-22.
[5] 吴熙曦, 李炳龙, 张天琪. 基于KNN的Android智能手机微信取证方法[J]. 山东大学学报(理学版), 2014, 49(09): 150-153.
[6] 王少鹏, 彭岩, 王洁. 基于LDA的文本聚类在网络舆情分析中的应用研究[J]. 山东大学学报(理学版), 2014, 49(09): 129-134.
[7] 张春英, 王立亚, 刘保相. 基于覆盖的区间概念格动态压缩原理与实现[J]. 山东大学学报(理学版), 2014, 49(08): 15-21.
[8] 左卫兵. 模糊命题逻辑L*中公式的条件随机真度[J]. J4, 2012, 47(6): 121-126.
[9] 裴海峰. ε-函数粗集及其在投资组合中的应用[J]. J4, 2012, 47(11): 88-93.
[10] 宋颖,张兴芳. £ukasiewicz n值命题逻辑中公式的α-随机真度理论[J]. J4, 2010, 45(5): 74-77.
[11] 王芳 郭华平 牛常勇 范明. 一种基于EVS相似度的邮件社区聚类方法[J]. J4, 2010, 45(3): 34-40.
[12] 袁彦莉 张兴芳. Gödel逻辑系统中公式条件概率真度的研究[J]. J4, 2009, 44(9): 70-74.
[13] 郝秀梅,杜英玲,任雪芳 . 信息向量的粗相似度与知识挖掘[J]. J4, 2008, 43(4): 14-16 .
[14] 王庆平,张兴芳,王大全 . 三值逻辑系统G3中的随机化研究[J]. J4, 2008, 43(2): 101-108 .
[15] 徐晓静,李健 . 静态粗相似度的特征[J]. J4, 2006, 41(6): 57-60 .
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!