您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(理学版)》

J4

• 论文 • 上一篇    下一篇

一种基于关联规则的搜索引擎结果聚类算法

宋春芳,石冰   

  1. 山东大学计算机科学与技术学院, 山东 济南 250061
  • 收稿日期:2006-03-09 修回日期:1900-01-01 出版日期:2006-10-24 发布日期:2006-10-24
  • 通讯作者: 宋春芳

An algorithm to cluster the search results basedon the association rules

SONG Chun-fang,SHI Bing   

  1. School of Computer Science & Technology, Shandong Univ., Jinan 250061, Shandong, China
  • Received:2006-03-09 Revised:1900-01-01 Online:2006-10-24 Published:2006-10-24
  • Contact: SONG Chun-fang

摘要: 提出一种搜索引擎结果的聚类方法,采用关联规则方法确定网页文档中的显著短语,并把这些显著短语作为对相应聚类的描述,聚类中包含的文档就是显著短语所关联的文档,然后对形成的聚类按照相关度分数进行排队,最终把结果展现给用户.

关键词: 搜索引擎, 聚类, 信息检索 , 显著短语, 关联规则

Abstract: A method is offered to cluster the search results.It uses the association rules getting the salient phrases in the Web documents,and the salient phrases just represent the corresponding clusters.The documnets in the clusters are related to the salient phraes.Then the clusters are ranked according to the score we have assigned for each of them,and finally the results are displayed to the uses.

Key words: information retrieval , salient phrase, association rules, cluster, search engine

[1] 陈鑫,薛云,卢昕,李万理,赵洪雅,胡晓晖. 基于保序子矩阵和频繁序列模式挖掘的文本情感特征提取方法[J]. 山东大学学报(理学版), 2018, 53(3): 36-45.
[2] 王凯,洪宇,邱盈盈,王剑,姚建民,周国栋. 一种查询意图边界检测方法研究[J]. 山东大学学报(理学版), 2017, 52(9): 13-18.
[3] 黄栋,徐博,许侃,林鸿飞,杨志豪. 基于词向量和EMD距离的短文本聚类[J]. 山东大学学报(理学版), 2017, 52(7): 66-72.
[4] 许忠好,李天奇. 基于复杂网络的中国股票市场统计特征分析[J]. 山东大学学报(理学版), 2017, 52(5): 41-48.
[5] 曹蓉,黄金柱,易绵竹. 信息检索—DARPA人类语言技术研究的最终指向[J]. 山东大学学报(理学版), 2016, 51(9): 11-17.
[6] 刘驰,闫宏飞. 基于元信息的云盘资源检索结果去重[J]. 山东大学学报(理学版), 2016, 51(7): 11-17.
[7] 张文雅,宋大为,张鹏. 面向垂直搜索基于本体的可读性计算模型[J]. 山东大学学报(理学版), 2016, 51(7): 23-29.
[8] 孟烨,张鹏,宋大为. 探索数据集特征与伪相关反馈的平衡参数之间的关系[J]. 山东大学学报(理学版), 2016, 51(7): 18-22.
[9] 翟鹏,李登道. 基于高斯隶属度的包容性指标模糊聚类算法[J]. 山东大学学报(理学版), 2016, 51(5): 102-105.
[10] 刘颖莹,刘培玉,王智昊,李情情,朱振方. 一种基于密度峰值发现的文本聚类算法[J]. 山东大学学报(理学版), 2016, 51(1): 65-70.
[11] 范意兴, 郭岩, 李希鹏, 赵岭, 刘悦, 俞晓明, 程学旗. 一种基于网页块特征的多级网页聚类方法[J]. 山东大学学报(理学版), 2015, 50(07): 1-8.
[12] 李胜东, 吕学强, 孙军, 施水才. Lucene全文索引效率的改进[J]. 山东大学学报(理学版), 2015, 50(07): 76-79.
[13] 赵官宝, 刘云. 一种基于位表的有效频繁项集挖掘算法[J]. 山东大学学报(理学版), 2015, 50(05): 23-29.
[14] 祝瑞. 一种基于信任度的电子商务社区聚类模型[J]. 山东大学学报(理学版), 2015, 50(05): 18-22.
[15] 焦潞林, 彭岩, 林云. 面向网络舆情的文本知识发现算法对比研究[J]. 山东大学学报(理学版), 2014, 49(09): 62-68.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!