您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(理学版)》

J4 ›› 2013, Vol. 48 ›› Issue (11): 105-110.

• 论文 • 上一篇    

基于均模型的IBCF算法研究

戚丽丽,孙静宇*,陈俊杰   

  1. 太原理工大学计算机科学与技术学院(软件学院), 山西 太原 030024
  • 收稿日期:2013-09-02 出版日期:2013-11-20 发布日期:2013-11-25
  • 通讯作者: 孙静宇(1975- ),男,副教授,博士,主要研究方向为协同Web搜索,推荐系统,生物特征识别. Email:whitesunpersun@163.com
  • 作者简介:戚丽丽(1986- ),女,硕士研究生,研究方向为推荐系统,大数据处理. Email:xiaodou929@126.com
  • 基金资助:

    山西省自然科学基金资助项目(200821024)

Mean model based IBCF algorithm

QI Li-li, SUN Jing-yu*, CHEN Jun-jie   

  1. College of Computer Science and Technology(College of Software), Taiyuan University of Technology,
    Taiyuan 030024, Shanxi, China
  • Received:2013-09-02 Online:2013-11-20 Published:2013-11-25

摘要:

基于项目的协同过滤(item-based collaborative filtering, IBCF)算法推荐精度高,实现简单,易于用于实际系统,然而因Item向量过长,计算相似性十分耗时。针对这一问题,从Item向量过长入手,提出了一种均模型表示Item向量的方法,缩短计算相似性的时间。在Movie Lens数据集上进行对比,实验表明,该算法在推荐精度基本保证的情况下,能有效缩短计算时间,降低时间复杂度。此外,本文还指出上述优化相似性计算方法可进一步优化来提高推荐精度和满足实际应用要求。

关键词: 相似性计算;均模型;推荐系统;基于Item的协同过滤

Abstract:

The item-based collaborative filtering algorithm (IBCF),a recommendation algorithm with high precision,simple and easy to use in actual system, is widely used in the field of recommendation systems. But it meets a higher computational time complexity for similar calculation because of the long length of item vector. In this paper, a sampled approach firstly is suggested to represent an item vector called mean model item vector representation through analyzing theory of IBCF algorithm, to solve the problem of the long length of item vector and cut down the computational time. Experiments using Movie Lens datasets show that the algorithm is very efficient to cut down the computational time on the premise of accuracy. Furthermore, some right sampling methods can be used to optimize the calculation method of similarity in order to meet practical application requirement.

Key words: similarity computing; mean model; recommendation system; itembased collaborative filtering

中图分类号: 

  • TP311
[1] 朱国红 石冰 邢晓娜. 基于特征点选择的聚类算法研究[J]. J4, 2009, 44(9): 40-42.
[2] . 基于QoS的Web服务发现技术的研究[J]. J4, 2009, 44(7): 89-91.
[3] 赵泽茂1,李林1,张帆1,2,张品1,周建钦1,王家波1. 基于分散子匿名区域的位置隐私保护方法[J]. J4, 2013, 48(7): 56-61.
[4] 饶绪黎1,张美平2,许力2. 基于Zigbee技术的RFID读卡系统设计[J]. J4, 2013, 48(7): 62-67.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!