您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(理学版)》

J4 ›› 2013, Vol. 48 ›› Issue (11): 66-72.

• 论文 • 上一篇    下一篇

基于量化情感的网店垃圾评论检测

彭庆喜,钱铁云   

  1. 武汉大学软件工程国家重点实验室, 湖北 武汉 430072
  • 收稿日期:2013-09-02 出版日期:2013-11-20 发布日期:2013-11-25
  • 作者简介:彭庆喜(1974- ),男,博士研究生,研究方向为数据挖掘与机器学习.Email: pengqingxi@gmail.com
  • 基金资助:

    中央高校基本科研业务费专项资金项目(201121102020005);国家自然科学基金资助项目(61272275)

Store review spam detection based on quantitative sentiment

PENG Qing-xi, QIAN Tie-yun   

  1. State Key Lab of Software Engineering, Wuhan University, Wuhan 430072, Hubei, China
  • Received:2013-09-02 Online:2013-11-20 Published:2013-11-25

摘要:

提出量化情感的概念(评论中的情感值),从用户评论的自然语言文本中得到用户表达的情感值。为了计算评论的量化情感,对评论中的情感词的依存关系进行了研究。给出了情感句的量化情感算法。对量化情感与垃圾评论的关系进行分析,通过直观观察,确定了一系列判别方法。最后本文以量化情感值为指标,建立时间序列对网店的评论进行分析,有效地检测了垃圾评论。实验结果证明在检测网店垃圾评论工作中,所提出的方法有良好的检测结果,优于已有的方法。

关键词: 量化情感;评论;垃圾评论检测

Abstract:

A novel concept of quantitative sentiment was proposed, which means the sentiment score of the review. The sentiment score is  derived from the natural language text of the review. To calculate the quantitative sentiment, the dependency relationships between sentiment words are  discussed. A quantitative sentiment algorithm of the sentiment sentence is  presented. Furthermore, the relationship between quantitative sentiment and spam reviews is  discussed. A series of prediction rules are  established through intuitive observation. In the end, the store reviews are  analyzed by establishing a time series with quantitative sentiment as indicator. The spam reviews are  detected efficiently. Experimental results show that the proposed method  has good detection result and outperform existing methods in detecting sore review spam.

Key words: quantitative sentiment; dependency relationships; store review spam

中图分类号: 

  • TP391
[1] 刘雅辉1,2,刘春阳3*,张铁赢1,程学旗1. 图索引技术研究综述[J]. J4, 2013, 48(11): 44-52.
[2] 于然1,2,刘春阳3*,靳小龙1,王元卓1,程学旗1. 基于多视角特征融合的中文垃圾微博过滤[J]. J4, 2013, 48(11): 53-58.
[3] 郑建兴,张博锋*,岳晓冬,成泽宇. 基于友邻-用户模型的微博主题推荐研究[J]. J4, 2013, 48(11): 59-65.
[4] 黄亮,杜永萍. 基于信任关系的潜在好友推荐方法[J]. J4, 2013, 48(11): 73-79.
[5] 张乃洲1, 曹薇2, 陈珂锐1, 李石君3. 一种基于时间感知的搜索引擎模型[J]. J4, 2013, 48(11): 80-86.
[6] 陈珂锐,潘君. 基于扩展特征向量空间模型的
多源数据融合
[J]. J4, 2013, 48(11): 87-92.
[7] 方志军,刘心韵,伍世虔,郑文娟. 基于子带加权融合的多尺度
Retinex图像增强算法
[J]. J4, 2013, 48(11): 93-98.
[8] 刘伍颖,易绵竹,张兴. 一种时空高效的多类别文本分类算法[J]. J4, 2013, 48(11): 99-104.
[9] 李玉倩 刘林 李金屏. 视频分析中灰度直方图的叠加原理研究[J]. J4, 2009, 44(11): 63-67.
[10] 谢桦 林尚垣 任雪芳. 单向粗关系及数据通讯安全[J]. J4, 2009, 44(9): 93-96.
[11] 许洁萍1,殷宏宇1,范子文2. 基于近似子乐句的翻唱歌曲识别研究[J]. J4, 2013, 48(7): 68-71.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!