您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(理学版)》

山东大学学报(理学版) ›› 2014, Vol. 49 ›› Issue (11): 8-13.doi: 10.6040/j.issn.1671-9352.3.2014.051

• 论文 • 上一篇    下一篇

融合表情符号的微博文本倾向性分析

刘培玉1,2,3, 张艳辉2,3, 朱振方4, 荀静2,3   

  1. 1. 山东英才学院信息工程学院, 山东 济南 250104;
    2. 山东师范大学信息科学与工程学院, 山东 济南 250014;
    3. 山东省分布式计算机软件新技术重点实验室, 山东 济南 250014;
    4. 山东交通学院信息科学与电气工程学院, 山东 济南 250357
  • 收稿日期:2014-08-28 修回日期:2014-10-21 出版日期:2014-11-20 发布日期:2014-11-25
  • 作者简介:刘培玉(1960- ),男,教授,研究方向为计算机网络信息安全、网络系统规划、网络信息资源开发和软件开发技术. E-mail:zhangyanhuicn@163.com
  • 基金资助:
    国家自然科学基金资助项目(61373148); 国家社科基金资助项目(12BXW040); 山东省自然科学基金资助项目(ZR2011FM030,ZR2012FM038); 山东省优秀中青年科学家奖励基金资助项目(BS2013DX033); 教育部人文社科基金资助项目(14YJC860042)

Micro-blog orientation analysis based on emotion symbol

LIU Pei-yu1,2,3, ZHANG Yan-hui2,3, ZHU Zhen-fang4, XUN Jing2,3   

  1. 1. School of Information Engineering, Shandong Yingcai University, Jinan 250104, Shandong, China;
    2. School of Information Science & Engineering, Shandong Normal University, Jinan 250014, Shandong, China;
    3. Shandong Provincial Key Laboratory for Normal Distributed Computer Software Technology, Jinan 250014 Shandong, China;
    4. School of Information Science & Electrical Engineering, Shandong Jiaotong University, Jinan 250357, Shandong, China
  • Received:2014-08-28 Revised:2014-10-21 Online:2014-11-20 Published:2014-11-25

摘要: 针对目前微博倾向性分析的研究主要集中在微博文本上,而没有考虑微博中其他情感因素影响的问题,通过对新浪微博的分析与研究,在传统的情感词典的基础上,通过加入表情符号词典和网络新词,构建专门的微博词典,同时对微博进行修辞分析和句式分析,以有效提高倾向性分析的效果.实验结果表明,该方法在对微博进行倾向性分析时取得了很好的效果.

关键词: 微博, 倾向性分析, 表情符号

Abstract: At present, the researches of Micro-blog orientation analysis mainly concentrate in the text, without considering the impact of other emotional factors. By analyzing and studying Sina Micro-blog, new words and emoticons dictionary were added into special Micro-blog dictionary with traditional emotional dictionary. Meanwhile, rhetoric and sentence were analyzed in this paper to improve the effect of orientation analysis. The experimental results showed that the method can obtaine better performance in Micro-blog orientation analysis.

Key words: orientation analysis, Micro-blog, emotion symbol

中图分类号: 

  • TP391
[1] HATZIVASSILOGLOU V, MCKEOWN K R. Predicting the semantic orientation of adjectives[C]// Proceedings of the 35th Annual Meeting of the Association for Computational Linguistics and 8th Conference of the European Chapter of the Association for Computational Linguistics. Somerset: ACL, 1997: 174-181.
[2] YI J, NASUKAWA T, BUNESCU R, et al. Sentiment analyzer: extracting sentiments about a given topic using natural language processing techniques[C]// Proceedings of the 3rd IEEE International Conference on Data Mining (ICDM 2003). Los Alamitos: IEEE Computer Society, 2003: 427-434.
[3] 吴江,唐常杰,李太勇,等. 基于语义规则的Web金融文本情感分析[J]. 计算机应用,2014,34(2):481-485. WU Jiang, TANG Changjie, LI Taiyong, et al. Sentiment analysis on Web financial text based on semantic rules[J]. Journal of Computer Applications, 2014, 34(2):481-485.
[4] PANG Bo, LEE L, VAITHYANATHAN S. Thumbs up? Sentiment classification using machine learning techniques[C]// Proceedings of 2002 Conference on Empirical Methods in Natural Language Processing. Somerset: ACL, 2002: 79-86.
[5] LI Fangtao, LIU Nathan, JIN Hongwei, et al. Incorporating reviewer and product information for review rating prediction[C]// Proceedings of the 22nd International Joint Conference on Artificial Intelligence. [S.l.]: AAAI Press, 2011: 1820-1825.
[6] 徐军,丁宇新,王晓龙. 使用机器学习方法进行新闻的情感自动分类[J]. 中文信息学报,2007,21(6):95-100. XU Jun, DING Yuxin, WANG Xiaolong. Sentiment classification for chinese news using machine learning methods[J]. Journal of Chinese Information Processing, 2007, 21(6):95-100.
[7] ABBASI A, FRANCE S, ZHANG Zhu, et al. Selecting attributes for sentiment classification using feature relation networks[J]. IEEE Transactions on Knowledge and Data Engineering, 2011, 23(3):447-462.
[8] 李寿山,黄居仁. 基于 Stacking 组合分类方法的中文情感分类研究[J]. 中文信息学报,2010, 24(5):56-61. LI Shoushan, HUANG Juren. Chinese sentiment classification based on stacking combination method[J]. Journal of Chinese Information processing, 2010, 24(005):56-61.
[9] ZHAI Z, XU H, KANG B, et al. Exploiting effective features for Chinese sentiment classification[J]. Expert Systems with Applications, 2011, 38(8):9139-9146.
[10] GO A, BHAYANI R, HUANG Lei. Twitter sentiment classification using distant supervision[D]. Stanford: Stanford University, 2009: 1-12.
[11] JIANG Long, YU Mo, ZHOU Ming, et al. Target-dependent Twitter sentiment classification[C]// Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics. Somerset: ACL, 2011: 151-160.
[12] DAVIDOV D, TSUR O, RAPPOPORT A. Enhanced sentiment learning using Twitter hashtags and smileys[C]// Proceedings of the 23rd International Conference on Computational Linguistics. Beijing: Tsinghua University Press, 2010: 241-249.
[13] KOULOUMPIS E, WILSON T, MOORE J. Twitter sentiment analysis: the good the bad and the omg! [C]// Proceedigns of ICWSM.[S.l.]: AAAI Press, 2011, 11: 538-541.
[14] 张珊,于留宝,胡长军. 基于表情图片与情感词的中文微博情感分析[J]. 计算机科学,2012,39(3):146-148. ZHANG Shan, YU Liubao, HU Changjun. Sentiment analysis of Chinese micro-blogs based on emoticons and emotional words[J]. Computer Science, 2012, 39(3):146-148.
[15] 吴迪. 汉语微博文本特征研究[D]. 长春:吉林大学,2012. WU Di. Research on text features of micro-blogging in Chinese[D]. Changchun: Jilin University, 2012.
[16] 丁建立,慈祥,黄剑雄. 网络评论倾向性分析[J]. 计算机应用,2010(11):2937-2940. DING Jianli, CI Xiang, HUANG Jianxiong. Orientation analysis of Web review[J]. Journal of Computer Applications, 2010(11):2937-2940.
[17] 唐慧丰,谭松波,程学旗. 基于监督学习的中文情感分类技术比较研究[J]. 中文信息学报,2007,21(6):88-94. TANG Huifeng, TAN Songbo, CHENG Xueqi. Research on sentiment classification of chinese reviews based on supervised machine learning techniques[J]. Journal of Chinese Information Processing, 2007, 21(6):88-94.
[1] 张聪,裴家欢,黄锴宇,黄德根,殷章志. 基于语义图优化算法的中文微博观点摘要研究[J]. 山东大学学报(理学版), 2017, 52(7): 59-65.
[2] 张中军,张文娟,于来行,李润川. 基于网络距离和内容相似度的微博社交网络社区划分方法[J]. 山东大学学报(理学版), 2017, 52(7): 97-103.
[3] 胡默之,姚天昉. 中文微博观点句识别及评价对象抽取方法[J]. 山东大学学报(理学版), 2016, 51(7): 81-89.
[4] 张克亮,黄金柱,曹蓉,李峰. 基于HNC语境框架和情感词典的文本情感倾向分析[J]. 山东大学学报(理学版), 2016, 51(7): 51-58.
[5] 孙赫,李淑琴,吕学强,刘克会. 微博城市投诉文本中的地理位置实体识别[J]. 山东大学学报(理学版), 2016, 51(3): 77-85.
[6] 朱梦珺,蒋洪迅,许伟. 基于金融微博情感与传播效果的股票价格预测[J]. 山东大学学报(理学版), 2016, 51(11): 13-25.
[7] 何炎祥, 刘健博, 孙松涛, 文卫东. 基于层叠条件随机场的微博商品评论情感分类[J]. 山东大学学报(理学版), 2015, 50(11): 67-73.
[8] 王立人, 余正涛, 王炎冰, 高盛祥, 李贤慧. 基于有指导LDA用户兴趣模型的微博主题挖掘[J]. 山东大学学报(理学版), 2015, 50(09): 36-41.
[9] 昝红英, 吴泳钢, 贾玉祥, 牛桂玲. 基于多源知识的中文微博命名实体链接[J]. 山东大学学报(理学版), 2015, 50(07): 9-16.
[10] 周超, 严馨, 余正涛, 洪旭东, 线岩团. 融合词频特性及邻接变化数的微博新词识别[J]. 山东大学学报(理学版), 2015, 50(03): 6-10.
[11] 唐波, 陈光, 王星雅, 王非, 陈小慧. 微博新词发现及情感倾向判断分析[J]. 山东大学学报(理学版), 2015, 50(01): 20-25.
[12] 匡冲, 刘知远, 孙茂松. 微博转发者的个性化排序[J]. 山东大学学报(理学版), 2014, 49(11): 31-36.
[13] 罗毅, 李利, 谭松波, 程学旗. 基于中文微博语料的情感倾向性分析[J]. 山东大学学报(理学版), 2014, 49(11): 1-7.
[14] 杨佳能, 阳爱民, 周咏梅. 基于语义分析的中文微博情感分类方法[J]. 山东大学学报(理学版), 2014, 49(11): 14-21.
[15] 孙松涛, 何炎祥, 蔡瑞, 李飞, 贺飞艳. 面向微博情感评测任务的多方法对比研究[J]. 山东大学学报(理学版), 2014, 49(11): 43-50.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!