您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(理学版)》

山东大学学报(理学版) ›› 2014, Vol. 49 ›› Issue (11): 51-58.doi: 10.6040/j.issn.1671-9352.3.2014.255

• 论文 • 上一篇    下一篇

基于词向量的情感新词发现方法

杨阳, 刘龙飞, 魏现辉, 林鸿飞   

  1. 大连理工大学信息检索研究室, 辽宁 大连 116023
  • 收稿日期:2014-08-28 修回日期:2014-10-24 出版日期:2014-11-20 发布日期:2014-11-25
  • 通讯作者: 林鸿飞(1962- ),男,教授,主要研究方向为搜索引擎、文本挖掘、情感计算和自然语言处理. E-mail: hflin@dlut.edu.cn E-mail:hflin@dlut.edu.cn
  • 作者简介:杨阳(1989- ),男,硕士研究生,主要研究方向为情感计算. E-mail:yangyang0477@mail.dlut.edu.cn
  • 基金资助:
    国家自然科学基金资助项目(60673039,60973068);国家高技术研究发展计划(“八六三”计划)项目(2006AA01Z151);教育部留学回国人员科研启动基金资助项目(20090041110002);高等学校博士学科点专项科研基金资助项目(20110041110034)

New methods for extracting emotional words based on distributed representations of words

YANG Yang, LIU Long-fei, WEI Xian-hui, LIN Hong-fei   

  1. Information Retrieval Laboratory, Dalian University of Technology, Dalian 116023, Liaoning, China
  • Received:2014-08-28 Revised:2014-10-24 Online:2014-11-20 Published:2014-11-25

摘要: 词语级的情感倾向性分析一直是文本情感计算领域的热点研究方向,如何自动识别情感新词,并判断其情感倾向性已经成为当前亟待解决的问题.首先用基于统计量的方法识别微博语料中的新词,然后利用神经网络去训练语料中词语的词向量,从语料自身挖掘出词与词之间的相关性,最后提出了基于词向量的情感新词发现方法.实验表明该方法可以有效应用于情感新词发现.

关键词: 情感词, 神经网络, 词向量

Abstract: Word-level sentiment analysis is a hot research interest in the field of affective computing. How to recognize and analyze these new emotional words automatically becomes an urgent problem. Firstly, statistics-based approach was used to identify the new words in Micro-blog corpus and then distributed representation of new words was trained by using neural network in order to get the correlation between words in corpus. Finally three vector-based methods to find new emotional words were introduced. The experimental results indicate that the proposed methods in this paper can be effectively used in discovery of new emotional words.

Key words: emotional words, neural network, distributed representations of words

中图分类号: 

  • TP391
[1] 朱嫣岚,闵锦,周雅倩,等.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006, 20(1):14-20. ZHU Yanlan, MIN Jin, ZHOU Yaqian, et al. Semantic orientation computing based on HowNet[J]. Journal of Chinese Information Processing, 2006, 20(1):14-20.
[2] 王素格,李德玉,魏英杰,等.基于同义词的词汇情感倾向判别方法[J].中文信息学报,2009,23(5):68-74. WANG Suge, LI Deyu, WEI Yingjie, et al. A synonyms based word sentiment orientation discriminating[J]. Journal of Chinese Information Processing, 2009, 23(5):68-74.
[3] 唐都钰.领域自适应的中文情感分析词典构建研究[D].哈尔滨:哈尔滨工业大学,2012. TANG Duyu. Research on domain adaptive Chinese sentiment lexicon construction[D]. Harbin: Harbin Institute of Technology, 2012.
[4] HUANG J H, POWERS D. Chinese word segmentation based on contextual entropy[C]// Proceedings of the 17th Asian Pacific Conference on Language, Information and Computation. Singapore, 2003:152-158.
[5] YE Yunming, WU Qingyao, LI Yan, et al. Unknown Chinese word extraction based on variety of overlapping strings[J]. Information Processing & Management, 2013, 49(2): 497-512.
[6] MIKOLOV T, CHEN K, CORRADO G, et al. Efficient estimation of word representations in vector space[EB/OL].(2013-10-23)[2014-02-23].http://dblp.uni-trier.de/db/journals/corr/corr1301.html#abs-1301-3781.
[7] MIKOLOV T, SUTSKEVER I, CHEN K, et al. Distributed representations of words and phrases and their compositionality [J].Advances in Neural Information Processing Systems, 2013:3111-3119.
[8] 黄昌宁,赵海. 中文分词十年回顾[J].中文信息学报,2007,21(3):8-19. HUANG Changning, ZHAO Hai. Chinese word segmentation:a decade review[J]. Journal of Chinese Information Processing, 2007, 21(3):8-19.
[9] 徐琳宏,林鸿飞,潘宇,等.情感词汇本体的构造[J].情报学报,2008,27(2):180-185. XU Linhong, LIN Hongfei, PAN Yu, et al. Constructing the affective lexicon ontology[J]. Journal of the China Society for Scientific and Technical Information, 2008, 27(2):180-185.
[1] 肖炜茗,王贵君. 基于Bernstein多项式的SISO三层前向神经网络的设计与逼近[J]. 山东大学学报(理学版), 2018, 53(9): 55-61.
[2] 张芳芳,曹兴超. 基于字面和语义相关性匹配的智能篇章排序[J]. 山东大学学报(理学版), 2018, 53(3): 46-53.
[3] 刘明明,张敏情,刘佳,高培贤. 一种基于浅层卷积神经网络的隐写分析方法[J]. 山东大学学报(理学版), 2018, 53(3): 63-70.
[4] 黄栋,徐博,许侃,林鸿飞,杨志豪. 基于词向量和EMD距离的短文本聚类[J]. 山东大学学报(理学版), 2017, 52(7): 66-72.
[5] 杜漫,徐学可,杜慧,伍大勇,刘悦,程学旗. 面向情绪分类的情绪词向量学习[J]. 山东大学学报(理学版), 2017, 52(7): 52-58.
[6] 秦静,林鸿飞,徐博. 基于示例语义的音乐检索模型[J]. 山东大学学报(理学版), 2017, 52(6): 40-48.
[7] 张克亮,黄金柱,曹蓉,李峰. 基于HNC语境框架和情感词典的文本情感倾向分析[J]. 山东大学学报(理学版), 2016, 51(7): 51-58.
[8] 姚亮,洪宇,刘昊,刘乐,姚建民. 基于语义分布相似度的翻译模型领域自适应研究[J]. 山东大学学报(理学版), 2016, 51(7): 43-50.
[9] 王长弘,王林山. 基于忆阻器的S-分布时滞随机神经网络的均方指数稳定性[J]. 山东大学学报(理学版), 2016, 51(5): 130-135.
[10] 甄艳, 王林山. S-分布时滞随机广义细胞神经网络的均方指数稳定性分析[J]. 山东大学学报(理学版), 2014, 49(12): 60-65.
[11] 刘铭, 昝红英, 原慧斌. 基于SVM与RNN的文本情感关键句判定与抽取[J]. 山东大学学报(理学版), 2014, 49(11): 68-73.
[12] 堵锡华,史小琴,冯长君,李亮. 基于野韭菜挥发性成分的色谱保留指数神经网络预测[J]. 山东大学学报(理学版), 2014, 49(1): 50-53.
[13] 马奎森,王林山*. S-分布时滞随机BAM神经网络的指数同步[J]. 山东大学学报(理学版), 2014, 49(03): 73-78.
[14] 常青, 周立群*. 一类具时滞细胞神经网络的全局一致渐近稳定性[J]. J4, 2012, 47(8): 42-49.
[15] 冯新营1,2,计华1,2,张化祥1,2. 基于聚类优化的RBF神经网络多标记学习算法[J]. J4, 2012, 47(5): 63-67.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!