山东大学学报(理学版) ›› 2014, Vol. 49 ›› Issue (11): 51-58.doi: 10.6040/j.issn.1671-9352.3.2014.255
杨阳, 刘龙飞, 魏现辉, 林鸿飞
YANG Yang, LIU Long-fei, WEI Xian-hui, LIN Hong-fei
摘要: 词语级的情感倾向性分析一直是文本情感计算领域的热点研究方向,如何自动识别情感新词,并判断其情感倾向性已经成为当前亟待解决的问题.首先用基于统计量的方法识别微博语料中的新词,然后利用神经网络去训练语料中词语的词向量,从语料自身挖掘出词与词之间的相关性,最后提出了基于词向量的情感新词发现方法.实验表明该方法可以有效应用于情感新词发现.
中图分类号:
[1] 朱嫣岚,闵锦,周雅倩,等.基于HowNet的词汇语义倾向计算[J].中文信息学报,2006, 20(1):14-20. ZHU Yanlan, MIN Jin, ZHOU Yaqian, et al. Semantic orientation computing based on HowNet[J]. Journal of Chinese Information Processing, 2006, 20(1):14-20. [2] 王素格,李德玉,魏英杰,等.基于同义词的词汇情感倾向判别方法[J].中文信息学报,2009,23(5):68-74. WANG Suge, LI Deyu, WEI Yingjie, et al. A synonyms based word sentiment orientation discriminating[J]. Journal of Chinese Information Processing, 2009, 23(5):68-74. [3] 唐都钰.领域自适应的中文情感分析词典构建研究[D].哈尔滨:哈尔滨工业大学,2012. TANG Duyu. Research on domain adaptive Chinese sentiment lexicon construction[D]. Harbin: Harbin Institute of Technology, 2012. [4] HUANG J H, POWERS D. Chinese word segmentation based on contextual entropy[C]// Proceedings of the 17th Asian Pacific Conference on Language, Information and Computation. Singapore, 2003:152-158. [5] YE Yunming, WU Qingyao, LI Yan, et al. Unknown Chinese word extraction based on variety of overlapping strings[J]. Information Processing & Management, 2013, 49(2): 497-512. [6] MIKOLOV T, CHEN K, CORRADO G, et al. Efficient estimation of word representations in vector space[EB/OL].(2013-10-23)[2014-02-23].http://dblp.uni-trier.de/db/journals/corr/corr1301.html#abs-1301-3781. [7] MIKOLOV T, SUTSKEVER I, CHEN K, et al. Distributed representations of words and phrases and their compositionality [J].Advances in Neural Information Processing Systems, 2013:3111-3119. [8] 黄昌宁,赵海. 中文分词十年回顾[J].中文信息学报,2007,21(3):8-19. HUANG Changning, ZHAO Hai. Chinese word segmentation:a decade review[J]. Journal of Chinese Information Processing, 2007, 21(3):8-19. [9] 徐琳宏,林鸿飞,潘宇,等.情感词汇本体的构造[J].情报学报,2008,27(2):180-185. XU Linhong, LIN Hongfei, PAN Yu, et al. Constructing the affective lexicon ontology[J]. Journal of the China Society for Scientific and Technical Information, 2008, 27(2):180-185. |
[1] | 肖炜茗,王贵君. 基于Bernstein多项式的SISO三层前向神经网络的设计与逼近[J]. 山东大学学报(理学版), 2018, 53(9): 55-61. |
[2] | 张芳芳,曹兴超. 基于字面和语义相关性匹配的智能篇章排序[J]. 山东大学学报(理学版), 2018, 53(3): 46-53. |
[3] | 刘明明,张敏情,刘佳,高培贤. 一种基于浅层卷积神经网络的隐写分析方法[J]. 山东大学学报(理学版), 2018, 53(3): 63-70. |
[4] | 黄栋,徐博,许侃,林鸿飞,杨志豪. 基于词向量和EMD距离的短文本聚类[J]. 山东大学学报(理学版), 2017, 52(7): 66-72. |
[5] | 杜漫,徐学可,杜慧,伍大勇,刘悦,程学旗. 面向情绪分类的情绪词向量学习[J]. 山东大学学报(理学版), 2017, 52(7): 52-58. |
[6] | 秦静,林鸿飞,徐博. 基于示例语义的音乐检索模型[J]. 山东大学学报(理学版), 2017, 52(6): 40-48. |
[7] | 张克亮,黄金柱,曹蓉,李峰. 基于HNC语境框架和情感词典的文本情感倾向分析[J]. 山东大学学报(理学版), 2016, 51(7): 51-58. |
[8] | 姚亮,洪宇,刘昊,刘乐,姚建民. 基于语义分布相似度的翻译模型领域自适应研究[J]. 山东大学学报(理学版), 2016, 51(7): 43-50. |
[9] | 王长弘,王林山. 基于忆阻器的S-分布时滞随机神经网络的均方指数稳定性[J]. 山东大学学报(理学版), 2016, 51(5): 130-135. |
[10] | 甄艳, 王林山. S-分布时滞随机广义细胞神经网络的均方指数稳定性分析[J]. 山东大学学报(理学版), 2014, 49(12): 60-65. |
[11] | 刘铭, 昝红英, 原慧斌. 基于SVM与RNN的文本情感关键句判定与抽取[J]. 山东大学学报(理学版), 2014, 49(11): 68-73. |
[12] | 堵锡华,史小琴,冯长君,李亮. 基于野韭菜挥发性成分的色谱保留指数神经网络预测[J]. 山东大学学报(理学版), 2014, 49(1): 50-53. |
[13] | 马奎森,王林山*. S-分布时滞随机BAM神经网络的指数同步[J]. 山东大学学报(理学版), 2014, 49(03): 73-78. |
[14] | 常青, 周立群*. 一类具时滞细胞神经网络的全局一致渐近稳定性[J]. J4, 2012, 47(8): 42-49. |
[15] | 冯新营1,2,计华1,2,张化祥1,2. 基于聚类优化的RBF神经网络多标记学习算法[J]. J4, 2012, 47(5): 63-67. |
|