Please wait a minute...
您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(理学版)》
  • 官方博客
  • 官方微博

当期目录

    2014年 第49卷 第11期 刊出日期:2014-11-20
      
    论文
    基于中文微博语料的情感倾向性分析
    罗毅, 李利, 谭松波, 程学旗
    2014, 49(11):  1-7.  doi:10.6040/j.issn.1671-9352.3.2014.194
    摘要 ( 1678 )   PDF (1457KB) ( 1799 )   收藏
    参考文献 | 相关文章 | 多维度评价
    微博的兴起与传播使得短文本情感分类成为目前的热门研究领域.通过对中文微博语料的情感倾向性分析进行研究,提出了一种新的情感分类方法.首先构建了两级情感词典,并对不同级别情感词作不同增强;然后在情感特征方面使用N-Gram方法,尽量获取有限长度博文中的未登录情感词和情感信息.经实验验证与传统方式相比较,该方法的准确率和召回率都有所提高,在COAE2014微博情感倾向性评测任务中也取得了较好的成绩.
    融合表情符号的微博文本倾向性分析
    刘培玉, 张艳辉, 朱振方, 荀静
    2014, 49(11):  8-13.  doi:10.6040/j.issn.1671-9352.3.2014.051
    摘要 ( 1395 )   PDF (741KB) ( 1612 )   收藏
    参考文献 | 相关文章 | 多维度评价
    针对目前微博倾向性分析的研究主要集中在微博文本上,而没有考虑微博中其他情感因素影响的问题,通过对新浪微博的分析与研究,在传统的情感词典的基础上,通过加入表情符号词典和网络新词,构建专门的微博词典,同时对微博进行修辞分析和句式分析,以有效提高倾向性分析的效果.实验结果表明,该方法在对微博进行倾向性分析时取得了很好的效果.
    基于语义分析的中文微博情感分类方法
    杨佳能, 阳爱民, 周咏梅
    2014, 49(11):  14-21.  doi:10.6040/j.issn.1671-9352.3.2014.069
    摘要 ( 2006 )   PDF (1943KB) ( 3072 )   收藏
    参考文献 | 相关文章 | 多维度评价
    通过分析微博的结构特点,提出了一种基于语义分析的中文微博情感分类方法.首先构建了表情符号情感词典和网络用语情感词典;然后结合词典资源对微博文本进行依存句法分析并且构建情感表达式树;最后根据制定的规则计算微博文本的情感强度,依据强度值判断微博的情感倾向类别.实验结果验证了该方法的有效性,也表明所构建的表情符号情感词典和网络用语情感词典能够有效增强情感分类器的性能.
    基于依存分析与特征组合的微博情感分析
    夏梦南, 杜永萍, 左本欣
    2014, 49(11):  22-30.  doi:10.6040/j.issn.1671-9352.3.2014.074
    摘要 ( 1550 )   PDF (1954KB) ( 2069 )   收藏
    参考文献 | 相关文章 | 多维度评价
    针对微博短文本存在口语化、简洁化等社交网络特征,充分利用句法依存关系以及条件随机场(conditional random fields, CRFs),抽取候选评价对象,并在基于机器学习的微博情感分类方法的基础上结合情感分析词典,引入情感值、微博标签、主题等特征,优化分类性能.在COAE(Chinese opinion analysis evaluation)微博评测数据集上,以准确率、召回率、F1值为评价指标对所提方法进行验证,证实了基于句法依存分析与CRFs相结合的评价对象抽取方法的有效性,分析了各类特征对情感分类性能的影响,最终在COAE微博观点句识别任务中准确率达91.4%.
    微博转发者的个性化排序
    匡冲, 刘知远, 孙茂松
    2014, 49(11):  31-36.  doi:10.6040/j.issn.1671-9352.3.2014.305
    摘要 ( 1384 )   PDF (1411KB) ( 2520 )   收藏
    参考文献 | 相关文章 | 多维度评价
    转发行为是微博平台上信息传播的主要形式.目前已有的工作大多数聚焦在转发行为的分析和预测.针对给定的一条微博时如何找到其转发者这个问题并没有得到很好的解决.结合贝叶斯个性化排序优化标准(BPR-OPT)和分解机(FM),提出了一种通用的方法用于对微博转发者进行预测,并进一步对影响用户成为转发者的特征因素进行了细致分析,然后根据这些特征,在大规模真实数据集上对微博转发者进行了预测.实验证明该方法能够明显提高预测效果,同时也验证了基于pair-wise和特征相关的方法能更有效解决微博转发者预测问题.
    基于半监督学习的微博情感倾向性分析
    朱玺, 董喜双, 关毅, 刘志广
    2014, 49(11):  37-42.  doi:10.6040/j.issn.1671-9352.3.2014.136
    摘要 ( 1458 )   PDF (1003KB) ( 1992 )   收藏
    参考文献 | 相关文章 | 多维度评价
    微博情感倾向性分析通常指对中文微博中每个句子褒义、贬义或者中性的情感进行自动分类.针对微博碎片化和情感类别失衡的特点,在半监督学习reserved self-training方法的框架基础上提取了适用于微博情感分类的文本特征,并提出了针对情感倾向性分析通过训练度阈值设定的方法来优化reserved self-training迭代终止的条件,在保留reserved self-training能有效处理微博语料中语料情感不平衡问题的优点基础上,防止了训练过度情况的发生.COAE 2014微博情感倾向性评测结果证明了该方法的有效性.
    面向微博情感评测任务的多方法对比研究
    孙松涛, 何炎祥, 蔡瑞, 李飞, 贺飞艳
    2014, 49(11):  43-50.  doi:10.6040/j.issn.1671-9352.3.2014.016
    摘要 ( 973 )   PDF (1260KB) ( 614 )   收藏
    参考文献 | 相关文章 | 多维度评价
    主要对COAE 2014评测中采用的算法进行描述,并结合评测结果进行分析比较.本次评测共有5个任务,本文重点描述与微博相关的3个任务.在微博情感新词发现和判断的任务中,方法核心是利用谷歌翻译算法的对齐操作来获得候选新词,之后使用平均点互信息筛选高频词语.在微博倾向性分析任务中采用两种方法,一种是传统的基于情感词典的极性判断方法,另一种是结合情感词标注的基于条件随机场CRFs的极性判断方法.在微博观点句要素抽取任务中,首先利用名词在复杂网络中的中介性和趋近性提取候选产品名和属性名,然后分别采用3种方法完成对产品属性名的抽取,其中,第一种方法是基于简单规则的滑动窗口抽取策略,后面两种方法都是基于CRFs的有监督抽取策略.
    基于词向量的情感新词发现方法
    杨阳, 刘龙飞, 魏现辉, 林鸿飞
    2014, 49(11):  51-58.  doi:10.6040/j.issn.1671-9352.3.2014.255
    摘要 ( 2067 )   PDF (3225KB) ( 3771 )   收藏
    参考文献 | 相关文章 | 多维度评价
    词语级的情感倾向性分析一直是文本情感计算领域的热点研究方向,如何自动识别情感新词,并判断其情感倾向性已经成为当前亟待解决的问题.首先用基于统计量的方法识别微博语料中的新词,然后利用神经网络去训练语料中词语的词向量,从语料自身挖掘出词与词之间的相关性,最后提出了基于词向量的情感新词发现方法.实验表明该方法可以有效应用于情感新词发现.
    基于语义场景的隐式篇章关系检测方法
    严为绒, 洪宇, 朱珊珊, 车婷婷, 姚建民, 朱巧明
    2014, 49(11):  59-67.  doi:10.6040/j.issn.1671-9352.3.2014.077
    摘要 ( 1107 )   PDF (1880KB) ( 830 )   收藏
    参考文献 | 相关文章 | 多维度评价
    针对篇章隐式关系检测较难的问题,提出了一种基于语义场景匹配的平行推理方法.该方法利用框架语义学,将论元抽象为概念一级的语义描述(简称语义场景),实现描述形式的压缩.基于大规模静态数据,通过语义场景的匹配挖掘可比较论元辅助关系推理.该方法能够在保证检测精度的同时,提升检测效率.利用宾州篇章树库(penn discourse tree bank, PDTB)对这一检测方法进行评测,检测精度为55.26%.
    基于SVM与RNN的文本情感关键句判定与抽取
    刘铭, 昝红英, 原慧斌
    2014, 49(11):  68-73.  doi:10.6040/j.issn.1671-9352.3.2014.025
    摘要 ( 1590 )   PDF (1423KB) ( 2092 )   收藏
    参考文献 | 相关文章 | 多维度评价
    文本的情感倾向在很大程度上依赖于其中情感倾向性较高的关键句,对这些情感关键句正确判定有利于提高整个篇章情感分类的效果.传统的基于规则的情感倾向性分析的优点是情感词表和规则表达准确,缺点是完备性差,而统计的方法则相反.结合使用支持向量机 (support vector machine, SVM)与递归神经网络(recursive neural network, RNN)分别构造分类器,然后对整个篇章和单个句子进行情感二元分类,将分类结果进行比较投票后判定出篇章中的情感关键句.句子级情感特征不仅包含情感词、否定词等传统的文法信息,同时加入深度学习领域中词向量的统计信息,而在篇章特征中也抽取出句型、位置等宏观信息.通过参与COAE 2014评测任务1的结果显示,该方法的微平均F1值达到0.388,在同类评测系统中处于最高水平.
    基于情感主题模型的特征选择方法
    郑妍, 庞琳, 毕慧, 刘玮, 程工
    2014, 49(11):  74-81.  doi:10.6040/j.issn.1671-9352.3.2014.328
    摘要 ( 1744 )   PDF (1129KB) ( 1426 )   收藏
    参考文献 | 相关文章 | 多维度评价
    意见挖掘在企业智能分析、政府舆情分析等领域发挥着重要作用,为了充分挖掘主观性文本所蕴含的商业价值和社会价值,提出了一种基于情感主题模型的特征选择方法.该方法重点考察极性词及其共现现象,采用主题模型挖掘出正面褒义主题和负面贬义主题中极性词的分布情况,旨在度量情感特征在情感倾向表达中的重要性.实验阶段结合支持向量机分类器进行分析.实验表明该特征选择方法能有效提高跨领域文本情感分类准确性,具有较好的实用价值.
    企业级无线局域网可信域间访问控制方案
    吕盟, 刘哲, 刘建伟
    2014, 49(11):  82-88.  doi:10.6040/j.issn.1671-9352.2.2014.140
    摘要 ( 1336 )   PDF (1953KB) ( 815 )   收藏
    参考文献 | 相关文章 | 多维度评价
    无线局域网(wireless LAN, WLAN)是移动办公网络的重要组成部分,但因其缺乏平台完整性验证机制及有效的域间访问控制机制,致其难以安全高效地支持更多新业务的应用及推广.提出了一种新型企业WLAN访问控制方案,结合可信平台模块及属性基访问控制思想,将信任链扩展至WLAN域间,并在域间切换过程中实现基于用户属性的细粒度访问控制,确保企业网络安全、可信.
    全局雪崩准则的矩阵表示及其性质
    袁宏博, 杨晓元, 魏悦川, 刘龙飞, 范存洋
    2014, 49(11):  89-94.  doi:10.6040/j.issn.1671-9352.2.2014.212
    摘要 ( 1481 )   PDF (741KB) ( 1189 )   收藏
    参考文献 | 相关文章 | 多维度评价
    从研究全局雪崩准则的表达方式出发,提出了全局雪崩准则的矩阵表示方法,并证明了布尔函数f(x)与f(x+α)全局雪崩的绝对值指标和平方和指标相同.依据矩阵表示方法得到了全局雪崩准则与布尔函数Walsh谱值的关系,并给出了一个布尔函数同一个仿射函数的互相关全局雪崩准则绝对指标的上、下限.最后,分析了修改序列中的一位对布尔函数全局雪崩准则指标的影响,结合爬山算法设计了一种修改M-M型Bent函数的优化算法,得到的布尔序列在非线性度和全局雪崩准则指标上优于已有的构造.