Please wait a minute...
您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(理学版)》
  • 官方博客
  • 官方微博

当期目录

    2014年 第49卷 第12期 刊出日期:2014-12-20
      
    论文
    基于情感依存元组的新闻文本主题情感分析
    周文, 张书卿, 欧阳纯萍, 刘志明, 阳小华
    2014, 49(12):  1-6.  doi:10.6040/j.issn.1671-9352.3.2014.159
    摘要 ( 590 )   PDF (1681KB) ( 921 )   收藏
    参考文献 | 相关文章 | 多维度评价
    以情感依存元组(EDT)作为中文情感表达的基本结构,把新闻文本主题情感倾向性判别任务分成主题识别、情感倾向性分析和主客观分类三个逐层递进的子任务。在主题识别前先对TF-IDF方法进行改进,再结合基于交叉熵方法提取主题特征词,同时考虑了新闻文章标题的主题表征作用,将标题词纳入主题特征集;然后基于空间向量模型计算句子与主题特征向量的相似度,在此基础上考虑句子位置、长度及句子与标题的相似度,计算句子的主题相关度以抽取主题句;最后建立情感依存元组判别模型计算主题句的情感,采用主、客观分类规则筛选出新闻倾向关键句。本方法在COAE 2014评测中各项指标皆逼近最好成绩,表明基于情感依存元组的分类方法具有较高的分类性能。
    基于在线评论的消费者品牌转换意向模糊推理
    宋爽, 那日萨, 张杨
    2014, 49(12):  7-11.  doi:10.6040/j.issn.1671-9352.3.2014.132
    摘要 ( 391 )   PDF (1197KB) ( 512 )   收藏
    参考文献 | 相关文章 | 多维度评价
    依据消费者心理学及品牌行为理论,从消费者感知质量、感知价值、品牌声誉、期望达成度4个维度建立了品牌转换意向模型;通过对网络消费者在线评论中评价词、情感词的提取和语义分析,结合模糊情感语料库和品牌转换意向推理规则,模糊推理出消费者品牌转换意向,进而推理出消费者的品牌转换意向的转换类型。以淘宝网上4种化妆品为例进行消费者品牌转换意向研究,得到较合理的结论并给予营销性建议,验证了所提方法的有效性。
    面向半监督中文事件抽取的事件推理方法
    徐霞, 李培峰, 郑新, 朱巧明
    2014, 49(12):  12-17.  doi:10.6040/j.issn.1671-9352.3.2014.182
    摘要 ( 578 )   PDF (805KB) ( 993 )   收藏
    参考文献 | 相关文章 | 多维度评价
    半监督中文事件抽取系统的性能依赖于种子模板,但自动获取的种子模板的表达方式与覆盖范围有限,导致某些语言现象下的事件实例很难被识别。为解决这一难题,基于篇章内的事件一致性理论提出基于同指事件与相关事件的推理方法,根据已抽取的事件实例来推理可能有同指关系与关联性的其它事件,从而进一步提高半监督中文事件抽取系统的性能。在ACE 2005中文语料上的测试表明,该方法可有效地提高半监督中文信息事件抽取系统的性能。
    基于词矢量相似度的短文本分类
    马成龙, 姜亚松, 李艳玲, 张艳, 颜永红
    2014, 49(12):  18-22.  doi:10.6040/j.issn.1671-9352.3.2014.295
    摘要 ( 978 )   PDF (2161KB) ( 2288 )   收藏
    参考文献 | 相关文章 | 多维度评价
    互联网中出现的短文本内容短小,相互共享的词汇较少,因此在分类过程中容易出现大量的集外词,导致分类性能降低。鉴于此,提出了一种基于词矢量相似度的分类方法,首先利用无监督的方法对无标注数据进行训练得到词矢量,然后通过词矢量之间的相似度对测试集中出现的集外词进行扩展。通过与基线系统的对比表明,该方法的分类正确率均优于基线系统1%~2%,尤其是在训练数据较少的情况下,所提出的方法的正确率相对提高10%以上。
    基于Bootstrapping的英文产品评论属性词抽取方法
    王辉, 陈光
    2014, 49(12):  23-29.  doi:10.6040/j.issn.1671-9352.3.2014.123
    摘要 ( 640 )   PDF (1246KB) ( 470 )   收藏
    参考文献 | 相关文章 | 多维度评价
    针对英文产品方面属性词抽取,提出了一种基于Bootstrapping的抽取方法。该方法利用少数几个种子模板,通过增量迭代的过程发现新的属性词,在每一轮迭代中通过统计技术,结合情感词典的情感词分析,利用属性词与模板的亲密度关系得到属性词被抽取出的概率得分,对候选属性词进行排序过滤。对于抽取后的特征词集利用Wordnet计算属性词间的相似度,根据得分进行聚类,得到产品不同方面的属性词类簇,同时过滤掉得分较低的类簇,进一步去掉噪声。此外还利用种子模板代替种子属性词以提高系统的可移植性。实验结果表明,利用该方法进行产品方面属性词抽取的准确率为0.799,召回率为0.779,调和平均值为0.789,具有较好的抽取性能。
    一种变长编码压缩倒排索引算法
    毛福林, 瞿有利
    2014, 49(12):  30-35.  doi:10.6040/j.issn.1671-9352.3.2014.230
    摘要 ( 445 )   PDF (1462KB) ( 1106 )   收藏
    参考文献 | 相关文章 | 多维度评价
    全文检索的效率依赖于数据结构-倒排索引,存储倒排索引需要较大的硬盘存储空间。提出了一种新的压缩算法,主要用于倒排索引中文档标识符的压缩。对于给定的文档集合使用信息检索工具Terrier,使用不同的压缩算法压缩倒排索引中的文档标识符,从而生成倒排索引文件,然后比较倒排索引文件的大小。实验结果表明,使用新的压缩算法能够节省倒排索引文件的存储空间。
    俄语武器装备名称共指词表构建
    张溟, 唐慧丰, 李珠峰
    2014, 49(12):  36-42.  doi:10.6040/j.issn.1671-9352.3.2014.139
    摘要 ( 492 )   PDF (2286KB) ( 536 )   收藏
    参考文献 | 相关文章 | 多维度评价
    在俄语军事领域文本的自动处理中,对武器装备名称进行共指消解是一个重要的研究内容。为了解决这一问题,采用模式匹配的方法,从维基百科的Infobox结构中同时提取共指词和模式,之后将二者结合成为新模式,再返回词条内容中迭代寻找共指词。实验结果以共指词表形式体现。计算结果表明该模式匹配方法能够准确有效地找出俄语维基百科中武器装备名称的共指词。
    基于曲率尺度空间的轮廓线匹配方法
    靳永刚, 王凡, 胡小鹏
    2014, 49(12):  43-48.  doi:10.6040/j.issn.1671-9352.3.2014.124
    摘要 ( 537 )   PDF (2667KB) ( 1015 )   收藏
    参考文献 | 相关文章 | 多维度评价
    基于曲率尺度空间(curvature scale space, CSS)理论,提出了一种匹配和识别存在仿射变化的平面曲线的方法。首先借助边缘检测算法提取图像轮廓,利用PCA白化算法消除轮廓线尺度、平移和切变的影响;然后对轮廓进行重采样并求取对应曲率尺度空间图的局部极值点;最后利用局部极值点向量数组作为轮廓线的描述符进行匹配。在MCD形状数据库的对比检索实验结果表明本文所提出的方法不仅有较高的检索率,而且对仿射变化具有良好的鲁棒性。
    基于尾部样本数据的尾部相关性分析
    李述山
    2014, 49(12):  49-54.  doi:10.6040/j.issn.1671-9352.0.2014.156
    摘要 ( 683 )   PDF (710KB) ( 1056 )   收藏
    参考文献 | 相关文章 | 多维度评价
    尾部相关性为两个变量联合分布的尾部性质。针对尾部相关性分析,给出了两种二维顺序统计量的概念,讨论了其联合分布;给出了尾部样本数据的概念,提出了通过尾部样本数据拟合Copula函数进而得到尾部相关系数估计的思想,讨论了基于尾部样本数据的尾部拟合参数估计方法、基于尾部样本数据的尾部拟合检验方法及相应的尾部相关系数估计方法并采用蒙特卡洛模拟验证了方法的有效性;最后探讨了上证和深证指数间的尾部相关性。
    证据权重方法与信用风险控制
    甘信军, 杨维强
    2014, 49(12):  55-59.  doi:10.6040/j.issn.1671-9352.0.2014.269
    摘要 ( 749 )   PDF (1030KB) ( 624 )   收藏
    参考文献 | 相关文章 | 多维度评价
    研究了证据权重方法在商业银行信用风险分析中的应用,给出了完整的证据权重逻辑回归算法,并且成功地将此算法应用到商业银行真实的企业财务数据,建立了信用风险评级模型,使得商业银行对于企业违约概率的定量刻画更加精准。此外通过与经典方法的比较,验证了该方法的可行性与效率。
    S-分布时滞随机广义细胞神经网络的均方指数稳定性分析
    甄艳, 王林山
    2014, 49(12):  60-65.  doi:10.6040/j.issn.1671-9352.0.2014.181
    摘要 ( 489 )   PDF (941KB) ( 244 )   收藏
    参考文献 | 相关文章 | 多维度评价
    利用Lyapunov泛函方法和随机分析技巧,研究了S-分布时滞随机广义细胞神经网络的全局均方指数稳定性。给出了稳定性判据。仿真实验验证了结论的正确性。
    G2型Shi-Catalan构形的自由性
    高瑞梅
    2014, 49(12):  66-70.  doi:10.6040/j.issn.1671-9352.0.2014.187
    摘要 ( 362 )   PDF (1324KB) ( 327 )   收藏
    参考文献 | 相关文章 | 多维度评价
    G2型Shi-Catalan构形是二维空间中的重构形, 它是将G2型Weyl构形在同一轨道中的超平面赋予相同的重数而得到的构形。 给出了G2型Shi-Catalan构形的4种具体形式, 通过将构形投影到射影平面计算构形中超平面交点个数的方法, 证明了G2型Shi-Catalan构形的锥构形都是自由的。
    拟常曲率复射影空间中的全实极小子流形
    刘敏, 宋卫东
    2014, 49(12):  71-75.  doi:10.6040/j.issn.1671-9352.0.2013.595
    摘要 ( 448 )   PDF (710KB) ( 237 )   收藏
    参考文献 | 相关文章 | 多维度评价
    利用活动标架法,研究了拟常曲率复射影空间中的全实极小子流形,得到一些拼挤结果,推广了相应文献中的结论。
    一种新的n阶纵横图编制的普适方法
    冯保初, 冯渊源
    2014, 49(12):  76-80.  doi:10.6040/j.issn.1671-9352.7.2014.003
    摘要 ( 509 )   PDF (695KB) ( 221 )   收藏
    参考文献 | 相关文章 | 多维度评价
    纵横图是个古老的组合数学问题。本文以1~n2个连续自然数构成的n行、n列的方形阵列作为n阶纵横图的基数字阵列,研究了其结构特点与纵横图特征(各行、各列及对角线数字和相等)的关系,提出了一种编制任意阶纵横图的通用性方法——对偶数字交换法。应用举例表明,该方法使用便易,不受纵横图的阶数约束,而且易于衍生出诸多种新的纵横图来。
    半定内积下的矩阵奇异值分解
    郑禅, 李寒宇
    2014, 49(12):  81-86.  doi:10.6040/j.issn.1671-9352.0.2014.159
    摘要 ( 532 )   PDF (731KB) ( 495 )   收藏
    参考文献 | 相关文章 | 多维度评价
    利用矩阵广义逆研究了其中一个权矩阵为半正定的,另一个权矩阵为正定的加权奇异值分解,同时给出了半定内积下的矩阵奇异值分解及其存在的条件。
    正则剩余格的模糊超⊙-理想
    刘春辉
    2014, 49(12):  87-94.  doi:10.6040/j.issn.1671-9352.0.2014.325
    摘要 ( 593 )   PDF (846KB) ( 366 )   收藏
    参考文献 | 相关文章 | 多维度评价
    引入正则剩余格的模糊超⊙-理想概念并考察其性质, 获得了模糊超⊙-理想的几个等价刻画。在正则剩余格L的全体模糊超⊙-理想集FU(L)上定义了格运算∨, ∧和逆序对合对应, 证明了当L满足条件(P)时, (FU(L),∨,∧,,0L,1L)构成一个De Morgan代数。 在FU(L)上定义了一个伴随对(), 证明了当L满足条件(P)时, (FU(L),,0L,1L)也构成一个剩余格。