Please wait a minute...
您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(理学版)》
  • 官方博客
  • 官方微博

当期目录

    2016年 第51卷 第7期 刊出日期:2016-07-20
      
    幽默计算及其应用研究
    林鸿飞,张冬瑜,杨亮,徐博
    2016, 51(7):  1-10.  doi:10.6040/j.issn.1671-9352.0.2016.266
    摘要 ( 2450 )   PDF (1413KB) ( 1425 )   收藏
    参考文献 | 相关文章 | 多维度评价
    幽默作为一种特殊的语言表达方式,是生活中活跃气氛、化解尴尬的重要元素。随着人工智能的快速发展,如何利用计算机技术识别和生成幽默成为自然语言处理领域热门的研究内容之一,并逐渐形成一个新兴研究领域:幽默计算。幽默计算致力于利用自然语言处理技术理解和识别包含幽默的文本表达,挖掘幽默表达潜在的语义内涵,构建面向幽默表达的计算模型。首先对当前幽默计算的背景进行概述,阐明幽默的可计算性和幽默计算对于人工智能的意义;在此基础上,对幽默研究的发展情况进行回顾,给出幽默研究的语言学基础;然后综述当前幽默计算在幽默识别和幽默生成两个方面的进展情况,分别给出针对幽默识别和幽默生成的计算框架;最后,对幽默计算在聊天机器人、机器翻译、儿童教育软件和外语教学等多个自然语言处理任务中的应用前景和应用模式进行展望。希望通过对幽默计算及其应用研究的总结和概述,完善现有幽默计算模型,增进计算机对于自然语言的理解,推动人工智能的进一步发展。
    基于元信息的云盘资源检索结果去重
    刘驰,闫宏飞
    2016, 51(7):  11-17.  doi:10.6040/j.issn.1671-9352.1.2015.060
    摘要 ( 936 )   PDF (1623KB) ( 572 )   收藏
    参考文献 | 相关文章 | 多维度评价
    区别于传统计算网页文本相似度的去重方法,以多媒体数据文件为主的云盘资源仅可利用相当有限的元信息进行检索结果去重。针对这一问题,以搭建的面向云盘资源数据的搜索引擎系统为基础,通过对云盘资源元信息特性的分析,发现除名称之外,资源文件后缀名、占用空间大小、资源的用户归属是判定重复记录的有效特征。在此基础上,给出了处理上述特征的归一化方法,进而使用无监督方法进行去重。实验结果表明,该方法能够有效对云盘资源检索结果去重。
    探索数据集特征与伪相关反馈的平衡参数之间的关系
    孟烨,张鹏,宋大为
    2016, 51(7):  18-22.  doi:10.6040/j.issn.1671-9352.1.2015.031
    摘要 ( 899 )   PDF (1668KB) ( 475 )   收藏
    参考文献 | 相关文章 | 多维度评价
    伪相关反馈(pseudo-relevance feedback)是一种可有效提升查询性能的查询扩展技术。对这项技术而言,如何选取参数来平衡原始查询和扩展词的比重以达到最优的查询效果是一个非常重要的问题。在以往的反馈模型中,该平衡参数在所有数据集上需要设置成固定的经验值。但是,由于数据集之间的差异性,该平衡参数应该随着数据集的变化而改变。通过分析数据集的统计特征来发掘其与最优平衡参数之间的关系,进而指导最优参数的选择,主要分析了文档长度离散度、低频词项在数据集和查询扩展词中的比重等特征。通过分析在6个标准TREC数据集上的实验结果得出结论:特殊词项的比例越高,文档长度离散度越大,越需要给原始查询更大的比重。
    面向垂直搜索基于本体的可读性计算模型
    张文雅,宋大为,张鹏
    2016, 51(7):  23-29.  doi:10.6040/j.issn.1671-9352.1.2015.069
    摘要 ( 1025 )   PDF (1309KB) ( 549 )   收藏
    参考文献 | 相关文章 | 多维度评价
    作为一项新兴的信息检索评价指标,可读性在文档相关性、实用性以及质量评估中占据重要地位。其中,如何为用户提供相关可读的文档已成为垂直搜索领域一个亟待解决的问题。为了有效解决这个问题,提出了一种基于本体结构的可读性计算模型。该模型以用户的阅读抽象过程为背景,分别从语篇表面层次和概念层次对文本进行可读性计算,从而引入了3个可读性指标,即概念势、概念域和文档连贯性。具体地是将单个指标或者指标组合计算所得可读性得分融入传统垂直检索模型中,对文档初次检索结果进行重排。在医学领域中,用户实验结果表明基于本体概念序列信息的可读性指标相对于传统的非序列化指标可以更加有效地预测文档的真实可读性水平。系统实验结果进一步说明了基于可读性的重排序模型可以兼顾文档的相关性和可读性,提升垂直领域信息检索性能。
    基于随机游走策略的专家关系网络构建
    高盛祥,余正涛,秦雨,程韵如,庙介璞
    2016, 51(7):  30-34.  doi:10.6040/j.issn.1671-9352.1.2015.085
    摘要 ( 1174 )   PDF (1444KB) ( 833 )   收藏
    参考文献 | 相关文章 | 多维度评价
    专家关系组织是专家关系网络构建的核心。提出了一种基于随机游走策略的专家关系网络构建方法,该方法首先提取专家实体及关系,获得专家之间朋友关系、指导关系及同事关系的简单无向图,利用图中专家节点连接关系,构建专家关系矩阵,然后借助随机游走策略思想,将若干表征专家关系的简单无向图进行有机组合,从而构建出复杂专家关系网络。实验结果验证了该方法的有效性。
    基于社会化标注和网页分类的个性化检索方法
    管毅舟,徐博,林原,林鸿飞
    2016, 51(7):  35-42.  doi:10.6040/j.issn.1671-9352.1.2015.E28
    摘要 ( 889 )   PDF (1304KB) ( 655 )   收藏
    参考文献 | 相关文章 | 多维度评价
    Web2.0为信息检索提供了很多可以使用的资源,其中两种资源对于个性化检索而言非常有益,那就是社会化标注和网页分类信息。用户给出的标签反映了其对于网页的认识和思考,而用户标注过的网页的类别则反映了用户在选择时的偏好和兴趣,两者的结合使用对个性化检索能起到良好的效果。在仅使用社会化标注进行个性化检索的方法上,提出基于标注和网页分类进行个性化检索的方法,通过两者结合筛选出兴趣和偏好相近的用户,进行用户属性的扩展,并在扩展时考虑用户的质量,从而能在个性化检索中取得更好的结果。在真实数据集上的实验表明,本文方法具有一定的优势。
    基于语义分布相似度的翻译模型领域自适应研究
    姚亮,洪宇,刘昊,刘乐,姚建民
    2016, 51(7):  43-50.  doi:10.6040/j.issn.1671-9352.1.2015.116
    摘要 ( 1480 )   PDF (1611KB) ( 661 )   收藏
    参考文献 | 相关文章 | 多维度评价
    统计机器翻译系统由规模较大、领域混杂的平行语料训练获得,当训练数据和测试数据领域分布不一致时,其翻译质量往往较低。针对这一问题,提出了一种基于语义分布相似度的翻译模型领域自适应方法。该方法首先获得目标领域源语言端和目标语言端的词向量,并构建二者之间的映射关系。借助这一映射关系,获取源语言单词在目标语言端的语义k近邻词,然后基于该语义k近邻词在通用领域语义空间的分布,计算双语短语在目标领域下的翻译相似度,并作为新特征加入解码器,以此提升通用翻译模型的领域自适应能力。实验结果表明,相比于基准系统,利用本文所提方法优化后的翻译系统在英汉翻译任务新闻领域测试集和科技领域测试集上,分别获得0.67和0.56个BLEU值的性能提升。
    基于HNC语境框架和情感词典的文本情感倾向分析
    张克亮,黄金柱,曹蓉,李峰
    2016, 51(7):  51-58.  doi:10.6040/j.issn.1671-9352.1.2015.E48
    摘要 ( 1291 )   PDF (1965KB) ( 965 )   收藏
    参考文献 | 相关文章 | 多维度评价
    提出了一种基于情感词典和概念层次网络(hierarchical network concepts, HNC)语境框架的文本情感倾向性分析方法,将文本的情感倾向分析分为两个阶段:特征词、语句和句群判定阶段;基于HNC语境框架的句与句群情感分析阶段。首先以HowNet情感词典和自建的形容词配价词典(valency dictionary of English adjective, VDEA)作为基础词典资源进行文本特征词匹配,在此基础上基于HNC语境框架进行文本的情感倾向性判定,融合情感词典资源与HNC语境框架的独特优势,从特征词语情感分析入手,以包含特征词的语句及句群为情感分析重点,进而确定文本的情感倾向性,体现了HNC “有所为有所不为” 的思想。为验证方法的有效性,文本分别对政治、经济、体育与影视评论等领域文本进行测试,从实验结果可以看出商品评论以及影评类的文本情感识别率相对较高,而政治与体育类识别率低,但基本达到了预期实验效果,从而验证了本方法的可行性。
    网购客服对话标注与分析
    侯永帅,王晓龙,陈俊杰,周小强,徐军,陈清财
    2016, 51(7):  66-73.  doi:10.6040/j.issn.1671-9352.1.2015.007
    摘要 ( 1603 )   PDF (1139KB) ( 899 )   收藏
    参考文献 | 相关文章 | 多维度评价
    在当前交互式问答的研究中,面向真实应用环境的交互式问答语料比较缺乏。首先收集大量网购客服对话日志作为交互式问答研究的语料数据, 对网购对话日志进行统计分析,然后从对话日志中抽取174组会话,对会话中的非规范语言现象、问句相关现象、问句答案匹配现象等交互式语言现象进行了标注和统计。基于标注统计结果发现:高频语句在网购对话中占较大比例,15%的语句的使用量占客服应答语句总量的45%以上;非规范语言现象出现比例占到会话语句的50%;问句相关现象中指代相关、省略相关、公共词序列相关是最重要的3个相关特征;问句答案匹配现象中交叉匹配的情形占到会话的60%以上;匹配的问答对中问句与答案具有显性匹配特征的占50%以上。
    基于SVM的电子商务行为的性别判断
    彭秋芳,刘洋
    2016, 51(7):  74-80.  doi:10.6040/j.issn.1671-9352.1.2015.094
    摘要 ( 995 )   PDF (1443KB) ( 755 )   收藏
    参考文献 | 相关文章 | 多维度评价
    不同性别的用户对产品的看法与品位存在着差异,特别是在欣赏与时尚相关的产品上,性别对用户判断的影响显得尤为重要。根据电子商务中在线商品的浏览记录,采用支持向量机(support vector machines, SVM)对所选取的7个特征建立模型,并进行性别判断。经过模型分析和训练,准确率可达79.21%。同时讨论了网络购物与实体店购物的区别,并对SVM进行了核函数对比及其它性能的研究,从理论和实际应用上为核函数的选取和SVM的选用提供参考。
    中文微博观点句识别及评价对象抽取方法
    胡默之,姚天昉
    2016, 51(7):  81-89.  doi:10.6040/j.issn.1671-9352.1.2015.089
    摘要 ( 1556 )   PDF (1052KB) ( 986 )   收藏
    参考文献 | 相关文章 | 多维度评价
    根据微博文本中句子的依存关系和情感词在依存关系中的位置来提取特征,将特征应用于最大熵模型来预测句子的情感倾向(褒义、贬义或中性)。并在此基础上,将词、词性和词在句法结构中的成分作为特征,训练条件随机场统计模型以此预测评价对象。实验结果表明,将句法依存关系作为特征应用到中文微博观点句识别中能够取得不错的效果,明显提高了中文微博观点句的识别率。
    在线社会网络中基于关系强度的访问控制机制
    蔡红云,马晓雪
    2016, 51(7):  90-97.  doi:10.6040/j.issn.1671-9352.2.2015.350
    摘要 ( 1334 )   PDF (1661KB) ( 791 )   收藏
    参考文献 | 相关文章 | 多维度评价
    访问控制是实现OSN隐私保护的有效方法之一,针对已有基于关系的访问控制中存在的控制粒度粗、不够灵活等问题,提出OSN访问控制下的关系度量机制,利用用户间关系强弱进一步区分关系(群组)中不同用户的访问权限。基于OSN用户交互特点,由交互行为分析用户关注度,利用用户关注度相对因子、交互强度、关系强度时间衰减性综合产生用户间关系强度。实验结果证明了所提关系强度度量方法的可行性和有效性。
    基于TCB子集的访问控制信息安全传递模型
    唐乾,杨飞,黄琪,林果园
    2016, 51(7):  98-106.  doi:10.6040/j.issn.1671-9352.0.2015.571
    摘要 ( 1531 )   PDF (1984KB) ( 794 )   收藏
    参考文献 | 相关文章 | 多维度评价
    综合考虑应用层向内核层传递访问控制信息的安全需求,提出了一种基于TCB子集的访问控制信息安全传递模型。应用层安全管理器与内核层安全管理器通过安全通路相联,安全通路为已加密状态,密钥存放在可信平台模块TPM(trusted platform model)中,访问控制信息进入安全通路前必须通过TPM的控制处理;安全通路解密后应用层安全通路接口把访问控制信息和校验标签传到内核层安全通路接口,随后应用层接口进行随机抽查,内核层接口返回验证证据并由应用层接口判断数据真实性和有效性。安全传递模型不仅可以有效地保证访问控制信息的安全性,还可以抵抗恶意欺骗和恶意攻击从而提高了访问控制的可靠性与有效性。
    两类无证书聚合签名方案的分析与改进
    胡江红,杜红珍,张建中
    2016, 51(7):  107-114.  doi:10.6040/j.issn.1671-9352.0.2016.026
    摘要 ( 1245 )   PDF (1012KB) ( 586 )   收藏
    参考文献 | 相关文章 | 多维度评价
    基于双线性对提出的无证书聚合签名方案存在安全缺陷和计算效率低的问题。通过对现有两个无证书聚合签名方案的安全性进行分析,指出了第一个方案的聚合签名验证等式存在错误,并且证明了两个方案无法抵抗TypeⅡ的伪造性攻击。最后,给出了一个基于RSA的无证书聚合签名方案,通过RSA问题和DL问题证明了该方案的不可伪造性,与同类方案相比,该方案的效率和安全性更高,实用性更强。
    多用户全双工无线携能系统中的波束赋形研究
    王旨,陈东华,贺玉成
    2016, 51(7):  115-120.  doi:10.6040/j.issn.1671-9352.0.2015.491
    摘要 ( 1102 )   PDF (1494KB) ( 813 )   收藏
    参考文献 | 相关文章 | 多维度评价
    针对多用户全双工蜂窝通信系统,提出了一种基于功耗最小及能量收获最大双目标准则的联合优化方案。该方案采用迫零消除上行链路中多用户干扰,在下行链路,为了实现信息和能量的有效传递,全双工基站分别采用信息波束赋形及能量波束赋形为用户提供通信服务,在保证用户的服务质量及功率约束的同时,实现了功率效率和频谱效率的同步改善。由于功率问题为非凸问题,通过半定松弛将其转化为凸优化问题。仿真结果表明,所提方案相比传统方案能够节约大量的功率,此外全双工基站通过能量波束赋形向下行用户传递能量,有效提高了系统的功率效率。
    一种基于小分子多肽配体检测AD7c-NTP的新方法
    张燕,韦宇平,张良,付彦凯,徐建栋,徐霞
    2016, 51(7):  121-125.  doi:10.6040/j.issn.1671-9352.0.2016.119
    摘要 ( 1136 )   PDF (1592KB) ( 736 )   收藏
    参考文献 | 相关文章 | 多维度评价
    与阿尔兹海默症相关的神经纤维蛋白(AD7c-NTP)是目前被广泛关注的一种用于早期诊断阿尔兹海默症的标志物,该标志物具有易获得、无创性的检测优势。本研究目的是检测尿液中的阿尔兹海默症标志物AD7c-NTP。通过分子模拟设计小分子多肽配体,固相合成方法合成多肽,基因克隆、原核表达AD7c-NTP,采用色谱方法分析小分子多肽配体的吸附能力、AD7c-NTP的检测范围以及在模拟尿液中的吸附情况。研究设计的DEWH配体可以与AD7c-NTP特异性结合,并且结合率达到了85%,该方法检测的线性范围是200~900 μg/L。该研究提供了一种便携的、可重复检测AD7c-NTP的方法,为阿尔兹海默早期诊断及延缓疾病奠定基础。
    分子模拟研究醇醚类表面活性剂耐盐机理
    马莹,张恒,苑世领
    2016, 51(7):  126-130.  doi:10.6040/j.issn.1671-9352.0.2016.188
    摘要 ( 1165 )   PDF (2229KB) ( 986 )   收藏
    参考文献 | 相关文章 | 多维度评价
    采用分子动力学模拟方法研究十二烷基羧酸钠(sodium dichloroisocyanurate, SDC)与十二烷基醇聚氧乙烯醚羧酸盐(dodecyl alcohol polyoxyethylene ether carboxylate, C12E3C)在水溶液和盐溶液中的聚集行为,并分析其与钠离子、钙离子之间的相互作用,从分子水平上解释两种表面活性剂的耐盐机理。结果表明在盐溶液中,钙离子与两种表面活性剂形成盐桥结构,降低了表面活性剂的静电作用,使得胶束结合更为紧密;钙离子进入表面活性剂的极性头,改变极性头周围的水化结构。通过分析极性头与离子之间的均力势,发现阳离子与C12E3C结合所需跨越的能垒高于SDC,在宏观上表现出醇醚羧酸类表面活性剂的耐盐性要高于烷基类羧酸盐。
    南四湖湿地植被构成及分布分析
    范小莉,刘伯燕,梁玉,刘建,房用,孟振农
    2016, 51(7):  131-136.  doi:10.6040/j.issn.1671-9352.0.2016.025
    摘要 ( 1288 )   PDF (1485KB) ( 618 )   收藏
    参考文献 | 相关文章 | 多维度评价
    南四湖是中国北方最大的淡水湖,湿地植物种类丰富,共有66科,147属,201种。包括有蕨类植物3科,3属,3种;裸子植物2科,2属,2种;单子叶植物14科,39属,58种;双子叶植物47科,103属,138种。南四湖植物主要生活型是多年生草本和一年生草本,属的分布区以世界分布、泛热带分布、北温带分布三种所含属的数量最多。
    Cd、Pb在东洞庭湖乌鳢、鳜鱼中的蓄积水平研究
    孙笑川,王德良,王元兰,詹慧莹
    2016, 51(7):  137-142.  doi:10.6040/j.issn.1671-9352.0.2016.035
    摘要 ( 1107 )   PDF (981KB) ( 772 )   收藏
    参考文献 | 相关文章 | 多维度评价
    采用湿式消解法,并用石墨原子吸收光谱法(GF-AAS)对东洞庭湖乌鳢(Channa argus)、鳜鱼(Siniperca chuatsi)不同组织进行重金属镉(Cd)、铅(Pb)的含量测定,分析其含量分布特征及其与体长、体质量的相关性,并用单因子污染指数法和THQ法评价其污染程度与食用安全性。结果表明,重金属在鱼体内的蓄积量存在组织特异性,同一器官组织对不同重金属的蓄积量不相同(Pb的蓄积量大于Cd的蓄积量)。Cd、Pb含量在鳜鱼和乌鳢的肠道和肝胰脏中含量最高,肌肉中含量最少。相关性分析显示,除Pb含量在乌鳢组织中相关性不显著,其余均表现出较强的相关性(P<0.05),且在鳜鱼中重金属含量与体长、体质量的相关性较显著,在乌鳢中则不显著。污染程度分析及健康风险评价表明,除肌肉组织(乌鳢肌肉组织Pb呈微污染水平)外其他组织器官均存在不同程度的污染水平,食用该区域的乌鳢和鳜鱼无明显的健康风险,食用安全性较高。