Please wait a minute...
您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(理学版)》
  • 官方博客
  • 官方微博

当期目录

    2015年 第50卷 第07期 刊出日期:2015-07-20
      
    论文
    一种基于网页块特征的多级网页聚类方法
    范意兴, 郭岩, 李希鹏, 赵岭, 刘悦, 俞晓明, 程学旗
    2015, 50(07):  1-8.  doi:10.6040/j.issn.1671-9352.3.2014.270
    摘要 ( 1156 )   PDF (1442KB) ( 1805 )   收藏
    参考文献 | 相关文章 | 多维度评价
    利用网页的结构特征,提出一种多级网页聚类方法。该方法首先对网页进行分块,然后使用网页的块特征对网页进行聚类。在聚类过程中,通过调整阈值,能够提供三级聚类:同站点网页聚类、同站点同结构网页聚类、同站点同结构同模板网页聚类。与已有的网页聚类方法相比较,该方法能够提供多级聚类结果,满足不同的聚类需求,而且在聚类的准确率和效率方面有本质上的提高。
    基于多源知识的中文微博命名实体链接
    昝红英, 吴泳钢, 贾玉祥, 牛桂玲
    2015, 50(07):  9-16.  doi:10.6040/j.issn.1671-9352.3.2014.026
    摘要 ( 1522 )   PDF (1567KB) ( 1269 )   收藏
    参考文献 | 相关文章 | 多维度评价
    命名实体在文本中是承载信息的重要单元,而微博作为一种分享简短实时信息的社交网络平台,其文本长度短、不规范,而且常有新词出现,这就需要对其命名实体进行准确的理解,以提高对文本信息的正确分析。提出了基于多源知识的中文微博命名实体链接,把同义词词典、百科资源等知识与词袋模型相结合实现命名实体的链接。在NLP&CC2013中文微博实体链接评测数据集进行了实验,获得微平均准确率为92.97%,与NLP&CC2013中文实体链接评测最好的评测结果相比,提高了两个百分点。
    基于在线评论的品牌再购意向模糊推理方法
    戚方丽, 崔雪莲, 那日萨
    2015, 50(07):  17-22.  doi:10.6040/j.issn.1671-9352.3.2014.154
    摘要 ( 1224 )   PDF (1477KB) ( 835 )   收藏
    参考文献 | 相关文章 | 多维度评价
    以计划行为理论为基础,从品牌态度、品牌声誉和感知价格三个维度,建立了消费者品牌再购意向模糊推理模型:构建了针对化妆品的评价词语料库和消费者品牌再购意向模糊推理规则库,通过对网络消费者在线评论中评价词的提取和语义分析,进行消费者品牌态度、感知价格、品牌声誉的计算和消费者再购意向的模糊推理:结合消费者的消费总额,构建“品牌再购意向-消费总额”消费者分类矩阵。以聚美优品网站的3款面膜为例进行品牌再购意向的实例计算,结果验证了所提方法的合理性和可行性。
    一种面向科技文献引言的信息抽取方法
    朱丽萍, 李洪奇, 杨中国, 刘蔷
    2015, 50(07):  23-30.  doi:10.6040/j.issn.1671-9352.3.2014.307
    摘要 ( 1217 )   PDF (3296KB) ( 985 )   收藏
    参考文献 | 相关文章 | 多维度评价
    分析了引言部分写作模型,将文本按照句子级别划分为背景知识、问题分析、工作描述三个类别。统计每个部分句子的引导词、句型表达、线索词、所处位置的特征,并构建相应规则库。在分词和词性标注基础上,利用规则匹配每个句子得出所属的类别,从而抽取出三个部分的信息。以石油勘探开发类科技文献和数据挖掘类科技文献为例,进行人工判别和本文方法抽取试验,结果表明本文方法能准确获取相应信息。
    基于迭代双通信半径的传感器网络DV-Hop算法
    赵峰, 徐秀
    2015, 50(07):  31-37.  doi:10.6040/j.issn.1671-9352.0.2014.514
    摘要 ( 1101 )   PDF (1802KB) ( 582 )   收藏
    参考文献 | 相关文章 | 多维度评价
    为了提高DV-Hop算法的定位精度,提出了一种基于迭代双通信半径的DV-Hop改进算法。首先针对当前网络拓扑结构选取一个合适的通信半径,并用它与节点的默认通信半径一起估计信标节点间的平均每跳距离,最后使用迭代算法对得到的平均每跳距离进行修正,选择误差最小的平均每跳距离对未知节点与信标节点间的距离进行计算。仿真实验结果表明,改进算法在不明显提高算法复杂度与通信量的基础上大大提高了定位精度。
    结合主动学习和自动标注的评价对象抽取方法
    朱珠, 李寿山, 戴敏, 周国栋
    2015, 50(07):  38-44.  doi:10.6040/j.issn.1671-9352.3.2014.106
    摘要 ( 1430 )   PDF (1647KB) ( 1150 )   收藏
    参考文献 | 相关文章 | 多维度评价
    提出了结合主动学习和自动标注的评价对象抽取方法。具体实现过程中,首先,利用少量的已标注样本训练分类器,对非标注样本进行测试,获取自动标注结果及其置信度:其次,通过置信度计算每个样本的整体置信度,挑选出低置信度即不确定性高的样本待标注:最后,对待标注样本中置信度低的词语进行人工标注,而置信度高的部分则采用自动标注结果。实验表明,该方法可以在确保抽取性能的同时有效地减小人工标注语料的开销。
    面向框架语义分析的目标词自动识别方法
    陈亚东, 洪宇, 杨雪蓉, 王潇斌, 姚建民, 朱巧明
    2015, 50(07):  45-53.  doi:10.6040/j.issn.1671-9352.3.2014.076
    摘要 ( 1192 )   PDF (1877KB) ( 1031 )   收藏
    参考文献 | 相关文章 | 多维度评价
    提出了一种基于监督学习的目标词自动识别方法,分析并检验了多种区分目标词、框架元素和非实义词的分类特征,并在此基础上,联合使用监督学习与规则匹配方法,形成了兼顾扩展性和精确性的目标词识别系统。在FrameNet语料集的实验结果显示,融合方法的目标词识别获得了3.86%的性能提升。
    多点协作复制攻击检测研究
    周先存, 黎明曦, 李瑞霞, 徐明鹃, 凌海波
    2015, 50(07):  54-65.  doi:10.6040/j.issn.1671-9352.0.2014.368
    摘要 ( 1655 )   PDF (3337KB) ( 750 )   收藏
    参考文献 | 相关文章 | 多维度评价
    在实际应用中,许多无线传感器网络是一个多功能的异构网络,同时存在静态网络和移动网络,这对节点复制攻击检测是一个极大的挑战。利用静态网络和移动网络相互协作实施检测,提出一种协作式检测方案,实现了节点复制攻击的检测与防御。通过实验对方案中的静态网络检测的密钥对预分配方案(PTPP)和移动节点复制攻击检测的协作式检测方案(CCD)进行了验证。分析表明,该方案具有较好的安全性和可以接受的成本和开销,是一种实用的异构无线传感器网络的节点复制攻击检测方案。
    基于哈希表的MapReduce算法优化
    李瑞霞, 刘仁金, 周先存
    2015, 50(07):  66-70.  doi:10.6040/j.issn.1671-9352.0.2014.461
    摘要 ( 1544 )   PDF (1309KB) ( 794 )   收藏
    参考文献 | 相关文章 | 多维度评价
    分布式并行计算是提高计算机性能常用的方法,但针对不同需求,并行程序的设计并没有统一的模型与方法,使得并行程序的编写完全依靠开发人员的经验。Google公司提出的分布式并行编程模型MapReduce能够完成特定类型的并行程序的开发与运行。使用哈希表对MapReduce分布式并行编程模型进行优化,减少中间结果中的碎片,并省略Combiner中间函数的调用,减少传输负载,提升运行效率,同时兼顾了Map函数与Reduce函数接口的属性,保持了MapReduce模型的并行性特点。
    基于广义Jaccard系数的微博情感新词判定
    桑乐园, 徐新峰, 张婧, 黄德根
    2015, 50(07):  71-75.  doi:10.6040/j.issn.1671-9352.3.2014.108
    摘要 ( 1452 )   PDF (1419KB) ( 1225 )   收藏
    参考文献 | 相关文章 | 多维度评价
    微博情感新词的极性判定是情感分析研究中的一项基本任务,旨在对新词进行情感分类。针对极性判定的问题,提出一种新的计算特征向量相似度的算法。该方法首先使用特征向量表示情感新词和已有情感词,利用点互信息计算特征权值:然后采用广义Jaccard系数分别计算情感新词与已有的三种极性的情感词集内情感词的相似度,词集内相似度之和即为情感新词与该情感词集的相关度:最后,通过情感新词与三个极性情感词集的相关度的距离差判定其极性。实验结果表明,基于广义Jaccard系数的情感新词极性判定算法得出的F值比COAE 2014参赛队伍的最好成绩高两个百分点。
    Lucene全文索引效率的改进
    李胜东, 吕学强, 孙军, 施水才
    2015, 50(07):  76-79.  doi:10.6040/j.issn.1671-9352.3.2014.217
    摘要 ( 1181 )   PDF (1034KB) ( 595 )   收藏
    参考文献 | 相关文章 | 多维度评价
    Lucene是一个优秀的开源的全文搜索技术框架,按照框架规范,扩展它的功能,可以将它很好地嵌入到搜索引擎中。研究了Lucene的索引结构和原理,通过改进增量索引、增大索引缓冲区的大小和减少往磁盘上写索引文件的频率,达到提高创建索引效率的目的。设计了全文检索实验,实验结果表明,该方法使10000篇文档创建索引的平均效率比前人方法提高了19.5%,具有良好的应用前景。
    基于消费者选择偏好的可替代品订货策略
    梁红燕, 许民利, 简惠云
    2015, 50(07):  80-88.  doi:10.6040/j.issn.1671-9352.0.2014.406
    摘要 ( 1559 )   PDF (1626KB) ( 787 )   收藏
    参考文献 | 相关文章 | 多维度评价
    基于消费者选择偏好,建立了相应零售商利润-订单量的条件风险价值模型。以零售商利润为最优化目标,在市场总需求不确定时,考虑零售商风险偏好、消费者选择偏好及两种产品的可替代性,研究零售商的最优订货策略。研究结果表明,当产品订货量在一定范围时,产品替代性将失去作用:当两种产品总订货量在一定范围时,产品最优订货量随顾客偏好系数及产品替代系数的提高而增大,随替代产品顾客偏好系数和零售商风险规避程度的提高而减小:产品与替代产品间的顾客偏好系数差异越大,两产品总订货量越大。
    自然沙堆积的静止角研究
    周向玲, 麦麦提吐逊·阿布都热依木, 俞胜清, 李华振
    2015, 50(07):  89-94.  doi:10.6040/j.issn.1671-9352.0.2014.360
    摘要 ( 1822 )   PDF (1652KB) ( 2094 )   收藏
    参考文献 | 相关文章 | 多维度评价
    以塔克拉玛干沙漠西南边缘自然沙丘的沙子为研究对象,对不同粒径的沙采用漏斗法进行沙堆积,并录像记录了沙的堆积过程。将录像处理成图片,用计算软件“CorelDraw”处理,从而得到沙堆静止角和崩塌角随时间和沙粒粒径的变化关系。得出结论:(1)沙堆的静止角随时间呈振荡变化。首先,静止角逐步变大到崩塌角,崩塌后堆积角回到静止极角,然后再增大到崩塌角,如此往复。(2) 当粒径小于0.30 mm时,沙堆崩塌角及崩塌角与静止极小角的差值随沙粒粒径的增大而增大:但当粒径大于0.30 mm时,其差值随沙粒粒径的增大而减小。(3)崩塌角与静止极角差值的平均值为(4.6±0.6)°。(4)混合沙的崩塌角与静止极角的差值为(5.2±0.3)°。