《山东大学学报(理学版)》

面向Hive的基于安全域的数据隔离保护框架

常天天,陈兴蜀,罗永刚,兰晓

2019, 54(3): 1-9. doi:10.6040/j.issn.1671-9352.2.2018.073

摘要 ( 1764 )

HTML ( 154 )

PDF (1780KB) ( 445 )

数据和表 | 参考文献 | 相关文章 | 多维度评价

针对Hive数据库中的数据共享所带来的敏感信息泄漏问题,以数据分级为前提,利用基于标签的访问控制技术,提出了一种基于安全域的数据隔离保护框架(SD-DIPF)。首先,通过设计层次安全标签树划分标签级别,用来对系统中的主客体进行标识;结合分级标签阐明安全域(SD)的设计思想,对安全域及其子域进行定义以及安全性的形式化证明;最后,利用安全域对平台数据进行逻辑划分保证不同敏感级别数据的有效隔离;针对该框架对Hive数据库的适用性进行说明,并结合现有的认证机制给出了其在Hive数据库中的实现。通过实验分析验证该框架可以保障敏感数据不被非法访问,证明了本框架的可行性和安全性。

社交网络用户敏感属性迭代识别方法

谢小杰,梁英,董祥祥

2019, 54(3): 10-17, 27. doi:10.6040/j.issn.1671-9352.2.2018.084

摘要 ( 1527 )

HTML ( 20 )

PDF (949KB) ( 683 )

数据和表 | 参考文献 | 相关文章 | 多维度评价

分析识别社交网络用户敏感信息，有利于从技术上量化隐私泄露程度，进行隐私保护。针对现有的用户属性识别方法需要对用户属性取值进行强假设的问题，结合RL迭代分类框架和扩展wvRN关系识别的方法，提出了一种社交网络用户敏感属性迭代识别方法。通过卷积神经网络提取用户文本特征进行识别，结合邻居结点迭代地进行关系识别，不仅弱化了对用户属性的假设，而且提高了可用性。实验结果表明，通过在社交网络中获取少量的标注数据，对迭代识别方法设置合理的参数值，可以获得较好的用户敏感属性识别结果。

基于密码协议实现的行为安全分析模型

吴福生,张焕国,倪明涛,王俊

2019, 54(3): 18-27. doi:10.6040/j.issn.1671-9352.2.2018.053

摘要 ( 1391 )

HTML ( 15 )

PDF (692KB) ( 318 )

数据和表 | 参考文献 | 相关文章 | 多维度评价

提出了一种基于密码协议实现的行为安全分析模型,该模型把密码协议实现分2个部分:一是外部行为(开放网络空间交互通信的行为);二是内部行为(代码实现的行为)。通过行为的可控性,能够发现、控制或纠正密码协议实现的安全。基于该分析模型方法,以经典的密码协议为实例进行模拟实验。实验结果表明,密码协议实现的行为安全是可控的。

视觉和物体显著性检测方法

许佳,蒋鹏

2019, 54(3): 28-37. doi:10.6040/j.issn.1671-9352.0.2018.601

摘要 ( 2242 )

HTML ( 26 )

PDF (7152KB) ( 503 )

数据和表 | 参考文献 | 相关文章 | 多维度评价

显著性检测的目标是快速找出图像视频等视觉数据中最吸引人注意的区域，作为计算机视觉领域的基本任务之一，近年来备受关注，众多的方法被提出。这些显著性检测工作可分为2个分支：视觉显著性检测方法和显著性物体检测方法。尽管这2个分支的方法有很多相同点甚至共享相同的计算模型，但是在不同分支的评价数据集上有巨大的性能差异，很少有工作对这2个分支的方法进行比较和分析。通过详细分析和阐述2个分支主流方法的计算模型、采用的评价机制以及使用的数据集，总结了多种改进视觉显著性检测方法用来检测显著性物体的方式，通过这些方式视觉显著性检测方法可应用于显著性物体检测数据集，其性能达到了领先水平甚至超过了一些主流显著性物体检测方法，从而缓解了2个分支显著性检测方法在不同分支数据集上表现的不一致的问题。

一种用户成长性画像的建模方法

董哲瑾,王健,钱凌飞,林鸿飞

2019, 54(3): 38-45. doi:10.6040/j.issn.1671-9352.1.2018.149

摘要 ( 1376 )

HTML ( 18 )

PDF (1933KB) ( 515 )

数据和表 | 参考文献 | 相关文章 | 多维度评价

用户成长值反映用户粘性，预测用户成长值有助于实现精准营销。聚焦用户成长性画像研究，针对用户原始数据记录复杂多样、难以提取有效特征的问题，通过散点图分析挖掘影响用户成长值的因素，提取行为特征和相对稳定的时间特征，并对比基于树的特征筛选算法和L1范数进行特征筛选。针对已标注成长值的用户数据不足问题，改进COREG算法，通过半监督学习模型丰富训练数据，提高模型的预测准确度，同时降低原算法的时间复杂度，最后采用模型融合整合不同模型的优势。在CSDN博客平台提供的SMP CUP 2017数据集上进行实验，结果表明，建立的模型有效地提高了泛化能力和预测准确度。

基于用户情感倾向感知的微博情感分析方法

吴洁,朱小飞,张宜浩,龙建武,黄贤英,杨武

2019, 54(3): 46-55. doi:10.6040/j.issn.1671-9352.1.2018.159

摘要 ( 2034 )

HTML ( 26 )

PDF (1385KB) ( 489 )

数据和表 | 参考文献 | 相关文章 | 多维度评价

微博言论往往带有强烈的情感色彩,对微博言论的情感分析是获取用户观点态度的重要方法。许多学者都是将研究的重点集中在句子词性、情感符号以及情感语料库等方面,然而用户自身的情感倾向性并没有受到足够的重视,因此,提出了一种新的微博情感分类方法,其通过建模用户自身的情感标志得分来帮助识别语句的情感特征,具体地讲,将带有情感信息的微博语句词向量序列输入到长短期记忆网络(LSTM),并将LSTM输出的特征表示与用户情感得分进行结合作为全连接层的输入,并通过Softmax层实现了对微博文本的情感极性分类。实验表明,提出的方法UA-LSTM在情感分类任务上的表现超过的所有基准方法,并且比最优的基准方法MF-CNN在F1值上提升了3.4%,达到0.91。

融合多源异构网络信息的标签推荐方法

包恒泽,周栋,吴谈

2019, 54(3): 56-66. doi:10.6040/j.issn.1671-9352.1.2018.100

摘要 ( 1397 )

HTML ( 11 )

PDF (6680KB) ( 474 )

数据和表 | 参考文献 | 相关文章 | 多维度评价

标签通常被广泛地应用于标注各种在线资源，例如文章、图像、电影等，其主要目的是便于用户理解以及高效地管理和检索海量网络资源。因为人工对这些海量资源进行标注十分繁琐且耗时，所以自动化标签推荐技术被广泛关注。目前大部分标签推荐方法主要通过挖掘资源的内容信息进行推荐。然而，现实世界中很多数据信息并非独立存在，如文献数据通过相互引用关系而形成复杂的网络结构。研究表明，资源的拓扑结构信息和文本内容信息可分别从2个不同角度对同一资源的语义特征进行概括，并且从2个方面观察到的信息可以互为补充和解释。基于此，提出一种同时对资源内容信息和资源网络拓扑结构信息进行统一建模的概率主题模型和标签推荐方法。该方法通过结合标签和资源内容之间的标注关系以及资源之间的链接关系等多源异构信息，去挖掘资源潜在的语义信息为新的资源推荐若干功能语义相近的标签。

基于标签和分块特征的新闻网页关键信息自动抽取

王雪梅,陈兴蜀,王海舟,王文贤

2019, 54(3): 67-74. doi:10.6040/j.issn.1671-9352.2.2018.212

摘要 ( 1417 )

HTML ( 16 )

PDF (649KB) ( 599 )

数据和表 | 参考文献 | 相关文章 | 多维度评价

针对抽取新闻关键信息需要人工构造或训练生成模板的问题,提出了基于标签和分块特征的新闻关键信息自动抽取方法。该方法首先通过计算新闻网页相关特征来定位新闻正文标签块,然后通过编辑距离定位新闻标题标签块,最后根据正文块和标题块定位新闻发布时间和来源标签块,并通过抽取各块的文本获得目标新闻关键信息。在该方法的基础上提出了针对新闻站点的目标新闻自动抽取框架,并用该框架对10个新闻站点的30个新闻栏目进行了新闻抽取。对抽取到的1597条新闻随机选择了1000条进行了实验。实验结果表明,该方法对新闻标题、发布时间、来源、正文均表现出良好的抽取效果,且优于实验对比对象。

切换奇异系统事件触发控制的输入输出有限时间稳定

冯娜娜,吴保卫

2019, 54(3): 75-84. doi:10.6040/j.issn.1671-9352.0.2018.297

摘要 ( 1410 )

PDF (545KB) ( 819 )

参考文献 | 相关文章 | 多维度评价

研究了基于事件触发的切换奇异系统的输入输出有限时间稳定性问题。给出切换奇异系统输入输出有限时间稳定的概念,并提出事件触发条件。基于事件触发机制设计了动态输出反馈控制器,利用Lyapunov函数和平均驻留时间方法,得到切换奇异闭环系统输入输出有限时间稳定的充分条件,并且得到了动态输出反馈控制器的参数。最后用一个数值实例说明结论的有效性。

基于随机森林算法识别基因间长非编码RNA

徐炜娜,张广乐,李仕红,陈园园,李强,杨涛,许明敏,乔宁,张良云

2019, 54(3): 85-92, 101. doi:10.6040/j.issn.1671-9352.0.2018.261

摘要 ( 1107 )

HTML ( 10 )

PDF (2464KB) ( 640 )

数据和表 | 参考文献 | 相关文章 | 多维度评价

为了深入了解和探索lincRNA的调控机制,建立了lincRNA高效识别模型,有助于为后续研究提供数据源。依据最小自由能(minimum free energy, MFE)和信噪比(signal-noise ratio, SNR)等特征,并通过特征贡献度大小剔除冗余特征,构建随机森林(random forest, RF)分类模型,有效地识别lincRNAs。经检验,模型的灵敏度、特异性和精确度分别达到94.1%、93.2%和93.7%,高于现有PhyloCSF、LncRNA-ID和CPC方法的各项识别指标。模型在识别过程中表现出较好的鲁棒性,可准确识别lincRNA。

一种块增量偏最小二乘算法

曾雪强,叶震麟,左家莉,万中英,吴水秀

2019, 54(3): 93-101. doi:10.6040/j.issn.1671-9352.1.2018.051

摘要 ( 1436 )

PDF (550KB) ( 876 )

参考文献 | 相关文章 | 多维度评价

增量学习模型是一种有效挖掘大规模数据的数据处理技术。增量式偏最小二乘(incremental partial least square, IPLS)模型是一种基于增量技术的偏最小二乘算法改进模型,具有不错的数据降维效果,但是,IPLS模型每新增1个样本都需要对模型进行增量更新,导致模型的训练时间较长。针对这一问题,基于数据分块更新的思想提出了一种块增量偏最小二乘算法(chunk incremental partial least square, CIPLS)。CIPLS算法将样本数据划分为数个的数据块(chunk),然后再以数据块为单位对模型进行增量更新,从而大幅减少了模型的更新频率,提高了模型的学习效率。在K8版本的p53蛋白数据集和路透文本分类语料库上的对比实验表明,CIPLS算法大幅度缩短了增量式偏最小二乘模型的训练时间。

面向不平衡分类的固定半径最近邻逐步竞争算法(FRNNPC)

周鹏,伊静,朱振方,刘培玉

2019, 54(3): 102-109. doi:10.6040/j.issn.1671-9352.1.2018.107

摘要 ( 1311 )

PDF (609KB) ( 373 )

参考文献 | 相关文章 | 多维度评价

许多真实世界的数据集都存在一个称为类不平衡问题的问题。传统的分类算法在对不平衡数据进行分类时,容易导致少数类被错分。为了提高少数类样本的分类准确度,提出了一种基于固定半径最近邻的逐步竞争算法(FRNNPC),通过固定半径邻(FRNN)对数据集进行预处理,在全局范围内消除不必要的数据,在得到的候选数据中使用逐步竞争算法(NPC),即逐渐计算查询样本邻近样本的分值,直到一个类的分值总和高于另一个类。简而言之,该方法能够有效地处理不平衡问题,而且不需要任何手动设置的参数。实验结果将所提出的方法与4种代表性算法在10个不平衡数据集上进行了比较,并验证了该算法的有效性。

引入垂直电商的供应链渠道定价策略

肖敏,余敏,何新华

2019, 54(3): 110-118. doi:10.6040/j.issn.1671-9352.0.2018.159

摘要 ( 1251 )

PDF (648KB) ( 638 )

参考文献 | 相关文章 | 多维度评价

随着网络的发展,引入垂直电商已成为制造商的必然选择。制造商需要对引入垂直电商后的直销价及给各零售商的批发价进行权衡。在对称信息情况下,研究了由制造商、传统零售商和是否引入网络垂直电商构成的两种渠道供应链系统,重点考虑市场价格与服务的敏感程度对制造商定价决策的影响并进行两种供应链系统的制造商定价对比。制造商选择引入垂直电商对于自身与消费者都是更好的选择,在引入垂直电商后,制造商直销渠道价格有所降低,批发给传统零售商的价格有所上升,但略低于垂直电商批发价,其具体价格制定受市场对价格和服务敏感程度的影响。

物流外包满意度提升路径——基于模糊集定性比较

张克勇,吕美琳,姚建明,王昊

2019, 54(3): 119-126. doi:10.6040/j.issn.1671-9352.0.2018.280

摘要 ( 1190 )

PDF (756KB) ( 422 )

参考文献 | 相关文章 | 多维度评价

构建物流外包“服务质量感知—满意度”的理论模型。以成都市高新西区和郫都区42家制造企业调研所得102份问卷为样本,采用偏最小二乘结构方程验证模型假设。以服务质量感知为解释框架,分析实现物流外包高满意度的构型,并发现各构型与满意度之间存在的非对称因果关系。研究发现物流企业专注于提升工作人员的专业性,并为客户提供一站式完整服务,是实现物流客户高满意度最重要的路径;对客户的服务做出快速反应是实现客户满意的核心条件,而提供可靠、准确、准时的服务是实现客户满意的共同的辅助条件。最后,对客户低满意度进行分析,针对物流企业如何实现客户高满意度和如何避开导致客户满意低的雷区,给出了具体建议。

当期目录