Please wait a minute...
您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(理学版)》
  • 官方博客
  • 官方微博

当期目录

    2024年 第59卷 第3期 刊出日期:2024-03-20
      
    基于元路径属性融合的异质网络表示学习
    王静红,吴芝冰,黄鹏,杨家腾,李笔
    2024, 59(3):  1-13.  doi:10.6040/j.issn.1671-9352.7.2023.787
    摘要 ( 79 )   PDF (5573KB) ( 79 )   收藏
    参考文献 | 相关文章 | 多维度评价
    针对信息网络的表示学习进行研究,提出了一种基于元路径信息融合的异质图神经网络(metapath attribute fusion graph neural network, MAFGNN),通过在异质网络中引入元路径之前将目标节点的邻居信息包括元路径信息融入到节点中,实现目标节点和邻居信息的融合。该方法首先将不同类型的节点属性特征进行维度转换便于后续的融合操作,通过计算目标节点和邻居节点权重值完成目标节点信息的融合操作。然后根据特定元路径对目标节点进行融合,最后在不同元路径间实现不同语义信息的融合操作。在多个异质信息数据集上进行实验表明,MAFGNN模型在处理异质网络节点嵌入方面相比于最先进的基准实验有最好的性能和更加准确的预测结果。
    模糊概念集的启发式构造方法及其推荐应用
    刘忠慧,姜帅,闵帆
    2024, 59(3):  14-26.  doi:10.6040/j.issn.1671-9352.7.2023.9950
    摘要 ( 41 )   PDF (1014KB) ( 61 )   收藏
    参考文献 | 相关文章 | 多维度评价
    针对模糊形式概念分析在推荐应用中难以用于大规模数据集的问题,提出了一种基于模糊概念集启发式构造的推荐方法。根据用户之间的相似度,为每个用户构建子背景,在子背景上采用新的启发式信息,分别以用户和项目为线索生成模糊概念。利用模糊概念内部信息,设计了融入用户权重的推荐置信度,实现了对用户的个性化推荐。在6个真实数据集上进行试验,本方法的推荐效率较高,与经典的协同过滤算法相比,在稀疏的数据集上能够取得更好的推荐效果。
    模糊边界剥离聚类
    孙嘉睿,杜明晶
    2024, 59(3):  27-36.  doi:10.6040/j.issn.1671-9352.4.2023.040
    摘要 ( 45 )   PDF (4176KB) ( 32 )   收藏
    参考文献 | 相关文章 | 多维度评价
    提出了一种模糊边界剥离聚类(fuzzy border-peeling clustering, FBP)算法。首先,采用了一种基于Cauchy核的动态密度估计方式来计算数据点密度;然后,使用逐层剥离策略区分边界数据和核心数据;接着,利用核心数据间的可达性实现核心区域聚类;最后,采用模糊分配策略实现边界数据的软划分。在人工数据集和真实数据集上与10种算法(包含6种密度聚类算法和4种模糊聚类算法)作了对比。实验结果表明,在所有数据集上,FBP的调整兰德系数ARI指标平均提高了21%~60%,FBP的标准化互信息NMI指标平均提升了12%~47%,基于Cauchy核和模糊分配策略优化后的边界剥离聚类算法显著提高了聚类的准确性。
    基于改进蝴蝶算法的水文地质参数优化
    韦修喜,彭茂松,黄华娟
    2024, 59(3):  37-50.  doi:10.6040/j.issn.1671-9352.7.2023.3667
    摘要 ( 38 )   PDF (5557KB) ( 55 )   收藏
    参考文献 | 相关文章 | 多维度评价
    针对水文地质参数求解精度不足以及传统配线法等策略在求参过程中效率低下等的问题,提出一种基于黄金正弦加权蝴蝶优化算法的水文地质参数优化策略。首先在蝴蝶优化算法的全局与局部搜索阶段引入黄金正弦算子,缩小算法解空间;其次引入自适应权重,调整算法后期种群个体移动步长与搜索方向。通过6个基准测试函数的寻优对比测试结果表明:黄金正弦加权蝴蝶优化算法的寻优精度较高且收敛速度较快。将该优化策略应用于水文地质参数导水系数与贮水系数的优化以达到最小降深误差,并与粒子群优化算法、配线法等优化策略进行实验对比。结果表明黄金正弦加权蝴蝶优化算法能有效优化水文地质参数并提高泰斯公式计算性能,获得更小抽水降深误差,为后续抽水试验提供了新方法。
    基于多策略结合的灰狼优化算法及应用
    秦宏伍,王立铮,傅渝,隋沐翾,何秉高
    2024, 59(3):  51-60.  doi:10.6040/j.issn.1671-9352.7.2023.4633
    摘要 ( 37 )   PDF (4919KB) ( 30 )   收藏
    参考文献 | 相关文章 | 多维度评价
    标准灰狼优化(grey wolf optimizer, GWO)算法存在局部探索和全局开发难以平衡等问题。针对此类问题,提出基于多策略结合的灰狼优化算法(multi-strategy grey wolf optimization, MSGWO)。首先,灰狼算法引入非线性收敛因子和Tent映射;然后,利用广泛学习、精英学习和协调学习三种策略,在GWO优化过程中协调工作;最后,利用轮盘赌进行策略选择,以获得更具多样性灰狼位置和更具全局代表性的个体。通过标准基准函数测试,采用算法变体进行对比。结果显示,MSGWO算法拥有较好的全局搜索、局部开发的平衡能力以及更快的收敛速度。在此基础上,利用MSGWO算法优化回声状态网络(echo state networks, ESN)超参数进行回归预测。实验表明平均绝对百分比误差为0.38%,拟合程度达到0.98,验证了MSGWO算法的优化性能。
    基于样本相关性的层次特征选择算法
    史春雨,毛煜,刘浩阳,林耀进
    2024, 59(3):  61-70.  doi:10.6040/j.issn.1671-9352.7.2023.1073
    摘要 ( 40 )   PDF (851KB) ( 52 )   收藏
    参考文献 | 相关文章 | 多维度评价
    提出了基于样本相关性的层次特征选择算法(hierarchical feature selection algorithm based on instance correlations, HFSIC)以进一步提高分层分类特征选择算法的性能。在使用稀疏正则项去除不相关特征之后,将层次结构中的父子关系与特征空间中样本之间的重构关系相结合,学习同一子树下各类别的样本相关性,利用递归正则优化输出特征权重矩阵。在衡量样本相关性时,将重构系数矩阵整合到训练模型中,同时利用l2,1范数去除不相关的和冗余的特征。使用加速近端梯度法解决所提模型的优化问题,并在多个评价指标下评估所提算法的优越性。实验结果表明,所提方法在5个数据集上的表现优于其他算法,验证了该算法的有效性。
    基于图注意力神经网络的实体消歧方法
    牛泽群,李晓戈,强成宇,韩伟,姚怡,刘洋
    2024, 59(3):  71-80.  doi:10.6040/j.issn.1671-9352.1.2022.4484
    摘要 ( 41 )   PDF (3779KB) ( 46 )   收藏
    参考文献 | 相关文章 | 多维度评价
    针对链接对象为存在半结构化数据的知识库,提出了一种基于图注意力神经网络的短文本实体指称消歧方法。通过信息抽取与融入关键词,将含有半结构化数据的知识库构建为全局知识图谱;同时基于Bert预训练模型对短文本中的实体指称项进行嵌入融合;使用图注意力神经网络对全局知识图谱中候选实体节点进行加权聚合表征,并计算实体指称项与各候选实体之间的相似度得分,实现实体消歧。在CCKS2019数据集上的实验结果表明,基于图注意力神网络的实体消歧模型有效提高了实体消歧效果。
    基于情感分布的emoji嵌入式表示
    曾雪强,孙雨,刘烨,万中英,左家莉,王明文
    2024, 59(3):  81-94.  doi:10.6040/j.issn.1671-9352.1.2022.3548
    摘要 ( 37 )   PDF (6234KB) ( 44 )   收藏
    参考文献 | 相关文章 | 多维度评价
    提出了一种基于情感分布的emoji嵌入式表示方法(emoji embedded representation based on emotion distribution, EDEER)。EDEER方法采用基于BERT的情绪预测模型软标签,从真实数据中学习emoji嵌入式表示,通过情感分布直接建模emoji在各种情绪上的表达程度,使嵌入式表示中包含emoji的多种情感信息。在包含emoji的中文微博数据集上的多组对比实验表明,本文提出的方法可以有效地学习到与细粒度情绪直接关联的emoji嵌入式表示,构建具有较高情绪表达质量的emoji表示空间。
    政府开放数据中个人信息披露识别与统计方法
    陈海粟,廖佳纯,姚思诚
    2024, 59(3):  95-106.  doi:10.6040/j.issn.1671-9352.7.2023.2681
    摘要 ( 35 )   PDF (1538KB) ( 27 )   收藏
    参考文献 | 相关文章 | 多维度评价
    为推进数据开放过程中个人信息保护,深入分析政府开放数据中个人信息的披露现状:首先从相关平台中获取数据,并对其预处理,根据字段、表名等特征筛选出含有个人信息的数据;其次利用敏感信息识别方法识别数据中各类个人信息,并将其映射到个体,以统计个体数量同时检测其关联数据;最后通过数据可视化,直观展示个人信息披露现状。虽然部分公共数据开放平台虽然对公共数据进行分级分类以及去标识化等处理,但是已开放的数据中依旧包含大量直接展示的个人信息,需要在数据规范化分级分类、敏感信息识别和敏感信息脱敏等方面进行完善。
    基于属性加权的ML-KNN方法
    温欣,李德玉
    2024, 59(3):  107-117.  doi:10.6040/j.issn.1671-9352.2.2023.027
    摘要 ( 40 )   PDF (3383KB) ( 44 )   收藏
    参考文献 | 相关文章 | 多维度评价
    提出了一种基于属性加权的ML-KNN方法。首先使用变精度邻域粗糙集识别来自每一个标记的决策类非正域中的样本,并构造异质样本对;然后基于属性对异质样本对的区分能力评估不同属性对于分类的重要度;最后计算样本之间的加权距离获得其近邻分布,且基于最大化后验概率的原则实现多标记分类。在10个公开的多标记数据集上的实验结果验证了所提方法的有效性。
    基于改进距离测度的概率犹豫模糊多属性群决策新方法
    刘梦迪,张贤勇,莫智文
    2024, 59(3):  118-126.  doi:10.6040/j.issn.1671-9352.7.2023.4667
    摘要 ( 40 )   PDF (2000KB) ( 42 )   收藏
    参考文献 | 相关文章 | 多维度评价
    针对概率犹豫模糊环境下属性权重已知的多属性群决策问题,考虑概率犹豫模糊集的犹豫度,提出基于改进距离测度的概率犹豫模糊多属性群决策新方法。结合传统的概率犹豫模糊距离测度,通过信息融合定义融入犹豫度的概率犹豫模糊距离测度:汉明距离、欧氏距离、广义欧氏距离,并通过组合系数来实现理论扩张和融合优化,同时研究距离测度的大小关系及参数单调性。将融入犹豫度的距离测度与基于理想解相似度的逼近理想解排序法(technique for order preference by similarity to ideal solution, TOPSIS)结合构建多属性群决策新方法,采用公司选址案例进行决策选择,通过参数分析和决策比较来揭示所建方法的有效性。相关研究系统深化概率犹豫模糊距离测度,并丰富了多属性群决策方法。