Please wait a minute...
您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(理学版)》
  • 官方博客
  • 官方微博

当期目录

    2010年 第45卷 第7期 刊出日期:2010-07-16
      
    论文
    一种新的密度加权粗糙K-均值聚类算法
    谢娟英1, 2,张琰1,谢维信2, 3,高新波2
    2010, 45(7):  1-6. 
    摘要 ( 803 )   PDF (368KB) ( 1173 )   收藏
    相关文章 | 多维度评价

    为了克服粗糙K-均值聚类算法初始聚类中心点随机选取,以及样本密度函数定义所存在的缺陷,基于数据对象所在区域的样本点密集程度,定义了新的样本密度函数,选择相互距离最远的K个高密度样本点作为初始聚类中心,克服了现有粗糙K-均值聚类算法的初始中心随机选取的缺点,从而使得聚类结果更接近于全局最优解。同时在类均值计算中,对每个样本根据定义的密度赋以不同的权重,得到不受噪音点影响的更合理的质心。利用UCI机器学习数据库的6组数据集,以及随机生成的带有噪音点的人工模拟数据集进行测试,证明本文算法具有更好的聚类效果,而且对噪音数据有很强的抗干扰性能。

    产生式与判别式组合分类器学习算法
    江雪莲,石洪波*
    2010, 45(7):  7-12. 
    摘要 ( 803 )   PDF (772KB) ( 1339 )   收藏
    相关文章 | 多维度评价

    在AdaBoost集成方法的基础上,研究了一种产生式与判别模型组合的方法。该算法在每轮中同时学习一个产生式分类器和一个判别式分类器,选择误差率较小的作为个体分类器,然后对所有个体分类器采用加权的方法得到最终分类器。实验结果表明,该方法在准确率和收敛速度上都得到了很好的效果。

    倾向性文本迁移学习中的特征重要性研究
    黄贤立,罗冬梅
    2010, 45(7):  13-17. 
    摘要 ( 671 )   PDF (351KB) ( 1251 )   收藏
    相关文章 | 多维度评价
    一种基于混沌变异的多目标粒子群优化算法
    裴胜玉,周永权*
    2010, 45(7):  18-23. 
    摘要 ( 592 )   PDF (797KB) ( 1031 )   收藏
    相关文章 | 多维度评价
    盾构机密封舱渣土非线性本构模型参数识别
    李守巨1,上官子昌2,3,孙伟4,栾茂田1,刘博3
    2010, 45(7):  24-27. 
    摘要 ( 630 )   PDF (1024KB) ( 1089 )   收藏
    相关文章 | 多维度评价
    基于类间差异最大化的加权距离改进K-means算法
    张雪凤1,刘鹏1,2
    2010, 45(7):  28-33. 
    摘要 ( 811 )   PDF (1770KB) ( 1104 )   收藏
    相关文章 | 多维度评价

    为了改善K-means算法的聚类效果,将聚类准则函数定义为加权的类内误差平方总和SSE(sum of the squared error),并调整了K-means算法迭代过程中重新分配数据对象的方法:使用一个带有类内数据对象数的加权距离作为重新分配数据对象的依据,同时按类间差异最大化为准则优化了加权距离中的参数。实验表明,改进后的K-means算法可以在很大程度上减少大类被拆分情况的发生,明显改善聚类效果。

    基于前序关系的非确定型有穷自动机极小化算法
    张明明,秦永彬
    2010, 45(7):  34-38. 
    摘要 ( 717 )   PDF (379KB) ( 791 )   收藏
    相关文章 | 多维度评价

    为了减少非确定型有穷自动机(non-deterministic finite automata,NFA)的状态数,引入前序关系,并以图论为工具,将NFA的转移图看作一个带有标记的有向图,给出了NFA极小化的一个新方法。与现行的利用归并等价状态来极小化NFA的算法相比,该方法可以使得NFA在接受语言的能力等价的前提下,状态数得到进一步的减少。

    一种基于名词短语的检索结果多层聚类方法
    庞观松,张黎莎,蒋盛益*,邝丽敏,吴美玲
    2010, 45(7):  39-44. 
    摘要 ( 965 )   PDF (959KB) ( 1302 )   收藏
    相关文章 | 多维度评价

    为了对检索结果获取高质量的聚类效果,提取名词短语作为候选类别标签,根据候选类别标签分布情况生成基础类,再使用具有线性时间复杂度的一趟聚类算法对基础类进行多层聚类。与NEC,STC和Lingo算法的对比实验表明:该方法在类别标签的可读性、有效性以及聚类性能上都优于以上3种方法。

    对基于聚类和遗传算法的时间序列分割算法的改进
    吴大华,何振峰*
    2010, 45(7):  45-49. 
    摘要 ( 744 )   PDF (885KB) ( 732 )   收藏
    相关文章 | 多维度评价

    Vincent S.Tseng 等人提出的基于聚类和遗传算法的时间序列分割算法中,对于适应值函数的定义存在缺陷,本文对此进行了改进:用归一化处理消除子序列幅度对距离计算的影响,并引入类间距使分割结果的类间差异(模式之间的差异)变得更明显。对比算法改进前后的实验结果可以看出,这两点措施使适应值函数的精确性得到了提高,更有利于识别出子序列的模式。

    基于GEP的多数据流预测算法
    丁超1,2, 元昌安1,3*, 覃晓1,3
    2010, 45(7):  50-54. 
    摘要 ( 748 )   PDF (1011KB) ( 1505 )   收藏
    相关文章 | 多维度评价

    针对传统的基于线性回归预测建模方法只能适应简单的预测建模和只能预测未来窗口平均值的不足,提出了基于基因表达式编程(gene expression programming,GEP)的多数据流预测方法。在多数据流环境中使用滑动窗口对多数据流的划分方法,给出了多数据流环境中的数据流名称的定义,揭示了这些数据流之间存在的映射关系;进而提出了对多数据流进行预处理的方法,并建立了基于GEP的多数据流的自适应预测模型。使用真实数据进行实验,验证了算法的有效性。

    基于调和平均测地线核的局部线性嵌入算法
    曾文赋1,黄添强1,2,李凯1,余养强1,郭躬德1,2
    2010, 45(7):  55-59. 
    摘要 ( 1107 )   PDF (1002KB) ( 1080 )   收藏
    相关文章 | 多维度评价

    为解决现有局部线性嵌入算法不适合处理非均匀分布数据和未利用距离远点信息的问题,首先引入测地线距离,以便能利用远点信息;然后使用调和平均规范化构造调和平均测地线核矩阵,使算法能更好地处理分布不均匀数据并具有鲁棒性。在UCI数据集上的实验结果表明,改进后的算法能够取得比局部线性嵌入算法更好的降维效果。

    一种基于粒计算的知识隐藏方法
    邱桃荣,王璐,熊树洁,白小明
    2010, 45(7):  60-64. 
    摘要 ( 746 )   PDF (866KB) ( 1344 )   收藏
    相关文章 | 多维度评价

    对数据中蕴涵的敏感知识的隐藏与保护是私有保护数据挖掘中重要一个研究课题。粒计算具有在不同的粒度层次上进行问题求解的能力。本文讨论了基于粗糙集粒计算模型的数据中知识隐藏与保护方法。首先,介绍了不完备信息系统下的相容关系、相容信息粒和信息粒度;其次,提出基于粒计算的知识隐藏与保护方法;最后,通过具体实例和在真实数据集上的测试表明了所提出方法的可行性。

    基于稀疏性约束非负矩阵分解的人脸年龄估计方法
    杜吉祥1,2,余庆1,翟传敏1
    2010, 45(7):  65-69. 
    摘要 ( 728 )   PDF (972KB) ( 1238 )   收藏
    相关文章 | 多维度评价

    基于人脸图像的年龄自动估计已经成为当前人脸识别领域的一个重要研究方向。首先通过非负矩阵分解(non-negative matrix factorization, NMF)算法对基矩阵或系数矩阵进行稀疏性约束,用形成的更具有局部表达能力的子空间对人脸图像数据进行表示。然后使用径向基函数神经网络进行训练和测试,提取包含在大多数人脸图像上的年龄信息来进行年龄估计。实验结果表明,具有稀疏性约束的非负矩阵分解算法对年龄估计问题具有良好的应用效果。

    一种基于上下文信息的乳腺肿块ROI检测方法
    郭乔进,丁轶,李宁
    2010, 45(7):  70-75. 
    摘要 ( 749 )   PDF (538KB) ( 1061 )   收藏
    相关文章 | 多维度评价

    传统的ROI(region of interest)检测方法忽略了图像中的上下文信息,为了解决这个问题,本文利用概率潜在语义分析(probability latent semantic analysis,PLSA)来对图像中的每块区域周围的图像特征进行分析,并利用其作为上下文特征来辅助ROI的检测。实验表明,该方法与直接进行分类相比,能够取得更好的分类效果。

    一种新的基于区域生长的彩色图像分割算法
    刘战杰1,马儒宁1,邹国平1,钟宝江2,丁军娣3
    2010, 45(7):  76-80. 
    摘要 ( 1083 )   PDF (1233KB) ( 1209 )   收藏
    相关文章 | 多维度评价

    为克服一般区域生长算法对初始种子点选择以及生长顺序鲁棒性较差的问题,提出了一种鲁棒于生长顺序的彩色图像区域生长算法.首先计算所有像素点的局部颜色直方图以及领域相似性指标(neighbor similarity factor,NSF);其次通过NSF值建立种子的选取准则、种子的生长准则以及生长的终止准则,对图像进行初分割;最后对未分类点进行重新分类得到最终分割结果。通过与JSEG算法比较发现,该算法在运算时间以及分割准确性具有明显优势。

    基于显著性加权颜色和纹理的图像检索
    邹国平1,马儒宁1,丁军娣2,钟宝江3
    2010, 45(7):  81-85. 
    摘要 ( 794 )   PDF (2157KB) ( 1199 )   收藏
    相关文章 | 多维度评价

    显著性体现了图像中像素区域引起视觉注意的强弱程度,在图像检索中具有重要意义。本文提出的基于显著性加权的图像检索方法不需要分割出显著性区域,而以显著性加权的方式建立了新的颜色特征和纹理特征,从而增加了显著性区域的颜色与纹理特征的权重。通过对4种主要的显著图的实验比较发现该方法能有效提高检索效果。

    基于脉冲耦合神经网络的多区域图像分割
    徐光柱1,刘鸣2,任东1,马义德3,刘晓丽1
    2010, 45(7):  86-93. 
    摘要 ( 711 )   PDF (2490KB) ( 1060 )   收藏
    相关文章 | 多维度评价

    为解决传统脉冲耦合神经网络(pulse coupled neural network,PCNN)仅限于二值分割且无法对灰度缓慢变化的大范围区域进行完整分割的问题,提出了一种基于PCNN的多区域图像分割算法。将分割图像经过平滑和归一化后送入PCNN,在快速连接机制作用下,每次迭代处理中具有相似状态的神经元可实现同步点火,完成单个图像区域的完整分割。经过预定的迭代次数后,以各神经元的点火次数为新输入图像各像素点的灰度值,然后经平滑和过归一化后再次送入PCNN重复上述处理,完成多区域图像分割。Berkeley图库的实验结果显示,该算法高效、鲁棒,可有效应用于图像分割。

    指纹图像分割方法综述
    郭文鹃,杨公平*,董晋利
    2010, 45(7):  94-101. 
    摘要 ( 880 )   PDF (597KB) ( 642 )   收藏
    相关文章 | 多维度评价

    在自动指纹识别系统中,精确的指纹图像分割可以加快后续处理速度,提高识别的准确性。按照图像特征的定义范围,将指纹图像分割方法分为基于像素特征、块特征和图像全局特征的方法。对每类方法分别从特征层面与分类器层面进行了归纳总结,并简要分析了3类方法的分割错误率与时间复杂性。最后指出了目前指纹分割算法中存在的主要问题和未来的研究方向。

    基于特征缺省的最小类内方差支持向量机
    宋玉丹,王士同*
    2010, 45(7):  102-107. 
    摘要 ( 1020 )   PDF (547KB) ( 1405 )   收藏
    相关文章 | 多维度评价

    最近提出的基于特征缺失的支持向量机(support vector machine with absent features,AF-SVM)在处理具有特征缺失的数据分类时,得到的分类超平面不能很好地适应数据的总体分布,并存在两类误分的比例相差比较大的问题。为此,本文通过引入最小类内方差支持向量机(minimum class variance SVM, MCVSVM)分类机制,提出了基于特征缺失的最小类内方差支持向量机(minimum within-class variance SVM with absent features,AF-V-SVM)。AF-V-SVM一方面可以依据数据集的分布特性,改善分类超平面的方向性;另一方面,通过自由设置分类间隔的定义空间,调整误分的比例。实验表明,与其他基于特征缺省的分类方法相比,该方法不仅提高了分类正确率而且使分类效果更加合理。

    一种新的基于多示例学习的场景分类方法
    王刚,许信顺*
    2010, 45(7):  108-113. 
    摘要 ( 728 )   PDF (1227KB) ( 996 )   收藏
    相关文章 | 多维度评价

    多示例学习是近年来才出现的一种新的学习框架,并以其对多义性对象的出色表示能力而被成功地运用在图像分类任务中。首先提出了一种新的图像多示例包生成方式,采用特征的概率分布表示图像,并对图像像素分布提取一个高斯混合模型,将每个高斯分布作为一个示例,生成图像的多示例包。然后,在对图像进行分类时,采用了信息瓶颈聚类把多示例包转化成单示例,从而将传统的单示例分类器用在该问题上。为了提高分类器的泛化能力,对多个分类器进行了集成。选取了5类自然场景图像进行试验,结果显示所提出的方法平均性能优于当前常用的一些多示例学习算法。

    决策树构建方法:向前两步优于一步
    张雯,张化祥*,李明方,计华
    2010, 45(7):  114-118. 
    摘要 ( 757 )   PDF (415KB) ( 761 )   收藏
    相关文章 | 多维度评价

    为提高搜索算法找到全局最优解的可能性,在C4.5算法的基础上,本文提出了向前两步的决策树(two-step forward decision tree,TSFDT)构建算法。该算法在选择属性时,考虑同时选择两个属性带来的信息增益,而不是只考虑单一最优属性对于信息增益的贡献,从而在寻找问题全局最优方面比只考虑单一最优属性具有更大的可能性。10个UCI基准数据集上的实验结果表明,该算法明显优于C4.5算法。

    一种基于分类精度的特征选择支持向量机
    易超群,李建平,朱成文
    2010, 45(7):  119-121. 
    摘要 ( 789 )   PDF (320KB) ( 1212 )   收藏
    相关文章 | 多维度评价

    在综合序列前向选择(sequential forward selection,SFS)方法和广义序列前向选择(generalized sequential forward selection,GSFS)方法的基础上,提出了基于分类精度的特征选取(sequential forward selection based on classification accuracy, CA-SFS)方法。它依次改变GSFS方法中的r值,并以支持向量机(support vector machine,SVM)作为分类器,将得出的分类精度作为准则函数对特征进行取舍。仿真实验表明CA-SFS算法不但选择了较少的特征,而且取得了较好的分类效果。

    基于人工免疫网络的机器人局部路径规划
    胡选子1, 谢存禧2
    2010, 45(7):  122-126. 
    摘要 ( 694 )   PDF (728KB) ( 1142 )   收藏
    相关文章 | 多维度评价

    为解决复杂环境下机器人路径规划问题,提出了基于人工免疫网络(artificial immune network,AIN)的移动机器人局部路径规划算法。建立了AIN与机器人局部路径规划问题的映射关系,给出了算法流程,最后对提出的方法进行了仿真验证,并与人工势场法进行了比较,结果表明该方法在复杂障碍物环境下是可行和有效的。