何爱香,张 勇
HE Ai-xiang,ZHANG Yong
摘要: 提出了一种从肿瘤的基因表达数据挖掘肿瘤分类规则的方法. 首先用Bhattacharyya距离指标和相关性分析去除分类无关基因和冗余,然后以决策树作为分类器,用遗传算法搜索所得的特征空间,优化分类精度和分类模型的复杂度. 运行多次得到多个分类树和多组分类规则,由此构建组合树分类器在测试集数据上检验分类效果. 在结肠癌基因表达数据上的实验结果表明了分类规则挖掘方法的有效性和可用性.
中图分类号:
[1] | 康海燕,马跃雷. 差分隐私保护在数据挖掘中应用综述[J]. 山东大学学报(理学版), 2017, 52(3): 16-23. |
[2] | 柳欣,徐秋亮,张波. 满足可控关联性的合作群签名方案[J]. 山东大学学报(理学版), 2016, 51(9): 18-35. |
[3] | 马丽菲,莫倩,杜辉. 面向中文短影评的分类技术研究[J]. 山东大学学报(理学版), 2016, 51(1): 52-57. |
[4] | 张凌, 任雪芳. 基数余-亏定理与数据外-内挖掘-分离[J]. 山东大学学报(理学版), 2015, 50(08): 90-94. |
[5] | 张晶, 肖智斌, 容会, 崔毅. 改进型遗传算法在网络蜘蛛上的应用[J]. 山东大学学报(理学版), 2015, 50(05): 1-6. |
[6] | 吴熙曦, 李炳龙, 张天琪. 基于KNN的Android智能手机微信取证方法[J]. 山东大学学报(理学版), 2014, 49(09): 150-153. |
[7] | 杜晓军,林柏钢,林志远,李应. 安全软件模糊测试中多种群遗传算法的研究[J]. J4, 2013, 48(7): 79-84. |
[8] | 孙飞,汪鹏君*,俞海珍,汪迪生. 基于遗传算法的三值FPRM电路面积优化[J]. J4, 2013, 48(05): 51-56. |
[9] | 马宇红1,2,孙淑芬2. 一个带中转和直销的多产品运输问题及其遗传算法[J]. J4, 2012, 47(7): 121-126. |
[10] | 张文东1,尹金焕1,贾晓飞2,黄超1,苑衍梅1. 基于向量的频繁项集挖掘算法研究[J]. J4, 2011, 46(3): 31-34. |
[11] | 吴大华,何振峰*. 对基于聚类和遗传算法的时间序列分割算法的改进[J]. J4, 2010, 45(7): 45-49. |
[12] | 张雯,张化祥*,李明方,计华. 决策树构建方法:向前两步优于一步[J]. J4, 2010, 45(7): 114-118. |
[13] | 许民利 孙彩群. 基于等待时间限制的服务备件多点转运库存模型研究[J]. J4, 2010, 45(3): 61-65. |
[14] | 丁然 李歧强 梁涛. 具有分解结构的多目的批处理过程短期调度模型[J]. J4, 2010, 45(1): 73-79. |
[15] | 朱国红 石冰 邢晓娜. 基于特征点选择的聚类算法研究[J]. J4, 2009, 44(9): 40-42. |
|