您的位置:山东大学 -> 科技期刊社 -> 《山东大学学报(理学版)》

J4

• 论文 • 上一篇    下一篇

基于遗传算法和决策树的肿瘤分类规则挖掘

何爱香,张 勇   

  1. 山东工商学院信息与电子工程学院, 山东 烟台 264005
  • 收稿日期:1900-01-01 修回日期:1900-01-01 出版日期:2006-10-24 发布日期:2006-10-24
  • 通讯作者: 何爱香

Classification rules for mining tumors and normal tissues using genetic algorithms and decision trees

HE Ai-xiang,ZHANG Yong   

  1. School of Information and Electronics Engineering, Shandong Institute of Business and Technology, Yantai 264005, Shandong, China
  • Received:1900-01-01 Revised:1900-01-01 Online:2006-10-24 Published:2006-10-24
  • Contact: HE Ai-xiang

摘要: 提出了一种从肿瘤的基因表达数据挖掘肿瘤分类规则的方法. 首先用Bhattacharyya距离指标和相关性分析去除分类无关基因和冗余,然后以决策树作为分类器,用遗传算法搜索所得的特征空间,优化分类精度和分类模型的复杂度. 运行多次得到多个分类树和多组分类规则,由此构建组合树分类器在测试集数据上检验分类效果. 在结肠癌基因表达数据上的实验结果表明了分类规则挖掘方法的有效性和可用性.

关键词: 决策树, 遗传算法, 基因表达谱 , 数据挖掘

Abstract: A new method was proposed to mine ensembles of groups of classification rules for tumor molecular classification. After removing irrelevant genes and redundancy from the original micro-array dataset, the GA was used to evolve gene subsets whose fitness is evaluated by the combination of classification accuracy and complexity of a decision tree. The ensemble classifier composed of the classification trees was developed to produce predications on unseen data. This method is assessed on the Colon cancer dataset and shows superior results in terms of classification performance and knowledge representation.

Key words: gene expression profiles , data mining, genetic algorithms, decision trees

中图分类号: 

  • TP391.4
[1] 康海燕,马跃雷. 差分隐私保护在数据挖掘中应用综述[J]. 山东大学学报(理学版), 2017, 52(3): 16-23.
[2] 柳欣,徐秋亮,张波. 满足可控关联性的合作群签名方案[J]. 山东大学学报(理学版), 2016, 51(9): 18-35.
[3] 马丽菲,莫倩,杜辉. 面向中文短影评的分类技术研究[J]. 山东大学学报(理学版), 2016, 51(1): 52-57.
[4] 张凌, 任雪芳. 基数余-亏定理与数据外-内挖掘-分离[J]. 山东大学学报(理学版), 2015, 50(08): 90-94.
[5] 张晶, 肖智斌, 容会, 崔毅. 改进型遗传算法在网络蜘蛛上的应用[J]. 山东大学学报(理学版), 2015, 50(05): 1-6.
[6] 吴熙曦, 李炳龙, 张天琪. 基于KNN的Android智能手机微信取证方法[J]. 山东大学学报(理学版), 2014, 49(09): 150-153.
[7] 杜晓军,林柏钢,林志远,李应. 安全软件模糊测试中多种群遗传算法的研究[J]. J4, 2013, 48(7): 79-84.
[8] 孙飞,汪鹏君*,俞海珍,汪迪生. 基于遗传算法的三值FPRM电路面积优化[J]. J4, 2013, 48(05): 51-56.
[9] 马宇红1,2,孙淑芬2. 一个带中转和直销的多产品运输问题及其遗传算法[J]. J4, 2012, 47(7): 121-126.
[10] 张文东1,尹金焕1,贾晓飞2,黄超1,苑衍梅1. 基于向量的频繁项集挖掘算法研究[J]. J4, 2011, 46(3): 31-34.
[11] 吴大华,何振峰*. 对基于聚类和遗传算法的时间序列分割算法的改进[J]. J4, 2010, 45(7): 45-49.
[12] 张雯,张化祥*,李明方,计华. 决策树构建方法:向前两步优于一步[J]. J4, 2010, 45(7): 114-118.
[13] 许民利 孙彩群. 基于等待时间限制的服务备件多点转运库存模型研究[J]. J4, 2010, 45(3): 61-65.
[14] 丁然 李歧强 梁涛. 具有分解结构的多目的批处理过程短期调度模型[J]. J4, 2010, 45(1): 73-79.
[15] 朱国红 石冰 邢晓娜. 基于特征点选择的聚类算法研究[J]. J4, 2009, 44(9): 40-42.
Viewed
Full text


Abstract

Cited

  Shared   
  Discussed   
No Suggested Reading articles found!