C4.5算法的优化

被引:16
作者
黄秀霞
孙力
机构
[1] 江南大学物联网工程学院
关键词
C4.5算法; 泰勒级数; 等价无穷小; GINI指数的均值; 非类属性间关联性; GC4.5算法;
D O I
10.16208/j.issn1000-7024.2016.05.029
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
对传统C4.5算法的运算效率和属性选择准确性进行研究,对其进行改进。运用泰勒级数和等价无穷小的原理对算法的计算公式进行简化,提高运算效率;在简化后的信息增益率计算公式中引入其它非类属性对于该属性的GINI指数的均值,用于调整因非类属性间冗余度问题导致的误差,提高算法属性选择的准确性,将改进后的算法称为GC4.5。对GC4.5、传统C4.5算法与其它改进算法进行对比实验分析,分析结果表明,GC4.5算法在分类效率和准确性上都有一定提高。
引用
收藏
页码:1265 / 1270+1361 +1361
页数:7
相关论文
共 8 条
[1]  
C4.5算法的一种改进及其应用.[D].刘晓宇.中国海洋大学.2013, 03
[2]  
商务智能.[M].赵卫东; 编著.清华大学出版社.2013,
[3]  
数据挖掘 : 概念与技术; 第3版.[M].(美) 韩家炜; (美) 坎伯 (Kamber;M.) ; (美) 裴健; 著.机械工业出版社.2012,
[4]   一种基于属性相关的C4.5决策树改进算法附视频 [J].
魏浩 ;
丁要军 .
中北大学学报(自然科学版), 2014, (04) :402-406
[5]   优化的C4.5决策树算法 [J].
陈英 ;
马仲兵 ;
黄敏 .
软件, 2013, 34 (02) :61-64
[6]   一种改进的C4.5算法 [J].
李瑞 ;
程亚楠 .
科学技术与工程, 2010, 10 (27) :6670-6674
[7]   一种改进的决策树分类属性选择方法 [J].
王苗 ;
柴瑞敏 .
计算机工程与应用 , 2010, (08) :127-129
[8]   决策树C4.5算法的改进及应用 [J].
黄爱辉 .
科学技术与工程, 2009, 9 (01) :34-36+42