基于特征子集区分度与支持向量机的特征选择算法

被引:61
|
作者
谢娟英 [1 ]
谢维信 [2 ]
机构
[1] 陕西师范大学计算机科学学院
[2] 深圳大学信息工程学院ATR国家重点实验室
关键词
特征选择; 支持向量机; 相关性; 特征子集区分度; 特征区分度;
D O I
暂无
中图分类号
TP18 [人工智能理论];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
考虑特征之间的相关性对于其类间区分能力的影响,提出了一种新的特征子集区分度衡量准则——DFS(Discernibility of Feature Subsets)准则.该准则考虑特征之间的相关性,通过计算特征子集中全部特征对于分类的联合贡献来判断特征子集的类间辨别能力大小,不再只考虑单个特征对于分类的贡献.结合顺序前向、顺序后向、顺序前向浮动和顺序后向浮动4种特征搜索策略,以支持向量机(Support Vector Machines,SVM)为分类工具,引导特征选择过程,得到4种基于DFS与SVM的特征选择算法.其中在顺序前/后向浮动搜索策略中,首先根据DFS准则加入/去掉特征到特征子集中,然后在浮动阶段根据所得临时SVM分类器的分类性能决定刚加入/去掉特征的去留.UCI机器学习数据库数据集的对比实验测试表明,提出的DFS准则是一种很好的特征子集类间区分能力度量准则;基于DFS与SVM的特征选择算法实现了有效的特征选择;与其他同类算法相比,基于DFS准则与SVM的特征选择算法具有非常好的泛化性能,但其所选特征子集的规模不一定是最好的.
引用
收藏
页码:1704 / 1718
页数:15
相关论文
共 1 条
  • [1] 特征选择算法研究综述
    毛勇
    周晓波
    夏铮
    尹征
    孙优贤
    [J]. 模式识别与人工智能, 2007, 20 (02) : 211 - 218