基于半监督K-means的K值全局寻优算法

被引:11
作者
孙雪 [1 ]
李昆仑 [1 ]
胡夕坤 [2 ]
赵瑞 [1 ]
机构
[1] 河北大学电子信息工程学院
[2] 河北大学工商学院
关键词
半监督聚类; constrained-K均值; K均值算法; 投票; 阈值;
D O I
暂无
中图分类号
TP181 [自动推理、机器学习];
学科分类号
081104 ; 0812 ; 0835 ; 1405 ;
摘要
提出一种基于半监督K-means的K值全局寻优算法,该算法打破传统方法中采用样本类别作为K值的限定,利用少量标记数据即可指导和规划大量无监督数据.结合数据集自身的分布特点及聚类后各个簇内的监督信息,根据投票方法来指导簇中数据集的类别标记.实验表明,本文所提出的方法可以有效的寻找适合数据集的最佳K值和聚类的中心,提高聚类性能.
引用
收藏
页码:106 / 109
页数:4
相关论文
共 7 条
[1]   一种半监督K均值多关系数据聚类算法 [J].
高滢 ;
刘大有 ;
齐红 ;
刘赫 .
软件学报, 2008, (11) :2814-2821
[2]   基于k-means和半监督机制的单类中心学习算法 [J].
李志圣 ;
孙越恒 ;
何丕廉 ;
侯越先 .
计算机应用, 2008, (10) :2513-2516
[3]   流形上的Laplacian半监督回归 [J].
杨剑 ;
王珏 ;
钟宁 .
计算机研究与发展, 2007, (07) :1121-1127
[4]   模糊聚类分析最佳聚类数的确定方法研究 [J].
孙才志 ;
王敬东 ;
潘俊 .
模糊系统与数学, 2001, (01) :89-92
[5]   用改进的RPCL算法提取聚类的最佳数目 [J].
李昕 ;
郑宇 ;
江芳泽 .
上海大学学报(自然科学版), 1999, (05) :409-413
[6]   Semi-supervised graph clustering: a kernel approach [J].
Kulis, Brian ;
Basu, Sugato ;
Dhillon, Inderjit ;
Mooney, Raymond .
MACHINE LEARNING, 2009, 74 (01) :1-22
[7]  
机器学习.[M].(美)TomM.Mitchell著;曾华军;张银奎等译;.机械工业出版社.2003,