针对多聚类中心大数据集的加速K-means聚类算法

被引:28
作者
张顺龙 [1 ,2 ]
库涛 [1 ,2 ]
周浩 [3 ]
机构
[1] 中国科学院沈阳自动化研究所
[2] 中国科学院大学
[3] 吉化集团吉林市软信技术有限公司
关键词
DIACK; 加速K-means; 聚类; 三角定理;
D O I
暂无
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
随着数据量、数据维度呈指数发展以及实际应用中聚类中心个数的增多,传统的K-means聚类算法已经不能满足实际应用中的时间和内存要求。针对该问题提出了一种基于动态类中心调整和Elkan三角判定思想的加速K-means聚类算法。实验结果证明,当数据规模达到10万条,聚类个数达到20个以上时,本算法相比Elkan算法具有更快的收敛速度和更低的内存开销。
引用
收藏
页码:413 / 416
页数:4
相关论文
共 9 条
[1]   基于PDS和ENNS的快速K-Means聚类算法 [J].
禹贵辉 ;
潘志斌 ;
乔瑞萍 ;
邹彬 ;
姜彦民 .
微电子学与计算机, 2011, 28 (06) :16-21
[2]   一种基于路径的划分聚类算法 [J].
王赛芳 ;
戴芳 ;
梁波 ;
张晓宇 .
信息与控制, 2011, 40 (01) :141-144
[3]   一种改进的K-均值聚类算法 [J].
但汉辉 ;
张玉芳 ;
张世勇 .
重庆工商大学学报(自然科学版), 2009, 26 (02) :144-147
[4]   基于粒子群的K均值聚类算法 [J].
刘靖明 ;
韩丽川 ;
侯立文 .
系统工程理论与实践, 2005, (06) :54-58
[5]  
一种快速k-均值聚类算法[A]. 孙广玲,唐降龙.第六届全国计算机应用联合学术会议论文集[C]. 2002
[6]   A fast k-means clustering algorithm using cluster center displacement [J].
Lai, Jim Z. C. ;
Huang, Tsung-Jen ;
Liaw, Yi-Ching .
PATTERN RECOGNITION, 2009, 42 (11) :2551-2556
[7]  
Scalability for clustering algorithms revisited[J] . Fredrik Farnstrom,James Lewis,Charles Elkan.ACM SIGKDD Explorations Newsletter . 2000 (1)
[8]   Fast clustering algorithms for vector quantization [J].
Pan, JS ;
McInnes, FR ;
Jack, MA .
PATTERN RECOGNITION, 1996, 29 (03) :511-518
[9]   RES [P]. 
澳大利亚专利 :AU5679373A ,1974-12-12