基于最小生成树的多层次k-Means聚类算法及其在数据挖掘中的应用

被引:32
作者
金晓民 [1 ,2 ]
张丽萍 [3 ]
机构
[1] 内蒙古大学交通学院
[2] 内蒙古自治区桥梁检测与维修加固工程技术研究中心
[3] 内蒙古师范大学计算机科学技术学院
关键词
最小生成树; 多层次k-means聚类算法; 数据挖掘;
D O I
10.13413/j.cnki.jdxblxb.2018.05.24
中图分类号
TP311.13 [];
学科分类号
1201 ;
摘要
针对传统聚类算法存在挖掘效率慢、准确率低等问题,提出一种基于最小生成树的多层次k-means聚类算法,并应用于数据挖掘中.先分析聚类样本的数据类型,根据分析结果设计聚类准则函数;再通过最小生成树对样本数据进行划分,并选取初始聚类中心,将样本的数据空间划分为矩形单元,在矩形单元中对样本对象数据进行计算、降序和选取,得到有效的初始聚类中心,减少数据挖掘时间.实验结果表明,与传统算法相比,该算法可快速、准确地挖掘数据,且挖掘效率提升约50%.
引用
收藏
页码:1187 / 1192
页数:6
相关论文
共 10 条
[1]   基于K-medoids项目聚类的协同过滤推荐算法 [J].
王永 ;
万潇逸 ;
陶娅芝 ;
张璞 .
重庆邮电大学学报(自然科学版), 2017, 29 (04) :521-526
[2]   多帧CT图像数据的测序数据挖掘与规律分析 [J].
何拥军 ;
骆嘉伟 ;
余爱民 .
现代电子技术, 2017, 40 (14) :106-108+113
[3]   非结构化网络中有价值信息数据挖掘研究 [J].
林媛 .
计算机仿真, 2017, 34 (02) :414-417
[4]   基于自适应布谷鸟搜索算法的K-means聚类算法及其应用 [J].
杨辉华 ;
王克 ;
李灵巧 ;
魏文 ;
何胜韬 .
计算机应用, 2016, 36 (08) :2066-2070
[5]   基于体素邻域信息的均值漂移聚类算法检测fMRI激活区 [J].
张睿 ;
熊金虎 ;
汪东兴 ;
高欣 .
江苏大学学报(自然科学版), 2016, 37 (05) :556-561
[6]   基于最小生成树的层次K-means聚类算法 [J].
贾瑞玉 ;
李振 .
微电子学与计算机, 2016, 33 (03) :86-88+93
[7]   MapReduce框架下支持差分隐私保护的k-means聚类方法 [J].
李洪成 ;
吴晓平 ;
陈燕 .
通信学报 , 2016, (02) :124-130
[8]   针对多聚类中心大数据集的加速K-means聚类算法 [J].
张顺龙 ;
库涛 ;
周浩 .
计算机应用研究, 2016, 33 (02) :413-416
[9]   改进K-means算法在入侵检测中的应用研究 [J].
王茜 ;
刘胜会 .
计算机工程与应用 , 2015, (17) :124-127+144
[10]   基于满二叉树的二分K-means聚类并行推荐算法 [J].
陈平华 ;
陈传瑜 .
计算机工程与科学, 2015, 37 (08) :1450-1457