基于满二叉树的二分K-means聚类并行推荐算法

被引:9
作者
陈平华
陈传瑜
机构
[1] 广东工业大学计算机学院
关键词
满二叉树; K-means; 聚类; 推荐算法; MapReduce;
D O I
暂无
中图分类号
TP391.3 [检索机];
学科分类号
081203 ; 0835 ;
摘要
在推荐系统中应用K-means算法聚类可有效降维,然而聚类效果往往依赖于选定的初始中心,并且一旦选定目标簇后,推荐过程只针对目标簇进行,与其他簇无关。针对上述两个问题,提出一种基于满二叉树的二分K-means聚类并行推荐算法。该算法首先反复迭代二分K-means算法,迭代过程中使用簇内凝聚度作为分裂阈值,形成一颗满二叉树;然后通过层次遍历将用户归入到K个叶子节点(簇);最后针对K个簇,应用MapReduce框架进行并行推荐预测。MovieLens上的实验结果表明,该算法可大幅度提高推荐系统准确性,同时增强系统可扩展性。
引用
收藏
页码:1450 / 1457
页数:8
相关论文
共 9 条
[1]   基于遗传算法的聚类与协同过滤组合推荐算法 [J].
冯智明 ;
苏一丹 ;
覃华 ;
邓海 .
计算机技术与发展, 2014, 24 (01) :35-38
[2]   采用聚类算法优化的K近邻协同过滤算法 [J].
尹航 ;
常桂然 ;
王兴伟 .
小型微型计算机系统, 2013, 34 (04) :806-809
[3]   一种结合有效降维和K-means聚类的协同过滤推荐模型 [J].
郁雪 ;
李敏强 .
计算机应用研究, 2009, 26 (10) :3718-3720+3762
[4]   基于蚁群聚类的top-N推荐系统 [J].
曹波 ;
苏一丹 .
微计算机信息, 2009, 25 (09) :225-226+222
[5]   双向聚类迭代的协同过滤推荐算法 [J].
王明文 ;
陶红亮 ;
熊小勇 .
中文信息学报, 2008, (04) :61-65+74
[6]  
数据结构.[M].严蔚敏;吴伟民编著;.清华大学出版社.1997,
[7]  
Cluster ensembles in collaborative filtering recommendation.[J].Chih-Fong Tsai;Chihli Hung.Applied Soft Computing Journal.2011, 4
[8]  
MapReduce.[J].Jeffrey Dean;Sanjay Ghemawat.Communications of the ACM.2008, 1
[9]   Recommender systems [J].
Resnick, P ;
Varian, HR .
COMMUNICATIONS OF THE ACM, 1997, 40 (03) :56-58