北京邮电大学学报 ›› 2007, Vol. 30 ›› Issue (3): 1-5.doi: 10.13190/jbupt.200703.1.niuk
• 论文 • 下一篇
采用属性聚类的高维子空间聚类算法
牛 琨1, 张舒博2, 陈俊亮1
- 1. 北京邮电大学 网络与交换技术国家重点实验室, 北京 100876; 2. 中国电信北京研究院 决策研究部, 北京 100035
Subspace Clustering through Attribute Clustering
NIU Kun1, ZHANG Shu-bo2, CHEN Jun-liang1
- 1. State Key Laboratory of Networking and Switching Technology, Beijing 100876, China;
2. Dept. of Strategy Research, China Telecom Beijing Research Institute, Beijing 100035, China
摘要:
为了解决现有子空间聚类算法时间复杂度偏高以及对输入参数敏感的问题,提出了一种基于属性聚类方法的高效子空间聚类算法.算法首先通过计算每个属性的基尼值来过滤冗余属性,而后通过基于二维联合基尼值的关系函数建立非冗余属性的关系矩阵,以衡量任意两个非冗余属性的相关度, 进而在关系矩阵上应用可产生交叠的聚类算法,聚类结果即为所有兴趣度子空间的候选集合,最后调用聚类算法得到所有存在于这些子空间内的簇.在人工数据集和真实数据集上的实验表明,新算法不仅在时间复杂度和子空间簇的寻找能力方面均有较优表现,而且对输入参数的取值不甚敏感.
中图分类号: