首页 期刊 计算机研究与发展 样本加权的多视图聚类算法 【正文】

样本加权的多视图聚类算法

作者:洪敏; 贾彩燕; 李亚芳; 于剑 交通数据分析与挖掘北京市重点实验室(北京交通大学); 北京100044; 北京交通大学计算机与信息技术学院; 北京100044; 北京工业大学信息学部; 北京100124
数据挖掘   多视图   聚类   k   样本权重  

摘要:大数据时代,人类收集、存储、传输、管理数据的能力日益提高,各行各业已经积累了大量的数据资源,这些数据常呈现出多源性和异构性.如何对这些多源数据进行有效的聚类(也称为多视图聚类)已成为当今机器学习研究关注的焦点之一.现有的多视图聚类算法主要从“全局”角度关注不同视图和特征对簇结构的贡献,没有考虑不同样本间存在的“局部”信息间的差异.因此,提出一种新的多视图样本加权聚类算法(sample-weighted multi-view clustering, SWMVC),该算法对每个样本的不同视图进行加权,采用交替方向乘子法自适应学习样本权值,不仅可以学习不同样本点间不同视图权重的“局部”差异,还可以从学习到的“局部”差异反映出不同视图对簇结构贡献的“全局”差异,具有较好的灵活性.多个数据集上的实验表明:SWMVC方法在异质视图数据上具有较好的聚类效果.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅