首页 期刊 电子学报 基于z值的分布式密度峰值聚类算法 【正文】

基于z值的分布式密度峰值聚类算法

作者:卢晶; 段勇; 刘海波 沈阳工业大学信息科学与工程学院; 辽宁沈阳110870; 河北大学计算机科学与技术学院; 河北保定071002
聚类   分布式计算   云计算   z填充曲线   密度峰值  

摘要:密度峰值聚类算法由于在发现任意形状簇且不需指定聚类个数等方面具有一定的优势而被广泛关注.但是该算法需要计算数据集中所有点的密度和点对之间的距离,因此不适合处理大规模高维数据集.为此,本文提出了一种基于z值的分布式密度峰值聚类算法,DP-z.本方法利用空间z填充曲线将高维数据集映射到一维空间上,根据数据点的z值信息对数据集分组.为了能够得到正确的结果,需要对分组间数据进行交互,然后并行计算每个点密度和斥群值.DP-z算法在分组间数据交互时采用过滤策略,减少大量无效距离计算和数据传输开销,有效提高算法的执行效率.最后,本文在云计算平台上对DP-z算法进行了验证,实验表明在保证DPz算法与原始密度峰值聚类算法聚类结果相同的情况下有效的提高了算法执行效率.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅