作者:丛勤 期刊:《自动化与信息工程》 2013年第02期
对谱聚类的奇异解进行了研究。在谱聚类中,由对象相似度的定义,两种属性完全不同或截然相反的对象的类,其类内对象的相似度、类间对象的相似度和与其它类对象的相似度,会出现接近或相同的情况,从而有可能被聚为一类。研究发现,大多数情况下,出现谱聚类的奇异解的主要原因是聚类个数设置不合理和高斯核参数σ估计不准确。本文给出了利用特征值差值分析与特征值累积贡献率来确定聚类个数和估计高斯核参数σ的方法。实验表明,所给聚类个...
作者:祖志文; 李秦 期刊:《河北科技大学学报》 2018年第02期
为了解决以欧氏距离作为相似性准则的传统模糊聚类算法对多维数据处理不利的问题,采用马氏距离代替欧氏距离,对基于马氏距离的模糊聚类算法进行优化研究,以增强基于马氏距离的模糊聚类算法的聚类效果和能力。通过构造启发式搜索与k-means算法结合的初始优化方法,利用可以自动调节最佳聚类数的有效性函数,提出了一种优化算法KM-FCM,并将此新算法与FCM,FCM-M,M-FCM聚类算法在3个标准数据集上进行了实验。结果表明,KM-FCM算法有效,聚...
作者:戴涛; 李春平 期刊:《计算机工程与应用》 2004年第30期
概率聚类的算法已经广泛地应用于聚类分析领域,但是这些算法都没有回答如何选择一个最佳的聚类个数的问题。该文首先分析了通用的确定概率聚类个数的方法,然后针对蒙特卡罗交叉验证算法不能解决后验概率分散的问题,提出一种改进的蒙特卡罗交叉验证算法(iMCCV)。实验结果证明该算法可以有效地确定最佳K值。
作者:征原; 谢云 期刊:《计算机技术与发展》 2017年第07期
k均值聚类算法在对数据进行聚类时需要以确定的聚类个数和初始聚类中心为前提,但聚类个数是难以准确给定的,通常随机选取k个样本作为初始聚类中心,由于不同的初始聚类中心可能导致不同的聚类结果,采用随机选取初始聚类中心的方法存在着较大的盲目性,造成聚类结果极不稳定。为此,提出了一种基于划分的聚类个数与初始中心点的确定方法。该方法通过对数据空间进行划分,统计每个网格空间中数据点数目作为网格的数据密度,同时计...
作者:李玉鑑 期刊:《北京工业大学学报》 2007年第03期
为了简单有效地对数据集进行结构分析,提出了一种基于最小树进行聚类的算法(MSTCA).其基本思想是在最小树中切割所有大于一定阈值的边。对数据集进行子类划分,同时对较小的子类进行合并.MSTCA产生的聚类结果在不考虑子类次序时是唯一的。对它的递归调用还可在若干不同粒度层次上形成数据集的聚类结构.计算实验表明,MSTCA不仅能为具有各种不同聚类形状的数据集自适应地选择较好的聚类个数,而且只需简单的参数选择就能准确...
作者:燕京京; 王鹏; 范家兵; 黄焱 期刊:《电子学报》 2016年第02期
提出了一种基于量子谐振子模型的聚类中心选取算法.该算法以量子谐振子波函数从高能态到基态过程中的概率变化过程为理论模型来描述聚类问题中数据对象向聚类中心点的聚集行为,能够快速查找到最优的聚类个数及较好的聚类中心点所在的网格;数据读入网格结构之后,算法的处理时间与数据集规模无关.实验结果表明:CCSA-QHOM算法较适合于处理每个子类局部区域的网格密度分布呈单峰特性的数据集的聚类中心选择问题.
作者:黄智武 张东站 段江娇 期刊:《现代计算机》 2010年第05期
BNAK-Divide—and—Merge聚类算法是基于David等人提出的Divide—and-Merge算法的一种改进算法。Divide-and-Merge算法是一种将自顶向下的分裂方法和自底向上的聚合方法相结合的聚类算法。虽然这个聚类算法已经通过众多实验表明其聚类的效率和质量。但是它在数据集很大的情况下分裂会很耗时间和空间资源.并且它需要阔值来确定聚类个数的方法也不是很理想。针对以上两个主要不足,对原算法进行改进。
作者:庞天杰 赵兴旺 期刊:《计算机科学》 2016年第02期
聚类个数的确定是聚类分析中一个富有挑战性的难题。现有的聚类个数确定方法主要采用随机选取初始聚类中心的策略,导致聚类过程中迭代次数的稳定性不强。基于此,在利用含有类标签的先验信息优化初始类中心的基础上,提出了一种基于先验信息的混合数据聚类个数确定算法。实验证明,该算法是有效的。
作者:包翔 宋余庆 刘哲 刘毅 郑明杰 期刊:《小型微型计算机系统》 2015年第08期
聚类理论是进行图像分割时的一种常用工具,然而多数聚类算法不能自动确定合适的聚类个数.提出一种基于高斯核密度函数的图像分割聚类数自适应计算方法.首先运用尺度空间滤波理论得到相应图像灰度值核密度函数的指纹图,然后运用高斯滤波理论得到滤波之后的核密度函数,再根据其与原核密度函数的相似程度得到聚类个数,最后将其作为核模糊聚类算法的初始参数进行分割.我们利用聚类标准I指标对分割结果进行评价,结果表明,该方法能准确地...
作者:冯少荣 潘炜炜 林子雨 期刊:《计算机工程》 2015年第09期
XML文档由于其自身的可扩展性、半结构化和自描述性等特点,已成为数据表示和交换的数据格式标准。一个高效、快速的XML文档聚类机制能够大幅缩短信息检索时间,提高数据查询的效率,挖掘出潜在的信息价值。为此,提出一种改进的k—medoids算法对XML文档进行聚类。运用模糊聚类方法确定聚类个数,利用遗传算法的全局最优的搜索能力求解最佳聚类中心点或质心,从而提高大规模XML文档集的聚类质量。实验结果表明,与基于传统k—medoi...