作者:苏琳; 赵永华; 李瑞琳 期刊:《科研信息化技术与应用》 2016年第06期
谱聚类算法是基于谱图分割理论的聚类方法,其对高维、非凸数据分布问题有很好的聚类效果。但对大规模数据问题的聚类,该方法存在着计算时间和存储空间等方面的瓶颈。本文给出了一个自适应的谱聚类并行算法,通过局部计算和异步循环通信并行方法,最大限度减少了并行谱聚类中数据通信次数,并通过计算与通信重叠策略,进一步降低了并行算法的通信开销。在并行算法实现中,将自主开发的最优预条件共轭梯度法并行求解器PLOBPCG用于谱聚类的...
作者:李爽; 史国友; 高邈; 陈晓; 吴京霖 期刊:《上海海事大学学报》 2019年第04期
为解决船舶自动识别系统(automatic identification system, AIS)数据挖掘不够充分,对航路辨识分析不够全面等问题,提出一种基于改进谱聚类算法的数据挖掘方式。利用Sliding Window算法对船舶轨迹AIS数据进行压缩,减少数据冗余提高聚类效率。改进亲和距离函数,提出新的亲和矩阵的标准,提高聚类的稳定性,进一步对数据去噪,减少噪声敏感。通过优化初始中心对k均值算法进行改进,优化全局搜索能力,缓解初始值的选取对聚类效果的影响。...
作者:储德润; 周治平 期刊:《智能系统学报》 2019年第05期
针对传统的谱聚类算法通常利用高斯核函数作为相似性度量,且单纯以距离决定相似性不能充分表现原始数据中固有的模糊性、不确定性和复杂性,导致聚类性能降低的问题。提出了一种公理化模糊共享近邻自适应谱聚类算法,首先结合公理化模糊集理论提出了一种模糊相似性度量方法,利用识别特征来衡量更合适的数据成对相似性,然后采用共享近邻的方法发现密集区域样本点分布的结构和密度信息,并且根据每个点所处领域的稠密程度自动调节参数σ,...
作者:郑建炜; 李卓蓉; 王万良; 陈婉君 期刊:《软件学报》 2019年第12期
在信息爆炸时代,大数据处理已成为当前国内外热点研究方向之一.谱分析型算法因其特有的性能而获得了广泛的应用,然而受维数灾难影响,主流的谱分析法对高维数据的处理仍是一个极具挑战的问题.提出一种兼顾维数特征优选和图Laplacian约束的聚类模型,即联合拉普拉斯正则项和自适应特征学习(joint Laplacian regularization and adaptive feature learning,简称LRAFL)的数据聚类算法.基于自适应近邻进行图拉普拉斯学习,并将低维嵌入、...
作者:李雪; 姜涛; 陈厚合; 李国庆 期刊:《中国电机工程学报》 2019年第23期
提出一种基于图分割的电力系统同调机群辨识新方法。借助电力系统广域量测信息,计算系统各发电机间的相关系数;以相关系数表征系统中任意2台发电机间的同调耦合度,构建可描述发电机间同调耦合度的同调信息无向图及其归一化拉普拉斯矩阵;基于所得归一化拉普拉斯矩阵,引入谱图聚类对该同调信息无向图进行图分割;对图分割所得各子图,通过逆映射,获取系统中各同调机群组成;最后,将所提方法应用于典型2区域互联交直流系统和南方电网中进...
作者:刘树栋; 魏嘉敏 期刊:《计算机科学》 2019年第S11期
面向类别不均衡数据集的分类学习一直是数据挖掘和机器学习领域的研究热点。数据级、算法级和集成方法是目前解决类别不均衡学习的3种主流方法,其中欠抽样是类别不均衡学习一种常用的数据级解决方法,其缺点在于容易丢失多数类中部分有用信息。文中将谱聚类引入到成对数据表示的多数类欠抽样过程中,首先利用谱聚类方法,对多数类样本进行聚类,根据聚类簇大小和簇内样本点与少数类样本点的平均距离,在每个聚类簇内抽取不同个数有代表...
作者:阮建雄; 马鹏刚; 陈锴; 方园 期刊:《电力学报》 2019年第05期
针对含分布式电源配电网发生事故后,如何进行孤岛划分,利用分布式电源带负荷进入孤岛运行保障更多更重要负荷持续供电的问题。研究提出了一种基于谱聚类的含分布式电源配电网孤岛划分策略,该策略根据复杂的网络社团结构发现原理,以划分后的各子系统内部结构紧凑、电力联系紧密为目标将系统进行初步划分;在初步划分的各子系统中建立负荷恢复范围优化模型,在各约束条件下保障在有限的功率内能够尽可能多地恢复更重要负荷,并通过二进...
遗传算法目前在特征向量选取中扮演着重要角色。由于其具有并行、自适应强等诸多优点,广泛受到多个领域的关注。本文首先对遗传算法、谱聚类等基础知识进行概述,其次介绍遗传算法的三个重要过程遗传、变异及交叉算子。最后给出遗传算法进行特征选择的步骤。为研究谱聚类算法中,使用遗传算法进行特征选择提供学习参考。
作者:肖李明; 周玲; 张小龙; 徐辉; 杨在辅 期刊:《智慧电力》 2016年第12期
以互联电网简化拓扑结构模型为基础,结合复杂网络理论,提出了一种基于PCA谱聚类分析的无功电压分区新方法。该方法根据电网的运行和结构特性,以网络的加权邻接矩阵作为无功分区的简化拓扑模型。利用PCA对分区模型进行主成分分析,将主成分个数作为谱聚类选择特征向量的维数标准,从而改进了谱聚类算法并完成对电力网络的快速有效划分。同时,把无功缺额度与模块度Q函数结合起来构建新的模块度指标,保证了分区数目的合理性并改...
作者:杨金鸿; 邓廷权 期刊:《工程科学与技术》 2016年第01期
为了有效利用少量先验信息提高多视角数据聚类效果,提出一种基于距离度量学习的半监督多视角谱聚类算法(简称ML-SMC)。首先,利用距离度量学习引入先验信息,将多视角数据映射到反映先验约束条件的空间。然后,根据相似性构造每个视角的视图,将多视角聚类问题转化为最小正则割的图划分问题。实验结果表明,MLSMC算法聚类结果的精度优于3种经典的多视角聚类算法和4种半监督单视角聚类算法。并且通过利用少量先验信息ML-SMC算法能够有...
作者:张思明; 游天童 期刊:《信息技术与网络安全》 2012年第22期
提出一种基于谱聚类的协同推荐算法(SCBCF)。首先从用户——项目二分网络的单顶点投影中得到用户之间的相似矩阵,然后对该矩阵应用谱聚类算法,将用户聚成k类,并将得到的聚类结果用于数据平滑和邻居结点的选择,最后基于最近邻居集评分行为,对目标用户产生推荐。在Movie-Lens上的实验结果证明本文方法比传统的协同过滤算法能更好地应用于二分网络的协同推荐。
作者:张娜; 张东站; 段江娇 期刊:《心智与计算》 2010年第03期
由于越来越多的结构化或半结构化的数据采用XML格式存储和交换,对XML数据的挖掘变得日益重要,其中对XML文档分类的研究越来越广泛。针对目前XML文档基于结构和内容的编辑距离分类算法的不足,本文在计算相似性度量时提出了一种新的改进方法CS-XMLSim方法,使得当XML文档结构相似而内容差异大时(即XML文档集由同一个DTD生成时)分类也有很高的准确率,并应用于k均值算法进行分类。CS-XMLSim方法在计算XML文档相似性时使用欧氏距离度量,...
作者:王波; 郑晓东; 李晓晔; 陶佰睿; 杨东波; 刘艳菊 期刊:《科学技术创新》 2018年第16期
本文采用大数据谱聚类技术构造核标识集,采用猫群优化算法改进贝叶斯分类方法,基于核标识集采用改进后贝叶斯分类方法实现癌症数据亚分型。实验结果表明该方法具有较好的准确度、灵敏度和特异度,具有很高的推广价值。
作者:杨随心; 耿修瑞; 杨炜暾; 赵永超; 卢晓军 期刊:《中国科学院大学学报》 2019年第02期
结合K-means算法和谱聚类方法的优点,提出一种新的高光谱图像聚类方法。该方法在对高光谱图像数据进行特征降维的基础上,采用K-means算法对图像进行粗聚类处理,然后采用谱聚类方法对粗聚类结果进行较高精度的聚类。与K-means聚类算法相比,该方法有效提高了高光谱图像聚类的分类精度。对模拟数据和真实的高光谱数据的对比实验表明,相对于K-means和谱聚类方法,该方法具有良好的聚类性能。
作者:李玉; 袁永华; 赵雪梅 期刊:《电子学报》 2018年第12期
为实现遥感影像分割中类别数的准确、自动判别,提出了一种可变类谱聚类算法.根据影像的相似图构建权值矩阵和标准Laplacians矩阵,计算Laplacians矩阵较小特征值对应的特征向量生成特征向量矩阵,并视其与像素对应的向量行为像素特征点集;研究Laplacians矩阵处于不同(近似)块对角结构时类属同一目标类像素特征点的聚集性,定义聚类度指标,计算不同分割类别数对应聚类度;选择聚类度将发生最后一次较大跳变时的分割类别数作为算法估计类...
作者:李军军; 曹建农; 廖娟; 程贝贝; 朱莹莹 期刊:《测绘科学》 2019年第10期
针对基于像素模型的单尺度或多尺度谱聚类影像分割方法在相似矩阵存储、特征分解效率及分割精度方面存在的不足。该文首先通过给定多组空间及光谱带宽参数,利用mean-shift初分割生成不同尺度的超像素对象层;然后联合像素与超像素对高空间分辨率影像中的不同类别地物进行的多尺度建模表达其空间拓扑关系,即在图割理论框架下建立“像素-超像素”联合的多尺度无向权图模型G(V,E,W),同时根据遥感影像纹理特征丰富的特点,在顶点相似性计...
作者:王贝贝; 杨明; 燕慧超; 孙笑仙 期刊:《河北工业科技》 2018年第02期
为了消除在构建谱聚类算法的相似矩阵时,高斯核函数中尺度参数的波动影响,构建了一种自适应相似矩阵,并应用到谱聚类算法中。自适应相似矩阵中数据点间的距离度量采用测地距离算法,相距较近的两点间的距离近似于欧氏距离,相距较远的两点则先根据欧氏距离得到每个数据点的k个近邻点,然后累加近邻点的测地距离,由此得到每对数据点间的最短距离。两点间的局部密度用共享近邻的定义来表示,更好地刻画了数据集的本征结构。在5个人工数据...
作者:王焱; 王卉蕾 期刊:《测控技术》 2018年第04期
为了消除传统的谱聚类图像分割算法存在的缺陷,提出一种改进的谱聚类图像分割算法。该算法提出余弦相似性加权矩阵,充分利用图像的纹理信息和空间临近信息构造相似性矩阵。在谱映射过程中,利用Nyst0m逼近策略估计相似性矩阵及其主特征向量。最后利用优化的K-means算法与优化的粒子群算法相结合的算法对得到的低维向量子空间进行聚类,避免直接采用K-means算法对初始值敏感,易陷入局部最优的缺点。实验证明该算法在运行时间和分割精...
作者:韩素青; 李淑慧 期刊:《太原师范学院学报·社会科学版》 2019年第02期
对不平衡数据进行聚类分析时,K-means聚类方法可能会错误地将分布在较小区域类别中的样本划分到大区域类别中;谱聚类算法,虽然可以有效优化数据结构,并很好地识别不同形状的样本,但却难以处理大规模数据.针对这些问题,提出一种改进地标点采样的不平衡数据聚类算法.该算法首先对不平衡数据进行预聚类以获得初始类标签,然后基于数据密度对数据进行采样.在此基础上,通过对采样数据执行K-means聚类,并将聚类中心作为地标点,对数据进行...
作者:牟军敏; 陈鹏飞; 贺益雄; 张行健; 朱剑峰; 荣昊 期刊:《哈尔滨工程大学学报》 2018年第03期
为了对船舶AIS轨迹数据进行快速聚类,本文提出了一种基于Hausdorff距离的船舶轨迹快速自适应谱聚类算法(fastself-tunespectralclustering,FSSC)。在保留轨迹特征的情况下,利用Douglas-Peucker(DP)算法对船舶轨迹数据进行预处理;基于Hausdorff距离,设计自动选取尺度参数的相似度度量函数,构造相似度矩阵并采用谱聚类算法对船舶轨迹进行聚类。以长江口水域船舶实际AIS数据为样本对算法进行了验证,结果表明:聚类结果能够准确提取水域...