摘要:提出改进的并行化谱聚类算法。该算法对于距离矩阵与相似度矩阵进行了改进,并在其中加入了kd树技术以对大规模数据进行稀疏化处理;然后在进行数据特征计算时,将数据以拉普拉斯矩阵的方式存入Hadoop之中,通过运行Lanczos分布计算的形式得到了其向量特征;最后运用在聚类算法中的较为高效的k-means聚类算法对向量特征的转置矩阵进行处理从而得到了需要的聚类结果。仿真实验结果表明,本文所提出的谱聚类并行算法能够为大规模的数据挖掘工作带来性能的巨大提升。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社
热门期刊服务
雷达与对抗 冶金设备管理与维修 高校辅导员学刊 大学物理实验 产业质量研究 安徽农学通报·下半月刊 中华活页文选·高一版 晋控科学技术 遗传与疾病 联合国研究 炼铁技术通讯 社会福利·实务版相关文章
改进工作作风心得体会