首页 期刊 计算机工程与设计 基于K-Medoids聚类的改进KNN文本分类算法 【正文】

基于K-Medoids聚类的改进KNN文本分类算法

作者:罗贤锋 祝胜林 陈泽健 袁玉强 华南农业大学信息学院 广东广州510642
文本分类   隶属度   k最近邻   样本裁剪  

摘要:为有效提高传统KNN算法(K最近邻算法)在海量数据的分类效率,分析传统KNN算法的分类过程,提出基于K-Medoids聚类的改进KNN算法。利用K-Medoids算法对文本训练集进行聚类,把文本训练集分成相似度较高的簇;根据待分类文本与簇的相对位置,对文本训练集进行裁剪,解决传统KNN算法在文本训练集过大时速度慢的问题。分析与实验结果表明,该裁剪方法能够合理有效地裁剪文本训练集,提高了KNN算法的运行效率和分类能力。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅