【免费】基于DBSCAN聚类的改进KNN文本分类算法-发表之家

基于DBSCAN聚类的改进KNN文本分类算法

作者：苟和平景永霞冯百明李勇琼台师范高等专科学校信息技术系海口571100 西北师范大学计算机科学与工程学院兰州730070

k最近邻文本分类样本裁剪

摘要：K最近邻算法（KNN）在分类时，需要计算待分类样本与训练样本集中每个样本之间的相似度。当训练样本过多时，计算代价大，分类效率降低。因此，提出一种基于DBSCAN聚类的改进算法。利用DBSCAN聚类消除训练样本的噪声数据。同时，对于核心样本集中的样本，根据其样本相似度阈值和密度进行样本裁剪，以缩减与待分类样本计算相似度的训练样本个数。实验表明此算法能够在保持基本分类能力不变的情况下，有效地降低分类计算量。

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询免费咨询杂志订阅

热门期刊服务

科技与经济统计与经济计算机教育计算机与信息技术数值计算与计算机应用计算机工程与设计计算机技术与发展计算机辅助设计与制造电气技术与经济机械科学与技术审计与经济研究制造技术与机床

基于大概念的语文教学基于智慧课堂的教与学基于核心素养的培养基于核心素养的教学方式基于模型的优化设计

科学技术与工程

影响因子：0.65

期刊级别：北大期刊

发行周期：旬刊

服务介绍

基于DBSCAN聚类的改进KNN文本分类算法

科学技术与工程

期刊咨询

订阅杂志

期刊推荐