【免费】基于分层抽样的k近邻分类加速算法-发表之家

基于分层抽样的k近邻分类加速算法

作者：宋云胜; 梁吉业山西大学计算机与信息技术学院; 太原030006; 山西大学计算智能与中文信息处理教育部重点实验室; 太原030006

分层抽样数据划分近邻分类精度运行时间

摘要：k近邻（k nearest neighbor,kNN）分类作为数据挖掘中最典型的算法之一,以较高的泛化性能以及充足的理论基础被广泛应用。然而kNN在测试时需要计算待识别实例与所有训练实例之间的距离,以至于在面对大规模数据时需要大量的时间。为此,提出一种基于分层抽样的kNN加速算法（KNN based on stratified sampling,SS-kNN）。首先将训练实例所在的空间划分为若干个实例个数相等的区域,然后从每个区域内抽取实例,最后判定待识别实例落入划分区域中的哪一个,并从此区域以及相邻区域抽取的实例中寻找其k个近邻。与原始kNN算法以及基于随机抽样的kNN算法相比,SSkNN算法可以获得与其相近分类精度,但将其运行速度分别提高大约399倍和16倍。

注：因版权方要求，不能公开全文，如需全文，请咨询杂志社

学术咨询免费咨询杂志订阅

热门期刊服务

统计与经济科技与经济计算机教育计算机工程与设计计算机技术与发展计算机与信息技术科技与经济画报计算机与生活工业审计与会计机械设计与制造会计与经济研究农村经济与科技

基于大概念的语文教学基于智慧课堂的教与学基于核心素养的培养基于核心素养的教学方式基于模型的优化设计

数据采集与处理

影响因子：0.68

期刊级别：北大期刊

发行周期：双月刊

服务介绍

基于分层抽样的k近邻分类加速算法

数据采集与处理

期刊咨询

订阅杂志

期刊推荐