首页 期刊 软件学报 基于语义距离的K-最近邻分类方法 【正文】

基于语义距离的K-最近邻分类方法

作者:杨立; 左春; 王裕国 中国科学院; 软件研究所; 北京; 100080; 中国科学院; 研究生院; 北京; 100049; 中国科学院; 软件研究所; 北京; 100080
本体   语义距离   最近邻   分类  

摘要:最近邻分类方法中对距离机制的研究大都集中在根据何种计算方法将不同属性取值的差异集中起来,而未考虑到同一属性间取值的语义差异所带来的影响;而且传统算法的分类准确率对于不同抽象层次描述的数据集带来的数据不完整性相当敏感.针对这两个问题,提出一种基于语义距离的最近邻分类方法SDkNN(semantic distance based k-nearest neighbor).该方法分析了同一属性内取值的语义差异,说明了如何基于领域本体计算语义距离,并将其应用到kNN算法中.经过在UCI数据集以及实际应用数据集中验证,SDkNN的整体性能要优于传统方法,在数据不完整的情况下效果更为明显,实践证明,SDkNN有较好的应用价值.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅