首页 期刊 科技通报 引入偏置选择变量的不平衡数据集重采样方法 【正文】

引入偏置选择变量的不平衡数据集重采样方法

作者:徐尽 许昌学院计算机科学与技术学院; 河南许昌461000
模式分类   偏置选择变量   不平衡度   泛化性能  

摘要:不平衡数据分类是模式分类领域较难处理的一类问题,其主要原因在于类间样本数目不均衡。为了有效地提高不平衡数据分类效果,本文提出了一种引入偏置选择变量的不平衡数据集重采样算法。该算法引入一个偏置选择变量,该变量定义了多数类样本被取样的概率。通过引入偏置选择变量可以有效地降低不平衡度,因此能很好地提高分类算法在不平衡数据集上的泛化性能。在人工生成数据集上的分类实验充分验证了本文重采样算法的有效性。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅