首页 期刊 计算机科学与探索 面向不平衡数据集的改进型SMOTE算法 【正文】

面向不平衡数据集的改进型SMOTE算法

作者:王超学 张涛 马春森 西安建筑科技大学信息与控制工程学院 西安710055 中国农业科学院植物保护研究所 北京100193
不平衡数据集   分类   遗传算子   synthetic   minority  

摘要:针对SMOTE(synthetic minority over-sampling technique)在合成少数类新样本时存在的不足,提出了一种改进的SMOTE算法GA-SMOTE。该算法的关键将是遗传算法中的3个基本算子引入到SMOTE中,利用选择算子实现对少数类样本有区别的选择,使用交叉、变异算子实现对合成样本质量的控制.结合GA-SMOTE与SVM(support vector machine)算法来处理不平衡数据的分类问题.UCI数据集上的大量实验表明,GA-SMOTE在新样本的整体合成效果上表现出色,有效提高了SVM在不平衡数据集上的分类性能。

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅