首页 期刊 数学的实践与认识 基于SMOTE和KNN的石油数据缺失填充算法 【正文】

基于SMOTE和KNN的石油数据缺失填充算法

作者:李董; 迟家俊; 相博; 王梅 东北石油大学计算机与信息技术学院; 黑龙江大庆163318; 大庆钻探工程公司钻井一公司; 黑龙江大庆163458; 吐哈油田公司都善采油厂; 新疆鄯善838000
数据缺失   数据填充   knn算法   smote算法   多重填补  

摘要:大数据环境下,数据缺失是一种普遍现象,由此带来数据决策偏差等问题.针对石油生产数据缺失问题,提出一种基于SMOTE和KNN的数据填充SMKNN算法.受不平衡数据集过采样的启发,SMKNN算法在KNN算法基础上采用SMOTE算法选取近邻随机插值产生的数据作为近似缺失值,同时,采用多重填补思想求平均值作为填充数据.分别采用UCI机器学习标准数据集和大庆油田某井区生产数据进行实验,验证了SMKNN算法不仅能填充数据,而且提高了准确率.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅