摘要:确定燃气管道安全风险大数据预警模型采用怀卡托智能分析环境。确定数据预处理流程,包含原始数据的获取、数据清洗、特征变量确定与提取、缺失值填补、训练样本的选取。指出内部因素数据为管龄、管材、管径、压力级制、埋深、管理单位,外部因素数据为铁路、地铁等电气化轨道、水系面(河流与湖泊)等影响管道腐蚀的3类。从数据库中随机提取正样本1份,负样本4份,每份各855个样本点。将训练数据集分成3组:训练样本1、训练样本2、训练样本3,组成分别为正样本+负样本1,正样本+负样本2,正样本+负样本3。确定缺失值填补采用KNN算法。选择决策树C4.5、随机森林、贝叶斯网络、朴素贝叶斯、支持向量机和逻辑回归6种算法作为预警模型训练算法。根据选择的算法,同时考虑内外部因素的影响,进行预警模型训练(即实验)。根据实验结果比较分析,选出随机森林为最优算法。同时考虑内外部因素比仅考虑内部因素,模型准确率提高5.07%。
注:因版权方要求,不能公开全文,如需全文,请咨询杂志社