首页 期刊 中国环境科学 基于Stacking集成学习模型的气态亚硝酸预测 【正文】

基于Stacking集成学习模型的气态亚硝酸预测

作者:唐科; 秦敏; 赵星; 段俊; 方武; 梁帅西; 孟凡昊; 叶凯迪; 张鹤露; 谢品华 中国科学院安徽光学精密机械研究所; 环境光学与技术重点实验室; 安徽合肥230031; 中国科学技术大学; 安徽合肥230026; 中国科学院区域大气环境研究卓越创新中心; 福建厦门361021
stacking   k折交叉验证   集成   气态亚硝酸   预测  

摘要:建立了基于Stacking集成学习下气态亚硝酸(HONO)预测模型.利用非相干宽带腔增强吸收光谱(IBBCEAS)系统获得的北京城区HONO的浓度,结合HONO的来源,选取了O3、CO、SO2、NO、NO2、NOy、温度(T)、相对湿度(RH)、风速(WS)、j(HONO)、j(NO2)、j(O1D)作为特征数据,通过对HONO的平均日变化分析,将测量时间按小时转换为新特征.分别以极端梯度提升(XGBoost)、轻量化梯度促进机(LightGBM)以及随机森林(RF)算法构建基模型,采用5折交叉验证的方式划分训练集,将基模型输出的结果作为新特征集,并将新特征集作为第二层线性回归模型的输入,通过对这两层中的模型进行训练,最终得到Stacking集成学习HONO预测模型.通过对模型的特征重要度分析和计算夜间交通直接排放所占的贡献,表明CO是模型预测中重要的影响因子,说明机动车的直接排放是该区域冬季时期HONO的重要来源.利用测试集分别对单模型和融合后模型的预测性能进行评估,3个单模型的预测结果与测量值的相关系数都达到了0.91以上,其中Stacking融合后的模型性能最好,相关系数达到了0.94,平均绝对误差和均方根误差分别为0.307×10-9和0.453×10-9,结果表明基于Stacking集成学习方式下HONO预测模型的可解释性和推广性.

注:因版权方要求,不能公开全文,如需全文,请咨询杂志社

学术咨询 免费咨询 杂志订阅