作者:唐科; 秦敏; 赵星; 段俊; 方武; 梁帅西; 孟凡昊; 叶凯迪; 张鹤露; 谢品华 期刊:《中国环境科学》 2020年第02期
建立了基于Stacking集成学习下气态亚硝酸(HONO)预测模型.利用非相干宽带腔增强吸收光谱(IBBCEAS)系统获得的北京城区HONO的浓度,结合HONO的来源,选取了O3、CO、SO2、NO、NO2、NOy、温度(T)、相对湿度(RH)、风速(WS)、j(HONO)、j(NO2)、j(O1D)作为特征数据,通过对HONO的平均日变化分析,将测量时间按小时转换为新特征.分别以极端梯度提升(XGBoost)、轻量化梯度促进机(LightGBM)以及随机森林(RF)算法构建基模型,采用5折交叉验证的方...
作者:张壮; 冯小年; 钱铁云 期刊:《北京大学学报·自然科学版》 2020年第01期
针对当前用户画像工作中各模态信息不能被充分利用的问题,提出一种跨模态学习思想,设计一种基于多模态融合的用户画像模型。首先利用Stacking集成方法,融合多种跨模态学习联合表示网络,对相应的模型组合进行学习,然后引入注意力机制,使得模型能够学习不同模态的表示对预测结果的贡献差异性。改进后的模型具有精心设计的网络结构和目标函数,能够生成一个由特征级融合和决策级融合组成的联合特征表示,从而可以合并不同模态的相关特征...
作者:李瑶琦; 周鑫; 高卫益; 柏志安; 耿娜 期刊:《工业工程与管理》 2019年第06期
急诊患者到达预测是医生排班的基础,是解决急诊拥堵的关键。现有预测多为单一预测算法,针对每天、每月进行,缺乏更短时间预测。构建基于堆叠法(Stacking)集成学习模型的预测方法,分别以小时、天、周为时间单位,对患者到达进行预测,探究不同时间单位的预测效果。在随机森林(RF)、梯度提升决策树(GBDT)、极端梯度提升树(XGB)、Light GBM(LGB)、支持向量回归(SVR)、K近邻学习(KNN)中选择预测效果较佳的方法作为Stacking集成的初级学习...
作者:曹再辉; 余东先; 施进发; 宗思生 期刊:《控制工程》 2019年第12期
针对不同的具体问题,传统机器学习算法的预测精度往往存在差异,而集成学习能够综合若干基分类器的预测结果,可以使得分类效果显著提升。首先,简单的介绍了集成学习的基本思想,并分析了Stacking集成算法相对于传统经典集成算法的优势;其次,基于Stacking集成框架,运用UCI的信用评估数据集,构建两层分类器学习模型用以评估个人信用;最后,将提出的模型方法用于实证分析,实验表明相对于SVM、RF、ANN、GBDT这些单一学习方法,以及对这些单...
作者:ZHENG; Ling-Ling; HU; Sheng; ZHOU; Ai-Ju; YANG; Rui-Cong 期刊:《结构化学》 2019年第10期
Co-crystallization of 2,3,6,7,10,11-hexahydroxytriphenylene(L)with nicotinic acid(3-pyaH)and isonicotinic acid(4-pyaH)offers L·(3-pyaH)·5 H2O(1)and L·2(4-pya H)·5 H2O(2),respectively.In 1,each L links three neighboring L molecules via O-H···O and C-H···O hydrogen bonds,furnishing a 1 D chain.The hydrogen bonding and p-p stacking deriving from 3-pyaH and L extend the chains to a 2D layer.Lattice ...
作者:马朋辉; 王雪宁; 李勇; 邵帅 期刊:《现代信息科技》 2019年第06期
本文主要研究了基于搜狗引擎用户浏览数据下的用户画像构建,我们具体地、标签化地、有针对性地描述了用户特征,并以此作为市场分析、商业决策、精准营销的依据。用户画像技术可以帮助搜索引擎更有针对性的服务用户。本文主要工作:一是对用户搜索数据集进行预处理,分词上我们选用了Jieba分词工具;二是特征词的选取采用了基于TF-IDF的向量空间模型;三是使用Word2vec将特征词转变为词向量;最后使用不同的分类器构建用户画像,我们在这...
作者:罗智青; 莫汉培; 王汝辉; 胡顺东; 方绍怀; 陈世涛 期刊:《能源与环保》 2019年第02期
计量故障中的失压故障是目前电力计量系统常见的故障问题之一,传统的失压故障判定以终端告警为依据,判定维度单一,且终端告警存在误报、漏报的情况,导致了故障无法及时发现、无法实时处理。为了解决失压故障识别维度单一和终端漏报误报的问题,采用比较研究法,在前人使用机器学习算法解决故障识别问题的基础上,结合真实计量数据,构建失压关键指标,提出了一种基于Stacking模型融合的计量故障监测算法。经反复实例论证和理论测算,该算...
作者:励嘉豪; 曾丹 期刊:《电子技术与软件工程》 2018年第20期
房价预测是大数据处理的经典命题。本文基于kaggle平台的房价预测数据集,实现了特征分析、特征清洗、特征工程、特征选择、模型选择和集成学习。其中特征工程中对多达79个特征的处理以及使用Stacking进行集成学习是本文的亮点。除了stacking学习法,本文还尝试了boosting学习法的XGB和LGBM以及Bagging学习法,最终在kaggle.com的最好成绩为0.11274,在世界4000多只队中排名TOP4%,这证明本文模型有效得预测了房价同时避免了过拟合。
作者:徐继伟; 杨云 期刊:《云南大学学报·自然科学版》 2018年第06期
机器学习的求解过程可以看作是在假设空间中搜索一个具有强泛化能力和高鲁棒性的学习模型,而在假设空间中寻找合适模型的过程是较为困难的.然而,集成学习作为一类组合优化的学习方法,不仅能通过组合多个简单模型以获得一个性能更优的组合模型,而且允许研究者可以针对具体的机器学习问题设计组合方案以得到更为强大的解决方案.回顾了集成学习的发展历史,并着重对集成学习中多样性的产生、模型训练和模型组合这三大策略进行归纳,然后...
高光谱图像分类研究中,集成学习能够显著地提高分类效果。但是传统的并行多分类系统对基础分类器有较高要求,即要求差异性及分类均衡。为了解决这一问题,采用Stacking Learning的堆栈式学习方式,首先使用K-Fold和交叉验证的方式进行数据分割和训练,将原始特征进行特征变换,重新构建二级特征。再使用新特征进行对Meta分类器进行训练得到判决分类器,用于样本的最后分类判断。实验结果表明,采用的Stacking Learning方法不依赖基础分类...
作者:张志东; 王志海; 刘海洋; 孙艳歌 期刊:《计算机科学》 2018年第03期
在多标记分类问题中,有效地利用标记间的依赖关系是进一步提升分类器性能的主要途径之一。基于分类器链算法,利用互信息度量理论构造分类对象的类属性之间明确的多标记关系依赖模型,并依据建立的标记依赖模型将分类器链中的线性依赖拓展成树型依赖,以适应更为复杂的标记依赖关系;同时,在此基础上利用Stacking集成学习方法建立最终训练模型,提出了一种新的针对树型依赖表示模型的Stacking算法。在多个实验数据集上的实验结果表明,与...
集成学习主要分为串行和并行学习方法.并行学习的优势在于分类器的并行学习和融合,对分类问题通常采用的融合策略为投票法或堆叠学习法,它们的代表分别为随机森林和堆叠泛化Stacking.为了进一步提高Stacking的分类性能,在经典Stacking算法原理的基础上,提出基于随机森林的多阶段集成学习方法,以随机森林作为基层的基学习算法,以投票法和学习法同时作为融合方法,来降低泛化误差.在UCI数据集上的实验结果表明,提出的模型在Accuracy和...
作者:孙允凯; 谢睿; 王小峰; 文格波; 林英武 期刊:《结构化学》 2016年第09期
By the reaction of different aromatic dicarboxylic acid with zinc nitrate, three metal-carboxylate frameworks, [Zn3(BDC)3(EtOH)2](1), [Zn3(BDC)3(py)2]·2DMF(2), and [Zn3(NH2-BDC)3(H2O)2]·5DMF(3) which are constructed on the same linear trinuclear Zn3(RCOO)6 secondary building units, have been synthesized and characterized by X-ray diffraction analyses. Structural analyses show...
作者: 期刊:《武汉理工大学学报》 2006年第S2期
The acquisition and processing of equipment information is pivotol to control and management of the automated storage and retrieval system.The work of this paper is based on the automatic storage and retrieval experimental system of Wuhan University of Technology.First,the output/input flow and the control information of storage/retrieval vehicle are studied and the plotting finite state machine...
作者:吴悠; 高静怡 期刊:《电子制作》 2014年第10X期
讨论解决不平衡分类问题的策略与算法,数据挖掘使用平台介绍,解决不平衡分类算法比较。
作者:汪凤 张彼德 刘秀峰 邹江平 凌骁洲 邓均 何頔 期刊:《水电能源科学》 2013年第08期
针对目前广泛应用于变压器故障诊断的四种分类器在模式识别中存在的不足,基于Stacking元学习策略的组合方式,构建了一种分类器组合模型。通过试验证明,该组合分类器优于单个分类器精度。
作者:胡小生 张润晶 钟勇 期刊:《计算机与数字工程》 2013年第11期
在基于Stacking框架下异构分类器集成的元学习基础上,将无监督的聚类应用到分类过程中,提出一种基于聚类分析的改进Stacking集成算法.训练样本首先被基分类器分类,随后分类结果被聚类成多个簇,以便分类结果相一致的样本能够被聚集至同一个簇中,同时,将样本特征属性也应用到聚类过程中以增强聚类效果,在每个聚簇内应用C4.5决策树算法提炼决策边界;在分类阶段,首先找出与待分类样本距离最近的聚簇,之后用此聚簇的决策树模型进行分类....