作者:易未; 郑沫利; 赵艳轲; 毛力; 孙俊 期刊:《计算机技术与发展》 2020年第02期
当前机器学习的技术已经运用到很多工程项目中,但大部分机器学习的算法只有在样本数量充足且运用在单一场景中的时候,才能获得良好的结果。其中,经典的支持向量回归机是一种具有良好泛化能力的回归算法。但若当前场景的样本数量较少时,则得到的回归模型泛化能力较差。针对此问题,以加权ε支持向量回归机为基础,提出了一种小样本数据的迁移学习支持向量回归机算法。该算法以加权ε支持向量回归机为Bagging算法的基学习器,使用与目标任...
作者:王国薇; 黄浩; 周刚; 胡英 期刊:《现代电子技术》 2019年第24期
为了进一步提高基于深度神经网络短文本分类性能,提出将集成学习方法应用于5种不同的神经网络文本分类器,即卷积神经网络、双向长短时记忆网络、卷积循环神经网络、循环卷积神经网络、分层注意力机制神经网络,分别对两种集成学习方法(Bagging,Stacking)进行了测试。实验结果表明:将多个神经网络短文本分类器进行集成的分类性能要优于单一文本分类模型;进一步两两集成的实验验证了单个模型对短文本分类性能的贡献率。
在现如今的机器学习领域,集成学习方法作为一种提高模型性能的策略,被广泛应用在各种机器学习模型当中。集成学习的核心概念是综合多个分类器的结果,通过某种集成策略,来得到一个准确率更高的模型。本文依据具体实例"Fashion-MINIST服饰分类数据集",分别采用了kNN模型,logistic模型,以及bagging集成kNN,logistic模型,比较分析了不同模型在该数据集上的差异性以及优缺点。
本文引入集成学习方法,具体包括Bagging、AdaBoost、Random Forest,选取A股上市公司的资产负债表、现金流量表、利润表中的关键财务指标,用集成学习模型对财务信息异常进行识别(分类),并对不同集成学习方法的识别效果进行比较分析。实证结果表明:上述三种方法的平均准确率都在80%以上,其中Bagging的准确率相对较低,AdaBoost的准确率相对较高;农林牧渔行业的平均准确率最高,化工行业的平均准确率最低;不同行业的准确率存在较大差...
作者:毕云帆; 撖奥洋; 张智晟; 孙文慧 期刊:《电力系统及其自动化学报》 2019年第07期
为了提高常规梯度提升决策树GBDT算法的泛化性能,并实现并行计算,在GBDT的基础上,利用隶属度函数对气象数据进行模糊处理,同时引入Bagging算法,通过Bootstrap方式对原始数据进行多次抽样形成新的训练样本,分别训练模糊GBDT负荷预测子模型,提出了基于模糊Bagging-GBDT的短期负荷预测模型。算例分析结果表明,本文提出的预测模型相较于BP-NN和常规GBDT预测模型,7日平均绝对误差分别降低了1.44%和0.22%,模型具有良好的预测精度和稳定性...
作者:陈亚男; 薛雷 期刊:《电子测量技术》 2019年第14期
为了更准确地预测股价趋势,为股民提供股票投资指南,在传统的支持向量机模型的基础上融入了Bagging思想,提出了一种股票价格趋势的预测方法。具体讲,就是从原始训练集中利用Bootstrap方法随机子抽样出若干个子训练集,再利用每一个子训练集训练出各自的子SVM模型,然后在测试阶段每一个子SVM模型会给出一个预测股票涨跌的趋势,最后用投票法统计出票数最多的一个作为最终预测结果。实验数据为近3年的工商银行股票指数。实验结果表明,...
作者:时雷; 段其国; 张娟娟; 熊明阳; 席磊; 马新明 期刊:《广西科学》 2018年第04期
【目的】为提高决策树集成的泛化能力和效率,解决集成全部决策树的情况下有时并不显著提高精度、反而导致额外存储和计算开销的问题,提出一种基于粗糙集的决策树集成学习算法。【方法】该算法基于粗糙集理论,从训练的全部决策树中选择一部分进行集成。【结果】与目前流行的集成学习算法Bagging和Boosting相比,本文提出的算法有效地减小了集成规模,并获得更好的泛化能力。【结论】该算法提高了决策树集成的泛化能力和效率。
作者:赵帅; 李妍君; 熊伟丽 期刊:《控制工程》 2019年第01期
工业污水处理过程具有高度非线性的特点,对水质指标中的生物需氧量的实时监测提出了挑战,提出一种基于核主元分析和Bagging算法的高斯过程回归建模方法。首先,采用核主元分析方法将采集到的污水数据投影到高维空间进行降维处理,提取非线性主元作为模型输入;然后采用Bagging集成学习算法得到若干样本子集,建立相应的高斯过程回归模型;最后根据贝叶斯后验概率计算得到各子模型的权重,对各子模型的输出进行融合,得到全局预测值。对实...
作者:刘雅璇; 潘万彬 期刊:《中国图象图形学报》 2019年第05期
目的目前垃圾主要采用名称检索的方式开展分类,这类方法通常基于事先设定的数据分类,很难有效包含现有所有的垃圾,更难应对未来持续增多的垃圾,针对上述问题,面向生活垃圾,提出一种基于自我训练的长效垃圾分类方法。方法首先,采用Bagging将两类分类能力和训练机制不同的基分类器:K近邻分类器和支持向量机,根据它们各自独立的投票和权重进行有机组合,提出了一种新颖的集成分类器对生活垃圾进行分类;其次,基于直观的图像交互反馈,动...
作者:郑建军; 甘仞初; 贺跃; 于同 期刊:《北京理工大学学报》 2005年第12期
提出一种神经网络分类器的动态集成方法.基于bootstrapping构建不同的个体神经网络,针对混合属性,通过不同的加权最近邻设计评估单个网络的分类精度,在此基础上动态选择误差率较小的神经网络,经过投票形成集成分类结果.将该方法与其它几种集成方法在10个UCI数据集上进行了分类性能比较.实验结果表明,该方法在上述所有数据集上的平均分类精度最佳,同时发现,Bagging比隐层神经元数法能更好地生成个体网络,而将两者结合起来训练个体神...
作者:徐继伟; 杨云 期刊:《云南大学学报·自然科学版》 2018年第06期
机器学习的求解过程可以看作是在假设空间中搜索一个具有强泛化能力和高鲁棒性的学习模型,而在假设空间中寻找合适模型的过程是较为困难的.然而,集成学习作为一类组合优化的学习方法,不仅能通过组合多个简单模型以获得一个性能更优的组合模型,而且允许研究者可以针对具体的机器学习问题设计组合方案以得到更为强大的解决方案.回顾了集成学习的发展历史,并着重对集成学习中多样性的产生、模型训练和模型组合这三大策略进行归纳,然后...
作为用户快速找到理想商品的主要手段,搜索在电商平台中占据着举足轻重的地位。本课题的主要任务就是利用机器学习技术,提出一个基于集成学习的算法,衡量电子商务站点的搜索结果相关性并用于进一步预测搜索性能。我们的研究成果未来可用于解决小型企业难以评估其搜索算法好坏的问题。
作者:李秀芳; 黄志国; 陈孝伟 期刊:《保险研究》 2019年第04期
保险欺诈不仅危及保险公司的正常经营,增加投保人的负担,甚至有可能影响到国家的金融稳定。随着大数据时代的到来,保险反欺诈亟需引入革命性技术。Bagging集成方法以其可调节模型结构、易于部署、参数空间可控、支持并行运算等特点成为保险公司进行保险反欺诈一个好的选择。Bagging方法主要包括Bagging算法、Random Subspace算法、Random Patches算法,它们又能与不同基学习器结合构成新的分支算法及算法特例。本文基于这些算法对保...
作者:李晓梅; 马树元; 吴平东; 陈之龙; 柳回春 期刊:《计算机工程与科学》 2004年第02期
Bagging是一种用来提高学习算法准确度的方法,通过构造一系列预测函数并将其结果按投票规则进行合成,就可以将一个弱学习算法提升为强学习算法.本文针对UK测试量表中的手写体数字,设计并实现了一个以神经网络为弱分类器的、基于Bagging的手写体数字识别系统.与单个神经网络分类器相比,Bagging后的系统显示了更加优良的性能.
作者:王元珍; 乐树彬 期刊:《小型微型计算机系统》 2005年第11期
基于MultiBoost分类组装技术,提出了一种用增量交叉验证技术求MultiBoost最小分类误差的算法,以使之在指定分类器数量T的范围内找出具有最小分类误差的合成分类器.
作者:赵金涛; 邱雪涛; 何东杰 期刊:《微型电脑应用》 2017年第10期
随着银行卡行业的迅猛发展,在带来海量银行卡交易的同时,欺诈交易也与之俱增。将GBDT算法应用于银行卡欺诈侦测领域,通过WOE和IV方法对变量进行分组处理及筛选,以Bagging的方式对模型进行了组合,通过加权投票方式判断欺诈交易。实证研究表明,该模型的达到预期评价指标,效果显著。
作者:连宇茜; 余锦华; 汪源源; 史之峰; 陈亮 期刊:《仪器仪表学报》 2016年第S1期
颞叶癫痫是一种常见的癫痫类疾病,基于磁共振成像(MRI)图像的颞叶癫痫识别可以避免正电子发射计算机断层成像(PET)对人体的辐射伤害。本文提出了一种基于MRI高通量分析的颞叶癫痫识别算法:对于脑部MRI图像,先利用SPM12平台将MRI图像配准到标准脑图集,在同一坐标系下再按照AAL分区提取海马区作为感兴趣区域;然后对提取的感兴趣区域进行高通量分析,提取540个图像特征;最后用Bagging分类方法进行分类,区分正常人与颞叶癫痫患者。实验...
作者:蔡毅; 朱秀芳; 孙章丽; 陈阿娇 期刊:《计算机科学》 2017年第S1期
半监督学习和集成学习是目前机器学习领域中两个非常重要的研究方向,半监督学习注重利用有标记样本与无标记样本来获得高性能分类器,而集成学习旨在利用多个学习器进行集成以提升弱学习器的精度。半监督集成学习是将半监督学习和集成学习进行组合来提升分类器泛化性能的机器学习新方法。首先,在分析半监督集成学习发展过程的基础上,发现半监督集成学习起源于基于分歧的半监督学习方法;然后,综合分析现有半监督集成学习方法,将其分...
作者:郭貔; 王力; 郝元涛 期刊:《中国卫生统计》 2017年第02期
目的探讨基于LASSO回归模型与百度搜索数据构建流感疫情预测系统的可行性。方法采用Bag—ging方法和模型性能的多指标优化评估策略,对传统LASSO回归模型进行改进,构建性能提升的集成LASSO回归模型,将其应用于中国大陆地区季节性流感流行趋势的预测研究。结果与传统LASSO回归模型相比,本研究所构建的集成LASSO回归模型对2011年至2015年中国大陆地区流感流行趋势的预测偏差更小,说明集成LASSO回归模型的外部推断能力更强,适合...
作者:吴伟昆; 傅仰耿; 苏群; 吴英杰; 巩晓婷 期刊:《计算机科学与探索》 2016年第12期
目前对置信规则库(belief rule base,BRB)的研究主要针对单个BRB系统,然而单个BRB系统的推理性能不仅受参数取值的影响,而且当训练集分布不均衡或数据量较少时,容易导致参数训练不全面,从而使得推理结果所提供的决策信息存在局部性。通过引入Bagging算法和AdaBoost算法,分别与BRB相结合提出了基于梯度下降法(gradient descent algorithm,GDA)的置信规则库系统的集成学习方法,并分别应用于输油管道检漏、多峰函数的置信...