作者:顾兆军; 吴优; 赵春迪; 周景贤 期刊:《计算机工程与应用》 2020年第06期
针对传统基于机器学习的流量分类方法中数据不均衡影响分类效果的问题,提出了一种基于重采样的梯度增强树算法。该算法利用流量数据的统计特征,通过回溯搜索策略优化特征集合并设计适用于流量分类的树结构参数,构造最优模型;利用结合重采样的LightGBM算法修正数据不平衡性并进行分类测试。经实验验证,该算法提高了不平衡数据的分类效果,并且具有性能稳定、快速的优点。
作者:李泽宇; 施勇; 薛质 期刊:《通信技术》 2020年第02期
网络攻击成为日益重要的安全问题,而多种网络攻击手段多以恶意URL为途径。基于黑名单的恶意URL识别方法存在查全率低、时效性差等问题,而基于机器学习的恶意URL识别方法仍在发展中。对多种机器学习模型特别是集成学习模型在恶意URL识别问题上的效果进行研究,结果表明,集成学习方法在召回率、准确率、正确率、F1值、AUC值等多项指标上整体优于传统机器学习模型,其中随机森林算法表现最优。可见,集成学习模型在恶意URL识别问题上具有...
作者:柯鹏飞; 蔡茂国; 吴涛 期刊:《计算机工程》 2020年第02期
针对复杂卷积神经网络(CNN)在中小型人脸数据库中的识别结果容易出现过拟合现象,提出一种基于改进CNN网络与集成学习的人脸识别算法。改进CNN网络结合平面网络和残差网络的特点,采用平均池化层代替全连接层,使得网络结构简单且可移植性强。在改进CNN网络的基础上,利用基于投票法的集成学习策略将所有个体学习器结果凸组合为最终结果,实现更准确的人脸识别。实验结果表明,该算法在Color FERET、AR和ORL人脸数据库上的识别准确率分别...
作者:王丽梅; 王景荣; 李向 期刊:《当代金融家》 2016年第10期
基于集成学习理论的评价模型有效地避免了单一模型过拟合的现象,同时该模型泛化能力更强,预测准确率更高。在金融活动中,中小企业信用评级正是对中小企业未来还贷款能力状况的研究,即对其违约风险进行预测。本文针对当前模型信用状况预测准确率不高、模型泛化能力不足等特点,提出了自己的模型框架。
随着中国社会经济不断的发展,中国国债的发行以及国债的交易规模不断扩大.国债收益率曲线可以反应出每时每刻已上市的国债收益率,它也在金融市场中有着标杆的地位,为各种资产提供标价的基准信息.本文运用2003年~2018年间中国国债收益率的数据,采用人工智能的方法,建立数学模型.从大到小排列依次选择五个特征.然后,采用BP神经网络和集成模型分别对中国国债10年期收益率进行预测,发现使用集成模型预测的效果比BP神经网络模型预测的效...
作者:李瑶琦; 周鑫; 高卫益; 柏志安; 耿娜 期刊:《工业工程与管理》 2019年第06期
急诊患者到达预测是医生排班的基础,是解决急诊拥堵的关键。现有预测多为单一预测算法,针对每天、每月进行,缺乏更短时间预测。构建基于堆叠法(Stacking)集成学习模型的预测方法,分别以小时、天、周为时间单位,对患者到达进行预测,探究不同时间单位的预测效果。在随机森林(RF)、梯度提升决策树(GBDT)、极端梯度提升树(XGB)、Light GBM(LGB)、支持向量回归(SVR)、K近邻学习(KNN)中选择预测效果较佳的方法作为Stacking集成的初级学习...
作者:樊浩; 苏海博; 陈立; 史宗谦; 李兴文 期刊:《电器与能效管理技术》 2019年第23期
基于机械振动信号对高压断路器进行故障诊断是一种有效的手段。提出一种基于振动信号的随机森林集成学习模型,进一步提高了故障诊断模型的效率和准确度。首先,获取电磁斥力机构高压断路器两个不同位置的分闸振动信号;然后,利用小波包分解对振动信号进行时、频特性分析,并计算振动信号的各频段归一化能量向量;最后,基于随机森林集成学习模型进行故障诊断和识别。实验结果显示,随机森林集成学习模型具有显著的泛化性能,使用简单,诊断...
作者:夏涛; 徐辉煌; 郑建立 期刊:《智能计算机与应用》 2019年第05期
冠心病是一种常见的心血管疾病,具有高发病率的特点。因此,冠心病住院费用的预测对于控制医疗费用有着重要意义。本文基于机器学习方法,通过将总的住院费用划为8个分项费用,以患者特征作为输入,结合随机森林与极端梯度提升算法,并使用十折交叉验证确定最佳的分项费用预测模型。再根据分项费用的预测值进行求和得出总的预测住院费用。总费用预测模型的拟合优度(R 2)为0.825,平均绝对百分比误差(MAPE)为29.16%。以此预测模型测试新的...
作者:张玉玺; 贺松; 尤思梦 期刊:《智能计算机与应用》 2019年第05期
糖尿病、高血压和心脑血管病并称为影响人类健康的三大杀手,不仅对患者的生命健康造成严重的威胁,也给患者的家庭造成严重的经济负担。对糖尿病做出准确的预测,意义深远。本文采用了KNN、支持向量机、逻辑回归、随机森林、集成学习五种方法对糖尿病数据进行预测,分别取得了71.86%,72.29%,74.46%,71.87%,76.62%的准确率。结果表明,集成学习预测效果最佳,验证了其优异性。
作者:曹再辉; 余东先; 施进发; 宗思生 期刊:《控制工程》 2019年第12期
针对不同的具体问题,传统机器学习算法的预测精度往往存在差异,而集成学习能够综合若干基分类器的预测结果,可以使得分类效果显著提升。首先,简单的介绍了集成学习的基本思想,并分析了Stacking集成算法相对于传统经典集成算法的优势;其次,基于Stacking集成框架,运用UCI的信用评估数据集,构建两层分类器学习模型用以评估个人信用;最后,将提出的模型方法用于实证分析,实验表明相对于SVM、RF、ANN、GBDT这些单一学习方法,以及对这些单...
作者:马泽文; 刘洋; 徐洪平; 易航 期刊:《信息网络安全》 2019年第09期
DoS攻击即拒绝服务攻击是一种常见且长期以来难以检测和预防的网络攻击方法,通过消耗被攻击者的带宽或计算资源造成目标计算机网络服务中断或停止,导致正常用户无法访问。随着机器学习算法的快速发展,决策树、支持向量机、随机森林、adaboost等算法逐渐被用于Do S攻击网络流量的识别与检测。对于大多数机器学习算法来说,网络流量特征的选择直接决定算法性能的优劣。文章使用网络流量特征提取工具CICFlow Meter和随机森林算法对网络...
作者:王梓齐; 刘长良; 刘帅 期刊:《仪器仪表学报》 2019年第07期
风电机组齿轮箱的故障频率和维修成本较高,有必要对其运行状态进行实时监测。非线性状态估计(NSET)算法有着对记忆矩阵依赖大、无法有效利用数据资源改善精度、实时性差等不足。为此,提出一种基于模糊软聚类和集成NSET的状态监测方法:使用模糊软聚类将历史数据分为边界有重叠的不同类别,实现工况的软划分并构造多个不同工况的NSET模型作为个体学习器;以参数回归方法作为结合器,可在不影响实时性的同时,使用大量数据训练参数以改善...
作者:金炜东; 陈春利 期刊:《系统仿真学报》 2019年第09期
针对目前雷达信号分选方法中难以快速提取到合适的特征,且其准确度较低等问题,提出一种基于集成深度学习模型的信号分选方法。通过堆叠不同类型的深度信念网络改进算法,对雷达辐射源信号进行深入特征学习,将每层模型得到的后验概率进行线性集成学习,再通过决策层确定最终的分类结果,从而进一步提高信号的识别率。采用所提方法对仿真的不同类型的雷达辐射源信号进行分选,实验结果表明,该方法展现出较强的学习到更多数据本质特征的能...
作者:刘慧; 姚金阳; 赵荣彩 期刊:《信息工程大学学报》 2019年第03期
基于机器学习的迭代编译方法是当前迭代编译领域的研究热点,其挑战在于学习算法选择、优化参数搜索及程序特征表示等问题。基于集成学习技术提出一种优化参数组合自动预测方法ELOPS。使用约束多目标粒子群优化算法对优化空间进行搜索,找到样本函数最佳优化参数组合;通过特征—类相关性度量方法对函数特征进行抽取;最后通过由函数特征和最佳参数组合形成的样本构建集成学习模型,对新程序优化参数进行预测。基于两种平台,在NPB测试集...
在大数据时代,基于机器学习的异常点(Outlier)检测被广泛应用在抗网络攻击、检测信用欺诈等方面,已引起工业界的普遍重视。不同于传统的分类和聚类问题,异常点检测需要面临严重数据失衡问题。为了解决这一问题,笔者提出了集成多种机器学习技术检测异常点的方法,并通过实验证明了方法的有效性。
作者:顾陈楠; 曾晓勤 期刊:《计算机与现代化》 2019年第11期
传统的2D卷积神经网络在进行视频识别时容易丢失目标在时间维度上的相关特征信息,导致识别准确率降低。针对该问题,本文采用3D卷积网络作为基本的网络框架,使用3D卷积核进行卷积操作提取视频中的时空特征,同时集成多个3D卷积神经网络模型对动态手势进行识别。为了提高模型的收敛速度和训练的稳定性,运用批量归一化(BN)技术优化网络,使优化后的网络训练时间缩短。实验结果表明,本文方法对于动态手势的识别具有较好的识别结果,在Shef...
作者:李哲; 于梦茹 期刊:《计算机工程与应用》 2019年第20期
针对车标图像的分类难问题,提出基于多种LBP 特征集成学习的车标识别算法。利用车牌与车标的相对位置关系粗定位车标区域;根据车标背景纹理特征使用不同的算子进行边缘检测,进而实现背景消融,采用投影方法精确确定车标位置;将车标图像分块,应用CSLBP 算子提取每个像素点邻域特征,将车标所有像素点邻域特征合成精细的纹理特征,运用LBP 直方图算法提取车标区域的空间结构特征,再采用SVM和BP 分别训练这两种特征,得到投票决策矩阵,利...
作者:王利君; 支志英; 贾鹿; 李伟 期刊:《计算机科学》 2019年第S11期
在油田生产过程中,油井受各种因素的影响容易发生结蜡。油井结蜡通常会降低油井产生,造成油井阻塞,甚至会造成停井及烧电机等现象,大大增加采油成本。对抽油井结蜡状态进行提前预测,实现抽油井设备预见性维护对油田降本增效及智能化管理具有重要意义。针对基于不平衡数据集构建结蜡预测模型预测效果不理想的问题,文中提出了一种面向非平衡数据的集成学习方法SCRF(SMOTE CLUSTER RANDOM FOREST)。该方法首先使用SMOTE方法对原数据集...
作者:刘华玲; 林蓓; 恽文婧; 丁宇杰 期刊:《计算机科学》 2019年第S11期
互联网金融的快速发展,使得P2P成为一种创新的金融模式,如何识别出网贷中的潜在风险成为研究热点。网贷交易数据常常存在严重的不平衡,导致风险识别率较低。针对这一问题,文中采用随机下采样、SMOTE和Bagging方法进行类平衡处理,利用逻辑回归和支持向量分类机进行检验评价。实验表明,在P2P风险识别中,以召回率为标准,bagging的平衡处理效果优于随机下采样与SMOTE,且逻辑回归不存在明显的过拟合,所以其他SVC更适合用于P2P逾期风险识...
作者:朱明; 王春梅; 高翔; 王静 期刊:《小型微型计算机系统》 2019年第12期
针对目前卫星网路协调任务存在协调成本高、协调效率较低的问题,提出基于XGBoost(e Xtreme Gradient Boosting,极端梯度提升树)的卫星网络协调态势预测方法.该方法采用XGBoost算法学习高维的卫星网络协调数据,构建卫星网络协调态势预测模型,实现卫星网络协调态势的有效预测.实验结果表明,XGBoost模型在卫星网络协调态势预测方面具有较好的优越性.