作者:孙世凡; 叶明; 刘凯 期刊:《计算机与现代化》 2020年第02期
针对直径为3 mm的小尺寸橡胶柱塞件端面,其受光斑、灰尘及纹理干扰不易分割提取缺陷轮廓的问题,提出一种结合SLIC(简单线性迭代聚类)和RF(随机森林)算法的缺陷检测系统。首先利用霍夫变换和各向异性扩散滤波对图像预处理,然后采用基于超像素分割的SLIC算法分割和提取缺陷区域,最后把获得的缺陷区域的五维形状特征作为RF分类器特征向量进行缺陷分类预测。结果表明,SLIC算法较传统的自适应阈值分割算法快了0.128 s,并且分割效果远好...
作者:朱迪; 陈丹伟 期刊:《计算机工程与应用》 2020年第04期
随着移动终端设备的蓬勃发展,移动应用种类的日益增加,移动应用类型识别成为网络管理、市场营销以及网络攻击防范等领域中一种具有重要意义的技术手段。在实际应用中,几乎所有的移动应用程序都采用SSL/TLS(Secure Sockets Layer/Transport Layer Security)协议进行数据加密,因此使移动应用类型识别工作更具挑战。提出了一种新颖的加密环境下Android移动应用类型识别技术。该技术利用信息熵对DBSCAN(Density-Based Spatial Clusteri...
作者:邱凌峰; 韩昕格; 胡啸峰 期刊:《中国安全生产科学技术》 2020年第01期
恐怖袭击事件通常会造成严重的人员伤亡、财产损失和社会影响,针对在不同场景下发生恐怖袭击所造成的后果进行预测是目前应对恐怖袭击事件急需解决的问题之一。利用多源数据,首先基于随机森林算法对恐怖袭击事件是否造成死伤进行分类预测,进而基于岭回归算法预测事件造成的具体死伤人数。研究结果表明:随机森林在测试集上对有死伤事件的召回率达到0.85,岭回归预测死亡和受伤人数的平均绝对误差分别小于1人和2人。研究结果可为反恐...
作者:张铭智; 尤东方; 何文静; 张汝阳; 陈峰; 胡志斌; 赵杨 期刊:《中国卫生统计》 2019年第06期
基因调控网络(gene regulatory network,GRN)是当前功能基因组学所研究的重要内容之一,作为一种描述基因间相互作用关系的方式,在推断复杂疾病的致病原理过程中发挥着重要的作用。通过对基因调控网络的分析,我们能够更加深入地了解各基因的生物学功能、理解基因间的调控机理并推断出未知基因的功能,这对疾病诊断、临床实践、药物研发等方面有指导性的意义。
作者:陈硕; 殷锋; 袁平 期刊:《现代计算机》 2020年第03期
为了获取工业互联网领域中文资讯的关键词,提出一种基于特征的中文关键词抽取算法。该算法主要从分词、候选词选取和特征选取三个方面做改进。首先,在分词阶段,通过从大量工业互联网资讯中抽取的特定词语和利用搜狗输入法的领域词库的词典创建了两个用户自定义词典,解决工业互联网领域文本中存在大量未登录词的问题,提高分词的准确率,进而提高关键词抽取的准确率;然后通过实验仿真选取合适数量的候选词,提高算法的效果和效率;其次,...
作者:郑梦琪; 朱家明 期刊:《高师理科学刊》 2020年第02期
对全民阅读意识形成进行研究,可以为今后教育行业提供有力的人才培养依据.进行问卷的设计和预调查,确定合理的问卷样本数量.对问卷的结果进行主成分分析和加权秩和比排序,得到阅读量差异的主要影响因素.运用随机森林算法进行因素分析,得到文化程度、家庭环境和爱好为主要影响因素,并与主成分分析结果进行对比.
文章深入简出的介绍了随机森林体系这一比较常用的人工智能算法,分别从其算法原理进行介绍,列举其决策树的运用技巧以及应用场景。对随机森林技术目前存在的优点以及缺点和现今主流的算法进行对比分析,并着重介绍了其未来应用的构思以及改进空间。同时将随机森林技术运用到电力稽查中的表现,详细分析了其在电力稽查中的运用成果,随机森林体系在电力稽查规则识别以及归类异常问题中有比较突出的表现成果。
作者:杨彦荣; 宋荣杰; 胡国强; 张桓 期刊:《现代电子技术》 2020年第03期
为准确、快速地从高分影像中获取苹果种植分布信息,以QuickBird遥感影像为数据源,首先采用分形理论和灰度共生矩阵(GLCM)提取纹理特征,然后将提取的分形纹理和GLCM纹理特征分别与光谱特征组合,最后开展随机森林分类实验,对不同分类特征和不同分类方法的实验结果进行比较。结果表明:光谱+GLCM纹理识别苹果园的效果明显优于光谱特征和光谱+分形纹理,其苹果园提取精度为95.99%,比光谱分类显著提高11.83%,比光谱+分形纹理提高1.34%;在...
科学有效地预测企业净资产收益率对于资本市场评估企业有很好的借鉴意义。文章为探求随机森林算法对净资产收益率的预测能力,以800家上市企业数据为样本,分别采用决策树、随机森林和支持向量回归模型进行对比试验,建立因子分析与随机森林组合模型,结果表明,随机森林对于净资产收益率有更优的预测效果,对资本市场进行企业评估有很好的借鉴和指导意义。
作者:秦喜文; 郭佳静; 史磊; 冯阳洋; 孙美虹 期刊:《制造业自动化》 2020年第01期
滚动轴承是常见机械设备的重要部件,其是否能正常运作,直接关联到设备生产的安全性以及效率的高低,因此,能够及时、准确地识别滚动轴承工作状态,显得至关重要。提出了一种阈值法确定变分模态分解中分解个数,该方法使得分解个数的确定更科学合理,同时提出基于变分模态分解和随机森林相结合的滚动轴承故障诊断方法,该方法利用变分模态分解方法将滚动轴承振动信号分解成若干个固有模态函数,轴承发生不同故障时,不同的固有模态函数内的...
作者:张智韬; 劳聪聪; 王海峰; ARNON; Karnieli; 陈俊英; 李宇 期刊:《农业机械学报》 2020年第01期
为探讨分数阶微分(FOD)联合支持向量机分类-随机森林模型改善高光谱监测荒漠土壤有机质含量(SOM)的效果,对以色列Sde Boker荒漠地区采集的砂质土(SS)和黏壤土(CLS)样品进行理化分析和室内光谱测定,依据光谱的平均反射率建立支持向量机分类模型(SVMAD),并对不同土质高光谱原始反射率分别经0^2阶(间隔0.2)的分数阶微分处理,构建归一化光谱指数(NDI),分析NDI和SOM之间的二维相关性,并筛选敏感的NDI指数,以此建立不同FOD的随机森林(RF)...
作者:海; 刘逸铭; 冯权泷; 欧聪; 郭浩; 刘建涛 期刊:《农业机械学报》 2020年第01期
针对精确获取大尺度空间范围内农业大棚的分布情况并进行长时间的序列动态监测存在数据量大、计算效率低、精度不高等问题,利用Google Earth Engine(GEE)云平台能够实现快速存取、实时处理海量卫星数据,基于多时相Landsat影像进行农业大棚时序光谱特征和纹理特征的自动提取,采用随机森林算法实现山东省农业大棚的遥感分类,从而生成了山东省近30年农业大棚的空间分布和时空动态变化图。结果表明,本文分类流程具有较高的分类精度,其...
作者:李远航; 陈先来; 刘莉; 安莹; 李忠民 期刊:《计算机工程》 2020年第01期
数据挖掘中的隐私保护问题是目前信息安全领域的研究热点之一。针对隐私保护要求下的分类问题,提出一种面向差分隐私保护的随机森林算法RFDPP-Gini。将随机森林与差分隐私保护相结合,在隐私信息得到保护的同时提高分类的准确率。以CART分类树作为随机森林中的单棵决策树,使用Laplace机制和指数机制添加噪声并选择最佳分裂特征。实验结果表明,RFDPP-Gini算法既能处理离散型特征又能处理连续型特征,在Adult和Mushroom数据集上的分类...
作者:赵淑渝; 张宏海 期刊:《科研信息化技术与应用》 2019年第03期
本文以华南-槽批LPG价格为研究对象,基于自身历史数据,竞争对手数据和与LPG价格相关的国际指标数据预测未来7天、10天、15天等不等周期的价格。为预测LPG价格,本文分别对数据采集和预处理、特征选择,以及模型算法进行了研究,最终选择随机森林模型框架对LPG价格进行预测。本文以金联创提供的2016年1月到2019年2月数据为例,使用随机森林算法分别针对不同种类的特征作为输入进行LPG价格预测。结果表明,不同种类的特征对预测结果的影响...
为保证电力传输的安全,本文将从电力海量准实时数据服务平台获取的数据与机器学习的随机森林算法结合,建立计量失压识别模型。探索专家样本,结合失压故障特点,建立失压识别特征,通过随机森林算法建立计量失压识别模型,判断电力传输过程中是否存在失压故障。
作者:梁家雄; 杨俊杰; 罗海波 期刊: 2018年第02期
随机森林是集成学习中广泛使用的算法,本文基于随机森林算法检测FTP 暴力破解进行分析,包括对随机森林原理,以及对基于随机森林算法检测FTP 暴力破解分析使用的数据集进行阐述,还跟决策树算法进行了对比,最后还对基于随机森林算法检测FTP 暴力破解分析提供了小小的改进建议。
作者:龚宇翔; 曹进; 付玉龙; 郭敏 期刊:《信息安全学报》 2019年第01期
近年来, 4GLTE-A技术发展迅猛,移动设备的普及以及各种承载于4G网络的业务和应用已经成为我们日常不可或缺的部分。但网络攻击技术也不断的在发展,特别是近年来针对4G LTE-A网络的攻击技术的不断演进,已成为危害人们切身利益的关键问题。DDoS作为DoS攻击的一种,对网络带来了更大的危害,因此需要研究一种攻击检测模型。文章提出了一个针对LTE-A网络中的DDoS攻击流量检测模型,模型利用熵作为特征之一,并使用随机森林算法训练模型分类...
作者:武吉梅; 唐嘉辉; 王昌达; 胡兵兵 期刊:《数字印刷》 2019年第01期
本文研究了基于随机共振和随机森林的轴承故障诊断方法。首先将原始的轴承故障数据分为训练集和测试集,然后将数据集通过随机共振处理以增强弱故障特征,之后将增强后的故障数据输入随机森林中进行模型训练,通过调整合适的模型参数,计算出最终正确率。结果表明,与传统的机器学习相比,本文提出的方法具有更高的识别准确率,可为智能印刷机的设计及故障诊断提供理论指导和技术支持。
作者:孙明喆; 毕瑶家; 孙驰 期刊:《现代信息科技》 2019年第20期
随机森林是一种灵活且易于使用的机器学习算法,因为它很简易,既可用于分类也能用于回归任务。在医学、生物信息、环境预测检测等领域有着广泛的应用。为此,本文介绍了随机森林原理及其相关性质,以及它的改进情况及应用,并讨论了以后的改进趋势和方向。
作者:吴晓欢; 付金强; 周训海; 彭刚; 陈敏; 阮景 期刊:《智慧工厂》 2019年第11期
本文采用动态平均偏差和方差方法进行数据特征提取,对工业生产过程进行数据分析,对比分析了基于决策树(DT)、随机森林(RF)和梯度提升决策树(GBDT)的故障预测方法,并设计了采用SSH框架与Python结合的故障预测系统。实验结果表明GBDT在预测时间和预测精度上表现较好。