作者:高亮; 潘积远; 于佳平 期刊:《科学技术与工程》 2018年第01期
非负矩阵分解已广泛应用于人脸识别,但因无监督、子空间线性表示、基特征局部次优等特点,它识别光照复杂、表情丰富的人脸图像的能力有限。为优化非负矩阵分解的人脸识别能力,分析并建立了非负矩阵分解的集成分类框架,整合多组基特征的弱类别结构信息,在无监督情形下利用偏最小二乘回归建立符合统计属性的集成标签映射,突显正确的类结构。通过多组人脸数据集的试验结果表明,基于非负矩阵分解的集成分类能力显著提高,适用光照复杂、...
作者:王琳; 冯正进; 刘成良; 崔光亮 期刊:《计算机工程》 2004年第17期
提出一种用组合多分类器融合局部信息进行人脸识别的方法.人脸识别过程中图像样本间的相似度可建模为"类内差"和"类间差"两种模式类,用这种思想在图像小波分解域的局部区域上构造弱分类器集,然后通过Boosting训练生成强分类器,最终的人脸匹配由多个弱分类器输出的加权和给出决策.实验结果表明,系统具有较高的识别率,对表情和光照变化具有很好的鲁棒性,而且对新个体有较好的扩展能力.
作者:汪良楠; 肖迪 期刊:《计算机工程与应用》 2018年第05期
模糊决策树在数据模糊化时,需要确定每个数量型属性的模糊语言项个数。另一方面,集成分类算法已成为提高模型准确率和稳定性的有效策略。提出了一种基于混沌布谷鸟(CCS)优化的FDT集成分类算法,首先用CCS算法确定数量型属性的模糊语言项个数,再通过bootstrap抽样生成FDT集成模型,最后采用OOB误差加权投票机制得到分类结果。通过4组UCI数据集验证,与其他分类算法对比,证明了该方法在分类精度上有明显的提升;同时,在处理缺失数据时,...
作者:程进; 王坚 期刊:《计算机集成制造系统》 2017年第11期
针对流程制造业在个性化制造环境中工艺参数难以快速决策以响应用户需求的问题,提出一种基于数据驱动的流程工艺参数匹配方法。从海量制造工艺数据中选取相近工艺的产品生产数据,基于信息论从制造工艺参数中提取能够划分不同产品的工艺特征,基于集成分类构建产品制造要求与工艺特征的关系模型,并建立产品工艺相似度函数。通过对比历史生产数据与目标产品制造要求的相似度实现工艺参数匹配。将该方法应用于钢板热轧环节,验证了所提...
作者:王军; 刘三民; 刘涛 期刊:《内江师范学院学报》 2017年第08期
提出一种基于分类器相似性加权和差异性集成的数据流分类方法.用最新基分类器作为参照分类器,代表数据流中即将出现的概念,基于此分类器通过Gower相似系数求出基分类器之间的相似性,并以相似性作为基分类器权值进行加权多数投票;同时采用Q-statistic方法计算出参照分类器与其他基分类器之间的差异性,并根据差异性大小淘汰较弱基分类器保持集成分类模型多样性.最终构建的集成模型在标准仿真数据集上进行实验仿真.结果表明:在对隐含...
作者:伍云霞; 田一民 期刊:《工程科学学报》 2017年第07期
针对现今煤岩图像识别方法的缺乏与不足,为了挖掘新的煤岩图像识别方法以及更好地处理高维煤岩图像数据,提出了基于最大池化稀疏编码的煤岩识别方法.本方法在提取煤岩图像特征时加入了池化操作,在分类识别时采用了集成分类器,即多个弱分类器组成一个强分类器.实验结果表明:最大池化稀疏编码的特征提取方式能简单有效表达煤岩图像的纹理特征,大大增强煤岩图像的可区分性,获得较高的识别率,并且具有良好的识别稳定性.研究结果可为煤...
作者:海宇娇; 刘青昆 期刊:《计算机工程与应用》 2017年第08期
集成分类通过将若干个弱分类器依据某种规则进行组合,能有效改善分类性能。在组合过程中,各个弱分类器对分类结果的重要程度往往不一样。极限学习机是最近提出的一个新的训练单隐层前馈神经网络的学习算法。以极限学习机为基分类器,提出了一个基于差分进化的极限学习机加权集成方法。提出的方法通过差分进化算法来优化集成方法中各个基分类器的权值。实验结果表明,该方法与基于简单投票集成方法和基于Adaboost集成方法相比,具...
作者:叶志雄; 王丹弘 期刊:《电信工程技术与标准化》 2016年第12期
钓鱼网站每年在电子商务、通信、银行等领域给用户造成极大损失,成功有效的防范钓鱼网站成为一项艰巨任务。本文通过对实际数据的分析,提取了URL相关特点、网页文本内容两方面特征描述网页,然后对不同特征构建相应分类器,根据增量学习思想优化各分类器,提升算法在线学习能力。最后采用分类集成的方法综合各个分类器的预测结果,达到对钓鱼网站在线智能检测的目标。实验表明,集成分类具有良好的在线学习能力和泛化能力。
作者:尹绍宏; 张盼盼 期刊:《计算机工程与应用》 2016年第12期
目前关于概念漂移数据流的分类研究已经取得了许多成果,但大部分没有充分考虑到数据流中概念重复出现的情况,这将耗费大量的计算和内存资源,增加了分类错误的可能性.为此,基于概念的重复性提出了一种数据流集成分类算法,该算法运用集成分类思想处理数据流中的概念漂移,但在学习过程中不会将暂时失效的概念及对应基分类器删除,而是把它们的基本信息存储起来,方便以后调用,并可根据概念间的转换关系预测即将到来的概念,在提高分类精...
作者:田宝明 戴新宇 陈家骏 期刊:《中文信息学报》 2009年第04期
基于词的向量空间模型是文本分类中的传统的表示文本的方法。这种表示方法的一个缺点是忽略了词之间的关系。最近一些使用潜在主题文本表示的方法,如隐含狄利克雷分配LDA(Latent Diriehlet Allocation)引起了人们的注意,这种表示方法可以处理词之间的关系。但是,只使用基于潜在主题的文本表示可能造成词信息的损失。我们使用改进的随机森林方法结合基于词的和基于LDA主题的两种文本表示方法。对于两类特征分别构造随机森林,...
作者:于化龙 顾国昌 刘海波 沈晶 赵靖 期刊:《计算机研究与发展》 2010年第02期
基于微阵列数据的肿瘤诊断方法有望在不久的将来成为临床医学上一种快速且有效的分子层肿瘤诊断方法,但由于微阵列数据存在高维小样本的特点,因而对传统的分类方法提出了挑战,为此研究人员开始关注于性能更好的集成分类算法.针对现有的微阵列数据集成分类算法分类精度不高、计算量过大等问题,提出了一种基于相关性分析的微阵列数据集成分类算法.该算法可以通过计算训练子集间的相关性挑选出差异度最大的一组子集来进行训练,...
作者:宋红胜 孔薇 期刊:《电子设计工程》 2012年第07期
构造高精度分类模型是对基因表达谱数据分析的主要研究方向之一,但提取不同特征空间产生的分类效果有很大差异,而集成分类系统在一定程度上提高了分类结果的可靠性和稳定性。构建基于PCA和NMF集成分量系统,并基于分析混合矩阵A的hinton图生物学意义建立集成独立分量选择系统,成功运用到基因表达谱分析,实验结果表明,集成分量分类系统优于单个分类器。
作者:吕靖 舒礼莲 期刊:《计算机与现代化》 2013年第09期
目前,针对不完整数据的集成分类算法没有考虑缺失属性之间的差异,在衡量各个子分类器的权值时仅仅考虑了数据集的大小以及包含属性的多少,并没有考虑各个数据子集之间属性的差异度.本文利用信息熵对各个子数据集的重要程度进行量化,进而评估从该数据集构建出的分类器的权值,使得在最终的加权投票过程更加公平,最终结果更加准确.使用基于multi-class AdaBoost的集成分类算法,以BP算法为基础分类器,对来自UCI的数据集进行实验,实验结...
现实生活中普遍存在冗余属性数据集,传统的支持向量机(SVM)集成分类方法需要耗费更多的时间进行运算,而且分类性能不够理想。针对传统支持向量机集成算法的不足,本文提出了一种基于主成分分析的SVM集成算法,该算法首先使用主成分分析进行主成分提取,去除冗余属性。然后在精简后的数据集上进行SVM集成学习。在部分UCI标准数据集上的实验说明本文算法可以有效地提高分类算法的性能。
作者:何凤英 钟尚平 徐巧芬 期刊:《福州大学学报·自然科学版》 2014年第05期
针对目前大部分BMP隐写分析方法主要采用单一特征和单一强分类器,容易产生训练样本敏感、分类精度难以提高等问题,提出一种基于特征融合和改进RSM集成分类的BMP图像隐写检测方法.方法首先串行融合Moulin和SPAM两种经典特征,然后利用序列前向选择(SFS)算法选取分类能力高的特征作为固定特征,其余特征在剩余特征空间中随机抽取,利用固定特征和随机抽取特征构造特征子集,最后在特征子集上训练成员分类器,并用多数投票法对它们进行组...