作者:支晓斌; 牛传林; 李亚兰 期刊:《西安邮电大学学报》 2019年第05期
针对两阶段判别嵌入式聚类算法无法有效地反映数据的真实结构问题,提出一种两阶段判别嵌入模糊聚类算法。首先利用模糊C-均值算法对数据进行初始聚类,得到数据的初始隶属度矩阵,然后通过奇异值分解和求解最大散度差对数据降维处理,最后在低维子空间中对降维后的数据再次进行模糊C-均值聚类。通过对初始数据和降维后的数据进行模糊聚类提高算法的准确度。对比实验结果表明,该算法可获取最优聚类精度,并能更有效地反映数据的真实结构...
作者:李江鹏 期刊:《广西科技师范学院学报》 2015年第06期
一个企业经营状况的好坏,会在其财务数据的各项指标中体现出来;财务数据越良好,证明该公司的综合实力越强.在量化投资中,企业的财务数据则成为量化研究的重点.现阶段人们对企业财务数据的研究多局限于单一、少量的指标进行分析,出发点不尽相同.在大数据时代,基于财务数据指标数量较多的特点,利用软件对其进行提取和转化,通过数据挖掘技术进行统计和分析,发现其中一些观点适用于在变量较多的情况下使用,并对数据挖掘和量化投资中数...
作者:蒋兴鹏; 胡小华 期刊:《数学建模及其应用》 2013年第01期
微生物以极大的数量统治了全球海洋,但是对其群体动力学、代谢复杂性以及协同作用等仍知之甚少。近年来,大规模测序技术的应用,尤其是宏基因组测序和16S rRNA测序已经逐渐成为研究海洋微生物生态系统的主要工具。这种不培养单个物种,而是直接通过测序提取所有微生物个体的遗传信息去研究微生物生态系统的成分和功能的方法,极大地促进了人们对海洋微生物世界的认识。本文简要介绍海洋生态系统学中的基本问题和最新计算分析方法。
作者:邹仕富; 李嘉周; 毛启均; 宋明军 期刊:《实验室研究与探索》 2019年第11期
提出一种基于数据降维和特征分析的GOA-LSSVM负荷预测方法.运用主成分分析对负荷的影响因素进行数据降维和特征表示,确定影响负荷的主要影响因素;针对LSSVM预测结果易受参数组合C和g影响,运用蝗虫优化算法对LSSVM模型参数进行自适应选择.研究结果表明,与GOA-LSSVM和LSSVM相比,本文算法可以有效提高负荷预测精度,通过数据降维和特征表示可以消除数据冗余和影响因素之间的相关性,不但简化了负荷预测模型的复杂程度,而且提高了预测模...
作者:王继博; 杨蕾 期刊:《交通建设与管理》 2019年第05期
不良驾驶行为是导致交通事故发生的重要因素,一些特定的交通违法行为(如超速)已被证明与交通事故风险直接相关。为综合分析交通违法行为与交通事故之间的关系,结合江苏某市历年交通事故与交通违法行为,利用局部线性嵌入算法,识别出交通事故类型和违法行为之间的非线性关系,并通过数据降维的方式提取非线性数据特征。并通过聚类分析挖掘交通违法类型和交通事故类型之间的对应关系,从而筛选出与交通事故高度相关的交通事故违法行为。...
作者:池亚平; 凌志婷; 王志强; 杨建喜 期刊:《计算机工程》 2019年第10期
入侵检测系统在大数据量的情况下误报率高、泛化能力弱,且单一机器学习算法不能较好地应对多种攻击类型。为此,设计一个基于支持向量机(SVM)与Adaboost算法的入侵检测系统。依托Snort系统,利用主成分分析方法对提取的特征做降维处理,并将SVM-Adaboost集合算法作为检测引擎。采用NSL-KDD数据集进行训练和测试,实验结果表明,该系统的正确率达到97.3%,较SVM算法和Adaboost算法分别提高4.8%和14.3%。
作者:余先川; 任雅丽 期刊:《地质学刊》 2014年第02期
非负矩阵分解(NMF)是重要的矩阵分解算法与数据降维工具。介绍了NMF的背景、定义、原理及特征。在已有NMF算法分类的基础上,总结当前流行的NMF算法及研究进展,综述NMF在地学领域中的应用,主要包括高光谱图像的处理与矿产资源预测。对NMF算法的研究方向进行了预测和展望。
降低高维数据的维度是多标记学习中一个重要且具有挑战性的工作,它可以提高数据处理速度,特征选择作为一种有效的降维技术,是找到一个保持最相关信息的特征子集。本文提出相似性矩阵及分解,结合Lasso进行特征选择的新方法,首先对高维数据进行形式化,构造相似性矩阵;然后分解相似性矩阵,利用Lasso进行特征选择;最后对比已有的特征选择算法,并进行参数优化分析,实验结果表明,提出的算法具有明显的优势。
海量数据的涌现与数据维度的提升,让数据的噪声与冗余特征带来的负面影响呈现出了严重化的趋势。在降低数据维度的基础上,提升数据的分类精度是机器学习领域需面对的重要问题。本文主要从数据降维方法与机器学习分类方法的内容入手,对基于数据降维的机器学习分类应用问题进行分析。
作者:饶伟; 李勇; 颜骥 期刊:《控制与信息技术》 2018年第01期
支持向量机(SVM)作为一种机器学习算法,具有良好的非线性处理能力、理论全局最优及克服维数灾难等优点。文章采用高斯核函数(RBF)支持向量机回归模型(SVR),归一化和降维进行数据处理,交叉验证进行参数寻优,获得最佳预测模型,并对该预测模型进行测试。应用该预测模型分析工艺参数对高功率器件合格率的影响,结果表明其对合格率的预测精度较高,对功率器件质量的提升具有重要的指导意义。
作者:戴云翔; 路东东 期刊:《电子技术与软件工程》 2019年第17期
本文对数据降维方法进行了概述,简要分析了现有数据降维方法,并指出数据降维方面的关键问题。同时对线性降维方法主成分分析分析方法、稀疏主成分分析方法及非线性降维方法等距特征映射方法、局部线性嵌入方法的具体步骤进行了详细阐述。
作者:王凯; 刘玉文 期刊:《唐山师范学院学报》 2017年第05期
重点阐述了大数据环境下的数据简化理论与技术,包括数据简化方法与模型。针对现有大数据系统的数据简化架构,探讨大数据系统数据简化研究方向。
作者:华满; 邵雄凯; 高榕 期刊:《湖北工业大学学报》 2019年第05期
为达到精准推荐,给用户提供个性化服务的目的,通过以Spark为核心的大数据技术,对电信运营商的数据进行挖掘、分析、聚类、建模,从而发现不同用户的个性化需求。实验结果表明,此方法能够较好地对不同用户的行为进行画像,同时经过优化后的PK-means聚类方法准确率有明显提高,与传统的数据处理模式相比,运算速度得到极大提升。
作者:杨晶; 程力 期刊:《舰船科学技术》 2019年第04期
为了有效提高船舶电机伺服系统离散变控制精确度,对传统控制方法的控制函数进行优化,提出新型电机伺服系统离散变结构控制方法。确定伺服系统的切换函数并修正传统控制函数的幂次趋近率,添加扰动估计量值,对系统控制不确定项进行补偿,获取最终控制函数,对控制数据降维,完成控制函数的收敛校对,添加周期量,保证系统可以完成定位控制,实现船舶电机伺服系统离散变结构的整体高精度控制。实验数据表明,与传统控制方法相比,设计的控制方...
作者:王得旺; 郭金良 期刊:《现代防御技术》 2017年第01期
针对多径效应或智能干扰下信号高度相关,基于单基地MIMO雷达信号模型,提出一种相干源波达方向(DOA)估计方法。该文首先利用降维变换将匹配滤波后数据结构变化成低维信号空间,然后结合共轭ESPRIT(C-SPRIT)思想,通过构造数据矩阵,使得相干源之间完全解相关,获得旋转不变因子,最后利用总体最小二乘ESPRIT方法进行角度估计。仿真结果表明,该方法能够有效解算相干源DOA,在N个物理阵元下MIMO雷达比相控阵雷达能够获得更高的...
作者:童基均; 刘宇; 常晓龙; 张瑾 期刊:《浙江理工大学学报·自然科学版》 2019年第02期
为自动、准确地对模特走秀动作进行评价,提出了一种基于多项式拟合的动作分类方法。该方法首先利用基于局部亲和域的方法进行人体关节点检测,同时为消除相机视角和个体体型差异性,将检测到的关节点通过普氏分析进行数据校准;其次将人体关节点分为脊柱、上肢和下肢三部分,分别从水平和垂直方向进行多项式拟合;再次对得到的多项式系数进行数据降维;最后将降维后的多项式系数作为动作评价的特征,利用SVM分类器实现模特走秀动作分类。...
作者:单中南; 翁小清; 武天鸿 期刊:《智能计算机与应用》 2019年第01期
在时间序列研究领域,半监督分类技术越来越受到广泛关注,绝大多数现有研究都是对原始时间序列直接进行半监督分类,一般情况下,时间序列的维数(长度)比较高,在半监督分类方法中选择合适的降维技术非常重要。本文提出了一种基于局部保持投影的时间序列半监督分类方法。该方法首先使用局部保持投影对时间序列样本进行维数约减,然后对降维后的数据进行半监督分类。在15个时间序列数据集的实验结果表明,该方法的分类性能显著地好于已有...
作者:毛向德; 梁金平 期刊:《计算技术与自动化》 2018年第03期
通过对电力机车控制系统中控制电源的电路结构特点分析,进行故障特征值提取,对所造成的高维数据无法进行模式识别这一特点。通过对传统的流形学习算法中LE理论进行改进,提出了基于马氏距离的LE算法理论。对LE算法中的邻域选择问题选行了深入的研究,使K具有自适应性,而且利用关联维数理论克服了非线性电路的故障特征提取中所造成的维数灾难,对其高维数据进行本征维数的估计,去除了不相关的信息维数,解决了流形学习理论中d的...
作者:李宜清; 程武山 期刊:《计算机测量与控制》 2019年第03期
支持向量机(Support Vector Machine,SVM)作为一种经典的非线性分类器,用于模式识别,可以将训练样本从不可线性分类的低维空间映射到可线性分类的高维空间,再做分类,文章主要训练支持向量机使它学会区分人脸和非人脸;支持向量机的数学推导完备,算法逻辑严密,整体上比Adaboost算法复杂,但在样本量较少的情况下效果良好,因此有样本优势;支撑它的理论包含泛化性理论、最优化理论和核函数等,这些理论也被学术界广泛用于其他机器学习算...
作者:刘丽娜; 马世伟; 芮玲 期刊:《计算机应用研究》 2018年第06期
针对采用主观分析法对基于流形学习的非线性降维效果进行评价存在主观性强,缺乏必要的量化计算进行指导问题,提出利用可信赖性和连续性两个指标对流形降维效果进行量化评价。其中,可信赖性用于衡量流形降维可视化效果图的可信度,连续性则旨在分析原邻域的保持性。对常用的基于流形学习的非线性降维方法进行分类和对比研究,并在经典数据集Swissroll、Swisshole、Twopeaks、Helix和Puncturedsphere上利用可信赖性和连续性指标进行实...