基于2017年全国残疾人基本服务状况与需求信息动态更新调查数据,使用收入贫困测量方法对残疾人的贫困状态进行研究,并采用解释能力较强的Lasso-logistic模型分析了导致残疾人收入贫困的影响因素。研究发现,年龄、婚姻状况、户口类别、受教育程度、住房状况、残疾类型、残疾等级、就业情况以及是否参加各种保险和社区各类服务等因素对残疾人的贫困状况有显著的影响,且进一步发现婚姻状况、住房状况以及是否参加各类保险对残疾人的贫...
作者:秦业海; 李修华; 艾矫燕; 付旭生; 林春焕 期刊:《环境与发展》 2019年第04期
为探究水质分析与大数据技术结合的可行方案,以MySQL+Hive+SparkR为主体框架搭建一整套从数据输入、存储、调度到应用的SparkR水质分析平台。设置室内培养模拟人工湖藻类生长实验组及其重复实验组,监测各项指标数据,通过SparkR平台,在本地应用Adaptive-Lasso算法识别出对照组和苦草组藻类生长主要影响因子,并建立回归方程进行验证,在集群分布式部署GBTs藻类预测模型,经重复试验验证预测模型未来3天的相对误差均值分别为15.3%、14.8...
作者:李政; 朱明皓; 范颖岚 期刊:《南开经济研究》 2019年第06期
本文以2011—2017年我国上市金融机构为研究对象,使用LASSO分位数回归构建金融系统的极端风险网络,并在此基础上提出了传染性和脆弱性指数测度金融机构的传染性风险水平。同时,本文进一步采用改进后的CoVaR指标来度量单个机构的系统性风险贡献,并详细分析了风险传染如何影响不同时期下金融机构的系统性风险贡献。研究发现:(1)金融机构的脆弱性与传染性分别取决于其不同的特征变量,并且两者在数值上存在一定的错配。一方面,规模较...
作者:郑年年; 高爽; 栾小丽; 刘飞 期刊:《高校化学工程学报》 2019年第06期
原油中含有大量无机盐如NaCl,CaCl2,MgCl2等,在石油精炼过程中,这些氯化物的存在将导致设备腐蚀,管道堵塞和污染以及催化剂寿命降低等一系列问题。原油脱盐脱水是炼油过程的关键环节,运用有效监控技术保证其安全、稳定和高效运行十分重要。研究对原油二级脱盐脱水过程的运行状态进行监测,提出了一种基于过程模式-势函数判别法的故障检测技术。首先针对原油脱盐脱水过程数据存在变量冗余和多重共线性问题,提出Lasso-PCA算法构造其过...
作者:王小云 期刊:《贵州广播电视大学学报》 2011年第03期
调整成本作为优化社会实践和工业实践的重要手段,地位愈加重要,在实际生产中存在将其整合为统计过程调整方案的客观要求。本文基于LASSO框架推导出新的多元节约型统计调整算法适用于一般的多输入输出过程,可广泛推广应用到需要控制调整成本的生产服务过程中。
作者:魏倩; 张佳铭 期刊:《中南财经政法大学研究生学报》 2017年第05期
随着中国进入"新常态",经济增长速度呈现出阶段性企稳态势,经济运行存在着特有的复杂性和不确定性。文中使用1997年1月至2017年9月的月度宏观经济数据,识别这段时间的经济周期及其拐点,筛选先行指标,结合logistic-lasso模型对2017年第四季度经济形势作出预测。结果表明中国的经济周期长度趋于稳定,呈现较为明显的非对称性,其波动受国际经济影响较大;2017年第四季度中国经济将进入收缩期,2017年9月是经济进入收缩期的拐点。积极推...
作者:喻胜华; 万晨曦 期刊:《湘潭大学学报·哲学社会科学版》 2016年第05期
在理论分析的基础上,从生产效率、出口升级和获利能力等三个方面构建制造业竞争力的指标体系,并利用Lasso方法研究长江经济带目前的生产性服务业对制造业竞争力的影响。实证结果表明,长江经济带的生产性服务业对制造业竞争力具有一定的促进作用,但尚未成为制造业竞争力提升的首要因素,其作用存在着区域分化的特征。
降低高维数据的维度是多标记学习中一个重要且具有挑战性的工作,它可以提高数据处理速度,特征选择作为一种有效的降维技术,是找到一个保持最相关信息的特征子集。本文提出相似性矩阵及分解,结合Lasso进行特征选择的新方法,首先对高维数据进行形式化,构造相似性矩阵;然后分解相似性矩阵,利用Lasso进行特征选择;最后对比已有的特征选择算法,并进行参数优化分析,实验结果表明,提出的算法具有明显的优势。
作者:闫慈; 田翔华; 阿拉依·阿汗; 张伟文; 曹明芹 期刊:《公共卫生与预防医学》 2017年第06期
目的 针对体检数据的高维度、高冗余特点,对体检数据进行Lasso特征选择,为高维体检数据减少数据冗余提供方法学参考。方法 以代谢综合征为切入点,收集乌鲁木齐某体检中心2016年体检者信息共34 981例,每位体检者信息包含75个变量。Lasso算法用于筛选体检中与代谢综合征强相关的变量。以F值、几何均数、ROC曲线下面积作为评价指标,比较Lasso特征选择前后,决策树分类体检中的代谢综合征患者的性能。结果 Lasso特征选择后,体检变量降至...
作者:马云倩; 郭燕枝; 王秀丽; 孙君茂 期刊:《干旱区资源与环境》 2018年第07期
粮食产量预测一直是各国政府关注的热点,预测结果的权威性很大程度上取决于预测方法的科学性。文中将重点对中国粮食产量影响因素及其预测方法开展研究。首先对LASSO-GM(1,N)、GM(1,1)、GM(1,N)以及LASSO这四种模型的预测效果进行了比较分析,并选择采用LASSO-GM(1,N)组合模型对2020年中国粮食产量进行预测。运用LASSO模型筛选出对粮食产量产生显著影响的因素:有效灌溉面积、化肥施用量、农村用电量、农业机械总动力、粮食...
本文以贵州省1995-2017年的地方财政一般预算收入及其他相关经济指标数据为样本,通过Adaptive-Lasso变量选择法来分析影响贵州省地方财政收入的关键因素,再用灰色预测模型筛选出的各指标2018-2019年的值,最后建立BP神经网络模型预测2018-2019年贵州省地方财政一般预算收入,得到预测效果良好。
作者:房位昊; 刘强; 王肖南; 周莉; 高颖 期刊:《中华中医药》 2018年第08期
目的:初步优化中风病综合治疗方案。方法:基于LASSO算法,对2012年3月至2014年2月14个医院983例经过3个月中医综合方案治疗的中风病急性期患者的治疗措施进行数据挖掘、分析,评价中风病急性期综合治疗方案的疗效,初步筛选优化的中风病急性期的综合治疗措施。结果:中医辨证论治下的清热化痰法、滋补肝肾法,推拿治疗中的摇法治疗,西医治疗中的溶栓药物、降纤药物、扩容药物、神经保护剂以及现代康复治疗中的言语康复治疗可以...
作者:谢帅; 黄跃飞; 李铁键; 刘朝云; 王建华 期刊:《应用基础与工程科学学报》 2018年第04期
同样预报精度情况下,中长期径流预报提前期越长,对水库调度方案与发电计划的制定辅助决策作用效果更强.中长期径流预报的难点在于径流序列的随机性以及相应预见期的气象难以可靠预报.当前的预报模型大都是基于数据分析的数据驱动模型,其输入因子多为前期径流和大尺度气候因子.而预报因子的选择对于数据驱动模型的精度非常关键.因此,需要有效的因子筛选方法以辅助建模.本文引入lasso回归方法以筛选径流预报因子,其选择结果作为支持...
作者:李骅锦; 许强; 何雨森; 朱星 期刊:《岩石力学与工程学报》 2017年第A02期
滑坡位移预测的重点内容是提高预测精度及提取阈值,基于该认识及已有研究,建立ARMA-(LASSOELM)-Copula模型,并选取白水河滑坡这一典型"阶跃式"滑坡为研究案例。首先,运用ARMA模型中的ACF值分析月降雨量与月库水位变化的周期性,并通过PPMCC分析位移月增量与一个周期内诱因数据(月降雨量,月库水位变化)的滞后相关性;然后,建立以所有诱因正相关滞后项为预测模型的输入项,以位移月增量为目标的LASSO-ELM滑坡位移预测模型,将预测...
作者:孙金金; 黄文武; 李杨; 林芬芳; 王延新 期刊:《宁波工程学院学报》 2019年第01期
通过最小二乘估计、逐步回归、Lasso估计和EXP罚估计来实证分析浙江省经济增长的15个影响因素,结果发现EXP变量选取方法对经济领域的研究有积极作用,从而进一步认识各要素对浙江省经济增长的影响程度。
作者:郑列; 任秀伟; 罗幼喜 期刊:《湖北工业大学学报》 2018年第02期
高通量生物技术的应用产生了大量的高维小样本生物数据。在生物医学“大数据”领域中,特征选择算法是解决维数灾难的有效方法之一。基于此提出一种新的特征选择算法(记为Sub(filter)Lasso)。实验结果表明:对于现有特征选择算法,分类性能表现较差的两个生物数据集ALL2和CNS,新算法的分类性能显著提高;新算法选出了具有非常好分类性能的特征子集,在不同的分类器上取得了稳健的分类效果;对15个数据集进行比较实验的结果表明,Sub(filte...
作者:王威; 杨朋之 期刊:《上海市经济管理干部学院学报》 2019年第04期
一些上市公司财务报告舞弊现象层出不穷,严重侵害了投资者的利益。如何高效识别财务报告中的舞弊行为已成为目前研究的热点。文章在对已有的财务报告舞弊识别模型分析的基础上,提出了一种基于lasso-二元选择分位数回归的识别模型,并通过选取2010-2017年间240家上市公司年报数据作为样本,设计了16个财务指标进行了实证研究。结果证明,与传统的Logistic回归模型相比,lasso-二元选择分位数回归识别模型不但具备良好的变量选择能力,而...
作者:王威 期刊:《新疆财经大学学报》 2019年第03期
财务报告舞弊行为会对广大投资者的切身利益造成巨大损害,因而如何高效识别财务报告中的舞弊行为已成为目前学界研究的热点。本文在对已有财务报告舞弊识别模型进行分析的基础上,针对Logistic回归模型在财务报告舞弊识别中存在的变量多重共线性和计算复杂等问题,提出Adaptive Lasso-Logistic回归识别模型,并以2010年—2017年间我国320家上市公司的年度财务报表数据为样本,从盈利能力、营运能力、偿债能力等方面设计了18个财务比率...
作者:黄烈佳; 郭竞璟 期刊:《现代城市研究》 2019年第09期
以武汉市郊区居民为研究对象,基于248份调査问卷,构建了包含个体特征、心理因素、交通与环境和产权属性四类11个影响因素在内的Lars-Lasso模型,对居民郊区购房意愿的影响因素进行实证分析,研究得出:(1)住宅价格、升值潜力、住房满意度、养老意愿、交通状况、自然环境和住房产权是影响居民郊区购房意愿的七大因素;(2)在七大因素中,自然环境对居民郊区购房意愿的影响最大,其次是养老意愿、住房满意度、住宅价格、升值潜力、交通状况,...
作者:王国长; 梁焙婷; 王金枝 期刊:《数理统计与管理》 2019年第04期
在金融领域,自适应Lasso被广泛的用于股票价格预测模型中的变量选择和参数估计。然而,自适应Lasso是针对非时间序列模型提出的,忽略了时间序列模型特定的结构,比如时间序列模型中通常会出现滞后阶数越靠后,对未来的预测能力越弱的特性,从而,容易造成估计及预测不精确。因此,时间序列模型的变量选择惩罚参数的设计应与滞后阶数相关,即对越靠后的滞后阶数应加上越大的惩罚。为了充分考虑时间序列模型的特性且保留自适应Lasso的优点,...