作者:刘科生; 王思洋 期刊:《北京航空航天大学学报》 2019年第10期
针对含有函数型和多元向量数据的回归模型中变量选择和参数估计问题进行研究,扩展了函数型数据分析和变量选择方法的应用范围。首先,函数型自变量基于函数型主成分基函数空间进行投影;然后,对投影后的函数型自变量(按组)及多元向量自变量采用惩罚变量选择方法,同时估计相应的系数。惩罚项调节参数采用自适应调节参数,损失函数采用中位绝对损失函数,以此为例,通过引入松弛变量将估计算法转化为求解线性规划问题,算法复杂度低。数值...
作者:田茂再; 梅波 期刊:《统计研究》 2019年第08期
本文考虑函数型数据的结构特征,针对两类函数型变量分位回归模型(函数型因变量对标量自变量和函数型因变量对函数型自变量),基于函数型倾斜分位曲线的定义构建新型函数型倾斜分位回归模型。对于第二类模型,本文分别考虑样条基函数对模型系数展开和函数型主成分基函数对函数型自变量展开,得到倾斜分位回归模型的基本形式。参数估计采用成分梯度Boosting算法最小化加权非对称损失函数,提高计算效率。在理论上证明了倾斜分位回归模型...
作者:梁银双; 刘黎明; 卢媛 期刊:《调研世界》 2017年第05期
近年来,京津冀地区的空气污染问题受到高度关注,为探讨该地区空气污染的特征,文章采用函数型数据的聚类分析方法对空气质量指数(AQI)进行研究。首先将空气质量指数变化曲线,通过函数型数据的主成分分析进行降维,其次将主成分基系数进行K-均值聚类,最后利用Arc GIS9.3将京津冀地区空气污染的聚类结果在地图上直观实现。结果表明,京津冀地区空气污染在空间上可划分为4类典型区域,呈现由北向南逐渐加重的趋势;在时间分布上有明显的...
提出基于函数序列的收入不平等动态测度思路与方法:采用B-样条拟合洛伦兹曲线序列;在生成函数型数据的基础上,对洛伦兹曲线序列进行函数型主成分分析。利用函数型数据建模,对1990-2010年中国城镇居民收入洛伦兹曲线序列变迁特征进行探索性数据分析,结果表明:采用人口五分法划分收入群体具有合理性;各收入群体对历年收入不平等程度变迁的贡献率分别为:低收入群体2.30%,中等收入群体80.33%,高收入群体17.36%。