作者:陈洁; 廖金盆; 陈义安 期刊:《中国统计》 2020年第01期
样本中的数据缺失势必会造成估计量精度的损失。为了尽可能减小损失,需要对缺失数据进行必要的弥补性处理。质量评估调查中出现的缺失数据有三种情况:住房单元未调查;个人的一部分人口统计特征遗漏;个人的匹配状态或住处状态悬而未决。对于上面说的数据缺失三种情况中的第三种情况,即由于悬而未决导致的数据缺失,在普查登记调查中也会存在,也要对其进行处理。因此,应用人口普查数据缺失插补方法技术,能解决上述问题。
作者:李开灿; 张文强 期刊:《湖北师范大学学报·哲学社会科学版》 2017年第03期
依照随机变量变换可以重新参数化的思想,得到了一种加权指数分布总体在具有缺失数据情况下参数的极大似然估计,利用中心极限定理和相关的极限理论,证明了这种估计量的强相合性和渐近正态性。
作者:衡明莉; 陈丽嫦; 王骏 期刊:《中国临床药理学》 2019年第22期
临床试验中会因各种原因导致数据缺失。数据缺失会引入潜在偏倚,不恰当的缺失数据处理方法将引入更多的偏倚。本文就当前常见的缺失数据处理方法进行介绍,以期为相关人员在处理缺失数据时提供参考。
作者:李建波; 孙晶 期刊:《应用概率统计》 2019年第05期
本文主要研究基于响应变量随机缺失的单指标模型的逆概率加权估计问题.首先通过B样条逼近未知单指标函数,然后构建逆概率加权最小二乘损失函数,接着通过两阶段牛顿迭代算法获得指标函数和指标系数的估计,最后通过大量模拟例子和实例分析说明了我们所提估计方法的有效性和合理性.
作者:石福艳; 马洁; 黄璐; 许小珊; 孙娜; 孟维静; 王素珍; 杨丽平 期刊:《中国公共卫生》 2019年第11期
作者:江琦; 关勇; 刘建宏; 田扬超 期刊:《新技术新工艺》 2019年第10期
近年来,相干衍射成像在材料学、生物学以及物理学上获得了广泛的应用,研究热度不断上涨。同时也出现了种类繁多的相干衍射重构算法,但是没有统一的标准来评判各种算法的性能以及适用范围,阻碍了很多算法的应用。提出了一整套相干衍射重构算法的模拟论证方法,研究了如何在频域添加泊松噪声,如何定义泊松噪声强度等技术细节,模拟了真实的实验过程,可以多个维度评判相干衍射重构算法的性能,从而得出不同相干衍射重构算法的适用范围,使...
本文提出影响会员卡接受度的主要因素包括:顾客满意度、会员卡功能以及转换成本。针对烟台市超市消费者对会员卡接受度调查,最终得出顾客满意度和会员卡功能对超市会员卡接受度的影响是正向的;而转换成本对超市会员卡接受度没有影响。
作者:Jonathan; A; C; Sterne; Ian; R; White; John; B; Carlin; Michael; Spratt; Patrick; Royston; Michael; G; Kenward; Angela; M; Wood; James; R; Carpenter; 张清(译); 张孔来(校) 期刊:《英国医学》 2009年第06期
许多研究都存在缺失数据。Jonathan Sterne及其同事对合理应用与报告多重填补方法处理这一问题给予了描述
近日,为进一步做好中国商品信息服务平台缺失数据采集录入工作,武汉分中心组织了80余家存在缺失数据的企业,进行了免费的专项业务培训。
作者:周清; 王奉伟 期刊:《测绘工程》 2016年第12期
在测量工作中,由于气候环境、观测方法、观测仪器以及观测人员自身因素等多方面的原因,可能造成观测数据的丢失或者不完全。文中针对这类数据的处理,采用加权平均法和三次样条插值法对缺失数据进行修复,建立GM(1,1)模型,并与非等间隔预测模型进行对比。通过两组仿真数据和两组实测数据验证发现:对于呈指数增长的序列和高增长序列修复之后建模预测精度更高;三次样条插值法数据修复后GM(1,1)建模预测精度较加权平均法预测精度更高;对...
作者:刘菲; 李明阳; 刘雅楠; 江一帆; 王子 期刊:《林业资源管理》 2018年第06期
在森林资源抽样调查中数据缺失现象时常发生,为了提高数据分析的准确性,有必要对缺失数据填充方法进行研究。以浙江省临安市1996年Landsat-5TM影像及同期县级森林资源连续监测固定样地数据为主要信息源,以样地内林木平均胸径为缺失因子,在对其空间自相关分析的基础上,采用十折交叉验证法对缺失数据进行空间、非空间和基于遥感估测模型填充以及精度评价。结果表明:1)研究区样地林木平均胸径的Moran’s I系数为0.21,空间分布表现出较...
作者:冯凤飞; 龙兵 期刊:《岭南师范学院学报》 2016年第03期
在数据缺失样本下研究了艾拉姆咖分布的参数估计和假设检验.根据似然函数给出了参数的极大似然估计,证明了估计量的相合性和渐近正态性,并给出了两总体参数之差的置信区间和假设检验.
作者:刘力军 期刊:《大连民族大学学报》 2012年第05期
针对线性回归模型,提出了一个新的期望递归最小二乘算法(Expectation Recursive Least Square,ERLS)。在响应变量数据存在部分缺失的条件下,ERLS取响应变量的期望值代替缺失值,基于该期望值与自变量数据,实现自适应的递归估计回归系数,避免了高维数据相关矩阵的求逆困难。ERLS算法充分利用了全部有效数据,实现了在线回归估计。数值实验结果表明,在观测数据存在野值时,通过引入非线性抑制函数,ERLS算法优于LS方法。
ITS系统处理交通状态信息数据质量好坏是后续交通诱导和运营应用的关键,所以数据质量的保障是ITS的重要组成部分。对于ITS处理的交通状态信息(路段速度及流量),由于各种原因会造成数据的不完整和缺失,这种情况下会直接影响交通管理和科研研究效果。本文针对缺失数据给出了修复的策略以及修复数据来源;然后根据不同条件使用适应的修复模型;最后对方法进行了实际数据验证。该方法对于定点检测器和移动检测器处理的交通状态缺失数据...
作者:彭兴慧; 李长征; 雷勇 期刊:《机械设计与制造》 2005年第03期
如何正确的对缺失数据进行填充是数据挖掘预处理过程中的一个重要问题.这里给出了一种基于决策树来解决此问题的算法.该算法应用改进的 ID3算法来构造决策树 ,利用决策规则对缺失值进行补充.在构造决策树之前,采用属性约简技术得出条件属性集,使得决策树简单,并且计算速度得到提高.此算法应用在某型发动机试车数据库中,被证明是可行的、高效的.
作者:邓方进; 王绪本; 李德伟 期刊:《物探化探计算技术》 2017年第05期
为了解决LMT时间序列出现的缺失和强干扰现象,根据实测资料数据量大、非线性、非平稳性等特点,首次采用ARIMA模型进行预测和填补,基于平稳性检验和贝叶斯信息准则确定模型阶数,采用最小二乘原理确定模型参数,建立双向预测模型和线性合并方法进行预测,并对比ARIMA模型和AR模型预测数据的准确度。实例表明,ARIMA模型预测结果准确,精度比AR模型高,且误差不会累积,解决了原始资料的不连续性和强干扰的问题。
作者:雷龙云; 甘怡群 期刊:《中国心理卫生》 2004年第10期
Ward等将跨文化适应区分为社会文化适应和心理适应两个方面,并通过测量社会文化困难和抑郁水平来分别评价这两个方面的适应状况[1-3].本研究根据Ward 等的理论,对来自6个大洲47个国家的96名在华留学生的跨文化适应状况进行了调查.男生59人,女生36人,缺失数据1人;平均年龄25±6岁;平均在华已居住时间18±19个月).
作者:张亚; 安佰玲 期刊:《宿州学院学报》 2018年第05期
为了研究当前概率密度函数统计应用中存在的问题,首先详细阐述两种概率密度函数估计方法基本理论,然后将两种估计方法应用于缺失数据情形下求取平均区间长度(AL)和覆盖概率(CP)。通过分析得到:(1)对于AL,采用非参数回归填补法得到的置信区间长度值更大一些;(2)当样本容量逐渐增加时,CP逐渐增加,最终达到0.95,在此期间,区间长度值有所减小;(3)接近名义覆盖水平的覆盖率获取方法为逆概率权填补法。结果表明:使用非参数回...
作者:李苗; 魏立力 期刊:《宁夏师范学院学报》 2018年第04期
研究了一类多重泊松模型参数估计的EM算法.首先针对完全数据情形推导出MLE的解析表达式;然后对缺失数据情形设计参数估计的EM算法;最后通过一个算例说明了本文方法的可行性.结果表明EM算法适用于缺失数据情形的参数估计,有较好的估计结果.
作者:查木哈; 卢志宏; 翟继武; 张福顺 期刊:《水资源与水工程学报》 2018年第02期
为了快速准确预测老哈河水质,采用老哈河2011-2015年水质监测数据,运用拉格朗日插值法补充缺失值,分别对化学需氧量、生化需氧量、高锰酸盐指数和总磷浓度建立Levenberg-Marquardt优化的双隐含层BP神经网络模型,利用2011-2014的数据建立训练网络,以2015年的数据进行验证与测试。结果表明:五日生化需氧量预测模型,第一隐含层节点数为4,第二隐含层节点数为12时,决定系数0.751 6(P=0.000 3),平均相对误差25.73%;化学需氧量预测模型...