首页 优秀范文 数理统计论文

数理统计论文赏析八篇

时间:2023-03-01 16:25:11

数理统计论文

数理统计论文第1篇

传统的考核方式以“平时成绩+期末成绩”模式为主,其中,平时成绩主要依据学生出勤情况和作业给分,期末考试则主要以闭卷书面形式考查。这种考核方式对于《医药数理统计》这门课程容易出现“重理论,轻应用”、“重期末,轻平时”、“重记忆,轻理解”的现象。使得学生为应付考试,期末临阵磨枪,把精力花在概念、公式的死记硬背上,虽有可能在考试中获得高分,但在学完之后,学生依然是从“理论到理论”,不知在实际中如何应用,而学生的自主学习能力、实践能力以及通过探究性、研究性学习所得到的收获和在本课程学习过程中获得的情感体验、直接经验,特别是创新精神是无法通过一张期末试卷来体现的。使得考试与社会需要的人才模式相脱离,与过程学习相脱离,无益于学生创新素质的提高和中医药类创新人才的培养。

2推行“过程式”考核方式研究

讲课中引入”探究式”教学法,从以教师为主转变成转换到以学生为主,教师设置的探究的问题可以是从学科领域或现实生活中选择和确定研究统计案例,以小组为单位,在教学中创设一种类似于学术研究的情境,通过学生自主、独立地发现问题、实验、操作、调查、信息收集与处理、表达与交流等探索活动,有助于真正让学生获得知识、技能、情感与态度的发展,特别是探索精神和创新能力的发展。而为更好的提高教学效果,应在“探究”的过程中进行“过程式”考核方式,通过教学过程中的一系列考核方式的改革,一方面可以激发学生对《医药数理统计》这门课程学习的兴趣和热情,培养学生学习的独立性与主动性;另一方面又能培养学生对知识的融会贯通和灵活应用能力,这是培养学生创新素质的有效途径。首先,因为考核的主要依据是应使学生基础知识和基本技能不断充实,自主学习内容和运用知识能力逐步增强,更加注重学生学习效果的评价。因此在授课过程中应重点考核学生的学习态度、学风与学习的主动性、创新性,增加统计软件、实际调查和文献纠错等内容考核,加强统计理论和实践的联系,重视考查学生分析问题、解决问题的能力,提高学生综合创新素质。其次,“过程式”考核的形式应该更加多样,在探究式教学的过程中应注意对各知识点的考核,在考核过程中,根据专业和学生层次的不同,灵活采用笔试、口试、答辩式、专题报告式、论文式、实践技能操作等多种考核方式。最后除传统考核手段之外,建立统计辅助教学与考核平台,将过去仅能通过一张试卷考计算,理论推导的考核方式,改变为通过统计辅助教学与考核平台进行计算机考核的方式,提高学生动手能力,进行数据分析解决实际问题的能力,提高学生综合创新素质。

3小结

数理统计论文第2篇

【关键词】医药数理统计;药学;教学体会;试验设计

医药数理统计方法是药学专业的基础课,是数学基础课中应用性最强的课程,是药理学、毒理学、药物动力学等课程的前期基础课程,同时也是药学科研的必备知识之一。通过该课程的教学,培养学生科学思维与推断能力,使其掌握药学统计方法的基本理论、基本方法与技能,具备较高的药学科研设计、统计思维,为阅读专业文献,进行科研工作打下良好的统计学基础。笔者任教的药学专业使用的教材是《医药数理统计方法》[1],教学时间为36学时。要使学生以较短的学时掌握实用的统计方法,并能在以后的专业学习和研究中正确应用,笔者尤感适宜的教学方法对于讲好这门专业基础课的重要性。下面就如何学习《医药数理统计方法》来浅谈一下我的一些体会。

1教学内容应结合专业实际

1.1概率论部分

教材中概率论偏重于理论基础,理论性较强。但概率论部分作为数理统计入门阶段,更应注重基本概念的理解,便于后期的教学。因此在教学中应适当减弱概率论部分的理论性和难度,多结合专业知识和用简洁易懂的阐释来介绍概率论部分的内容。

1.2数理统计部分

数理统计偏重于应用,在教学内容方面要做到突出实用性。注重假设检验部分的讲解,注意阐述数理统计方法的思想、应用的背景及应用中所需的条件,重点讲解假设检验应该如何选取原假设和备择假设,如何对得出的结论进行合理的解释[2];在区间估计中置信区间的讲解中结合在生产中片重差异或含量质量时正常值的范围,以确定药品是否合格等;在方差分析部分结合药理学中如何进行药效学实验分组结果的分析与多重比较的应用等;在一元线性回归部分结合药品质量分析时如何建立标准工作曲线的应用等。

1.3定理公式部分

教材中定理、公式、法则比较抽象,较难理解。在定理、公式、法则的教学中更应结合专业知识,加深理解与应用。一般不要求对公式等进行推导,也不要求记忆。课后做适量的作业加深定理公式的应用与理解。但样本的均值、方差、变异系数的公式要求掌握,这些不仅是后续课程的基础,更在药品质量分析中如重现性、回收率等实验中有着广泛应用。

2以试验设计为导向讲述统计应用

在药学专业中,特别是制剂工艺研究中,有多种比较性试验设计方法,每种方法有其特点和适用范围,较常用的有两组比较试验设计、多组比较试验设计、析因设计、正交设计和均匀设计等[3]。在讲完教材内容后,再以试验设计为导向梳理阐释t检验、方差分析、回归分析等知识的具体应用。

两组比较试验设计用于不同处理间指标差异的比较,常采用t检验分析方法,分为配对比较和两组比较。配对比较常用于用药前后观察指标的变异情况等,两组比较一般用于两种技术或工艺对指标差异的比较。多组比较试验设计用于多组试验处理结果的比较,常采用方差分析与多重比较,如研究不同浓度乙醇提取某中药有效成分的影响等。正交试验设计与均匀试验设计均是适合多因素多水平的试验设计,在制药工艺研究中应用更为广泛,前者是基于方差分析模型,后者是基于回归分析模型。这两部分教学中结合自己在工作中的应用重点讲述如何选因素水平,如何利用相应的表来安排试验,对试验结果的分析处理及相关软件如正交设计助手的应用等。

3重视现代方法在教学中的应用

教学中,应对部分内容尝试引入计算机辅助教学。利用现代化学习工具学习当今社会发展所需要的知识是时代的要求,本课程是以应用为主要目的,教学重点讲解数理统计的概念、思考方法、形成及应用背景等,引导学生用数理统计学的知识去思维,理解数理统计,而不是大量的计算。因此,结合实际,利用计算机讲述Excel在统计学中的应用、SPSS统计软件的使用等。

4不断提高自身素质

作为应用性很强的课程,在教学过程中,要不断进行高等数学、数理统计、教学方法等方面的研究,夯实基础,不断提高教学质量。更要通晓在药学科研工作中数理统计应用方面的知识,结合教材便于更好地组织教学,使学生学到统计知识并能在专业领域正确应用。因此,教师须不断研究、探讨教育思想、教学观念和教学方法,不断提高自己的教学能力,才能培养出合格的应用型药学人才。

【参考文献】

1祝国强.医药数理统计方法.高等教育出版社,2004.

数理统计论文第3篇

质量数据管理系统是卷烟企业制丝线生产管理系统的重要组成部分之一,其主要指设计过程质量规范、检测、监控与改进过程质量指标,达到保证产品或服务质量目的的管理系统。从质量管理的最新发展理论可以看:BPR(过程管理)技术、六西格玛质量管理、ISO标准及PLM等都是以关注过程质量为核心。这些质量管理相关理论从本质上来看,可以将过程质量管理的内容划分为规划过程质量、设计过程质量、制造过程质量、使用过程质量、报废处理过程质量和服务过程质量等产品生命周期各个阶段的管理。图1为制丝线质量管理系统的功能边界示意图。

2过程质量模型

过程质量模型是以关键工艺设备为核心来建立的。系统首先对设备的工艺任务进行描述,根据工艺任务完成的内容,对需要考核的质量指标、工艺标准进行建模,将质量指标、工艺标准转化为具体的工艺参数设定值和设定范围;然后,系统将针对具体的工艺参数要求对各个控制环节需要的控制器件、检测器件进行分类和建模,完成质量标准、工艺标准工艺参数控制器件的统一建模过程;最后系统针对质量问题的描述进行建模,将质量问题描述转化为具体的数值信息,便于分析和考核生产过程的质量状况。

3过程数据模型

根据制丝线生产组织方式特性、制丝工艺流程形式和制丝线过程质量管理的业务需求建立了面向制丝线过程质量管理的过程数据模型,其模型结构如图2所示。

4过程质量分析评价方法统计

过程控制(SPC)提供了一系列的统计分析方法和相应的分析控制图用于对加工过程中的各个工序进行监控,从而达到改进与保证产品质量的目的。在制丝过程质量管理系统中我们将以SPC的统计分析方法为基础,结合前述的过程数据模型的特性建立面向制丝线的过程质量分析评价方法。基本的分析评价方法如图3所示。

5关键设备工艺数据分析

5.1CPK实时计算

过程能力指数(ComplexProcessCapabilityIndex,CPK)反映设备生产能力强弱,是衡量过程加工内帐一致性的、最稳态下的最小波动。对于生产过程,产品质量总是分散存在。若CPK过高,则产品质量特性值的分散就会越小;反之,产品质量特性值的分散就会越大。CPK实时计算主要分下面几个步骤实现:①计算出该工艺数据的标准方差。标准方差的计算公式如式(1)所示。STDDEV=(PVi-PV)2姨n(1)其中,PVi为第i个采样周期的采样值;PV为所有采样值的平均值;n为采样次数。对上式进行化简有:STDDEV=∑PV2-(∑PV)2/nn-1姨(2)其中,PV为当前采样周期的采样值。在PLC中实时计算式(2)时,存在一个“大数吃小数”的问题:因为在PLC中,32浮点数的有效位数只有7位,在计算标准方差时,∑PV2和(∑PV)2是一个很大值且大小相当值,导致两者之差的结果会产生误差,从而最终导致CPK的计算结果产生误差。为解决上述问题,克服PLC浮点数计算精度导致的计算误差,对式(2)的标准方差计算公式进行如下改进:STDDEV=∑(PV-SP)2-(∑(PV-SP))2/nn-1姨(3)②计算制程准确度K值。K=SP-(∑PV)/nSP*Scale(4)其中,SP为工艺参数设定值;Scale为设定的波动标准。③计算制程精密度CP值。CP=SP*Scale3*STDDEV(5)④计算过程能力指数CPK值。CPK=(1-K)*CP(6)PLC通过式(3)至(6)在设备控制层对重要工艺参数的CPK值进行实时计算,然后将计算的CPK值通过监控网络实时传输到IO数据采集服务器,最终在WINCC监控系统和质量数据管理系统中实时更新显示。

5.2叶片水分、温度控制

构建润叶机质量数据管理模型,首先根据工艺任务和工艺标准确定润叶机的工艺质量指标,包括出口水分和出口温度。当系统正常工作时,确保系统条件满足要求,也就是水压、气压、汽压等需按照设备正常工作条件进行设定,按照批次组织生产。将润叶机整个工序中的关键数据实时记录,主要是电子秤流量、润叶机出入口水分、润叶机出口水分。当润叶机出口水分达不到工艺标准要求时,可分析是否生产控制参数设定错误,加水管路工作是否正常,电子秤、流量计、水分仪精度是否满足精度要求。当润叶机出口温度达不到工艺标准要求时,可分析温度检测仪是否精度不够、蒸汽控制阀是否平稳、系统工作压力是否正常等。通过润叶机水分、温度的控制可以看出,质量分析不仅是对某批次简单的质量评定,同时通过质量分析,可以对在线设备的各方面性能提出明确的改进方向。

6小结

数理统计论文第4篇

按照应用性为主的教学目的要求,在概率论与数理统计教学过程中,应该以培养学生应用概率论与数理统计方法解决实际问题的能力为出发点,使学生掌握概率论的基本知识和理解统计方法的基本思想,并将理论的学习转化成一定的统计应用能力。随着目前统计工作所面临的数据日益庞大,传统教学中的计算公式已经很难使用手工计算的方式进行求解,因此借助于计算机及统计软件完成统计计算,分析统计结果、做出统计推断便成为统计教学中不可忽视的一个手段。使用软件辅助概率论与数理统计的教学能使课程中的数据处理和数值计算更简易、更精确。伴随着计算机技术及数学软件的发展,使得诸多的统计分析借助数学软件得以实现,如参数估计、假设检验、方差分析和回归分析等计算问题,也无需担心大量的统计数据带来的计算量等问题。同时,在高等教育统计教学中应用统计软件,有利于培养学生学习统计、计算机及软件等专业课的兴趣,提高学生的计算能力和利用专业知识解决实际问题的能力,科学整合统计教学内容,促进统计教学面向社会需要,提升学生的实践能力。在教学中进行软件的训练也能为学生将来的工作打下初步的基础,为了更好进行概率论与数理统计的教学和实践,近年来新编教材也增加了数学软件的内容,在概率论与数理统计课程教学中使用数学软件已成为改革发展的趋势。在课堂教学中,为了让学生加深对理论的理解,实践环节的设置变得非常关键,概率论与数理统计课程中加入数学实验能很好的填补学生在理论和实践之间的空白。数学实验的开展可以在数学教育中体现学生的主体意识,让学生做到边学边用,提高学生学习的趣味性、体现数学教育的时代性。因此,将数学实验融入概率论与数理统计教学,是概率论与数理统计教学改革中非常值得探讨和研究的课题。根据概率论与数理统计课程的特点,数学实验的内容设计可以和案例教学方法进行有机结合。案例式教学能解决概率知识综合运用的问题,能丰富课程内容、加深学生对知识的理解。教学案例能将所学知识有机联系起来,使课程的各部分不再是孤立的,通过对案例设置问题的求解,便能使学生完成由学概率论与数理统计理论到用概率论与数理统计解决问题的转变。在解决实际问题的过程中辅以软件进行数值计算试验,能最大限度发挥软件的优势,使学生学以致用,将理论学习与实际应用有机结合起来。在传统概率论与数理统计教学过程中,概率论与数理统计课程计算量大一直是困扰课堂教学的难点问题,如二项分布,若试验次数较多,其中的具体概率计算将变得十分复杂。复杂的计算往往使得教师的教学重点发生偏移,侧重课后习题计算的处理,使得课程的设计重点偏向排列组合公式的计算。另外在教学过程中,前后知识的联系对初学者也是一个障碍,比如条件概率等基本公式在讨论多元随机变量时还会用到,但在教学实践中我们会发现,由于缺少互相联系的教学实例,学生一般都是将这两部分分开来学习,不习惯将前面的知识和随机变量进行有机结合。因此设计恰当的案例,将知识前后贯通是教师面临的重要任务。

2软件介绍

在强调学生为主体的实践式教学设计中,教师设计案例的求解一般要选择合适的软件进行辅助,当前数学软件众多、功能强大,如综合性软件Mat-lab,统计专业软件SPSS、SAS等。对于专业数学软件一般要先进行软件的学习才能用来解决实际问题,对于概率论与数理统计这样一门独立的课程,显然不宜专门来进行软件的培训,为了应对实践教学课堂应用,简单易学且容易配置的软件能最大限度实现教学任务。在此以Excel为例介绍案例式教学和利用Excel进行软件试验的一点尝试。Excel使用简便,基本不涉及程序的编制,在图形化界面下进行操作,且具备有强大的图形功能,便于概率结果的呈现和分析。Excel有丰富的概率函数,能帮助用户进行各种类型的概率计算,或进行随机模拟来学习概率论与数理统计。Excel可以计算大部分常用理论分布的概率密度函数PDF、累积分布函数CDF以及模拟产生服从常用概率分布的随机数据。如果能够正确使用,Excel可以成为非常强大的学习工具。选用Excel作为概率论与数理统计教学辅助软件的另一个原因是作为微软Office工具之一,大部分学生均了解Excel的使用,因此不用进行软件的教学即可用来解决实际问题,在学习过程中也能进一步促进学生对软件的使用增强他们解决实际问题的能力。下面介绍一个利用Excel辅助的案例式实验教学设计实例。为了使数学实验背景贴近学生的学习生活,以考试中选择题成绩分析为例。背景分析:考试是每个学生都经历的学习过程,其中选择题是经常遇到的类型,选择题的设计与概率知识之间有密切的关系。通过与学生密切相关的问题引入概率教学,能极大激发学生的学习兴趣。问题设计:选择题在解答时不同于填空题或者解答题,因为在完全不会的情况下仍有可能靠猜测得到正确的答案,那如何来评估选择题在考试中的效度,可以使用什么样的概率论与数理统计的基本知识予以研究?

3实验教学案例设计

首先提出基本假设,考试时一个选择题有4个选项,仅有一个选项是正确的,如果不会做就随机作答,因此在不会做题的情况下随机选择答案有25%的可能性得到正确答案,即从卷面上看该题做对了,对于老师来说,按照成绩评价学生实际知识水平非常重要,因此需要评估在答案正确的前提下求学生实际会做该题的概率。图像显示出选择题答案正确而显示被试者会做该题的概率一直大于被试者实际会做该题的概率,说明选择题容易高估被试者的水平,为了有效区分被试者的不同程度,需要适当调节题目的难度来区分被试者是不是真的会做。作为一个例子,若学生会做与不会做的概率相同,取x=0.5,则容易计算出P(A|B)=0.8,即实际会做概率为0.5时,选择题表现出来的得分可能为0.8分。对于数学实验来说,让学生自己对该案例进一步讨论,亲自实践在软件辅助下的概率解题,对促进学生将理论用于实际非常重要。在课堂讲授的基础上,可以将学生自学内容引申到用随机变量的分布律和分布函数来研究在实际考试中选择题得分情况演示,结合二项分布理论研究选择题对学习评价的情况。评价借助于Excel软件设计如下实验。假设某项考试由100道选择题组成,每道题1分,学生会做该题的概率为x(实际问题中相当于难度系数为1-x),当x=0的时候,被试者对考试内容完全不会,每题都随机选择,可以看成服从参数为(100,0.25)的二项分布,使用Excel中的BINOM-DIST()函数进行二项分布概率密度值和分布函数值的计算来演示考试结果。函数用法为:BINOM-DIST(k,n,p,FALSE/TRUE),其中k表示回答正确的题目数量,可以使用单元格自动生成,n,p为二项分布的参数。n表示总试验次数,p表示每次试验中事件出现的次数即答对题的概率。后面的参数FALSE/TRUE用来说明是计算概率密度函数和是计算分布函数。如BINOMDIST(A2,100,0.25,FALSE)表示对A2单元格中的自变量计算参数为(100,0.25)的二项分布概率密度函数值。使用Ex-cel的自动填充功能,便可方便生成该二项分布的概率密度表。为方便调节二项分布参数,可以将参数(n,p)用单元格的绝对引用代替,改变参数单元格的数值就能得到不同二项分布的概率密度表格。Excel还可以对概率密度表和分布函数表生成条形图和线图,若试题难度系数0.5,学生事实会做的题目应该有50道,因此会做的题目有50道,另外不会做的随机选择,正确率0.25,因此回答正确的题数为12.5,两者相加可知最终得62.5分的概率最大。

4结束语

数理统计论文第5篇

(一)数理统计的主要特点

数理统计就是通过对随机现象有限次的观测或试验所得数据进行归纳,找出这有限数据的内在数量规律性,并据此对整体相应现象的数量规律性做出推断或判断的一门学科。概括起来有如下几方面的特点:一是随机性,就是说数理统计的研究对象应当具有随机性,确定性现象不是数理统计所要研究的内容。二是有限性,就是说数理统计据以研究的随机现象数量表现的次数是有限的。三是数量性,即数理统计以研究随机现象的数量规律性为主,而对随机现象质的研究为次。四是采用的研究方法主要为归纳法。最后,数理统计通过对小样本的研究以达到对整体的推断都具有一定的概率可靠性。用样本推断总体误差的存在是客观的,但是数理统计不仅重在研究误差的大小,还指出误差发生的可能性的大小。

从数理统计的学科特征来看,数理统计是应用数学中最重要、最活跃的学科之一。由此可见!数理统计从学科划分来说,应属于数学学科,但是其重在应用!而不是纯数学理论或方法的研究,故其采用的方法也就重在归纳法,而不是数学的演绎法。

综上所述,数理统计的主要特点可以用一句话概括为、数理统计是一门对随机现象进行有限次的观测或试验的结果进行数量研究,并依之对总体的数量规律性做出具有一定可靠性推断的应用数学学科。

(二)统计学的主要特点

统计学是一门收集、整理和分析统计数据的方法论科学,其目的在于探索数据的内在数量规律性,以达到对客观事物的科学认识。

统计学从其研究的范围来说有三大领域:数据的收集$数据的整理和数据的分析。首先,这三大领域随着统计学的不断发展,已很难分辨出哪个领域更重要些。也许有很多人认为数据的分析要相对重要些。在对1900年和1910年美国两次农业普查资料进行分析时,列宁曾指出:“全部问题,任务的全部困难在于,如何综合这些资料,才能确切地从政治上经济上说明不同种类或类型的农户的整个情况。”这足见数据整理的重要性。近年来困扰我国统计研究的并不是数据的分析方法,而是缺少充分真实有效的统计数据,造成无法用数据去检验或证实相应的经济理论、经济模型和经济政策。数据收集的重要性可见一斑。其次,统计学是一门方法论科学。长期以来,人们一直认为在这众多的方法中,统计研究的基本方法是大量观察法、统计指标法、统计分组法和模型推断法。特别是大量观察法更成为统计学最重要的基本特征方法之一,也可以说这是统计学与数理统计的根本区别之一,否则,统计学也就真的成了现代西方数理统计学了。随着统计学由早期的纯粹描述统计不断拓展为描述统计与推断统计并重,直至有的学者认为现代统计学应该以推断统计为主,描述统计为辅,暂且不论这种观点是否有不妥之处,但可足见推断统计学已在现代社会生活中起到举足轻重的作用。事实上,推断统计已成为现代统计学的基本特征之一。再次,统计学从其成为一门科学的那一天起,就把对现象数量方面的研究作为自己的基本特征,但是,同时强调要以对现象的定性认识为基础。

(三)数理统计与统计学的比较

通过上述对数理统计与统计学特点的分析,可以把数理统计与统计学的主要异同归纳为如下几方面:

1.从其研究目的来看,两者都重在揭示总体现象的数量规律性,而统计学更声称要以对总体现象的定性认识为基础。

2.从其研究的途径来看,数理统计希望通过对总体部分个体的数量特征的研究,以达到对总体相应数量特征的认识;而统计学既希望通过对构成总体的全部个体的数量特征的研究(如果可能$或值得的话),以达到对总体相应数量特征的认识,同时也希望能通过对构成总体的部分个体的数量特征的研究,以达到对总体相应数量特征的认识。

3.从其研究的手段来看,数理统计主要依赖于小样本特征值统计分布的数学原理来推断总体的相应特征值;而统计学或者说推断统计学主要依赖于大样本特征值统计分布的数学原理来推断总体的相应特征值。

4.从其研究的主要范围来看,数理统计侧重于对样本数据的定量分析;而统计学不仅重视样本数据的定量分析,而且重视对所获得的总体全部数据的定量分析,同时,重视数据收集方法、数据整理方法的研究。

5.从其利用样本数据对总体进行推断的数理机理而言,概率论是其共同的基础。特别是作为统计学基本方法之一的大量观察法,其数理基础正是概率论中的大数定律;统计学中用大样本可以方便地推断出总体特征的数理基础正是概率论中的中心极限定理,而无论是大数定律还是中心极限定理也都是数理统计的根基。

6.数理统计尽管强调应用性,但是它本身还是一门数学学科,重在应用方法的数理基础的研究;统计学更侧重于对解决社会、经济等现实问题数量分析方法的研究与应用,而方法本身的数理基础的科学性研究,则由相应的理论统计学去研究,事实上,推断统计方法的数理基础的科学性研究,正是数理统计的研究范畴之一。

从上述数理统计与统计学的特点及其比较,可以清楚地看到,随着现代统计学的发展及其在社会政治经济生活中发挥作用越来越大的趋势,数理统计研究问题的理念及其方法已对统计学的发展产生重要的革命性影响,但是,数理统计与统计学毕竟是两门差异较大的学科,不可能简单地加以“统一”。

二、数理统计在统计学中的地位

数理统计与统计学是两门不同的学科,不可相互取代,也不可能像多年来有些学者提出的那样,要建立所谓的大统计,或者说融合统计学,其实质就是要把数理统计与统计学融合起来。但是其融合的直接后果就是现在某些高校所使用的统计学教材中,既有统计学的内容,也有数理统计的成分,不伦不类,细读之,其实就是数理统计的内容与统计学内容的简单拼接。这不能不说是近年来,中国统计学、统计学教材、统计教学的一大悲哀:迷失了自我,盲目地要“与西方接轨”。笔者认为要想理顺数理统计与统计学的关系,就必须对数理统计在统计学中的地位加以深入的研究。

(一)数理统计在统计思想发展中的地位

统计作为一项社会实践活动,已有几千年的历史。“统而计之”,就是人们对统计的朴素认识。随着社会生产力的不断进步,当代的统计已不圄于“统而计之”的范畴。

1.统计作为人们认识社会的最有力的武器之一,已广泛应用于社会、政治、经济、科技等众多领域,而每一个领域有其复杂多样性,若采用简单地“统”,即全面调查几乎是不可能的,但是全面地了解每一个领域的基本情况及不同领域之间的数量联系的规律性,又为现代社会管理所必需。数理统计研究问题的思路和方法,自然而然地为统计学所利用,即数理统计为现代统计学的发展点燃了解决复杂现实问题的科学思想火花——为用总体的部分去说明总体奠定了数理基础。

2.20世纪30年代以来,随着政府要有效地干预国民经济理念的形成,政府以社会经济生活直接参与者的身份出现,基于对全局数据的掌握,大大地推动了统计思想的发展,不仅投入了大量的资金对统计这支“武器”进行开发,更重要的是从立法的角度对统计行为进行规范。在当今许多国家的统计法规中,都明确地规定抽样调查在统计调查中的重要地位。比如,在我国1996年5月经修改后颁布并实施的《中华人民共和国统计法》第二章第十条就明确规定:“统计调查应当以周期性普查为基础,以经常性抽样调查为主体,以必要的统计报表、重点调查、综合分析等为补充,收集、整理基本统计资料”。而抽样调查的基本原理就基于数理统计的推断原理。可见,数理统计的推断理念在统计实践中的地位已用法律的形式确定下来。

3.作为社会经济活动主体的企业单位,在世界经济全球化、区域经济一体化的发展背景下,不仅没有足够的资金、技术支持从事某一方面的全面调查,有时也没有必要通过全面调查以获得生产经营方面的全面数据资料,而抽样调查就足以提供相应可靠的数据作为企业生产经营决策的依据。这也说明数理统计有着微观的现实需要,为微观经济管理活动开辟了无限广阔的前景。在微观统计应用中有着坚实的思想根基。

4.统计的理念,已不仅仅在于用历史数据描述历史的发展特征,而当代更强调通过对历史数据的收集、整理和分析,去预测未来,而这种预测的基础同样基于数理统计的原理。即从历史的时序数据中找出数据的内在数量规律性,以把握未来的走向,即数理统计的分析原理在时间序列数据预测中的作用,同样功不可没。

(二)数理统计在统计方法中的地位

随着数理统计解决现实问题的理念在统计思想中地位的确立,数理统计在统计方法中的重要地位也相应地得以确立。

1.大数定律为数理统计应用于统计学搭起了连接的纽带。大量观察法是现代统计学的基本方法之一,而大数定律又是大量观察法的基础。统计学若没有大量观察法的支撑,则统计分析中的基本指标——平均数与相对数,则失去其应有的作用和意义,可见数理统计在统计方法中的基础地位不容置疑。

2.中心极限定理为数理统计在统计学中的应用铺平了道路。用样本推断总体的关键在于掌握样本特征值的抽样分布,而中心极限定理表明+只要样本容量足够地大,得自未知总体的样本特征值就近似服从正态分布。从而,只要采用大量观察法获得足够多的随机样本数据,几乎就可以把数理统计的全部处理问题的方法应用于统计学,这从另一个方面也间接地开辟了统计学的方法领域,其在现代推断统计学方法论中居于主导地位。

3.数理统计中样本抽样分布的理论,为现代统计学中的方差分析、正交设计等方法的应用同样提供了方法上的理论保证。特别是正交设计在现实工农业生产中的作用,及其对经济的贡献已引起国外学者的高度关注。据日本某些专家估计:“(日本)经济发展中至少有10%的功劳归于正交设计。”这足见数理统计的方法在统计方法中应用的现实意义。

(三)数理统计在统计内容中的地位

统计学是一门关于如何收集、整理和分析统计数据的一门方法论科学。不管数理统计对统计思想的发展有多大的影响,也不管数理统计在统计方法中居于何种地位,数理统计在统计学中的地位还是主要体现在统计分析中的地位。数理统计对数据的收集方法与整理方法的实际影响要比其对统计数据分析方法的影响小得多。也就是说,统计学作为一门方法论科学,其研究领域要比数理统计宽广得多。试图用数理统计取代统计学的观点显然是不正确的,同样试图用大统计学取代数理统计的观点也不正确,毕竟数理统计作为一门数学学科有其自身的不可替代的特点。因此,数理统计在统计内容中的地位,也只能主要体现在统计分析方面。

1.统计数据收集方法的研究仍然是现代统计学的主要内容之一。正如前所述,在我国现阶段如何获得大量真实有效的统计数据,是我们所面临的迫切任务之一。不真实、不全面的统计数据,使国家的宏观管理"经济理论’经济模型和经济政策的统计检验,以及企业的生产经营预测、决策,都不能有效地进行。可见,“统计数据的质量是统计全部工作的生命”的观点的正确性。而数理统计在统计数据收集方面的影响仅体现在统计数据调查方式方法方面,即抽样调查如何组织实施的方式方法,在统计数据收集方法中得以突出和强调。

2.相同的原始统计数据,采用不同的整理方法所获得的整理资料可以完全不同,并由此对其采用相同的方法进行分析所得的结论,可能完全相反。这足以说明统计整理的重要性。但是数理统计在统计整理方面却难以发挥有效的作用,毕竟,数理统计研究的依据是小样本,而统计学研究的依据的是大样本。假如统计学不是以大样本或总体的全部个体为研究依据,统计学也许就真的沦为数理统计了。

3.数理统计对统计数据分析方法的影响是显着的。不仅体现在对大样本总体参数估计、非参数估计、相关与回归分析、总体分布型态的判断、一个总体参数与两个总体参数的假设检验、方差分析和正交设计等许多内容上,而且体现在描述统计学中最基本指标:平均数、相对数的计算原理等方面。也许真不可想象,若在现代统计方法的内容体系中缺少了数理统计的关于大样本的分析方法原理,将是怎样一种景象。

三、统计学传播理念的转变

对数理统计与统计学的特点作了比较研究,以及对数理统计在统计学中的地位作了分析之后,让我们再回到统计学知识传播的现实实践中来,可以更清楚地看到我们现在正在做什么、在哪些方面还需要改进、今后该怎样把工作做得更好。

(一)统计学知识传播理念的转变主要体现在如下三个方面:

1.统计是什么。这是对统计的最基本的认识,可以通过加强对统计知识的宣传达到。在现代统计工作中,尽管“统而计之”仍有非常重要的现实意义,但是在我们的统计学教学与其它途径的统计知识的传播中,绝不能仅限于此。不仅要让不同阶层的人,认识到统计对现实社会生活的巨大认识作用,而且要让他们了解统计在国家宏观管理、企业经营预测、决策,以及对经济理论#经济模型、经济政策检验中的重要性,从而使各个阶层的人民群众自觉地参与和配合各级统计机构所开展的统计调查活动,以保证统计数据的真实完整。这就要求我国必须加强统计知识普及教育及统计法规的宣传教育!开辟多途径多手段的统计知识传播途径。这是统计学传播的基础理念。

2.统计为什么,即让统计活动的直接参与者懂得为什么要这样做。显然,这是对统计学传播的较高层次要求。知道为什么要这样做!即要知道统计的原理,这并不需要所有的公民都知晓。事实上,只能是具有一定知识基础的人才可能真正理解,且其途径主要是通过高等学校的统计教学活动。由此就对高校的统计学教学理念提出了挑战:统计学课堂上应向学生教授什么。笔者从事高校统计学教学多年,认为高校统计学课堂上应向学生解释统计方法的原理。高校统计学教学课堂不应过分地强调对统计知识的宣传和如何具体地从事统计活动,而应强调重视统计方法机理教学的传播理念,但这在我国现实的高校统计学教学中并没有真正地形成。

3.怎么做统计,这是统计方法具体应用的问题。可以说当前我国高校统计学教学实质上就是教会学生如何做实际统计工作。如何收集、整理数据,如何用公式去计算某些指标等。显然,这样的工作中学生就可以胜任。而真正为什么要那样组织实施数据的调查、整理,为什么要那样计算。不仅老师介绍的不够!而且教材编写的深度也不够。

由此可见,统计知识的传播理念应大致界定在三个层面上:一是统计基本常识的传播。二是如何开展具体的统计活动。三是为什么那样开展统计活动可以达到预期的目的。不同层面的传播对象是有差别的。知道统计是什么、怎么做统计,相对于懂得为什么要那样做统计,其要求是相当低的。也许只要会记数、会写字的居委会大妈,就可以从事数据的收集工作,而会套用公式的一个中学生就可以计算服从X*2分布的统计量的样本数值。而知道为什么要这样做,没有相应的数理统计知识是万万不行的。另一方面,随着计算机的普及及统计数据处理软件的开发,利用计算机对数据进行分析已变得异常简单,甚至一个孩童都可以教会使用统计处理软件,在这种情况下。是否让学生懂得统计为什么就变得不重要了呢?正相反,在统计学的高校课堂上让学生懂得为什么就更重要了。

四、我国统计学教材改革的方向

从对统计学传播理念的不同层次的要求,及数理统计在统计学中的地位和学生的知识结构来看,改革现行高校统计学教材内容体系及教学理念势在必行。

1.去除现行统计学教材中与数理统计相重复的内容,加强关于大样本的数理统计内容,即增加大样本统计分布的数理基础的内容。

2.强调大数定律及中心极限定理内容的教学。尽管这两个定理是纯数理统计的问题,但由于其在数理统计的教学中,教师通常重视不够,因为小样本问题才是数理统计研究的主要问题,因此,可能一带而过,而它们恰恰是联系数理统计与统计学的重要纽带。因此,在统计学教材中必须增加并突出其内容。

数理统计论文第6篇

科学工作流中的任务之间的依赖既包含控制依赖,也包含数据依赖。连接两个任务(t1-t2)的边表示任务t1的输出作为任务t2的输入,工作流中的每个任务可能读入一个或多个输入文件,然后写入一个或多个输出文件。在工作流层,文件可以分为3种类型:输入文件、中间文件和输出文件。不同类型的文件具有不同的生命周期。(1)输入文件。输入文件不由工作流中的任务产生,文件通常驻留在用户存储服务器上。在运行时,可以从一个存储服务器传送到另一个存储服务器,然后在这里被检索,也可以在存储服务器上直接检索。图1中的F-input就是一个输入文件[10]。(2)中间文件。在工作流运行过程中产生但无需长期保存的文件称为中间文件,将在所有使用它的任务结束后被立即删除。图1中的f-t1-o1、f-t1-o2、f-t2-o1、f-t2-o2都是中间文件。(3)输出文件,由工作流产生,对用户有用并且在工作流结束后需要永久保存的文件。在工作流执行过程中,这些文件通常被转移到常驻存储中。图1中的F-output就是工作流的输出文件。值得注意的是,输出文件不一定必须是工作流中最后任务的输出,也可能是中间环节任务的输出数据。

2云计算环境下工作流执行模型

科学工作流由工作流管理系统提交和管理,工作流管理系统驻留在提交主机,协调调度工作的流执行。工作流管理系统将工作流中的任务分配到虚拟机的工作节点,任务的执行所需要的数据可以从一个或多个输入数据存储点输入。中间文件在工作流执行期间驻留在数据暂存站点。当工作流结束时,工作流管理系统删除中间数据,同时将输出文件从暂存站点转存到输出站点,然后永久性保存。根据工作流管理系统和目标执行环境的不同,多个数据站点可以协同工作。例如,在输入数据已经驻留在计算节点的情况下,该计算节点和输入点是相同的。图2显示了具有两个任务的工作流,来说明工作流所需的文件是如何在逻辑上独立的站点之间移动的。

3对象存储应用于科学工作流中的数据管理

对象存储系统主要包括存储服务器、元数据服务器、客户端等组成部分,其核心思想是将数据的读和写与元数据存储分离,如图3所示。存储服务器主要负责数据存储、智能的数据分布以及每个对象元数据的管理;元数据服务器主要提供对象存储访问、文件和目录访问管理以及客户端缓存的一致性管理等功能。为了提供可扩展的可靠服务,对象存储器的内部结构非常复杂。例如,亚马逊的简单存储服务(S3)[12]通过REST(RepresentationalStateTransfer)、SOAP(SimpleObjectAccessProtocol)和APIs(ApplicationProgrammingInterfaces)提供检索和删除操作;它将一个对象的多个副本布局在存储服务器上以提供错误情况下的冗余。很多网格存储服务和为数据密集型应用设计的协议可以认为是对象存储,这种架构对构建来自不同的执行环境的数据管理模式而言具有重要的借鉴意义。针对面向大数据工作流,利用对象存储的优点,本文提出两个方案:一是工作流中的3类数据文件都使用远程的对象存储;二是在计算节点上使用共享文件系统作为数据暂存点来存储中间数据。

3.1单独使用对象存储

在这种情况下,所有的数据都存储在对象存储系统中,工作流管理系统需要从对象存储中无缝检索数据,为本地工作流任务使用。在这样的设置中,工作流管理系统从对象存储中检索输入文件和中间文件,然后,工作流中的任务对本地的POSIX文件系统做必要的输入/输出设置,任务完成时,工作流管理系统能够将中间数据和输出数据存储到对象存储中。这样,即使工作流被部署在分布的资源上,科学应用只需要对POSIX做常规的输入/输出设置,就能完成工作流的执行。工作流管理系统与对象存储的多次交互增加了工作流执行的开销,而该开销与分布资源上的计算相比并不算大。对象存储中既有输入数据也有中间数据,只要工作流系统与对象存储能够无缝检索和存储,那么任务执行可以在任何地方。如图4中,任务t1可以在校园计算机集群上完成,而属于同一工作流的任务t2可以在亚马逊的EC2上完成,t1、t2使用亚马逊的S3对象存储作为中间数据文件的暂存。总之,数据存储和执行环境的分离,使得工作流在分布资源上的执行更为容易。一个常见的情况是,当计算需求超过本地或校园计算所提供的资源时,将使用云资源。图4也说明了工作流的数据移动情况。在这里,文件F-i被传送到云中的高性能计算集群工作节点的本地文件系统。任务t1从该节点开始,读入输入文件F-i,然后写入本地文件系统的中间文件F-t,F-t被传回到作为数据暂存点的对象存储中。F-t文件将从对象存储中被检索进入到EC2节点的本地文件系统。任务t2启动后读取F-t文件(该文件是由t1创建),然后将F-o写到本地磁盘,再传送到对象存储中。以上所有的数据传输工作都由工作流管理系统完成。科学工作流中单独使用对象存储的明显不足之处是,数据重复传输会引起在大数据处理过程中的延迟。工作流中的多个任务使用相同的文件,所以重复传输是显而易见的[13][14]。对象存储将对同一资源的重复请求认为是不同的请求,对象存储通常以其良好的扩展性减轻这种重复对工作流性能造成的影响。另外,工作流系统可能在本地节点选择缓存文件,或者利用集群中的共享文件系统来减轻此问题。延迟是整个工作流性能应该关注的问题,云对象存储的设计提供了很高的带宽,但对单个检索或对象操作可能需要数秒钟的延迟。对具有大量文件的数据密集型的科学工作流而言,这种延迟显著增加了工作流运行的时间开销。大型工作流中的另一个问题是多数中间文件需要被传输到对象存储中由相关后续任务检索并使用。由于商业对象存储提供以GB为单位的存储,并按迁移、存储和检索的请求数付费,所以重复传输也就意味着费用的增加。

3.2共享文件系统作为数据暂存

解决由数据重复迁移造成的延迟问题的方法之一,是工作流管理系统将中间文件暂存在POSIX兼容系统中,由多个计算节点文件系统共享,然后在一个资源节点上运行所有的计算。文件共享系统保存了工作流管理系统中所有任务的中间数据,在这种情况下,只有输入输出文件存储在对象存储中。由于中间文件不需要在对象存储与计算节点之间传送,从而可降低使用商业云对象存储的费用。如图5所示,是一个具有文件共享系统的高性能计算环境下具有2个任务的简单工作流。文件F-i被工作流管理系统传送到集群文件共享文件系统。任务t1在计算节点1上启动,从共享文件系统中读入文件F-i,然后将中间文件F-i-t写入到共享文件系统中,任务t2在计算节点2上启动,从文件共享系统中读入F-i-t(由任务t1创建),然后将其输出写入到F-o,F-o由工作流管理系统送到对象存储中,这种方法的优点在传统的有高速并行超级计算环境中尤为显著。例如,XSEDE(ExtremeScienceandEngineeringDiscoveryEnvironment)节点对多数科学工作流点有极大扩展性[15]。值得注意的是,如果第一个计算节点忙而需要将计算溢出到另一个节点时,这种随数据布局任务的方法,损失了布局计算的灵活性。以上两种方法各有所长,选择使用哪种方法取决于工作流的类型和工作流执行的目标环境,这就要求工作流管理系统的开发具有弹性的数据管理方案,允许科学家有效使用对他们有用的基础设施。工作流中的数据管理方案应该具有如下特征:首先,科学工作流管理系统允许任务和数据后绑定,任务依据资源的可用性映射到计算资源上,任务在执行时能够发现资源,并从众多存储中选择数据暂存位置;其次,在科学家只有一个计算资源可用的情况下,允许任务和数据的静态绑定;再次,支持使用不同协议和不同安全机制访问对象存储。

4相关工作

工作流管理系统处理数据的方法很多,Swift[16]采用与本文所描述的第二种模式类似,使用本地文件系统或共享文件系统作为数据缓存,提交主机扮演数据暂存的角色。系统首先选择一个计算站点来运行一个任务,然后将数据从提交主机推向该站点的文件系统,任务执行后,输入的文件被回传给提交主机,中间文件被留在共享文件系统中以便后续任务的执行。相对而言,本文将数据文件(包括输入、输出、中间文件)与提交主机分离,并使用不同的协议,具有更好的灵活性。其他工作流管理系统如Kepler[17],Triana[18]和Taverna[19]关注的是流式工作流中任务的调度和其他Web资源的调用,这些工作流具有图形化的用户界面,允许用户搭建具有不同部件的工作流,但通常没有涉及访问大量数据集的问题。这些工作流中的数据管理很大程度上依赖于用户,数据管理自动化非常有限。Kepler[20]引入了一个MapReduce执行器,允许执行采用MapReduce算法的混合工作流。Hadoop平台通常用来运行数据密集型的科学应用,它所提供的文件操作与POSIX类似,允许随机读,但不允许随机写。在这种情况下,Hadoop平台负责将输入文件切片并分布在各个数据节点。而本文提出的方法主要针对工作流运行在多个不同的执行环境中,代码不能MapReduce的情况。在XSEDE中,任务利用分布式文件系统如GPFS-WAN[21](GeneralParallelFileSystem-WAN)来访问数据,分布式文件系统支持POSIX操作,可以对输入和输出文件进行远程访问。研究表明[22],将大型数据集布局在本地计算节点会更好,但这一策略也会带来新的问题,如不同类型工作流的融合以及数据布局策略算法等。

5总结

数理统计论文第7篇

针对新疆部队饮用水的水源特点及保障水质的要求,构建监测、预警、分析、应急于一体的水源水质监测预警管理信息系统。水质管理系统由一个中心监测站和若干个固定监测子站组成(如图1所示),水质检测结果的数据由各个监测子站将水质检测结果录入系统,基于106项水质国标在线监测与实时技术,全面提升饮用水水源水质预警水平及应急管理,做到集中管控、实时预警、提前治理。系统采用网络地理信息系统(WebGIS)平台的开发模式,以GIS为载体建立水源点信息及地理位置数据库,然后与水质状态和中心预警模型连接起来,将实时分析结果展示在GIS中。本文中的水质预警系统基于ArcGISServer、Flash等软件开发平成,是集数据库、评价、预测、预警、图形等功能于一体的地理信息系统。

2数字化管理系统的功能模块及整体设计与开发

水质预警管理系统采用B/S与C/S结合的系统架构进行系统设计,以Oracle数据库作为服务端,利用PowerBuilder9.0开发客户端程序,包括监测、分析、预警、综合管理等功能模块。

2.1功能模块

2.1.1短信应用平台数据模块(可扩展)

系统采用当前主流的短信应用平台技术,使系统交互性更强,脱离传统的系统运行模式,摆脱没有计算机或网络无法使用系统的情况。该模块允许用户通过短信方式与数据中心交互提交指标数据,使中心监控站的管理人员无需长时间查看系统是否有预警。一旦数据分析有预警情况发生,可直接以短信形式将预警内容发送到管理人员的手机上,即使管理人员外出不在计算机旁也可第一时间了解预警的详细信息。

2.1.2数据中心模块(可扩展)

该模块是系统中的主要模块之一,负责实时监控分析监测子站上传的水质检测数据,实时发出预警,并能提供数据缓存服务(指标数据与MapInfo地图数据),提高Web窗体模块的响应速度。

2.1.3Web窗体模块

Web窗体模块即UI展示模块,该模块承载所有用户所要操作的子模块。

2.1.3.1用户模块

(1)用户登录。提供用户登录与退出操作。(2)密码管理。提供用户修改账户密码操作。

2.1.3.2查询模块

(1)重点指标快速查询。系统可对用户关心的重点指标进行提前设置,使用该功能可快速查询系统设置中标记的重点指标数据。(2)自定义查询。提供自定义指标查询功能。(3)报表生成与导出。可根据日期、地区等条件对检测结果生成各种图表,例如柱状图、曲线图、饼状图等,并提供导出功能。(4)指标预警地图展示。根据系统中预定的国家规定饮用水指标阈值对各个水源传来的水源检测结果进行指标检测,检测到不合格水质时,将通过MapInfo地图直观地展示水源位置、超标项等预警信息。

2.1.3.3录入模块

(1)指标录入。各个监测子站将采样时间、采样地点、水质各项指标的检测结果通过该功能上传给系统。(2)设备文件批量导入。可使用系统指定的模板对水源水质检测结果进行批量导入。

2.1.3.4设置模块

(1)用户管理。提供用户新增、维护、权限分配等设置功能。(2)权限管理。提供权限的新增、修改、删除功能。(3)指标管理。主要针对国家规定的生活饮用水卫生标准中的各个指标的管理,可对指标进行新增、删除、修改等功能。(4)数据备份与恢复。提供数据库备份与恢复功能。

2.2系统设计与开发

2.2.1系统架构

系统采用3层架构形式,层与层之间的调用由特定功能模块调用实现,各类信息由各个特定的接口实现。(1)表现层。即Web端,基于客户端Flash表现形式实现空间数据与属性数据的关联,以图一体化形式为用户提供丰富化的可视化操作界面。为了保证表现层的简易性、灵活性、可扩展性等特点,系统借助ArcGISAPIforFlex和Framework框架来设计实现,以此来创建比传统WebGIS更智能、更具交互性的客户端。(2)服务层。作为整个框架的核心,提供GIS地图服务和各种数据服务。主要负责处理用户从客户端发来的各种请求,并根据类型作出相应的响应。ArcGISServer作为GIS应用服务器的核心组件,为客户端提供在线地图服务,并通过空间数据引擎连接空间数据库。基于.NET的Web应用服务器提供系统运行数据服务,用于客户端与后台进行业务数据交互,包括水质在线监测数据模块和预警模块的数据传输都是由Web服务器实现的。服务层可对短信应用平台支持扩展接口。(3)数据层。主要包括空间数据引擎ArcCatalog以及数据库Oracle,主要功能是为水质预警系统提供数据支持。数据库模块包括实时监测水质、水源点空间分布及水质标准。系统检测指标包括色度、浑浊度、臭和味、肉眼可见物、pH值、总硬度、铁、锰、铜、锌、挥发酚、阴离子合成洗涤剂、硝酸盐、硫酸盐、氯化物、氟化物、氰化物、砷、汞、镉、铬、铅、细菌总数、大肠菌群等常用指标。

2.2.2公共类设计

公共类及接口主要是对应用系统的通用方法进行抽象,实现应用系统的一些基础功能,为各子系统提供部分可供调用的基本方法和接口,有效地实现代码的重用,保证整体的一致性。同时,各子系统在此基础上,可以依据各模块内部的业务逻辑对基本方法和接口进行组合和扩展,以实现各模块特有的业务功能。公共类主要有数据访问类、统计图表类、图层控制类、目录管理类、数据处理类等。各类的设计如下:(1)数据访问类。此类主要实现与Oracle数据库的交互,实现的功能包括属性数据库的查询、添加、删除以及更新,空间数据库的查询、添加、删除、数据检测等操作,并通过函数的重载来实现不同输入参数情况下功能的实现,以增加系统实现过程中的灵活性。通过此类的封装可为其他模块提供更加方便的实现函数。(2)统计图表类。此类主要是对由属性或业务数据产生各类统计图表的功能进行封装,实现各类统计图表的绘制功能,包括柱状图、折线图、饼状图等种类。通过此类的封装可为其他相关模块提供各类统计图表的实现方法。(3)图层控制类。此类主要是对矢量图层的相关操作进行封装,实现图层加载、图层卸载、图层可见与否等的控制以及图层控制树的动态加载及实现。此类的封装可为其他模块实现图层控制子模块的实现方法以及对图层的基本操作方法。(4)目录管理类。此类主要是对应用系统中可能涉及到的各类对象的管理方法进行封装,包括组的创建、删除,图层状态的获取、设置以及初始化需要涉及到的相关操作。通过此类的封装可为其他模块提供更加简便的操作。(5)数据处理类。此类主要是对数据的处理进行封装,包括原始数据的读取与解析、数据的转换等主要功能。针对各种指标采集或动态地对数据进行分析和转换,为相关模块提供统一的方法。

3核心预警模块

水质预警模块是整个系统的核心部分。水源点传感器采集后的数据通过上传至服务中心,中心对接收的数据进行提取、分类与处理,将数据存储到指标记录库中,并从指标阈值库中读取阈值与数据进行对比,如超出阈值,则预警信息。

4系统实现

传统的地理信息系统的计算管理模式是集中式的,信息的流动范围有限。系统处于相对封闭和孤立的状态,普遍存在严重的“信息孤岛”问题,即每个子系统之间是独立的,不能有效地进行信息交换和共享,很难随着业务范围的增加而线性扩充,不能适应空间数据的爆炸性增长及其分布、动态更新的要求。WebGIS是一项应用Internet技术来扩展和完善传统地理信息系统的新技术,是在GIS中嵌入HTTP和TCP/IP标准的综合应用技术体系。利用Internet在Web上空间数据,为用户提供空间数据的浏览、查询、分析等功能,已成为GIS发展的必然趋势。GIS的图形处理功能能够将城市管网和监测点的信息图文并茂、准确、快速地显示在屏幕中,使人清楚直观地了解水源水质的现状,并可根据需要定制输出各种专题图。数据库技术的运用,使得存储和管理海量的监测数据十分便捷安全。管网的水力水质模拟基于良好的水力水质模型,是预警系统关键的部分,利用其模拟分析可全面了解管网的运行状况。该系统基于C/S架构,通过遍布全区基层连队的全军政工网或综合信息网对水质监测实时信息进行集中监控管理,实时上传并分析水源检测结果。对超标结果通过基于MapInfo地图的WebGIS实时预警,直观显示超标情况和地理位置,并且可采用当前主流的短信应用平台技术,摆脱没有计算机或网络无法使用系统的情况。强大的数据缓存服务可对繁多的水源检测指标数据和MapInfo地图数据实时缓存,使系统响应速度更快、使用更流畅。

5结语

数理统计论文第8篇

2.方法原理

本文采用的方法可称之为统计分析法,即将以往施工中所积累的同类型工程项目的资源耗用量加以分析、统计,并考虑施工技术与组织变化的因素,经分析研究后制定资源消耗指标的一种定额编制方法。

使用统计分析法,首先要确定统计分析的对象,这就涉及到企业定额的子目划分。当前,可以借鉴预算定额的子

本文出自/目划分方法。在确定了统计分析对象后,即可对承包商过去已完工程的原始记录进行统计分析。企业定额的水平应取为企业内部的平均先进水平,因此,在对原始记录进行统计时,应采用加权平均的方法计算消耗量。为便于说明统计分析法的具体操作过程,以砌筑1m3单面清水砖墙的人工消耗量为例予以阐述。

3.算例

设某承包商近年来完成的砌筑1m3单面清水砖墙的人工消耗量资料如表1所示:

表1砌筑1m3单面清水砖墙人工消耗量原始记录单位:工日

12345678910

1.141.121.111.151.091.201.131.151.181.06

续上表

11121314151617181920

1.131.151.101.051.081.121.171.101.061.17

统计分析的具体步骤如下:

3.1.对数据分组

对数据分组主要是确定组数。确定组数的原则是分组的结果能正确地反映数据的分布规律。组数应根据数据多少来确定。数据过少,会掩盖数据的分布规律;组数过多,会使数据过于零乱分散,无法显示数据的分布状况。

通常,可按表2的经验数值确定。

表2数据分组参考值

数据总数50~100100~250>250

分组数6~107~1210~20

本例中,取分组数为6。

将数据分为6组后,便可确定组距,也即组与组之间的间隔。组距可以按照下式计算得出:

(1)

式中,h——组距

本文出自/

R——数据中极大值与极小值之差

k——组数

3.3判断概率分布

根据绘制的直方图,可以大致判断出数据所属的概率分布。本例中,根据统计数据及对实际情况的分析可知,人工砌筑墙体中的人工消耗量属于正态分布。

3.4计算所选分布的特征参数

3.5计算资源消耗指标

计算资源消耗指标时,先选择在置信区间内的数据作为企业定额的平均消耗水平,再以小与置信区间左测值的数据及大于置信区间右侧值的数据与之加权平均后,所得结果为企业定额的平均先进水平。以数学表达式表示为:

(3)

式中,——定额资源消耗量

——小与置信区间左侧值的数据

——小与置信区间左侧值的数据个数

——在置信区间内的数据

——在置信区间内的数据个数

——大于置信区间右侧值的数据

——大于置信区间右侧值的数据个数

将本例中的数据代入式(3)得

即砌筑1m3单面清水砖墙的人工消耗量为1.12个工日。

4.企业定额的动态维护

由于施工工艺的改进、管理方法的改善等各项影响资源消耗指标因素的变化,企业定额建立后,不应该是一成不变的。对企业定额应该进行及时的动态维护。

为达到对企业定额动态维护的目的,应做好以下工作:

(1)采用数据挖掘技术,对已完工程的数据进行整理、分析、提炼。收集和整理基础数据应充分利用现代化的手段,如数字摄像机、计算机等,以使所得数据的精确性、可靠性得到保证。在此基础上,找出数据之间的内在联系和规律,利用这些规律,承包商可以对原有企业定额进行对比分析,剔除不合理或过时之处,修正偏差较大的定额子目,增补新的定额子目。

(2)对于典型工程(施工条件和环境同测试企业定额时比较接近的工程),应该对施工过程进行细致地记录,并注意分析各个工程间的资源消耗量的差异原因,和企业定额相比所增加或减少的消耗指标的产生原因,从而在实践中检验企业定额的科学性、合理性。

(3)企业定额的动态维护应与专业软件公司合作,开发出适合承包商使用的企业定额管理软件,软件应包括以下5个模块:①数据录入及修改模块;②数据库浏览模块。③查询检索模块,提供灵活的方式实现对数据库进行多种方式的查询检索。④数据维护模块,提供数据的备份、修复及更改等功能。⑤数据分析模块,对于在建或已完工程的资源消耗数据进行分析,与企业定额进行对比分析,为企业定额的修订补充提供科学依据。