首页 优秀范文 教育测量与评价论文

教育测量与评价论文赏析八篇

时间:2022-03-28 11:23:59

教育测量与评价论文

教育测量与评价论文第1篇

关键词:高校思想政治理论课; 教育教学测评; 新趋势

中图分类号: G642 文献标识码:A 文章编号:1672-9749(2010)06-0001-02

对高校思想政治理论课教育教学质量开展测评工作十分重要。在上一轮全国范围内开展的高校本科教学评估中,思想政治理论课曾纳入了评估范围,但探索建立一个独立的经常性的思想政治理论课教育教学质量监测体系,对于不断推进教育教学质量提高便显得非常必要。

一、贯彻《国家中长期教育改革和发展规划纲要(2010-2020年)》,高校思想政治理论课应当带头构建教育教学质量测评的长效机制

《国家中长期教育改革和发展规划纲要(2010-2020年)》(以下简称《纲要》)指明了今后十年教育工作的两大重点任务是促进公平、提高质量。而其中改革教育质量评价制度和人才评价制度,是深化改革新的切入点和政策措施的亮点之一。在贯彻《纲要》时,改革高校思想政治理论课教育教学质量评价制度具有特别重要的意义。这是因为,有无马克思主义的思想理论教育,这是社会主义高等教育与资本主义高等教育本质区别的重要标志;保证思想政治理论课的教育质量,对于提高大学生的思想政治素质,保证其全面发展,巩固马克思主义在意识形态领域里的指导地位,都显得意义非凡。因此,高校思想政治理论课应率先构建教育教学质量监测的长效机制。

对于“高校思想政治理论课测评体系研究”的课题,教育部曾多次作为哲学社会科学一般课题进行过招标,但尚未取得突破性的进展。一些高校也进行过探索,如:改革考试考核办法,开展高校思想政治理论课质量保障体系研究,开展多方面的满意度测评,开展社会主义核心价值观培育质性研究等等,取得了一定成绩和经验。今后,各地各高校仍需发展多样化质量测评,同心协力促进思想政治理论课教育教学质量和水平的不断提高。但是,在吸取这些经验的基础上,研制一个既能深入教学内容,又能经常有效操作;既全面测评又突出重点;既能主要在网上操作,又易于在全国推开的质量监测工具,就成为思想政治理论课教育教学测评改革创新的紧迫任务。

二、思想政治理论课教育教学测评改革创新要跟踪国内外高等教育质量测评的前沿

首先,对我国2003-2008年开展的本科教学工作水平评估要有一个正确的认识。当时高校扩招后普遍存在资源投入跟不上、条件差距较大等问题,本科教学工作水平评估派专家组进校,在全面测评中重过程、条件、资源改善等的评估,达到了“以评促建”的目的。但由于要评优,客观上重等级奖罚,因此,许多高校突击应付,有的甚至作假,评估指标也不一定能完全说明高校教育质量。这种投入过大,周期较长的评估办法,沿用的可能性已受到质疑。在提高质量成为今后十年重点工作的历史阶段,要使“发展性评价”的理念、目的落实到高校思想政治理论课教育教学测评中去,势必要另辟蹊径。

同时,纵观国际高等教育质量测评现状,以学生学习效果为高校育人质量的基点和监测的起点,已成为国际高等教育测评发展的新趋势。国外高等教育评价理论大体上经历了四个发展阶段:以测量为标志的第一代测量阶段(1900-1930)、以描述为标志的第二代泰勒模式阶段(1930-1940)、以判断为标志的第三代价值判断阶段(1940-1970)和由枯巴、林肯确立的以发展性与建构性评价为标志的第四代评价理论。上世纪80年代以来,在第四代教育评价理论的基础上,逐步克服了过去存在的评价内容片面性、评价方法单一性、评价主体的偏离等不足,形成了更为科学的评价理念和模式。许多专家经过深入研究,指出“教育资源与教育质量之间的相关关系比较薄弱,对于高校资源条件的要求还不足以保证其教育质量,而对高等院校的评估应该重视与教育质量有更直接关系的学生学习效果”[1]。很多国家的教育评价研究都得出了类似的结论,如英国高等教育质量保障局于2001年公布的适用于全国的学位标准,在阐述各级学位的质量和水准时,几乎用了一半篇幅列举各级学位持有人应有的学习产出。[2]美国以法律条款对学生的学习成就加以规定,要求评估者从两方面把握高校的绩效责任:一是高校所确立的对学生学习效果的期望水准,二是该水准已经实现的证据。[3]欧盟高等教育质量保障协会制定的《欧洲地区高等教育质量保障准则与标准》第三项“对学生的评价”也指出,“要突出对学生学习产出的测量”,“要为高校提供教学成效和学生支持等方面有价值的信息”[4]。可见,越来越多国家的高等教育评价均聚焦于学生的学习效果,这对于我国高等教育质量评价无疑具有重要的启迪和借鉴意义。

国内基础教育评价也正在借鉴国外教育评价的先进经验,把学生看作是教育质量的最终体现者,因而把学生学习效果的评价作为教育评价的核心。教育部基础教育质量监测中心从2007年成立以来,已对数学、语文、外语等科目的教育质量开展了评价监测。国内外教育评价理论和实践的发展趋势都启示,以学生的学习效果为逻辑起点,构建高校思想政治理论课教育教学评价新理念和质量监测新方案,不仅是必要的,而且也是可行的。

三、“高校思想政治理论课教育教学质量监测体系”研究的基本思路

首先,从理念上坚持“发展性评价”并实现“三个转向”。即从重过程评价向重结果评价转向;从重教师、条件测评向重学生学习效果测评转向;从面面俱到向重点突破转向。因为一定的资源条件占有,并不一定与学习效果和质量成正比。

其次,从研制思想政治理论课四门必修课的教育教学质量监测工具入手。每门课三套测试卷(需具有同等效度、信度),每套测试卷包含四个模块的测试内容:一是基本情况(便于分类统计处理);二是对该课程后知识的掌握、能力的提高情况(运用考试学理论和方法);三是对该课程的情感、态度、价值观的进步情况(运用心理测量理论和方法);四是对二、三的进步情况作归因分析的题目(运用社会调查原理与方法)。

再次,监测工具研制中做到“三个突出”。高校思想政治理论课与中学思想品德、思想政治课不同,未编写课程标准和教学大纲,在测评中如何明确测试目标和观察点?唯有吃透教材,突出各门课程的核心内容、重要观点和要求。四门课程除测试知识掌握的试题各不相同外,在测试能力、情感、态度、价值观的题目中形式雷同怎么办?要把握区分度,突出各门课程教学的特殊要求。在归因分析中,思想政治理论课与语文、数学、外语等课显著不同,学生的进步同时也受到社会、家庭和大众传媒、网络的影响,如何判断与思想政治理论课教学的相关度?在分析题设计中唯有努力突出该课教育教学的影响因子,才有可能得出正确结论。

最后,思想政治理论课教育教学质量监测工具的优越性。按上述思路取得突破,将具有以下优越性:一是主要在网上操作,测试题多用选择题,测能力的题也努力作到主观试题客观化,因此运行成本低而效率高;二是地方教育主管部门、高校教师可方便灵活地经常使用;三是跟踪测评、动态发展,还有利于作纵向分析、横向比较;四是有利于及时掌握学生学习效果,发现问题,及时改进工作,领导教师由被动转为主动,一般不会出现逆反心理而采取应付态度。

当然,思想政治理论课教育教学质量监测工具的研制,是以普通高校为使用者来设计的。其他高校使用时则需结合实际变通使用并对测试题作相应调整。

测试卷中的题目内容应当根据形势的发展、教学内容的与时俱进,作出相应调整。因此,如全面推广和经常使用,势必要求建立题库,设立专门机构。是建立中介机构、协会,还是委托某个高校、机构来抓思想政治理论课教育质量监测工作,这需要从我国实际出发来确定。同时,如果在面上主要运用思想政治理论课教育教学质量监测工具,也不排斥各地各高校采用多种多样的直接测评、间接测评手段和办法。总之,只要是有利于收集学生学习效果的各种信息、证据的办法都可以用。这样,才能更好地实现测评方式的多样化、评价主体的多元化、评价内容的丰富性,才能更好地通过测评促进师生的进步和发展。

参考文献

[1]魏红,钟秉林.重视学生学习效果,改善教育评估效能――国际高等教育评估发展新趋势及其启示[J].中国高教研究,2009(10):16-19.

教育测量与评价论文第2篇

论文摘要:教育评价对教育发展和改革具有举足轻重的作用,随着信息技术在教育评价中的应用,如何对教育评价技术有更清楚的认识,使教育评价更加公正、公平、合理,具有重要的意义。教育技术的发展与教育评价技术的发展息息相关,文章将从教育技术的发展历程来简要介绍教育评价技术的发展。

引言

教育评价对提高教学质量、促进教育改革的深化具有重要的作用,主要包括诊断功能、导向功能、激励功能以及调节功能。有人说,教育评价改革已成为当今基础教育改革与发展的瓶颈,但是目前教育评价的改革却很难取得突破性进展,一方面,是因为这项改革涉及教育教学的各个核心领域,教育评价中诸多问题本质上正是社会矛盾在教育中的转嫁与具体体现,特别是人才标准、社会价值取向和经济发展状况等,都会直接制约教育发展的理念和改革进程;另一方面,是因为我国基础教育评价的理论和技术研究相对薄弱,尤其是教育测量和评价技术整体上还处在较低水平。可见教育评价技术在教育评价、教育发展与改革中具有重要作用。

纵观教育评价技术的发展历史,其与教育技术的发展是信息相关的,本文主要从教育技术的发展历程来简要介绍教育评价技术的发展。

一、相关概念的界定

1.教育评价

“评价是一种价值判断的活动,是对客体满足主体需要程度的判断。而教育评价是从教育测量活动中逐步发展出来的,是对教育活动满足社会与个体需要的程度做出判断的活动,是对教育活动现实的(已经取得的)或潜在的(还未取得,但有可能取得的)值做出判断,以期达到教育价值增值的过程。教育评价往往把教育测量作为它的基础,“按照教育评价的主体分为个体评价和社会评价,按照教育评价的目的分为形成性评价和总结性评价,按照教育评价的范围则分为学生评价、教学评价、课程评价、学校评价、大群体评价、特殊方案与项目的评价以及人事评价”等多个方面。冈而教学评价是一种中观和微观的教育评价。

此外,教育评价也不等同于教育测量,但二者有着密切的联系,教育测量是教育评价的基础,教育评价是在教育测量的基础上的深化。

2.教育技术

根据AECT’94教育技术定义:教学技术是为了促进学习,对有关的过程和资源进行设计、开发、利用、管理和评价的理论与实践(In-structional Technology is the theoryand practice of design,development,utilization,management and evalua-tion of processes and resources forlearning)。AECT’05教育技术定义:教育技术是通过创造、使用和管理合适的技术性的过程和资源,以促进学习和提高绩效的研究与符合伦理道德的实践(Educational Technol-ogy is the study and ethical practiceof facilitating learning and improvingperformance by creating, using andmanaging appropriate technologicalprocesses and resources)。

3.教育技术中的评价

评价一直是教育技术定义中的一个重要组成部分,是确定教学和学习是否合格的过程。根据1970年教学技术委员会的第二项定义:“‘教学技术’是一种根据特定目标来设计、实施与评价整个学与教的过程的系统方法,它以对人的学习和传播的研究为基础,综合运用人力、物力资源,以达到更有效的教学的目的。”1994年的定义更是将评价作为教育技术研究的五个范畴中的一个方面,主要是针对学习资源与学习过程的评价,其内容主要包括问题分析、标准参照测量、形成性评价和总结性评价。教育技术评价又是教育评价的一个子范畴,所以,教育评价的基本原则和方法同样适用于教育技术的评价。

4.教育评价技术

目前尚没有对教育评价技术有一个权威统一的定义,也有些学者认为教育评价技术与教育评价方法是相同的。《辞海》(1999年版)中规定了技术的定义是在劳动生产方面的经验、知识和技巧,也泛指其他操作方面的技巧,英文是technology,art, skill, technique。现在也有很多学者认为技术是科学的其他有组织的知识在解决实际问题或完成现实任务中的系统运用,包括物化技术和智能技术。

教育评价技术,就是在教育评价的过程中所采用的一些经验、知识和技巧等。

二、从教育技术的发展到教育评价技术的发展

对于教育技术的发展历程,人们普遍认同的是关于教育技术的“四次革命论”的提法。最早是英国著名的教育家阿什比(Ashby)在以色列技术学院做题为《教育中的技术学》的演讲中说“在漫长的教育史上曾有过四次智力革命”。其主要的内容有以下四点:第一次革命是教育职能由家庭转移到基督教会或犹太教会;第二次革命是采用了书写作为教育的工具;第三次革命是印刷术的发明;第四次革命是上世纪在教学上开始采用的新技术,如电影、唱片、电视等。

1978年,由原美国驻中国联络处印发的小册子—《美国教育技术》中写到了四次革命论:第一次革命是教育青年人的责任从家族转移到专业教师手中;第二次革命是采用书写文字作为与口语同样重要的教育工具;第三次革命是发明印刷术和普遍运用教科书;第四次革命正在出现,主要是近年来电子学、通信技术及数据处理应用于教育。

以上两种观点基本上是一样的,都是从媒体的发展对教育方式产生的影响进行分类的,是侧重于媒体进行划分的。

教育评价是从教育测量、教育测验活动中逐步发展出来的。在20世纪30年代才由“教育评价之父”泰勒提出了“教育评价”(educationevaluation)的概念,“从而把教育评价与教育测量区分开来,教育评价学就是在泰勒原理的基础上诞生并发展起来的”。纵观教育评价的发展历程,“其思想源于中国古代教育的考试,孕育于西方教育测量的批判,形成于‘八年研究’的改革实践”。

教育评价的理论和技术也一直伴随着教育的发展而发展,本文就主要从教育技术发展的四次革命简单介绍教育评价技术的发展历程,并展望教育技术在教育评价中的未来发展趋势,如表1所示

1.专职教师的出现

第一次革命是专职教师的出现。此时的教育评价技术主要侧重于口头提问和实际操作来评定学生的学业。我国早在西周时代就已经形成了较完备的考试制度。如《礼记·学记》中记载,“比年人学,中年考校”就是典型的实例。而在西方,“古希腊哲学家常采用评论、谈话等方式来进行考核,提倡辩论,注重学生的思维训练。最为有影响力的就是苏格拉底的研讨评价法”,这一方法是指以苏格拉底“产婆术”教学法为基础,通过苏格拉底式的提问和积极参与研讨,以实现思想和价值理解扩展的质性评价活动。

2.书写文字的出现

第二次革命是采用书写文字作为与口语同样重要的教育工具。文字的出现使笔试成为了主要的教育评价的技术。我国历代封建王朝为选拔人才,建立了“开科纳士”、“分科举人”的考试制度,历史上称之为科举考试制度。试卷测验是教育中应用最为广泛的评价技术,它是根据教育目标,通过编制试题、组成试卷对学生进行测试,引出学生的学习表现,然后按照一定的标准对测试结果加以衡量的一种评价方法。采用试卷测验作为评价技术只是属于测量的阶段,只是追求评价结果的数量化、客观化为主要目的。

3.印刷术的发明和教科书的出现

第三次革命是印刷术的发明和教科书的出现。这一阶段还是采用笔试的教育评价技术,教育测量和教育测验仍然是重要的评价技术,但已经不再是唯一的工具了,评价者的任务不仅是要运用一定的测量手段搜集评价信息,还要制定判断评价的目标与评价标准,运用一定手段进行价值判断。教育测量和教

育测验是用数学方法对事物或现象进行描述,是为了取得客观的数据,客观性是测验质量的首要指标。这种教育评价技术从出现到现在仍普遍运用于国内外教育评价中,比较常见的测验类型有常模参照测验和标准参照测验。

(1)常模参照测验,“指参照常模群体的水平解释分数的测验。常模群体可以是一个特别选定的团体,也可以是被测所在群体的本身。参照常模解释分数,突出反映了被试在常模群体中的相对位置,便于进行比较和选拔,适用于带有竞争性质的人学考试、竞赛以及为相对评价提供信息的各种测验”。

转贴于 (2)标准参照测验,指依据某种特定操作标准可以直接解释测量结果的测验。操作标准一般可通过界定个体所应该完成的任务集合或任务领域来确定。“标准参照测验主要用作鉴定,高中毕业会考、自学考试等就是典型的标准参照测验。在平时的教学中也经常采用标准参照测验进行诊断性评价或终结性评价”。

4.电子、通信、网络技术在教育中的应用

第四次革命是近年来的电子技术、通信技术以及网络技术在教育中的应用。由于计算机和其他新型媒体技术的出现,信息技术的发展以及质的研究方法得到重视,教育评价技术也出现了很多新的方式。例如在英语口语和听力考试中开始利用录音机或者语音实验室等设备来辅助测试,还有伴随程序教学法出现的计算机辅助评价、契约评价、量规评价、电子档案袋、情境评价以及目前研究比较热门的基于绩效技术的评价、基于数据挖掘技术的评价。其中几种评价内容如下。

(1)计算机辅助评价(ComputerAssisted Assessment,简称CAA)“指在评价学习者的知识、技能和能力的过程中引人计算机作为工具或手段,它引发了评价内容、方法和形式的深刻变革。从测评的内容和目标分类的角度来划分,CAA可分为知识测评和技能测评两大类,它们共同构成能力素质测评的基础。”把计算机引人教育测试领域进一步激发了人们开发新的测试技术的兴趣,这种测试技术不仅利用了计算机的高速数据处理能力,而且还利用了计算机的交互能力,海量数据的即存即取能力,新颖的图像处理能力,以及控制多媒体环境的能力。随着目前网络教育、远程教育的发展,计算机辅助评价又有不受时间和空间限制的特点等,对教育评价的发展具有深远的影响。

(2)契约评价:“来源于真正意义上的契约或合同。教育技术强调以学为主,以‘任务驱动’和‘问题解决’作为学习和研究活动的主线,为了能够让学习在完成任务和解决问题时有一个具体的目标或依据,也为了客观合理地评价,契约评价这种评价方式越来越受到人们的重视。目前比较常见的是学习契约,也称为学习合同,“是一种由学习者与指导教师共同协商、设计、实施和评价的关于某一学习主题的书面协议。在学习过程中,这种契约可以不断修正,它赋予了学习者自主学习的决定权,规定了学习者必须履行的学习义务,为学习者开展自主学习提供了一种基本框架”。它规定了学习者将要学习什么、怎样学习以及如何检验/评价是否达到学习目标。在远程学习中,将学习契约与信息技术有机结合,将有益于提高评价的效度。

(3)量规(Rubric ):“是一种结构化的定量评价标准,往往是从与评价目标相关的多个方面详细规定评价指标,具有操作性、准确性高,主观与客观相结合的特点。随着教育信息化的发展,越来越多学习任务是以非客观性的方式呈现的,因此,量规的应用逐渐得到重视。在设计量规时,应该注意两条原则:根据教学目的和学生的学习水平来设计结构分量;根据教学目标的侧重点确定各结构分量的权重。目前所提倡的以学习者为中心,基于任务驱动、项目学习或问题求解的学习活动,“其学习过程和学习成果通常是以研究报告、学习反思、调查报告、研究论文等形式呈现,这种学习绩效评价所要求的评价方法/工具不但要关注学习结果,更要关注学习过程。量规是一种适用于评价这种类型学习绩效的方法//I具”。

(4)档案袋(Portfolio):也称为成长档案袋,“是按照一定目的收集的反映学生学习过程以及最终产品的一整套材料,对学生进行客观的、综合的评价”。其使用在客观上有助于促进个人的发展,学生也能在自我评价中逐渐变得更加积极。评价包可包括各种形式的学习材料,如作业、录像带、书面文章、图画、成绩单、调查报告、教师的评语等。档案袋在计算机出现以前就存在于教育评价中,只是由于信息量大,存储资料费时费力,并没有得到广泛的应用,电子档案袋出现以后就解决了以上问题,可以更好地发挥其评价的作用。

(5)绩效评价:“学生个人或小组针对某一主题,独立完成任务,并以PPT文档、电子作业、网页、解决方案、研究报告等方式来展示绩效,已经成为一种得到认可的学习形式。绩效评价涉及学生创造成果或完成所要求任务的过程。绩效评价需要一整套辅助工作,如学生作业的观察、展示、陈述、访问、学生生成的计划、模仿以及角色扮演等。为了绩效的真实性,它们应与真实世界或该世界的某些方面保持联系,即使不是真实的任务,也应该是有意义的任务,不能是对知识的回忆。好的绩效评价反映了真实世界的复杂性并同时对许多方面进行测量。在绩效评价中,学生有机会展示广泛的才能,任务的完成使学生有可能起到类似真实世界场景中所期望的角色。通过绩效评估,学生意识到学习不仅仅是记忆的练习,而且是发展既有具体训练的深度又能适应所学领域的复杂性的一种感悟。

(6)数据挖掘(Data Mining):就是“从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的但又是潜在有用的信息和知识的过程”。数据挖掘有时也称为“数据库中的知识发现”(Knowledge Discovery inDatabase , KDD ),还有很多和这一术语相近似的术语,如数据分析、数据融合以及决策支持等。它涉及对数据库中的大量数据进行抽取、转换、分析以及模型化处理,从中提取辅助决策的关键性数据。通过数据挖掘,可以帮助决策者寻找规律,发现被忽略的要素,预测趋势,从而进行决策。在教育评价中,收集到的教育信息数据量较大,而且存在一些特殊的数据,利用数据挖掘技术可以深人挖掘这些数据,消除冗余数据和没有价值的数据,对评价主体进行多指标、多主体、全过程、全方位的整体综合评价,使教育评价更加公平、公正、合理

三、发展趋势和问题

教育测量与评价论文第3篇

本次专题研讨会的论文和专家报告表明,我国在基础教育质量评价、检测和监控的研究及实践方面已进入了一个新的发展阶段。

一、看待基础教育质量标准及检测或监控的不同视角

基础教育的质量、质量标准、质量评价、质量检测或监控等,是与会者共同关注的基本问题。大家从多种视角看待上述问题。特邀报告多为宏观视角。专题研讨会论文的视角可分为理论的、区域的和学校的三个层面。

基础教育质量包含的内容过多。办学质量、师资质量、课程质量、教学质量、人的全面发展质量等,都是基础教育质量必须包含的内容。观察基础教育质量的立场和角度也太多。宏观、中观、微观,理论、实践,历史、现实、未来,政府、社会、学校、家长,不同视角的观察,获得的结果和结论有所不同。特别是对于基础教育质量、质量标准的看法存在很多差异。

特别需要澄清的是,监控意义上的基础教育质量,指的是教育的质,而不是教育的量。质的意义上的教育质量,对应着以课程标准为核心的明确的标准(课标),与课程标准相对应的评价(监测或监控)只能用达标与否来表示。也就是说,质的意义上的教育质量,只有一个质的标准,判断的方法,就是看其是否完成了这个任务、达到了这个标准。《教育规划纲要》提出的建立国家基础教育质量标准,就是质的标准;建立基础教育质量监测或监控机制,就是通过恰当的、适用的评价形式,保障全国基础教育都能够完成教育任务、达到教育标准。

量的意义上的教育质量对应的是教育结果(有时还延伸到教育过程)的优劣程度。通过恰当的、适用的评价方法,对教育优劣程度作出判断,将不同地区、学校及教师的教育教学质量水平区分出来,能够给学校或教师的工作质量的高低或优劣进行排名。所谓“不断提高教育质量”,指的就是这种量的意义上的教育质量。

将质和量加以区分,有助于梳理对质量监控的认识,也便于质量监控工作的操作,在某种意义上还有助于对社会和大众的宣传。质,是达到目标,并且是百分之百达到。量,是“更高”、“更好”、“更多”、“卓越”、“优质”。政府、学校和教师的法定任务是完成质的目标,学校和教师在完成质的目标的基础上,可以努力达到更高的质量,但那不是当前质量监控的重点。质量监控,首先是质的评价和保障,其次才是量的追求。

基于不同的目的,质量监控应采用不同的评价形式;使用评价方法不同,获得的评价结果就不一样。测查教育质量的高低、好坏、优劣程度,适用于相对评价方法。相对评价方法的基础是群体均数、常模之类的客观标准。监测或监控基础教育质量是否达标,适用于绝对评价方法。绝对评价的基础是制订基础教育质量标准,比之“常模”,这种标准带有较强的主观性。基础教育质量标准是以课程目标为核心而确立的学校、教师和学生必须达到的教育和学习目标。通过绝对评价,可以准确而高效地监测或监控质量目标的完成情况。至于在实现标准之后,如何追求更高的、卓越的、优质的教育质量,就不是教育质量标准所关注的问题,因此也就不是教育质量监测或监控所应考虑的问题了。倘若在讨论制订基础教育质量标准问题时,不能在理论上和思维方式上剔除“更高”、“卓越”、“优质”这些旨在反映目标标准之上的量的提升情况的修饰词,就容易在质和量的问题上出现摇摆,就容易说不清基础教育质量监测的任务究竟是为了改进工作,还是为了给地区和学校乃至教师和学生进行排名。

研讨和论文中还涉及两个基础性概念,一个是监测,一个是监控。厘清这两个概念也有助于推进对基础教育质量问题的研究和实践。这两个概念涉及测、监、控三个字,分别具有不同的含义。测,是方法和技术,是手段,表现为测量工具的开发和应用;监,是实时掌握和了解质量状态,是对质量的充分把握、切实把握,表现为一种常态化的运作机制建设;控,是控制教育质量和保障教育质量,表现为一种使基础教育尽快达到国家标准的保障制度建设。基础教育质量监测是以质量标准为基点,测查教师的教学和学生的学习是否达到了目标。当然为了保证教师的教学和学生的学习,需要监测的还有学校的管理及其他教育质量的主要影响因素。建立一种质量控制的机制,以保证基础教育能够完成教育标准。在当前我国的教育体制中,督导或督学制度是实现监控的主要途径之一。测在前,控在后,测是技术的表达,控是制度的表达。监控比之监测,多出来的正是对质量保障制度的诉求。

二、从量的评价转向质的评价,从相对评价转向绝对评价

制订基础教育质量标准,是开展基础教育质量检测或监控的逻辑前提。依据质量标准而实施的评价属于绝对评价。我们要开展质量监控,首先需要实现评价观的转变。近年来,社会普遍信服客观标准,相对评价属于比较偏重于客观标准的评价(常模),绝对评价则偏于主观,但是质量监控需要的恰恰是要制订一个适合当前工作状态的主观标准(人为制订)。

从宏观角度看,在国家和一个相对大的区域层面,需要有意识地排除通过评价给地区和学校排序、评比的做法。宏观层面所谓转变评价观念,就是要强调基础教育质量监控的是质而不是量,是教育目标的完成情况以小学语文课程为例,课程标准对识字数量是从学生认识的字数和会写的字数两方面来要求的,学生认识的字数在第一学段增幅为1600字~1800字,会写的字数在第一学段为800字~1000字。这两个数字构成了教育质量的监控标准。但是有些地区和学校,把标准中的“一会”提高为“两会”(不仅会认,还要会写1600字~1800字,超标一倍),“两会”再提高为“四会”(会认、会写、会读、会用),对于这些做法,我们应该给予什么样的评价呢?给予“达标”,似乎不足以说明其质量的“高超”程度,给予“良好”和“优秀”,则又非质量监控的本意,也不是课程标准的本意,甚至还可以说是对课程标准的某种僭越和批判——要求二年级的教师和学生完成四年级的任务——课业负担就是这么被加重的!

对于学生及其家长而言,认字越多越好,这是量的评价,是相对评价的任务;对于学校、教师及政府而言,完成课程标准就好,这是质的评价,是绝对评价的任务。识字教学这个例子说明,可以“不断提高”的,只有量,没有质。

当然,一般来说,宏观和微观视角中的教育质量监控的实际含义多少有所不同。

宏观、中观的视角,重在监控底线,须用绝对评价方法。微观的视角中,重在考查程度,既可用绝对评价方法,也可用相对评价方法。假如以15秒为学生百米跑的速度标准,代表体育教学目标,那么我们可用绝对评价方法予以监控。凡15秒以上者为达到目标、完成任务、质量合格。但对于14秒、13秒、12秒、11秒的学生是否就意味着质量很高?要不要更高?在宏观和中观视角中即绝对评价中,后面的问题都不成立!只有在微观视角中,才可以说,跑11秒和15秒之间意味着什么差异。美术、音乐等艺术和技能性课程都如此,知识性课程、道德性课程同样如此。比如:学生做志愿服务或社会实践的时间,20课时为达标、合格。可以倡导或鼓励个别学生争取30、40个课时,并予以表扬,但不能作为质量标准。换言之,质的评价,是针对15秒、20课时的达标性评价。它不太关注14秒、13秒,30课时、40课时的问题,相反,它非常关注16秒和19课时所反映出的教育教学工作问题。

及存在的问题。基础教育质量监控的“达标”性质和“保障”目的,决定了绝对评价是比相对评价更加适宜的评价方法。

从微观角度看,由于绝对评价依据的是教学目标,是一种质的评价,因此它有助于我们发现教学中的问题,其结果对于改进工作具有重要价值。而相对评价依据的是群体均数,是一种量的评价,它有助于发现个人差异,其结果具有很客观的评比、排名作用。所谓转变评价观念,就是依据提升教育质量的目的,微观层面的学校和教师,都应该将适应于“完成既定教学任务,发现教学中存在的问题以便及时改进”的评价方法作为主要方法,而压缩和减少使用相对评价方法。

无论宏观角度的监控还是微观角度的监控,都应遵循把握教育质量的“质”这个逻辑原则。《教育规划纲要》中提出的制订基础教育质量标准所预示的对应的评价性质是质的评价,对应的评价技术是绝对评价。如果说我们曾经在新课程改革过程中一度比较重视应用相对评价的技术和方法,如比较重视课程及教学目标的生成性,重视研制各种常模,以便于评价每个孩子(与群体均数相比)的发展情况,那么,国家层面所要监控的必定是教育教学目标的达成程度。相对评价一般使用等级分数,自然能够评出名次;绝对评价一般使用达标线,只能分出是否达标,而不能细分名次。

当前,基础教育质量评价面临的问题是多方面的。

重量轻质,并把量当成质,是当前的一个主要问题。当我们把一个本来有目标、有标准的事物由于美好的愿望而有意抹杀其质的标准,使之变为一个具有无限弹性的事物时,“不断提高”这四个字,就从愿望性的口号变成了现实政策。在“不断提高教育质量”的观念下,是无法确立和制订质量标准的。没有标准,便无法确定恰当的、适用的评价方法;没有明确的评价方法,便没有切实的监控。“不断提高”只是此类愿望性口号的代表,实践中还可以看到花样翻新、五光十色、丰富多彩的不断创新的概念说法(优质的、卓越的、高标准的、可持续发展的学生等)。这些说法的目的并不在保障教育质量方面,而仅在于如何“不断”提升名次,以达到“出人头地”的目的。在几篇介绍香港基础教育质量监控的文章中,我们也可以清晰地看到这样一个转向的趋势:基础教育质量监控的评价从重视输入、过程,向重视结果方面转化,从重视量向重视质方面转化,从重视“虚”向重视“实”方面转化,从权力控制向评价监控方面转化。

有论文鉴于目前流行的评价方法对教育质量的结果评价只有好坏、优劣、高低这样的表达方式,而提出用模糊综合评价模型来处理这个问题。这在实践中也是一种被大家普遍接受的方式。但是,在好坏、优劣、高低之前,还存在一个“是否”、“有无”的问题,而“是否”和“有无”所针对的,恰恰是基础教育质量的标准所在,是质量的“质”所在。

时龙理事长在讲到质量标准框架时,提到了一系列相关工作,概括地说,主要包括:一制订标准,二研制相应的技术、方法和工具,三建立监测机制,四建立控制、保障机制。这四个要素构成了基础教育质量监控的完整架构。

香港教育质量检测和保障的基本机制包含三个圆圈,小圈指学校层面对于质量的监控,中圈指区域层面对于质量的监控,大圈指国际层面对于质量的监控。它给我们的启示在于,这三个圈完全符合质量保障和质量管理的一般思维和实践逻辑,管理学上称之为PDCA质量圈(计划、实施、评价、改善)。香港的质量监控机制对我们研究、设计、实验基础教育质量监控的方案和计划,具有重要的参考意义。

基础教育质量监控应该是一个逻辑严密的系统。这个系统所包括的四个基本环节(质量标准——评价技术——检测方案——保障制度)的相互关系应该是:质量标准是基础,是当前的工作重点,是评价或监测的指标构成。监测(评价)方法和工具是与质量标准相配套的技术手段,是教育评价研究者最为关注的重点。监测方案是以与质量标准相关联的评价技术为核心而建立起来的一整套教育质量监测机制,这套机制也可视为基础教

三、构建教育质量监控体系的四个基本要素及其相互关系

育质量监测的解决方案,目前国家和各省市正处于尝试研制和试点建立阶段。第四是依据这套监测机制或监测方案而构建的质量控制和保障制度,这是通过对现有教育管理制度进行以保证质量为目标的整合而形成的新的基础教育管理体系。具备了质量控制和保障机制之后,质量标准才能真正得到全面落实。

目前来看,要建立基础教育质量监控体系,我们还有许多问题需要澄清,有观念方面的、习惯方面的、认识和理解方面的,体制、机制和制度方面的,也有技术和操作方面的。

我们首先要解决的问题是制订基础教育质量标准。

这项工作的艰巨性主要表现在三个层面:思想理论层面、政策制度层面和方法技术层面。

在思想理论层面,“优质”、“均衡”、“人民满意”等观念混淆在一起,不利于在“什么是”基础教育质量标准问题上取得价值共识。许多地区在为义务教育均衡发展制订阶段目标时,都把“优质均衡”或“高质量、高水平均衡”作为一个阶段目标的标志,说明在义务教育均衡发展问题上普遍存在认识上的混乱。优质与均衡分别体现着不同的价值取向。价值的多义性,导致基础教育政策的多标准性;政策的不稳定性,导致教育评价及质量监控工作的盲目性和模糊性。

在政策制度层面,监控体制的建设涉及教育行政部门、教育督导部门、教育研究部门以及其他相关部门的职责和权利的整合与合作。近年来,各地教育行政部门在做各种机制调整的尝试,各级督导部门也在积极开展质量监控的理论和实践探索。这个层面的问题是当前推进基础教育质量监控工作的关键。其深层,关乎思想理论的进一步澄清;其表层,影响着评价技术操作方面的研究和推进。

在方法技术层面,制订基础教育质量标准,所面临的首先是质量标准的研制问题,而不仅是测评工具、分析手段等问题。教育质量监控是以课程标准为基础的,即虽然课程标准是主观制订的,但我们必须假定它是合理、合法的(虽然有与会者提出课改后新课程标准存在种种问题)。课程标准可分为三个维度的内容,一是知识、技能维度,二是思维、表现维度,三是态度、情感维度。知识、技能部分对应的标准是理解和掌握;思维、表现部分对应的标准是判断和表达,态度、情感部分最为复杂,课标对此的表述是态度、情感、价值观,在实际操作中,如北京的综合素质评价,还包括学习兴趣、自信心、意志力、积极性等。态度、情感、价值观的可测标准怎样确定?这是多年来一直困扰大家的难点问题,但并非不能解决。当我们首先确定质量标准是“准则参照”而不是“常模参照”,对应的方法是绝对评价而不是相对评价时,这个问题就会在相当程度上变得比较清晰也比较容易操作。

质量监控,核心是保障教育活动完成既定目标。香港在质量标准的基本分类中,同样包含“学生表现”和“校风及学生支援”的范畴。该范畴的“范围”表述(学生支援、学校伙伴,态度和行为、参与和成就)和“指标”表述(学生成长支援、学校气氛,家校合作、对外联系;情意发展和态度、群性发展,学业表现、学业以外表现),这两个层次的表述方式,形成了一种“准则参照”体系,并在相当程度上具备了“是否”、“有无”的基本特征。由此可见,即使是对于态度、情感、价值观这方面的教育目标,只要排除了量的无限要求,其质的部分,还是可以通过我们的细致工作,加工成为可测的指标体系的。上海教科院基教所陆关于上海地区参加2009年PISA测试情况的报告,也向我们展示了PISA怎样成功地测查了态度、情感和价值观方面的内容。

四、基础教育质量监控理论与实践今后可能的发展方向

作为基础教育质量监控的核心问题的评价体系及其方法,可能需要我们向着逻辑化、技术化和艺术化方向进一步深化研究。评价体系及其方法的逻辑化,指的是强化质量监控体系的科学化程度;技术化,指的是强化质量监控体系的实用化和便利化程度(如指数化、色标化、概念化等);艺术化,指的是强化质量监控体系的平等、尊重、友好、善意、和蔼、亲切等美感友善的程度。艺术化主要在微观层面的应用中需要特别加以注意,以便于学校和教师愿意自觉地、愉快地应用。

评价方法和技术没有好坏之分,只有恰当与否。根据不同的评价目的,选取恰当的、适用的评价方法,是正确的做法。如相对评价对于发现学校或学生的发展问题而言,是好的评价方法。绝对评价对于监控既定教育质量目标的完成及工作改进情况而言,是好的评价方法。

我们始终面临着一个十分纠结的问题:如果说质量标准的制订从理论上讲指的是“最低标准”的话,那么,我们多年来习以为常的一些概念,诸如优质、卓越、高水平、拔尖创新、学生的可持续发展等等,又怎么理解、怎么对待、怎么处理?换言之,怎么不断鼓励学校办出特色,不断鼓励教师提升教学水平,不断鼓励学生提高学习成绩?这个纠结,根本原因在于,监控者(政府)确定的质量标准不是质的标准,而是量的标准;使用的评价方法,不是旨在达标、在发现问题以改进工作的绝对评价,而是旨在区分发展差异、旨在评比排名的相对评价。

其原因还在于,应该属于学校校长甚至教师的某些权力,在一定程度上还被掌控在政府教育管理部门,质量监控与业绩考评与评比竞赛等混杂在一起。这些,都有待于教育体制、制度和机制的进一步改革。教育质量监控工作一方面是一项有助于促进教育改革的工作,一方面它又需要通过教育改革的深化才能逐渐完善起来。

通过对现有教育管理制度进行以保证质量为目标的整合而形成的新的基础教育管理体系,其有效的运行,将全面促进基础教育质量在“量”的方面的不断提升。优质、卓越、拔尖创新、高水平、高层次等概念,只有在这个质量监控体系的基础上,才具有实质的意义。

教育测量与评价论文第4篇

中国期刊投稿热线,欢迎投稿,投稿信箱1630158@163.com 所有投稿论文我们会在2个工作日之内给予办理审稿,并通过电子信箱通知您具体的论文审稿及发表情况,来信咨询者当天回信,敬请查收。本站提供专业的服务和论文写作服务,省级、部级、核心期刊快速发表。

【摘要】多元化的评价取向自从20 世纪初美国教育心理学家桑代克编制出第一批标准化的教育测验, 纸笔测验在学生评价中一直占据主导地位, 成为评价学生、教师和学校质量的神圣工具。

【关键词】多元化的评价取向 纸笔测验在学生评价中一直占据主导地位

【本页关键词】论文写作 期刊征稿 论文投稿

【正文】

二、现代教育评价视野中我国大学英语学生评价的改革方向

(一) 多元化的评价取向自从20 世纪初美国教育心理学家桑代克编制出第一批标准化的教育测验, 纸笔测验在学生评价中一直占据主导地位, 成为评价学生、教师和学校质量的神圣工具。标准化考试的理论基础是联结主义, 它是通过学生对大量结构化情景的反应, 来了解学生的知识和能力的, 但它无法考察学生在动态的、真实的背景中会如何应用知识。而现实生活是非结构化的, 没有现成的答案可供选择。现代教育的最终目的是让学生成为一个主动的探索者和学习者, 因此, 非结构化的任务对于学生的评价结果非常重要。传统评价方式的弊端和新的知识观、学生观、学习观的建立, 使教育者日益意识到, 仅仅使用传统的评价方法去评价学生的学习, 是远远不够的。必须改变过去半个多世纪一直占据主导地位的传统评价方式, 寻求多元化的、更真实、更公正的评价方式。在这样的背景下, 教育评价在经历了测验和测量时期、描述时期、判断时期之后, 进入了建构时期。建构时期的评价, 克服了前三个时期依赖测验为主、评价仅局限于目标的客观描述、不进行价值判断、被评价者主体地位被忽视等诸多不足, 提出评价实质上是评价者和被评价者共同参与、民主协商并达成一种共识的过程, 认为评价最基本的作用在于促进教学反思, 使被评价者能清楚地认识自己,为其自我发展提供决策信息; 评价的方法应该多元化, 要全面深入收集信息; 评价活动应受多元价值的支配, 评价应利于被评价者个性的发展。④在第四代评价理念的影响下, 上个世纪90 年代以来, 英国、美国、我国台湾地区相继进行了多元化学生评价改革。多元化学生评价是指不单纯采用标准化测验, 而是采用多种途径, 在非结构化的情景中评价学生学习结果的一系列评价方法。多元化评价的理论基础是现代建构主义学习理论和多元化智力理论。多元化的学生评价机制包括评价主体、评价标准、评价方法和评价内容的多元化。一方面, 多元化评价的背景是真实的或是对真实生活的良好复写, 它是对学生运用自己的知识进行判断、解决问题的直接评价, 并为教学及学习设定了清楚的目标。另一方面, 多元化评价克服了学科学绩测验偏重于知识记忆的缺点, 注重对学生理解能力、操作能力、应用及创造能力的评价, 这在评价思想和评价方法上都是一种进步。在多元化的评价背景下, 评价突破了以往单一化、标准化的模式, 人们对其从试题类型、评分过程、标准化程度、被评价者状态、评分的语言重点、被评价者反应速度、分数解释、评价对象、评价目的和评价者等多个维度进行了划分。从多元化的学生评价发展来看, 现代学生评价具有以下特征: (1) 由总结性学生评价走向形成性学生评价; (2) 评价内容更全面、综合; (3) 学生主动参与评价; (4) 学生的成长发展过程成为评价关注的重点; (5) 强调评价方法多样化、文化价值多元化。(二) 真实性与情境性评价的改革方向在国际教育评价新理念的影响以及学科自身发展的变革要求下, 大学英语的评价体系正经历着由单一的考试测量到多元化评价发展的转变。我国大学英语传统的客观语言测试, 是建立在行为主义心理学、心理测量学和结构主义语言学等理论基础之上的。早期的行为主义心理学家桑代克认为, 凡是事物都是有数量, 凡是数量都是可以测量的。⑤实施客观语言测试的假设是: 语言能力作为人的一种心理特质, 是以一定数量的形式存在的, 是可以被测量的; 这一潜在的心理特质通过其外显的行为, 如听、说、读、写等语言活动表现出来; 语言能力是可分的, 它由一定的成分组成的, 这些成分又都以各自的量存在, 可以通过对成分的测试来确定受考者的语言能力;只要对其他一些与语言能力无关的变量进行严格的控制, 就能将语言能力的量准确地反映出来。这些假设使客观语言测试成为可能。客观语言测试在语言测试史上改变了“没有任何科学理论依据”的状况, 克服了对语言能力的主观臆测性,大大地促进了语言测试的发展。这样, 以测量为指导思想的实证主义就进入了语言教育评价领域, 测试成了语言教育评价的主要手段。然而, 正如在客观语言测试被引入前, 人们对缺乏测试技术的传统语言测试产生怀疑一样, 到20 世纪中期以后, 拥有现代技术支持的客观语言测试同样也受到人们的批评。比如, 通过四、六级测试, 我们大致可以了解到学生对词汇知识和语法知识及听、说、读、写等技能的掌握, 但是在大学英语学习过程中的诸多个体因素, 如语言学习策略、态度和观念等的变化, 以及这些内在因素与学习者的学习经历、家庭背景、学校条件等外在因素的交互作用是无法通过客观语言测试得以了解的。量化测试的方法具有准确、高效、说服力强、容易操作等优点, 但用完全定量的方法来评价语言学习是不合适的, 要对影响语言学习的其他因素进行确定, 就必须使用一些定性的方法。在处理定性与定量的关系上现代教育评价观认为, 定性是定量的基础, 没有正确的定性就不可能有准确的定量, 而且定量的结果还要靠定性来解释, 只有两者的结合才能进行全面的辨证的综合分析, 作出较为科学的评价。因此, 在现代教育评价视野中, 大学英语教学的评价应是采用多种方法、参考多元价值、多方参与的协商共建的系统活动。《大学英语教学基本要求》提出: 评价要以学生的基本语言综合应用能力为出发点, 将形成性评价和终结性评价相结合, 建立多样化评价体系。教育不能用一把尺子去衡量所有的学生, 要让学生有更多的选择, 要发挥学生的个性, 评价体系也切忌一个模式、一个标准。就外语教学来说, 我们不能局限于简单地对学生掌握的外语知识进行测试, 我们更应该注重评定学生使用英语进行交际的能力, 采用基于学生真实性任务中表现行为的动态评价方式, 突出评价方式的“质”性, 强调评价情景的真实性, 关注评价条件的支持性,注重评价过程的动态性。

【文章来源】/article/44/213.Html

【本站说明】中国期刊投稿热线:专业致力于期刊论文写作和发表服务。提供毕业论文、学术论文的写作发表服务;省级、部级、核心期刊以及写作辅导。 “以信誉求生存 以效率求发展”。愿本站真诚、快捷、优质的服务,为您的学习、工作提供便利条件!自05年建立以来已经为上千客户提供了、论文写作方面的服务,同时建立了自己的网络信誉体系,我们将会继续把信誉、效率、发展放在首位,为您提供更完善的服务。

联系电话: 13081601539

客服编辑QQ:860280178

论文投稿电子邮件: 1630158@163.com

投稿邮件标题格式:投稿刊物名 论文题目

如:《现代商业》 论我国金融改革及其未来发展

声明:

本站期刊绝对正规合法

并带双刊号(CN,ISSN),保证让您轻松晋升

教育测量与评价论文第5篇

关键词:教育评价;范式;历史演变;趋势

中图分类号:G40-058.1 文献标识码:A 文章编号:1671-1610(2012)01-0051-05

教育评价范式是一个动态的历史发展过程,它不仅受制约于当时的时代背景,而且直接受影响于当时的哲学思想的冲击。美国评价专家库巴和林肯在对评价领域批判的基础上,提出了教育评价发展的历史阶段划分,即测验和测量时期、描述时期、判断时期、建构时期。[1]以此为基础,笔者把教育评价范式划分为量化的范式、描述的范式、判断的范式和建构的范式,并认为量化的范式、描述的范式、判断的范式虽然有强烈的目的性、计划性与可操作性而被广泛使用,但它们都共同遵循实用主义的世界观,存在以稳态的观点研究动态的过程,以孤立的观点研究系统问题,以线型的框架研究非线型的结构等弊端而必然受到抛弃。因此,笔者以为,人本范式以人的意义及其生命价值作为关注重点,将把评价实践带入一种意义结构的文化图景,从而成为一种全新的、有生命力的、多样化的评价范式。

一、教育评价范式概述

所谓范式,起初来源于自然科学领域,“是一套相互关联的概念,它提供了人们观察和理解特定问题和活动的框架,决定了人们的目的、解释观察到的现象以及解决出现问题的方式。当老的范式不能解决突出的问题时,范式便要发生变革。”[2]社会科学的学科“范式”主要包括:第一,科学共同体共同遵守和信仰的哲学思想和学科信念,以及在此基础上形成的理论系统、基本观点和相关成果;第二,相应的研究实践模型和技术框架,它规定了该门学科研究的方法和程序;第三,不同时期和阶段解决问题的具体模型和范例,或者是同一时期和阶段对同一问题的具体模型和解答。[3]

教育科学内部存在学术共同体,有着众多的研究者,有着共存的哲学思想、学科信念、研究方法、理论模型、研究规则、解决问题的框架和范例等,同时形成了不同的教育思想和教育理论流派。因此,教育学理论或教育科学研究范式是存在的。而教育评价是“依据一定的教育价值观或教育目的,运用可操作的科学的评价技术和手段,通过系统地收集信息、资料,分析、整理对教育活动、教育过程和教育效果及影响教育效果的诸因素作出的价值判断,从而不断改进教育措施或为教育决策提供依据的过程。”[4]两者综合来看,教育评价范式即指:第一,教育评价共同体在某一历史时期内共同遵守一定的教育哲学思想和教育信念,以及在此基础上形成的教育评价理论系统、基本观点和相关成果;第二,应具有相应的教育评价的实践模型和技术框架,它规定了教育评价的方法和程序;第三,不同时期和阶段具有独特教育评价的具体模型和范例。

教育评价范式对于教学活动来说意义重大。日本教育评价领域的权威专家田中耕治教授曾说过,之所以关注教育评价,因为它是连接“教”与“学”的“指南针”,是深化教学认识论的方法论。毫不夸张地说,教育评价是推动教育进步与变革不可或缺的动力之一。而教育评价范式可以为教育评价提供理论的基础、思想的指导、评价的模式、方法的支持以及技术的帮助,从而保障教育评价的客观性、真实性、科学性,促进教育活动朝着科学的方向前进。不仅如此,教育评价范式的研究还具有积极的现实意义。就我国的教育评价实践而言,还存在着严重的问题。如周济指出的那样,“目前,应试教育倾向仍未从整体上得到改变,学生课业负担过重的现象未能得到有效扭转”、“一些制约素质教育推进的体制尚未消除”、“与素质教育相配套的考试评价机制还未跟上”。[5]实际上,这是教育评价与教育实践之间激烈矛盾的表现。可见,在教育实践中教育评价有着举足轻重的地位。而如何确立一种合适的教育评价范式来指导我们的教育是每一个教育工作者都应该深刻思考的问题。

二、教育评价范式的历史演变

教育评价在不同的时期,由于教育的进步和科学的发展从而具有不同的范式。它们之间彼此相互区别。笔者根据各个时期教育评价理论体系、指导思想、评价模式和评价方法、技术的不同,将教育研究范式分为四个不同的种类,各个范式之间相互区别却又相互联系,为教育的发展提供科学的依据。

(一)量化的范式

虽然教育的产生历史悠久,但教育评价范式产生的时间较晚。量化的范式是最早的相对成熟的教育评价范式,最初是由心理测量和教育测量发展而来,盛行于19世纪末至20世纪30年代。在当时,教育学家们普遍认为教育活动的结果是可以量化的,将任何结果量化为数字或图表,保证了教育评价的客观性与结果的科学性。教育测量运动之父桑代克有一段非常有名的论述,如果物质存在,就会以量的形式存在,如果有量的存在,就可以测量。同时他还身体力行,发表了《心理与社会测量导论》,还编写了《书法量表》、《拼字量表》、《作文量表》、《图画量表》等一系列标准测量工具,推动了教育评价量化范式的发展与完善。

在研究者们看来,“教育科学也可相应地把全部完整的教育过程作为一项实体化的活动加以多系列、多侧面的划分,成为各种变项,探究其间的因果关系及交互作用,然后将得到的结果验证并加以研究。”[6]基于此种想法,量化的教育评价范式主要采取的是测量、统计等可获得客观结果的评价方法。在进行具体评价的过程中,教育者们像自然实验那样以观察、实验的方法收集具体的可检验的数据,然后对这些数据进行分析与综合,最后量化出教育结果。这一教育评价范式在当时被许多大家所推崇,如1905年,被世人称为智力测量的鼻祖法国人比纳与其助手西蒙推出了《比纳――西蒙量表》进行智力测量。而1923年,美国出版了第一个标准化成绩测验“斯坦福成绩测验”,它标志着教育测量的编制和运用已达到了同一时期的顶峰。

量化的教育评价范式在历史的很长一段时期内得到学者的追捧,这与它自身的合理性是分不开的。量化的评价范式具有客观性,它以外显的现象或行为作为评价对象,并以数字作为评价的结果依据,克服了评价过程中各种主观因素的影响,以数据说话,具有较大的说服力和科学性。但是它也存在有一定的弊端。这主要是由于量化的评价范式是基于两个假设的基础之上,“一是测验的分数能够作为一般的意义推广”[7]31,即可以根据测验的结果推断学生相对应的整个能力的发展。“二是一个测验的所有题目应该测量一个单一的根源属性”[7]31,即测试的内容,围绕预先计划所要测试的内容而来,只评价单一的属性。但实际上,量化的方法要做到这一点是很难的,太多的主观或客观因素在量化的过程中难以预料的。这两个假设的不可克服,也就使得量化评价范式所产生的结果是不够客观公正的。因此,杜威认为“测量运动”中所谓的“个体差异”,是依据统计学标准进行的量的分类,而绝不能将其视为人的固有特征或表现人的精神世界特征的个性差异,忽视了对质的把握。[8]

(二)描述的范式

20世纪30年代之后,量化的教育评价范式由于自身的缺陷遭到了教育学界的质疑与反对,而对于量化的教育评价范式的批判,促进了另一种评价范式――描述范式的兴起与发展。杜威对于“测量运动”的批判为泰勒的“评价”方法奠定了基础。20世纪30年代,伴随着“八年研究”的兴起,描述的教育评价范式在教育领域蔚然成风,并且一直持续到1940年左右。

进步主义教育协会主持的“八年研究”的辉煌成果之一,是在泰勒主持下构建了教育评价的理论与方法,泰勒因此被称为教育评价之父。所谓的“泰勒原理”是由:(1)目标选择――“学校应为实现什么样的教育目标而努力”;(2)学习经验的选择――“实施什么样的教育才能实现这些目标”;(3)学习经验的组织――“怎样有效地组织教育经验”;(4)结果的评价――“是否实现了这些教育目标、如何判断”这四个部分构成。它所追求的是将课程――教学――评价作为一个整体,全面掌握。评价方法已不再局限于笔试,扩展到观察记录、轶事记录、问卷、访谈、活动记录、收集作品等。同时,测试的范围已不再局限于智力方面,较多地涉及到了学生内隐的情感和思想方面,如态度、兴趣、信仰、社会适应等方面。较之量化的教育评价范式,描述范式克服其弱点,评价结果更为公正与全面。

描述的教育评价模式预先确定目标,使行为有了目的性和计划性,提高了评价的功效,其操作性较强,工作流程相对简单,故易于大多数人接受和掌握。但它也具有局限性,这主要表现在它基于的是一种消极、被动的人性观和教育观,视“学校为工厂”(school as factory),学生根据预定的目标来学习,未考虑个人的意愿与兴趣,故其隐含着人生观是消极、被动的。其次,回避了教育的价值问题。该模式没有考虑目标的科学性,一味地把教育评价局限在预期目标的实现方面,阻碍了人们对目标本身的评价。第三,只重视对“结果”的评价,而忽视了对教学过程的评价。第四,对非预期结果的处理未涉及,也未重视人的个性发展的特殊性。第五,并非所有的目标都可以行为化、量化,那些难以用行为目标陈述的评价问题(尤其是意识形态领域,如欣赏水平、同情心等)如何评价,这在评价的技术处理上又是一次挑战。[9]

(三)判断的范式

在描述的教育评价范式之后紧接着以判断为主的教育评价范式。1946至1972这一时期的主要特征是用一定的标准去衡量所得结果是否达到了既定目标,并作出“价值判断”。代表人物有克龙巴赫、斯塔弗宾和斯里克文。与前两个阶段一样,教育学家们在总结前人经验与教训的基础之上,对教育评价范式进行了不懈的努力与探索。

克龙巴赫于1963年发表了《通过教育评价改进课程》的论文,他认为:(1)评价人不仅就关心教育的目标,检验教育目标达到的程度,更应关心教育的决策;(2)评价的重点应放在教育过程之中,而不是在教育过程结束之后;(3)评价不是决定优劣的过程,而要作为一个收集和反馈的过程。紧接其后,1966年斯塔弗宾提出来了以决策为中心的CIPP模式,主张教育评价主要是要通过找出“实际是什么”与“应该是什么”之间的差异来为决策服务。不久,斯里克文于1967年发表了《评价方法论》一文,明确区分了如下几种概念:(1)形成性评价与终结性评价;(2)专业性评价与业余评价;(3)比较性评价与非比较性评价;(4)目标达成度的评价与目标是否值得达成的评价。同时斯里克文针对“基于目标的评价”提出了“目标游离评价”模式,该模式的基础在于它认为教育活动除了收到预期的效应之外,还会产生各种“非预期效应”。

判断的教育评价范式较之于描述的评价范式扩大了评论的视野,“针对行为目标模式中缺少对制定的教育目标本身的合理性进行评价的问题,提出了重视目标的背景评价,将目标的评价引入到教育评价活动当中,使教育目标本身的科学性、合理性受到一定的关注和重视。”[10]同时还强调了评价要贯穿教育活动的整个过程,关注评价过程中产生的非预期结果。但“判断时期”教育评价也存在不足,评价活动把评价对象及其他有关人员排除在外,容易使评价者与评价对象之间形成紧张对立的关系,影响评价工作的顺利进行以及评价的公正与准确。而且评价者总是把自己的价值观作为评价工作的唯一标准,评价很难为多元文化背景下的人们普遍接受。再有评价过分强调科学实证主义的方法,缺乏必要的灵活性和弹性,忽视了价值方面尤其是评价对象道义上的追求。

(四)建构的范式

建构主义萌生于20世纪80年代,随着对课程改革运动的深刻反思而产生。它的产生是以教育评价日趋专业化为背景的。上个世纪70年代以来,一些评价团体创办了杂志,如《教育评价和政策分析》、《评价研究》、《评价和方案设计》、《方案评价新探》和《评价信息》等;许多大学开设了评价的方法论课程,一些大学,如,伊利诺斯大学、斯坦福大学、波士顿学院、明尼苏达大学和西密执安大学增设了研究生的评价课程;同时,还建立了研究中心,用以研究和发展评价,如,斯坦福评价协会、伊利诺斯大学的教育和课程评价中心、西密执根大学评价中心、波士顿大学评价和教育政策研究中心等。[11]这些都标志着教育评价走上了专业化的发展道路。

在这一时期又有新的评价理论的诞生,如斯塔克等人提出的“应答评价模型”。 这一模式的主要特点是以问题特别是直接从事教育活动的决策者和实施者所提出的问题,做为评价的先导。由于主体在面对外部信息时,其原始的经验积累、情感体验和智力结构各不相同,因而其认知结果也各不相同。所以,评价必须融入差异与个性因素,通过评价者与评价有关的各方面人员之间的持续不断的“对话”,了解他们的愿望,对教育的方案做出修改,对大多数人的愿望做出应答,以满足各种人的需要。斯塔克认为解决教育问题只有依靠那些直接接触问题的人,教育评价应有助于改进工作,应运用非正式的观察、交往等描述性的定性分析的方法,以弥补传统的实验的和标准化测验的不足。20世纪80年代,美国又出现了自称“第四代教育评价”的理论,由库巴和林肯创立。他们认为:从评价本质上看,评价描述的并不是事物真正的、客观的状态,而是参与评价的人或团体关于评价对象的一种主观性认识,是一种通过“协商”而形成的“心理建构”。因此,评价应坚持“价值多元化”的信念,反对“管理主义倾向”[12]。

建构范式已经突显现代西方教育评价发展的一些特点:(1)从评价的目的上看,以决策为中心转向以人为中心,评价强调将完整的、有个性的人当作自己的对象,并努力通过评价促使受教育者个性的充分发展;(2)从评价的对象看,评价从学生的学力发展到评价影响学生学习的各种因素;(3)从评价的功能上来看,从原来的甄别和选择以促进学生发展,到评价教育活动是否达到预定的教育目标,再扩大到通过评价进行教育决策,提高教育质量,促进教育改革;(4)从评价方法上来看,从推崇标准化的教育测量,发展到提倡观察、调查等手段的定性分性,进一步发展到广泛收集信息、进行解释论证,并作出价值判断的定量与定性结合的方法;(5)从评价的形式来看,从终结性评价发展到形成性评价,进一步再发展到背景评价、输入评价、过程评价、结果评价等多种评价。

三、人本范式――教育评价范式的未来展望

人本教育评价范式主张把教育的意义和价值作为自己的研究对象,注重教育者与受教育者的主观方面、个体意识、精神以及进入价值意义结构的文化背景。主张通过重新体验,理解教育中人们的内心世界、活动动机、文化意义达到了主体与客体的融合。它所提倡的是一种全面、客观、多样化的评价;认为评价是与教学过程并行的同等重要的过程,其根本目的在于促使个体最大可能地实现其价值。这里用雅斯贝尔斯的一句话描述评价的使命比较合适,即“帮助个人自由地成为他自己,而非强求一律”[13]然而,受现代科学主义技术逻辑的影响,以往的评价一直表现出一种片面的和急功近利的特点,成为一种统一与程序化机械过程,甚至是一种科学主义技术化垄断。“它容易排斥矛盾和差异,容易形成绝对理念与崇拜行动,形成教学的功利主义甚至评价暴力,导致了学生独立精神与创造欲望的丧失。”[14]在教育价值关系上,忽视甚至否认受教育者的主体地位,过分追求教育的外在价值,忽略了其内在价值的追求。它忽视了人的内心世界、精神生活,缺乏对人生意义与幸福真谛的追求,使得“那些终极的、最高贵的价值,已从公共生活中销声匿迹。”[15]这给我国教育的发展带来了不可估量的负面影响。

人本教育评价范式是基于人本主义教育价值取向而提出的。它坚信统一的评价范围是极其有限的,因为它无法衡量学生成长中的意志努力,学习态度和我行为动机等因素,也无法判断学生学习活动的性质。因此,教育评价应从更加宽泛的角度,将人的全面发展视为一个统一整体,进行全人格分析测定。就价值取向而言,人本教育评价范式与历史各阶段的教育评价范式相比,最大程度地将人作为教育的价值观取向,以人作为出发点,突出人的终极的、最高贵的生命价值。就知识而言,需要尊重个人知识、默会知识与建构知识的价值,需要恢复知识的“个体性”、“建构性”和“现场性”等性质,以克服客观主义知识霸权对人的价值的宰制,使学生在体验、反思与实践中成长。[16]就过程而言,促进批判与反思,并使之成为知识进步的杠杆。社会知识和人文知识都是与价值有涉的,没有批判与反思,就不会有新的理论出现。在这里,批判与反思不仅是事实性的,而且也是主体性与价值性的。罗蒂曾倡导哲学家应该关注教养的问题而不是认识论的问题:“哲学家们应该远离对认识论问题的关注,而转向有关解释学和教化的问题。”[17] 就技术而言,而不再是以冷冰冰的分数或测量作为教育评价为依据,而是重视评价中的个人活动的独特性、创造性、过程性、情境性和不连续性的价值。如果我们更重视“教养”的信念而不是“知识”的信念时,那么,我们就会从动态、生成的视角看待和领会教学意义的情境性、多样性、复杂性。[18]因而,人本范式可谓是一种生命的范式。

总的来说,人本教育评价范式体现如下特点:一是推崇自我评价。当学生的自我评价作为学习的主要依据时,其独立性、创造性和主动性就会得到发展。自我评价法不是和别人比较,而是对照自己,看出自己前后不同的学习情况,避免了因分数竞争而造成的心理压力和厌倦情绪。二是把学习过程当作人生过程。对自己学习进行评价的主体只能是学生自己。这种评价是个人对自己做出的,而且始终保持的一种自我估计,它表达了一种赞同或不赞同的态度,并表明了个人相信自身的能力、重要性、成功和价值的程度。学习旨在形成自我概念,促进自我发展。三是强调主动反思与自我修正。“从对译价的直接控制转入元评价地位,克服教育评价的管制思想”[19],使学生自我发现并解决学习问题,从而逐步培养起自我评价的习惯和能力。四是师生理解与对话。学生主动参与学习与评价过程,在教师的指导下自我评定学业成绩,教师亦可从学生的自我评价中了解到学生内部的真实思想。评价的最终目的不仅仅是管理与选拔,而且是让学生学会自我评价,让学生在自我评价的过程中了解和肯定自己的能力,并能与他人分享自我探索的体会以及进步的喜悦。

参考文献

[1]周朝森.教育评价理论的新探索―美国“第四代教育评价述评”[J].教育研究,1992(2):52-54.

[2]赵必华.教育评价范式:变革与冲突[J].比较教育研究,2003(10):62-64.

[3]周继良.无存“范式”之争―教育学研究中的本质主义与反本质主义新解[J].现代大学教育,2011(5):01.

[4]孙俊三.教育原理[M].长沙:中南大学出版社.2001:424.

[5]程刚.教育部长周济详解应武教育为何愈演愈烈[N].中国青年报,2006-04-28(6).

[6]梁燕玲.关于教育研究中实证―分析范式的探讨[J].教育评论,2000(2):26.

[7]赵必华.教育评价范式的变革与启示[J].全球教育展望,2003(11).

[8]田中耕治.教育评价[M].高峡,等,译.北京:北京师范大学出版社,2011:22-23.

[9]肖远军.目标导向课程评价模式探析[J].教育科学,2003(3):25.

[10]谭利净.采用CIPP模式进行课堂教学评价研究[D].石家庄:河北师范大学硕士学位论文,2011:16.

[11]吴钢.西方教育评价发展历史的探讨[J].外国教育研究,1992(4):14.

[12]肖远军.教育评价原理及应用[M].杭州:淅江大学版社,2004:42.

[13]雅斯贝尔斯.存在与超越―雅斯贝尔斯文集[M].上海:三联书店.1988:166.

[14]唐松林,张辰宸.两种外在的教育评价主体的价值取向:差异、辩证与对话 [J].中国地质大学学报(社会科学版),2011(3):89.

[15]韦伯,M.学术与政治[M].冯克利,译.上海:三联书店,1988:48.

[16]冯君莲.大学神圣性的消弭与回归[J].大学教育科学,2011(2):26.

[17]鲁玛纳,L.罗蒂[M].刘清平,译.北京:中华书局,2003:24.

[18]杨钦芬.教师的教学理解与提升[J].大学教育科学,2011(1):69.

[19]刘文娟,任伟.美、英、日高等教育评价的“非管制化”启示[J].现代大学教育,2004(6):50.

基金项目:湖南省教育厅研究项目“人本教育研究 ”,项目编号:10W001。

教育测量与评价论文第6篇

1 研究的理论基础

本文所建构的全日制教育硕士专业发展量表指标体系主要参照了美国、英国和中国的教师专业评价标准,主要从内容、结构等方面进行了研究。

首先,从标准所涉及的内容来看,美国全国教师认证委员会于1954年制定了候选教师标准,主要内容涉及:熟悉学科内容;明白有效的教学策略;反思自己的教学实践并调整自己的教学;能从不同的文化背景角度给学生提供教学;接受教学导师的监督;能把教育技术应用于教学中[1]。美国洲际教师评估与支持联合会于1997年颁布的新教师标准等提出了10条核心标准,这10条核心标准分别涉及学科知识、学生学习、学生的多样性、教学策略、学习环境、交流手段、教学计划、评价策略、教师的反思与专业发展、合作关系[2]。每条标准包括知识、倾向和表现3部分。这些标准为测量职前教师的专业水平提供了有效的框架。2006年英国合格教师专业评价标准涉及3大方面内容:教师的专业品质、教师的专业知识和理解、教师的专业技能。这些内容是以教师专业发展理论为基础的。这个专业标准提出了作为一名合格教师,应该具备的知识、能力和专业行为,同时指出,教师的知识和技能是教师专业评价不可或缺的重要组成部分,教师的专业行为更是对教师道德与责任的规范[3]。2011年12月12日,我国教育部颁布了《幼儿教师专业标准(试行)》、《小学教师专业标准(试行)》和《中学教师专业标准(试行)》[4-6],其基本理念为:学生为本、师德为先、能力为重和终身学习。其主要框架为3个维度、14条具体指标以及61个观测点,涵盖了专业理念与师德(职业理解与认同、对学生的态度和行为、教育教学的态度和行为、个人修养和行为)、专业知识(教育知识、学科知识、学科教学知识、通识性知识)和专业能力(教学设计、教学实施、班级管理与教育活动、教育教学评价、沟通与合作、反思与发展)等。

其次,从量表的框架结构来看,尽管在不同的国家由于文化背景的差异,具体内容不尽相同,但三级指标体系的框架结构仍十分清晰。一级指标指向专业领域(主要是指将教师视为一个专业应当具备的基本知识和能力的分类领域),主要包括教师的专业知识、专业技能、专业情意。教师的专业知识和专业技能,关系到教师的教学能否有效促进学生成长。教师的专业情意,如专业道德和专业自主性,关系到教师是否具有终身发展的能力和潜质;二级指标是专业领域的概括性阐述,基本上能概括出整个教师专业评价标准所应该具备的内容,是对教师专业评价标准应然状态的陈述;三级指标是教师专业评价标准最细致的要求,具体化到可以进行测量和评价的程度,以此来判定教师是否达到了这个专业标准。以上文献分析为本研究编制《全日制教育硕士专业发展评价量表》奠定了理论基础。

基于以上对于国内外教师专业标准结构和维度的分析,结合全日制教育硕士课程计划和现行培养模式,初步专业提供论文写作和写作论文的服务,欢迎光临dylw.net构建了评价量表指标体系,见图1。

2 研究方法

2.1 问卷编制

1)进行文献检索。主要查阅了美国、英国和中国的教师专业发展评价标准及其它相关资料,并进行访谈和开放式问卷调查。在参考以上资料的基础上,对职前教师的学习和实习情况进行分析,初拟了《全日制教育硕士专业发展调查问卷》。

2)论证、修改初始问卷。请教师教育专家对初始问卷进行论证,就问卷内容与全日制教育硕士现状的符合程度及问卷的可理解性进行修改。利用初拟问卷对2011级专业硕士进行首轮问卷调查,收回问卷71份,使用项目分析和各题项信度检验删除不具有显著意义的题项,同时对问卷进行修订。

3)预试与定稿。将修订后的问卷通过网络平台发放给首都师范大学2010级和2009级教育硕士,回收问卷111份。根据统计分析结果,通过查阅文献和分析访谈记录,再次对问卷进行修订。最后形成的《全日制教育硕士专业发展调查问卷》由三个维度(教师专业情意、教师专业知识、教师专业能力)总共32个题项组成。其中,各维度的题项分布为:教师专业情意维度8个题项,教师专业知识维度9个题项,教师专业能力维度15个题项。

问卷采用李克特5点量表计分,要求被试从代表“完全不符合1”到“不太符合2”、“不确定3”、“基本符合4”和“完全符合5”中选择一个作答,其中选“1”得1分,选“2”得2分,以此类推。

2.2 研究对象

问卷样本取自首都师范大学全日制教育硕士。该校从2009年招收全日制教育硕士,是教育部指定的12所教育硕士教育试点单位之一。第一次预试选取2011级教育硕士71人为被试。第二次预试采用整群抽样的方法、网络问卷的方式,以2009~2011级教育硕士为被试,最后实得有效问卷111份,上述两次问卷均用于量表题项的筛选。

正式施测的对象为152名2012级全日制教育硕士,同样采用网络平台的方式发放,最后实得有效问卷136份,有效问卷回收率89%。施测对象已经经 过了半年多的教师教育专业课学习,即将进入中学进行为期两周的见习。从被调查对象本科阶段学校类别来看,非师范类学校的学生占27%,师范类学校的学生占73%;从调查对象的生源地来看,37%来自北京本地,63%来自京外;从性别分布来看,男生占14%,女生占86%;从专业分布来看(见图2),有学科教学(语文、数学、英语、物理、化学、生物、地理、历史、思想政治、音乐、美术)、现代技术教育、学前教育、教育管理和心理健康教育,其中学科方向数学、语文和英语所占比例较大,分别为16%、15%、12%。

2.3 数据统计

原始数据录入分析采用Excel,量表的项目分析和探索性因子分析采用SPSS16.0统计软件。

3 研究结果

3.1 量表信度检验

用“Cronbach ”系数检验量表的内在信度。检测到量表的科隆巴赫 系数为0.936,维度1的 系数为0.788,维度2为0.854,维度3为0.923,表明分量表和总量表均具有很好的信度;以上数据说明自编量表有较好的信度和较高的内在一致性。

3.2 量表效度检验

1)探索性因子分析。本研究采用因素分析的方法,对《全日制教育硕士专业发展问卷》的结构效度进行考察。Bartlett's的球形的 值为2.401€?0-3(<0.001),极其显著,说明变量间有共同因素存在,适合做因素分析。取样的适当性KMO的指标为0.894,表明数据样本适合做因素分析。在限定因素层面的前提下,以主成分专业提供论文写作和写作论文的服务,欢迎光临dylw.net分析法(PC)对数据进行因素分析,提取公共因素(特征值大于1),求得初始负荷矩阵,再用最大方差斜交旋转法求得最终的因素负荷矩阵(见表1)。表1表明,因子对方差的总解释量为51.03%,因子负荷范围为0.465~0.760,可见所提取的因子可以很好地反映各原始变量的信息,和事先三维度(教师专业知识、教师专业能力和教师专业情意)理论假设吻合。

2)内部相关分析。本研究使用多因素方差分析法对全日制教育硕士专业发展评价量表各维度以及各维度与总分之间的相关性进行分析,来检验量表的结构效度,总量表与三个维度得分之间以及各维度间的相关系数分析结果见表2。

表2 量表总分与三个维度得分之间 以及各维度的相关系数(=136)

教师专业知识 教师专业能力 教师专业情意

教师专业知识 1

教师专业能力 0.380** 1

教师专业情意 0.493** 0.723** 1

教师专业发展 0.672** 0.857** 0.938**

** 表示所有相关系数均达到0.01的显著水平

表2表明,各维度与总分之间的相关系数在0.672~0.938之间,属于中高度相关,表明自编量表各维度评测的构念与总量表评测的构念效度比较一致,但也还有一定的区别。各维度之间的相互相关系数介于0.380~0.723之间,属于中低度相关,表明量表的各维度间的区别效度较为合理,各维度所评测的构念效度在大方向上较为一致,且各维度之间又可区别,因此,自编量表的结构非常符合量表的编制要求。

3.3 全日制教育硕士专业发展的差异分析

依据量表的计分方式,得分愈高表示其发展水平愈好。本研究全体样本得分的平均值为3.798,三个维度得分的平均值在3.364~4.235之间,总量表和各个维度获得的均值都显著高于常数3(见表3),说明全日制教育硕士专业发展情况普遍较好,量表各维度的得分均值也较好,其得分依高低顺序排列为教师专业情意(4.235)、教师专业能力(3.825)和教师专业知识(3.364)。

1)地区差异性分析。本研究按生源地对全日制教育硕士的专业发展进行了比较分析。数据表明,北京生源和非北京生源在教师的专业情意维度(=0.014,>0.05)、教师专业知识维度(=0.199,>0.05)、教师专业能力维度(=0.059,>0.05)不存在显著差异。教师专业发展维度(=0.079,0.05)也不存在显著差异(见表3)。

表3 全日制教育硕士专业发展地区差异分析表

北京 京外

维度 值 值

平均数 标准差 平均数 标准差

教师专业情意 4.235 0.490 4.281 0.489 0.014 0.591

教师专业知识 3.专业提供论文写作和写作论文的服务,欢迎光临dylw.net364 0.561 3.406 0.607 0.199 0.686

教师专业能力 3.825 0.473 3.857 0.569 0.059 0.744

教师专业发展 3.798 0.428 3.836 0.477 0.079 0.640

2)性别差异性分析。将男生和女生的专业发展情况进行差异显著性检验发现,男女生的专业发展水平有显著差异,女生的专业发展状况显著高于男生(见表4)。女生在教师专业情意维度(=0.433,<0.01)、教师专业知识维度(=1.642,<0.05)、教师专业能力维度(=1.570,<0.05)、教师专业发展维度(=2.595,<0.01)得分均显著高于男生。

表4 全日制教育硕士专业发展性别差异分析表

男生 女生

维度 值 值

平均数 标准差 平均数 标准差

教师专业情意 3.980 0.524 4.31 0.468 0.433 0.006

教师专业知识 3.075 0.747 3.44 0.545 1.642 0.011

教师专业能力 3.607 0.749 3.88 0.484 1.570 0.036

教师专业发展 3.551 0.570 3.866 0.425 2.595 0.005

3)本科就读院校类别差异性分析。本研究还对全日制教育硕士本科是否就读师范类院校进行了显著性检验。数据分析表明,在教师专业情意维度(=0.440,=0.718>0.05)、教师专业能力维度(=2.820,=0.221>0.05),两类学生不存在显著性差异,但在教师专业知识维度(=0.403,0.000<0.05)和总量表(=1.152,=0.043<0.05)这两个维度存在显著性差异。从平均值来看,本科就读师范类院校的学生得分明显高于本科非师范类的学生(见表5)。

表5 全日制教育硕士本科就读院校类别差异性分析表

师范 非师范

维度 值 值

平均数 标准差 平均数 标准差

教师专业情意 4.273 3.827 4.240 4.159 0.440 0.718

教师专业知识 3.497 4.747 3.105 5.878 0.403 0.000

教师专业能力 3.879 7.155 3.753 9.952 2.820 0.221

教师专业发展 3.870 13.888 3.692 16.103 1.152 0.043

3.4 讨论

1)全日制教育硕士专业发展评价量表的结构。本量表的理论结构主要参照了美国、英国和中国的教师专业发展标准中的三层面结构理论,维度和题项部 分来自与专家学者、一线教师和专业硕士的访谈分析。依据初测后项目分析结果,经过两轮修改,确定正式量表包括3个维度、32个题项。初始量表中很多来自国外专业评价标准的题项或者被删除或者被修改。量表中原有40个题项,根据项目分析结果,删除了1个不具专业提供论文写作和写作论文的服务,欢迎光临dylw.net有显著性差异的题项,将剩余的39道题项逐项进行信度检验,去除信度系数较低的题项后,进行探索性因子分析,保留的32道题项与研究的三维度理论假设吻合,因此正式量表由32道题项组成。数据验证还发现,本量表的三因子结构中各因子所属的题项还不够均衡,需要在进一步的研究中进行调整和修正。

2)全日制教育硕士专业发展评价量表的特点。经过查阅文献后发现,尽管国外学者研制、修订和发展了很多科学实用的教师专业发展评价量表,但研究对象大多集中于在职教师,用于测量全日制教育硕士培养成效的量表比较少。本研究根据国内外的教师专业评价标准,编制了《全日制教育硕士专业发展评价量表》,构建了比较完善的全日制教育硕士专业发展评价指标体系,为测评职前教师的培养成效提供了一套简单实用的评价工具。本研究从理论构想到量表的每一次设计、施测和修订,都经过了研究者、教师教育专家和一线教师的充分讨论。理论与实践的融合、数据统计与质性分析的统一,是本量表的特色之一。

3)全日制教育硕士专业发展情况分析。本研究正式施测的对象为首都师范大学2012级152名全日制教育硕士,测试借助学校网络平台发放问卷,最后实得有效问卷136份,有效问卷回收率89%。研究发现,首都师范大学全日制教育硕士的教师专业情意、专业知识、专业能力均得到较好发展,其中教师专业能力发展好于专业情意、专业知识。说明半年的专业学位研究生教育取得了良好的效果,充分显示了师范大学在教师专业化培养中的优势。表3表明,生源地几乎不影响全日制教育硕士专业发展。表4表明,男生和女生的专业发展在各个维度都存在显著差异,女生得分明显高于男生,这可能与师范大学男女生问卷对象数量悬殊有关系,也有可能是女生的学习态度好于男生,这有待在今后的研究中进一步证实。表5表明,全日制教育硕士本科阶段是否就读师范类院校对学生的专业发展存在影响。虽然专业情意和专业能力维度基本没有差异,但是在专业知识维度,本科就读师范类院校的学生明显好于本科非师范类的学生。从专业发展总体维度来看,女生的专业发展总体水平优于男生,本科就读师范类院校的学生专业发展总体水平明显优于非师范类院校毕业的学生。

4 结论

本研究通过全面系统的文献研究、广泛深入的问卷访谈、科学严密的数据统计等环节构建了《全日制教育硕士专业发展评价量表》。该量表从教师专业情意、专业知识、教师专业能力3个维度的32个测点评估全日制教育硕士的专业发展水平,具有较高的信度和效度,是当前评估职前教师的专业发展水平简单而有效的评价工具,具有一定的理论价值和应用前景。

参考文献

[1]朱旭东.教师教育标准体系研究[M],北京:北京师范大学出版社,2011.

教育测量与评价论文第7篇

关键词:思想道德;素质;测评;评价

中图分类号:G643.1 文献标志码:A 文章编号:1674-9324(2012)04-0244-02

一般地,研究生德育测评应该包括对研究生个体思想道德素质、德育工作部门、德育工作者的考评,不仅包括对德育效果的考评,也包括对德育工作过程的考评。但在目前在笔者能搜集到的资料中,这类文献并不多见,零零散散地见之于一些不入流的报刊和书籍中,现撷取部分内容加以介绍。

一、关于德育测评体系及其构建的研究

刘顺厚[1]在对研究生德育绩效进行研究的基础上,构建了研究生德育绩效评价体系,包括构建的意义、要素、指标体系以及对应注意的几个问题进行了探索。[1]戴艳军等人[2]探讨了构建研究生德育评价指标体系的重要意义、基本原则、基本结构及其操作中应当注意的若干问题。赵鹏飞等人[3]认为建立评价指标体系是比较科学、合理的。但在文章中,无论是指标内容还是权重的赋予,都缺乏合理的解释和依据,令人无法信服。类似文章还有《高校学生思想品德行为量化测评浅探》[4]等。有学者还试图对思想道德测评体系进行构建,如周甜等人[5]依据德育目标的要求和研究生健康发展的需要,建立了由思想、政治、品德三维度组成的立体结构以及它们各自所分解的12条项目和相关细目组成的研究生思想政治、品德考评的指标体系。考评方式主要为研究生自评、年级同学间互评、教师的师评这三个基本途径,然后根据一定的权重进行研究生思想政治、品德的综合考评。许二平等人[6]在对高校现行的大学生综合测评制度进行调查和分析后,提出应该把素质测评分为基础素质和发展性素质两方面,采用平时考核、自评、互评、师评的方法,并提到“德”素质测评由“纪实”和“评议”两部分组成。

二、关于研究生德育工作的研究

施昌海[7]针对研究生德育工作评估方法的复杂性,从选择评估内容、采集评估信息和确定评估内容等方面研究了相应的对策:抓住基本要素,坚持综合评估与单项评估相结合的方法;选准基本渠道,坚持内部评价与外部评价相结合的方法;注重客观公正,坚持量化评价与定性分析相结合的方法。崔连昌[8]对研究生德育工作实施评估进行了思考,对评估工作的组织实施、评估工作成果的推广以及开展评估工作应注意的问题等方面进行了比较深入的探讨。他强调:要认真把握好评估的指导思想,处理好专项和整体评估的关系,要正确看待评估结果和平时工作。另有学者[9]针对应该如何建立高校德育工作评估体系以及高校德育评估的要素构成等问题进行了思考。有关研究生德育工作开展及其途径的研究比较多,有学者[10]讨论了如何利用校报独特的思想政治教育优势对大学生进行思想政治教育;有学者[11]认为应该通过党建工作来促进德育工作。丁江、丁鸣[12]、赵莹[13]和王玉芝[14]等人从发挥导师的作用来探讨促进大学生德育工作的方法;罗玉华[15]从家庭教育的角度出发;张富良[16]探讨了新形势下高校社团在研究生德育教育中的优势,体现的德育教育内容及其重要作用和意义。

三、关于研究生思想道德素质测评方法的研究

学者们对研究生思想道德素质测评方法的讨论比较少,更多的是对大学生的探讨,且多是在讨论综合素质测评方面时有所提及。冯瑞明等人在对大学生综合素质测评存在的问题进行分析时提到,“德育评价完全量化缺乏科学性。‘品德竟然也可以用分数来衡量,并且可以精确到小数点以后的几位数’这是不可能的。一个人的品德是很难量化的。”[17]裴劲松等人认为,现行研究生综合素质测评中存在这样一些问题:“思想考核公正性差,时效性较差。在对思想方面进行考核时,缺少具体的要素限定与分析,定量分析方法水平较低,部分评估环节过于主观,影响了评价的公正性和科学性,容易出现争议和平均主义,而且评价大多是期末时进行,评价者很难准确记得被评价者长时间的表现,都是凭模糊印象打分,时效性很差。”[18]对此,他们主张通过理论创新来提高现行研究生综合素质测评理论。

四、关于研究生思想状况、特点的研究

黄艳秋[19]分析了研究生在思想政治、道德、人生观、成才意识、心理素质等方面的特点,包括有较强的自尊心、压力感,最高需要是事业的成功,价值观趋于注重实际,偏重物质利益,强调自我价值,呈多元化发展。在成才方面,他们更看重的是个人的自我奋斗,但是这在传统观念中与自私自利等同。还有以个案调查来研究思想的。如管晓风[20]是以江西师范大学为个案进行研究;戴亦军等人[21]是以教育硕士专业学生为个案进行研究;陆永忠等人[22]对软件工程专业的研究生进行思想教育问卷调查;等等。这些研究为讨论现行研究生思想道德素质测评方案是否合理提供了重要的依据,使讨论可以站在研究生的立场上,从其特殊的思想状况、特点来着手研究这一特殊群体的思想道德素质应该如何测评。

五、对现有研究的评述

有关研究生思想道德素质方面的研究有很多,但大多是集中在对研究生德育工作的开展上,包括从各方面提出如何改进和加强德育工作的文章,如社团建设、党建工作、导师作用、家庭教育、校报的思想政治教育优势等;有对研究生德育现状的调查,包括从研究生整体调查、分学校调查、分专业、分学科性质调查等,然后给出对策建议;有对德育工作的现状了解与思考建议等。构建研究生德育理论体系的学位论文,有思想道德对策研究、思想政治教育工作存在的问题及对策,以及对研究生德育的重要性、研究生的思想政治特点的探讨。德育测评的研究在我国已经广泛开展起来了,但是针对高校大学生和研究生的德育测评研究还比较少。相比本科生而言,关于研究生德育测评的研究更少,只是散见于对大学生的研究中,且对思想道德素质测评的研究多散见于有关综合素质测评的文章中,极少有专门的文章是针对思想道德素质测评的,且实证调研方面的较少。因此笔者认为,有必要针对研究生的特点展开专门的实证研究。

现有研究大多都是从理论等出发来研究的,鲜有从评价学的角度来探讨研究生思想道德素质如何提高,德育工作应该如何完善,期待有新的方法来推动研究生思想道德素质测评工作。

参考文献:

[1]刘顺厚.研究生德育绩效及其评价[D].上海:复旦大学,2004:16.

[2]李志强.谈研究生德育评价指标体系的构建[J].学位与研究生教育,2003,(4).

[3]赵鹏飞,陈家润,原刃锋.大学生德育素质量化考评之研究[J].湖北汽车工业学院学报,2003,(6).

[4]林雷.高校学生思想品德行为量化测评浅探[J].南京人口管理干部学院学报,2001,(6).

[5]周甜,张陟遥.构建研究生思想政治品德考评指标体系[J].中国青年政治学院学报,2001,(1).

[6]许二平,姬旺华.对高校现行的大学生综合测评制度的调查分析[J].河南中医学院学报,2005,(1).

[7]施昌海.研究生德育工作评估方法探析[J].科学学与科学技术管理,2003,(3).

[8]崔连昌.对研究生德育工作评估的若干思考[J].江苏高教,2001,(6).

[9]冯翠玲,李义丹.高等院校德育评估研究[J].天津大学学报,2001,(9).

[10]曹启娥.论校报独特的思想政治教育优势[J].思想政治教育,2008,(6).

[11]胡章萍.加强研究生党建推进研究生德育工作[J].安徽农业大学学报,2001,(3).

[12]丁江,丁鸣.发挥导师育人优势加强研究生德育工作[J].合肥工业大学学报,2005,(2).

[13]赵莹.导师负责制下研究生德育工作探究[J].江西教育学院学报,2005,(8).

[14]王玉芝.实施德育导师制探索研究生思想教育新路[J].中国高等教育,1999,(21).

[15]罗玉华.论家庭教育对大学生诚信品质培育的影响[J].思想政治教育,2008,(6).

[16]张富良.研究生德育教育的“第二课堂”――高校社团[J].中国特色社会主义研究,2002,(3).

[17]冯瑞明,侯铁虎.大学生综合素质测评存在的问题及改进[J].思想教育研究,2006,(3):46.

[18]裴劲松,张影强.高校研究生综合素质测评理论探讨[J].中国高教研究,2006,(9):25.

[19]黄艳秋.研究生思想特点研究[J].思想教育研究,1998,(1).

[20]管晓风.当代研究生思想政治教育现状及对策――以江西师范大学为个案[J].山西财经大学学报(高等教育版),2005,(12).

[21]戴亦军,刘四二.教育硕士专业学位研究生思想道德特点及其管理机制初探[J].学位与研究生教育,2000,(4).

教育测量与评价论文第8篇

[关键词] 研究型德育;主体间理论;实验设计

【中图分类号】 G621 【文献标识码】 A 【文章编号】 1007-4244(2014)03-051-1

近年来,作为培养学生自主研究能力、自主创新能力并有利于提高学生实践能力的研究型教学模式,已越来越突显其优越性,德育课程与研究型教学模式相结合,将有助于学生的全面发展,也将成为各级各类学校培养创新型人才的必然选择。

一、实验意义

研究型教学注重对学生的人格进行培养,注重知识探索的过程,采用多种教学方法并配合多种教学环境,通过学生互助互动,利用图书馆、社区等相关资源,师生在合作与探讨中共同完成教学任务。其意义主要表现在:第一,促进学生的全面发展与健康成长。第二,提高教师的教学能力与理论水平。第三,改善传统德育课程单纯理论灌输的现状进而提升教学质量。

二、实验理论依据和目的

研究型德育课程教学方法既符合研究型教学模式的要求,又符合德育课程的特点,其理论依据主要主要是:主体间理论认为,在教学过程中,师生之间的关系应该是主体间的关系,教师与学生的主体性是平等的。实验目的是:研究型德育课程教学实验的目的主要有三点:第一,促进学生的品德发展;第二,提升德育教师的教学能力与理论素养;第三,改革当前的德育课程教学方式。

三、实验内容

研究型德育课程依赖于学生知识的积累,因此在小学五年级以上的学生中开展研较为合适,针对教材中的内容,充分考虑学生的特点来设计教学过程,在课程的设计与实施中,应注意:第一,运用“小组工作”等创新性教学方式。为学生创设课堂上的实践环境,激发学生的主体性、参与性以及创造性,促使学生们自行发现问题,分析问题,解决问题,加强互动互助。第二,建立主体间性的师生关系。在研究型德育课程中,教师是教的主体,学生是学的主体,建立主体间性师生关系,充分发挥学生自主学习的主观能动性。第三,培养学生自主探究意识和能力。要求学生借助已有的知识和能力来进行自主探究,将学生分组,让学生自主选择研究题目、收集材料、合作开展研究活动。第四,使家长、学校、社区等课堂以外的因素积极配合德育工作的开展。第五,注重过程性评价与描述性评价。注重过程性评价,并用描述性评价进行表达,结合传统的笔试考试。

(一)实验设计。实验假设:研究型德育课程教学方式显著优于传统的理论灌输式教学方式,更适应小学高年级学生发展的需要,更能促进学生品德的健康发展。

实验被试:根据各小学的水平与特色不同,在全市范围内选取样本学校进行实验合作,在每一所学校的5年级和6年级中,选择两个基本情况相近的班级作为被试参加实验,即A班和B班。选定班级的主要参考指标包括:学生品德发展水平相近,学习成绩的总成绩、平均成绩相近,学生人数、男女比例相当。

实验变量:

自变量:德育课程教学方法X(新方法――X1,传统方法――X2)

因变量:德育课程教学效果Y

无关变量:学生原有的品德水平

实验控制:为避免无关变量的影响,故采用轮组实验法,实验之初,别在A、B两班进行德育课程教学,A班运用新的教学方法(X1),B班运用传统教学方法(X2),在学期末时分别对两班的教学效果进行测试,A班测试结果为Y1,B班测试结果为Y2,在第二学期时,改为A班运用传统的教学方法(X2)进行德育课程教学,B班运用新的教学方法(X1)进行德育课程教学,期末时再对两班的教学效果进行测试,A班测试结果为Y3,B班测试结果为Y4,则有:

Y1+Y4=μ1 Y2+Y3=μ2

对比μ1和μ2,并进行右侧t检验,可得出统计决断。

(二)实验测评。实验的前、中、后均需要进行测评,实验的前测是选定实验班与对照班,通过历次考试的情况进行筛选,选择学习成绩相近、人数与男女比例相当、品德发展水平相近的班级参加实验。实验开展一学期后,对实验班和对照班进行一次测评,测评的内容包括:学生情商发展水平,品德知识点掌握情况,各门学业成绩发展水平,学生的创新性水平以及每一个学生所获得的描述性评价。中期测评结束以后继续开展实验,第二学期结束后进行实验后测评,与中期测评的方法一致。

(三)实验注意事项。在教学过程中应该提升过程性评价与描述性评价在整个评价体系中所占的比例。在研究型德育课程中,由于学生自主进行研究与实践,因此研究结果未必是教师预设的“标准答案”,对学生进行过程性评价,描述性评价,立体式评价多方参与、互相评价,弱化学生之间的横向对比,加强个体发展的纵向对比,因材施评,即时评价,定期汇总,以促进学生的健康发展。

实验过程中的两次测评之间要有梯度,且不能出现重复性试题。尽量避免与其他教育实验产生交叉影响。

四、结论

研究型德育课程在理论上具备多种优势,应用研究较少。因此进行研究型德育课程教学实验则具有重要意义,需要教育工作者踊跃的投入,以检验有关论证,并总结教训,弥补不足,最终使学生获得全面发展。

参考文献:

[1]郝文武.教育:主体间的指导学习――学习化社会的教育本质新概念[J].教育研究,2003,(3):14-18.

[2]赵微.以学科为载体的中学英语教学改革实验研究设计[J].当代教师教育,2011,(12):41-49.

[3]张京京,张原瑞.研究型德育课程教学方式在小学高年级的应用[J].中小学教师培训,2012,(9):58-61.