文档库 最新最全的文档下载
当前位置:文档库 › 教育测量与评价考试重点版

教育测量与评价考试重点版

教育测量与评价考试重点版
教育测量与评价考试重点版

课程性质和教学要求

课程的性质:《教育测量与评价》是教育测量学与教育评价学内容的整合并侧重于教育测量的一门综合性教育课程,它着力探讨对教育教学效果进行测量、评价的原理和方法,是一门带有综合性、技术性、实践性、应用性等特征的应用性学科,是实现教育科学研究与教育管理科学化所必须借助的一门科学,也是教育学专业和小学教育专业所开设的一门必修专业基础课程。

教学目标和要求:理解《教育测量与评价》的基本概念、原理和方法,能正确使用各类标准化的教育测验、会作测验质量分析、能正确解释分数的含义,并学会运用这些知识,对学校教育、教学和研究实践中的实际问题,做出比较正确与合理的判断和评价,以促进教育管理现代化、教育研究科学化。

第一章教育测量与评价的学科发展

教育测量与评价的基本问题

教育测量与评价的发展历史

教育测量与评价的学科地位和作用

1.测量的定义

史蒂文斯曾对测量作出以下定义:“就其广义来说,测量是按照法则给事物指派数字。”

我国有些学者认为:“测量是对客观事物进行某种数量化的测定”,“测量是按照一定的法则,用数字方式对事物的属性进行描述的过程”。

本书的观点:从广义上讲,测量就是根据某些法则与程序,用数字对事物在量上的规定性予以确定和描述的过程。

从以上对测量所下的各种定义可以看出,这种对事物进行区分的过程,必须是

按照一定法则的,区分的结果必须能够用数字的方式进行描述的。

2.测量的要素

(1)测量的量具

测量的量具是指依据某些科学原理和法则,发展出合适的量具或制定出科学的测量方案。(2)测量的单位

不同的测量所采用的单位是不同的。

理想的测量单位必须符合两个条件:①要有确定的意义;②要有相等的价值。教育测量的单位不够完善,既无统一的单位,也不符合等距的要求。

(3)测量的参照点

量的参照点系测量的起点。要确定事物的量,必须有一个测量的起点,这个起点就叫做测量的参照点。

参照点有两种类型:①绝对参照点(绝对零点);②相对参照点(相对零点)。理想的参照点是绝对参照点,但教育测量中很难找到绝对零点,多采用人为指定的相对零点。

3.教育测量的定义与特点

教育测量的定义

教育测量,就是针对学校教育影响下学生各方面的发展,侧重从量的规定性上予以确定和描述的过程。

教育测量的特点

(1)本书的观点:

①间接性和推断性;

②测量对象的模糊性和测量误差的不可避免性;

③量表具有多样性,结果具有相对抽象性。

(2)其他的观点:

有人概括为:①间接性;②相对性。(金瑜)

有人概括为:①间接性;②相对性;③客观性。(郑日昌)

有人概括为:①间接性;②不确定性;③明确的目的性。(朱德全、宋乃庆)

4.量表及其种类

量表的概念

量表(量尺)是指确定了测量单位和参照点并具有取值系统的测量工具。

量表的类型

由于事物的属性(特征)不同,以及所制定的规则不同,致使用数的属性来描述事物属性(特征)所达到的程度不同,这就产生了不同测量水平的问题。

史蒂文斯根据对测量结果数量化描述的不同水平,将测量分成四种不同水平:称名测量、顺序测量、等距测量、比率测量。这四种不同水平的测量产生了相应的四种类型的量表。

5.称名量表和顺序量表

称名量表(命名量表或名称量表或类别量表)

称名量表是最低水平的测量量表,它只是用数字代表事物或用数字对事物进行分类。在这种情况下,数字只是事物的符号,而没有任何数量的意义。

适合于对称名量表进行统计分析的统计方法有百分比、次数、众数和χ2 检验。顺序量表(等级量表)

顺序量表是次低水平的测量量表,它不仅能够指代事物类别,而且能够表明不

同类别的大小、等级或事物具有某种特征的程度。在顺序量表中,数字只表示等级、大小和程度的顺序,它既没有相等的单位,也没有绝对的零点。

适合于对顺序量表进行统计分析的方法有中数、百分位数、等级相关系数和肯德尔和谐系数等。

6.等距量表和比率量表

等距量表

等距量表是较高水平的测量量表,它不仅能够指代事物的类别、等级,而且具有相等的单位。

适合于对等距量表进行统计分析的方法有平均数、标准差、积差相关系数以及t 检验和F检验。

比率量表(等比量表)

比率量表是最高水平的测量量表,它除了具有类别、等级、等距的特征外,还具有绝对零点。

适合于对比率量表进行统计分析的方法除了与等距量表相同外,还有几何平均数、变异系数。

7.教育测量属于哪一种水平的测量,为什么?

答:(1)教育测量属于顺序测量的水平。

(2)①从所使用的参照点来说,教育测量领域的参照点均为相对参照点;

②从所使用的单位来说,教育测量的单位远没有其他测量的单位成熟和完善,

既无统一的单位,也不符合等距的要求。

8.教育评价的概念(如何理解“教育评价”的含义?)

评价的含义

广义的讲,评价泛指衡量、判断人物或事物的价值。

教育评价的定义

对于什么是教育评价,专家、学者至今没有一个统一的认识。但具有代表性的观点有以下几种:

格兰朗德:评价是为了确定学生达到教学目标的程度,收集、分析和解释信息的系统过程;评价包括对学生的定量描述和定性描述两方面。

斯塔费尔比姆:评价是一种规定、获取和提供叙述性和判断性的过程。这些信息涉及研究对象的目标、设计、实施和影响的价值及优缺点,以便指导如何决策、满足教学效能核定的需要,并增加对研究对象的了解。

美国教育评价标准委员会:评价是某些现象的价值如优缺点的系统调查,为教育决策提供依据的过程。

泰勒:评价评价的过程在本质上是确定课程和教学大纲在实际上实现教育目标的程度的过程。

德雷斯:所谓评价,就是决定某种活动、目的及程序的价值的过程。

桥本重治:评价是与教育的目标和价值有明确关系的概念,是按照教育目标和价值观对学生的学习成果及教育计划的效果等进行测量的过程。

布鲁姆:评价乃是系统地收集证据用以确定学习者实际上是否发生某些变化,确定学生个体变化的数量或程度。

我国学者黄光扬:教育评价是指按照一定的价值标准和教育目标,利用测量和非测量的种种方法系统地收集资料信息对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断,并为教育决策提供依据的过程。

从上述对“评价”概念在教育教学活动情境下的各种描述中不难发现,教育评价包含以下几个共同的要点:

①强调以教育目标为标准的价值判断过程;

②强调运用多种方法系统收集资料和信息;

③教育评价的内容既要以是教育计划、也要以是学生的学习结果,也要以是某种教育现象、教学活动、教育目的或教育程序;

④强调为学生发展和教育决策服务。

9.教育测量与教育评价的关系

测量与评价既有联系又有区别。教育评价最根本的特征是做出价值判断。而教育测量过程的完结,在给出数量事实的描述与判断之后,不一定都要做出价值判断。从这个意义上说,教育测量可以为教育评价提供价值判断的基本数量事实,教育测量是教育评价的基础;而教育评价往往是教育测量过程的继续,是对测量结果的解释与应用,并朝着价值判断与释放教育功能的方向拓展。

10.思考题:教育测量与教育评价有何区别?

答: (1)教育评价最根本的特征是做出价值判断。而教育测量在给出数量事实的描述与判断之后,不一定都要做出价值判断。

(2)教育测量可以为教育评价提供价值判断的基本数量事实,教育测量是教育评价的基础;而教育评价往往是教育测量过程的待续,是对测量结果的解释与应用,并朝着价值判断与释放教育功能的方向拓展。

11.教育评价与教育评估的关系

教育评价与教育评估这两个概念既有联系又有区别。第一,英语词源不同(教育评价通常用“education evaluation”表示,教育评估通常用“educational

assessment”表示),其意义则多少有所差别;第二,源出相同(教育测量运动、美国着名的“八年研究”),它们肯定有想通与交叉之处;第三,汉语词义相近(“评估”一词,含有“评判”、“评量”、“估测”、“估算”等意思;教育评估可能有价值判断,也可能没有价值判断),它们在内容上有交叉,也有区别;

22.教育测量与评价的发展历史

(1)中国是考试制度的发源地

(2)中国科举制度的世界地位

(3)教育测量学科的诞生

(4)教育测量运动的蓬勃开展

(5)美国的“八年研究”是教育评价的催生剂

(6)教育测量与评价理论的发展

13.教育测量与评价的学科地位和作用

(1)教育测量与评价是现代教育科学研究的三大领域之一;

(2)教育测量与评价在教育改革中具有重要的作用;

(3)教育改革呼唤教育测量与评价更加科学化;

(4)教育测量与评价是教师的专业素养和能力。

第二章教育测量与评价的类型和功能

教育测量与评价的主要类型

教育测量与评价的主要功能

1.教育测量与评价的类型

1.按测量与评价在教学中运用的时机分类,教育测量与评价可分为:

(1)形成性测量与评价:形成性测量与评价是在教学活动过程中经常实施

的,其目的:其一,教师藉此获得教学过程中连续性的反馈,了解学生的学习效果、学习历程、学习特点、学习困难等信息,作为随时修正自己教学的参考;其二,学生根据反馈的结果获知自己学习后的表现情况,从而肯定或修正自己以后的学习方式。

(2)诊断性测量与评价:诊断性测量与评价是对经常表现出学习困难的学生所作的测量与评价,它的目的是对个人的问题行为及其原因进行诊断。诊断性测量与评价多半是在形成性测量与评价之后实施。

(3)终结性测量与评价:终结性测量与评价是用于教学结束后,其目的:其一,在教学目标之下,检查学生一学期的学业达到了什么样程度,从而判断教学效果的得失;其二,根据终结性测量与评价的结果,评定学生的学业成绩,并将评定结果通知学生家长或记入档案。

2.按解释测量结果或评价结果时的参照点分类,教育测量与评价可分为:

(1)常模参照测量与评价:常模参照测量与评价是将被试水平与测验常模相比较,以评价被试在团体中的相对地位的一种测量与评价类型。

(2)标准参照测量与评价(目标参照测量与评价):标准参照测量与评价是将被试的表现与既定的教育目标或行为标准相比较,以评价被试在多大程度上达到该标准。

(3)潜力参照测量与评价:潜力参照测量与评价是将被试实际水平与其自身潜在水平(潜力)相比较,以评价被试有无充分发挥自身潜力为目的。在强调人性化、动态化和个别化的现代教育测评潮流下,潜力参照测量与评价理应发挥更大的作用

3.按测量与评价被试行为表现的性质分类,教育测量与评价可分为:

(1)最佳行为测量与评价:最佳行为测量与评价是以测量最佳行为表现为目的。凡是以成就或能力的高低为评价基础的,都属于最佳行为测量与评价。

(2)典型行为测量与评价:典型行为测量与评价的目的不在测量与评价被试能力的高低,而是测量与评价其是否具备某种(或某些)典型行为。在这些测量过程,希望被试以其平常的典型状况来回答,无所谓正确与错误之分。在重视学生个性发展和全人教育的现代教育理念下,典型测量与评价的方法具有特殊的意义。

4.按测量与评价的内容分类,教育测量与评价可分为:

(1)智力测量与评价:智力测量与评价的目的在于测量被试的智力并对被试的智力发展水平和特点做出评价。

(2)能力倾向测量与评价:能力倾向测量与评价的目的在于测量与评价个人的潜在才能,预测个人的能力发展倾向。能力倾向测量与评价一般可分为两种:一种是关于一般能力倾向的测量与评价,旨在探测个人多方面的潜能;另一种是特殊能力倾向测量与评价,旨在探测个人某方面的特殊潜在能力。

(3)成就测量与评价:成就测量与评价的目的在于测量并评价个人在接受教育或训练后的成就。成就测量与评价有两种类型:一是学科成就测验,旨在测量与评价被试在某一科目上的学习成就;二是综合成就测验,旨在测量与评价被试在多个学科或综合学科上学习成就。

(4)人格测量与评价(个性测量与评价):人格测量与评价的目的在于测量与评价被试的人格心理特征,诸如气质、性格、兴趣、态度、动机、适应性等方面的心理特征。用于人格测量与评价的量具主要分为两类:一类是自陈人格问卷;另一类是投射测验。

5.按测量与评价的对象分类,教育测量与评价可分为:

(1)个别测量与评价:个别测量与评价是指同一主试在同一时间内只能测量一个被试。这种形式的测量与评价,主试对被试行为反应有较多的观察和控制机会,主试与被试有更多的交流,这可让主试获得更多的信息,也可以建立较融洽的主被试合作关系,有利于测量与评价的进行。但是个别测量与评价费时、费力,特别是主试必须经过严格的训练才能胜任。

(2)团体测量与评价:团体测量与评价是指在同一时间内由一位主试测量许多位被试。这种形式的测量与评价突出的优点是节省时间,可以在短时期内收集到大量的测量数据。但由于同一时间内接受测量的被试多,不易有效地控制被试的行为,容易产生测量误差,从而影响测量的信度和效度。

6.按测量与评价的材料(测验材料)分类,教育测量与评价可分为:

(1)文字测量与评价(文字测验、纸笔测验):文字测量与评价的测验内容是以文字的形式表现的,被试也用文字作答的一种测量与评价的方式。对于不同教育背景的被试,这种测量与评价的有效性将受到一定程度的影响。

(2)非文字测量与评价(非文字测验、操作测验):非文字测量与评价的测验内容是通过图形、仪器、工具、实物、模型等形式表现的,被试通过指认、手工操作向主试提供答案的一种测量与评价的方式。这种形式的测量与评价不受或较少受文化背景的影响与限制。

7.按测量与评价量具有的标准化程度分类,教育测量与评价可分为:

(1)标准化测量与评价(标准化测验):标准化测量与评价的测验是指由测量专家严格按照测验编制程序而精心编制的一种测验。通常标准化测验都具有一定的编制程序,包括试题的抽样,难度、区分度指标分析,明确的施测指导语和

施测程度,计分标准,解释分数的常模,以及信度、效度等指标资料。

(2)非标准化测量与评价:非标准化测量与评价的测验编制相对自由,没有严格按照测验编制程序进行。教师自编测验常由教师依照自己的教学需要和教学目标而自行编制的测验,是一种非标准化测验。

2.教育测量与评价的功能

(1)实现教育判断的功能

教育测量与评价的最基本、最原始、最现实、最普遍的功能,就是实现教育判断,具体来说就是实现测量评定、事实判断、价值判断、问题诊断和区分选拔等功能。(2)改进教师教学的功能

通过教育测量与评价的结果,教师能够了解学生的起点行为,作为改进教学、补救教与学的依据,确保教学目标的达到,从而充分发挥其改进教师教学的功能。(3)促进学生学习的功能

教育测量与评价具有激励学生的学习动机、帮助学生的记忆和促进迁移、促进学生自我评价等促进学生学习的功能。

(4)行使教育管理的功能

教育测量与评价具有控制、指挥、导向、计划、检查、考核、评估和监督等方面的作用,通过对教师、目标和过程等方面管理来行使其教育管理的功能。

第三章教育测量与评价的质量特性

教育测量与评价的信度

教育测量与评价的效度

教育测量与评价中项目的难度

教育测量与评价中项目的区分度

1.信度的意义

信度是指测量结果的稳定性程度,记为rXX 。换一句话说,信度是指用同一测量工具反复测量同一种物质对象所得多次测量结果间的一致性程度。

测验信度是对测验工具及其操作的整体质量的一种量度,是测验性能的重要质量指标。如果测验本身抗干扰能力强,测验实施过程各方面误差因素都控制得好,多次施测所得分数(测值)的一致性就高,那么测量信度高,人们在使用所得测值时就会感觉可靠。

2.信度的统计定义

定义1:信度是一个被测团体真分数方差与观察分数方差之比。即:rXX=σ2T / σ2X

定义2:信度是一个被试团体的真分数与观察分数的相关系数的平方。即:rXX=ρ2TX

定义3:信度是一个被试团体在测验X(A卷)上的观察分数与在测验X的任意一个“平

行测验” X′(B卷)上观察分数的相关系数。即:rXX= ρXX′3.重测信度(稳定性系数)

(1)重测信度是指用一个量表(测验或评价表)对同一组被施测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的相关系数。

(2)重测信度基本假设:某测验所要测量的潜在特质,短期内不会随着时间推移而改变。

(3)重测信度适用于异质性测验(一个测验包括几个不同的部分,这几个部分分别测量几个不同的心理特质,它们之间可能并不存在相关或相关较低),也适用于

速度测验和运动技能测验。

4.复本信度(等值性系数或等值稳定性系数)

(1)复本信度是指两个平行测验(在试题格式、题数、难度、指导语说明、施测要求等方面都相当,并且都用来测量相同潜在特质或属性,但试题又是不相同的测验)测量同一批被试所得结果的一致性程度,其大小等于同一批被试在两个复本测验上所得分数的相关系数。

(2)实施复本测验的方式:一是在同一个时间连续施测(此时所得的复本信度叫等值性系数),二是间隔一段时间后施测(此时所得复本信度叫等值稳定性系数)。

(3)使用复本信度首先要构造出两份或两份以上的真正的平行测验。这是一个很难达到的条件。另外,重测信度的一些不足,在复本信度中仍然存在,需要加以克服。

(4)复本信度不仅适用于难度测验,也是估计速度测验信度的好方法。

5.同质性信度的概念

(1)同质性信度(内部一致性信度)是指测验内部所有题目间的一致性程度。这里题目间的一致性含有两层意思:其一是指所有题目测的是同一种心理特质;其二是所有题目得分之间都具有较高的正相关。

(2)同质性信度的基本假设:当一个测验具有较高的同特性信度时,说明测验主要测的是某一单个心理特质,由于众多的题目测试了同一心理特质,那么实测结果就是该特质水平的反映。

(3)同质性信度不适用于异质测验和速度测验。

6.同质性信度的估计方法

(1)分半信度

分半信度指是的将一个测验分成对等的两半后,所有被试在这两半上所得分数的一致性程度。

分半信度的计算方法和等值复本信度的方法类似,只不过分半信度计算的是两个“半测验”上得分的相关系数,只是半个测验的信度,还必须用斯皮尔曼—布朗公式加以校正。

(2)库德-理查逊信度

该方法适合于测验题目全部为二分记分题的测验的内部一致性信度分析。常用的库德-理查逊公式有:

(3)克龙巴赫系数

当测验题型较多,并非都是二分记分题时,估计测验信度可采用克龙巴赫系数。其计算公式为:

(4)荷伊特信度

1941年荷伊特提出用方差分量比来估计测验内部一致性的方法,其估计值为:7.评分者信度

评分者信度的含义

评分者信度是指多个评分者给同一批人的答卷进行评分的一致性程度。

评分者信度的计算

(1)当评分者人数为两人时,评分者信度等于两个评分者给同一批被试的答卷所评分数的相关系数。依据数据形式,可采用不同的相关系数计算方法。

(2)当评分者人数多于两人时,评分者信度可用肯德尔和谐系数进行估计。8.标准参照测验的信度分析

(1)百分比一致性指标(PA)

百分比一致性指标是指同一测验或两平行测验先后两次施测,其对被试的分类结果一致的比例。其计算公式为:

(2)K一致性系数

K一致性系数是指实际被评定为一致的百分比与在理论上被评定为一致的最大可能次数百分比的比率。其计算公式:

(3)K2 指数

标准参照测验关注决断的可靠性,而这种决断显然与被试团体的平均水平密切相关。在考虑到这个因素的基础上,心理统计学家莱芬斯顿提出了K2指数作为考察标准参照测验信度的指标。其计算公式为:

9.测量标准误

测量标准误的含义

测量标准误是指测验中所得测值偏离真分数的程度,记为SE。

测量标准误与测验信度的关系

测量标准误的意义

测量标准误是反映测量结果精确性和可靠性的又一指标,同时也是人们正确解释测验分数的科学依据。

10.效度的概念

效度的意义

效度是指一个测验或量表实际能测出其所要测量的特性的程度。对这一概念,我们可以从以下几个方面来理解:

①效度始终是针对一定测量目的而言的;

②效度只有程度上的差异;

③效度是针对测量结果而言的;

④评价一个测量是否有效要多角度、多方面地收集证据。

效度的统计定义

效度可定义为目标真分数方差与观察分数方差之比:rXY=σ2V / σ2X 效度与信度的关系

(1)信度高是效度高的必要而非充分条件

(2)效度系数不会大于信度系数的平方根

11.如何理解“效度”的意义?

效度是指一个测验或量表实际能测出其所要测量的特性的程度。对这一概念,我们可以从以下几个方面来理解:

(1)效度始终是针对一定测量目的而言的;

(2)效度只有程度上的差异;

(3)效度是针对测量结果而言的;

(4)评价一个测量是否有效要多角度、多方面地收集证据。

12.内容效度

内容效度的含义及应用范围

内容效度是指测验题目样本对于应测内容与行为领域的代表性程度。如果是教学情境下的成就测验,那么其内容效度就是看测验题目样本能体现教学目标与教材要求的程度。

内容效度主要适用于教育测量(尤其是学业成就测验)的情境中,也适合于某些用于选拔和分类的职业测验,但不适合某些心理测验(如智力测验、人格测验)。

内容效度的分析方法

①逻辑分析的方法

内容效度的逻辑分析法,即依靠有关专家对测验题目与应测内容范围的吻合程度作出判断。

②内容效度的量化分析方法

该方法要求专家在仔细审阅测验目标的基础上,独立地对测验的每个题目作出判断:“该题目实际测到的内容与其欲测量的目标内容之间相关程度如何,并用四点量表(用完全无关、有点相关、相关较密切、完全相关来表示)来表示这种相关的程度大小”;当两位专家完成此项工作后,统计弱相关(完全无关、有点相关)、强相关(相关较密切、完全相关)的题目数,则此测验的内容效度系数为:内容效度系数 =D/(A+B+C+D)( D 表示两位专家都判定为强相关的题目数)

13.结构效度

结构效度的含义

结构效度是指一个测验或量表实际测到所要测量的理论结构(结构是指心理学或社会学上的一种理论构想或特质)的程度。

结构效度的验证一般步骤

①提出有关理论结构的说明,并据此设计测量用的试题;

②提出可以验证该理论结构是存在的假设说明;

③采用各种方法收集实际的资料,以验证第二步提出的假设的正确性;

④收集其他类型的辅助证据,淘汰与理论结构相反的试题,或是修正理论,并重复第二和第三步,直到下述的假设得到验证,即测验的结构效度获得支持为止。结构效度的验证方法

①测验内部寻找证据法

这种方法是通过研究测验内部结构来验证测验的结构效度。它主要包括内容效度、作答过程分析、测验的同质性和因素分析等四个方面。

②测验之间寻找证据法

这一方法的特点是同时考察两个或多个测验间的相互关系,从而来验证测验的结构效度。它包括相容效度、聚合效度、区分效度和“多种特质-多种方法矩阵法”等具体方法。

③考察测验的实证效度法

如果一个测验有实证效度,则可以拿该测验所预测的效标的性质与种类作为该测验的结构效度指标,至少可以从效标的性质与种类来推论测量的结构效度。主要方法有差异被试比较法和先后测试分析法。

14.试比较内容效度、结构效度、效标关联效度的异同?

相同点:三者都是作为检验测验有效程度的指标,都可以作为评价一个测验优劣的标准。

不同点:①考察的角度不同。内容效度是指测验题目样本对于应测内容与行为领域的代表性程度。结构效度是指一个测验或量表实际测到所要测量的理论结构(结构是指心理学或社会学上的一种理论构想或特质)的程度。效标关联效度是指一个测验对于处于特定情境中的个体行为进行预测时的有效性。

②应用的范围不同。内容效度主要适用于教育测量(尤其是学业成就测验)的情境中,也适合于某些用于选拔和分类的职业测验,但对于某些特质的心理测验(如智力测验、人格测验),内容效度并不适合。结构效度主要用于智力测验、人格测验等一些心理测验方面。效标关联效度适用于能够找到有效效标的测验,常

用的效标主要有:学业成就、等级评定、临床诊断、专门的训练成绩、实际的工作表现、对团体的区分能力以及其它现成的有效测验。

③确定的方法不同。内容效度确定的主要方法是逻辑分析法、量化分析法。结构效度确定的主要方法是测验内部寻找证据法、测验之间寻找证据法和考察测验的实证效度法;效标关联效度确定的主要方法有相关法、显着差异法、命中率。

15.难度的概念

题目或项目的难度,就是指被试完成题目或项目任务时所遇到的困难程度。定量刻画被试作答一个题目的困难程度的量数,就叫做题目的难度系数,也常称为难度值,用符号P表示。

16.难度系数的计算方法

(1)以全体被试得分率为难度系数

如果一个题目的难度大,则被试得高分的可能性小;反之,如果题目的难度小,则被试得高分的可能性就大。因此,用得分率可以作为难度系数的指标。其计算公式为:

如果题目是选择题的话,被试有可能猜对而得分,因此,对选择题的难度系数有人建议需用下面的公式进行校正:CP =(kP-1)/(k-1)

(2)以全体被试失分率为难度系数

直接建立在通过率基础上的难度系数,P 值越大试题越容易,P 值越小试题越难做。这与人们观念可能不一致,因此有人提议用失分率q 来表示难度,计算公式为:q = 1-P

(3)以两端组被试得分率的均值为难度系数

该方法是分别计算高分组被试和低分组被试的得分率,然后求取二者的平均值

作为难度系数,公式为: P =(PH+PL)/2

以两端组被试的得分率作为难度系数的具体计算步骤:

①按被试的总分,将全体被试从高到低进行排序;

②从高分往下找,找出高分组;由低分往上找,找出低分组。两组人数分别占总人数的27%;

③分别计算高分组、低分组的被试在该题目上的平均得分;

④代入公式,分别计算分组和低分组被试在同一个题目上的难度系数;

⑤把 PH 和 PL 代入公式 P =(PH+PL)/2 ,计算这个题目的难度系数。

17.难度的等距变换

用上述方法计算出来的难度系数,都属于顺序变量,不具有相等的单位。因此,通过 P 值的比较并不能客观指出难度之间差异大小,这对我们作进一步的难度分析带来了困难。

为了解决这个问题,人们常假设每个试题所要测量的潜在特质或能力是呈正态分布的,然后就可以根据正态分布曲线,将试题的难度值 P 作为正态曲线下的(概率)面积,转换成具有相等单位的等距量表,即 Z 分数(标准分数)。由于标准分数具有相等单位,属于等距量表。所以,用标准分数作为题目难度的指标,为进一步作难度分析带来了一些方便。

18.测验题目的恰当难度和恰当难度分布

测验由多个题目所组成,显然,所有这些题目的难度取值都应该力求恰当,而且这些题目分布状态也应合理。究竟怎样的题目难度与难度分布是合适的,这主要取决于测验的目的与性质。

教育测量与评价

教育测量与评价 文件编码(008-TTIG-UTITD-GKBTT-PUUTI-WYTUI-8256)

《教育测量与评价》习题(一)填空题 1. _桑代克_的论着《精神与社会测量导论》一书标志着教育测量理论的诞生,泰勒领导了着名的八年研究并提出“行为目标评价模式”,最早提出了教育评价的概念,被称为“当代教育评价之父”。 2. 按照测量的精确程度,教育测量量表从低级到高级分为称名量表、顺序量表、区间量表/等距量表和比率量表。 3. 某道论述题满分12分,所有考生在这道题上的平均得分为分,则此题的难度为。 4.教育基本理论研究、教育测量与评价科学研究以及教育发展理论研究已成为现代教育科学研究的三大领域。 5. 教学工作评价的内容包括对教师的备课、上课、批改作业、课外辅导、命题考试等教学工作基本环节的评价。 (二)判断题 (√)1. 测验的信度受许多因素的影响。一般来讲,增加测验的长度,可以提高试题取样的代表性,因而有助于提高测验的信度。 (√)2. 标准分数本身是关于原始分数的一种线性变换,因此,标准分数不改变原始分数的分布形态。 (×)3. 假如某学生在期中语文统考中卷面分数为85分,又知该学生所在年级中有60%的学生成绩低于85分,则该学生的百分等级为51。 (×)4. 等距变量具有等级变量的特征,要求连续数量之间的差距相等,亦即具有相等的单位。因此,等距变量可以作加减乘除运算。

(×)5. 教育评价的主要功能就是甄别和选拔,通过各个层次的教育评价可以监督教师的教学工作和学生的学习活动,确保学校教育教学工作的正常进行。 (√)6. 测验试题的难度影响着测验分数的分布。 (×)7. 现代测量理论是在经典测量理论的基础上发展起来的,修正了经典测量理论的不足,所以现代测量理论可以完全代替经典测量理论。 (√)8. 发展性教学评价认为面面俱到的课不是好课,只是“教教材”,没有“用教材教”的课也不是好课。 (三)简答题 1. 常见的指标权重分配方法有哪几种 【答题要点】:常见的指标权重分配方法包括:(1)关键特征调查法;(2)两两比较法;(3)专家评判平均法;(4)倍数比较法;(5)Q分类法。答题时一是要阐述清楚这五种方法各自的内涵是什么,二是简单说明这五种方法的操作步骤。 相关内容可参考第七章“制定教育评价表的一般方法和步骤”中第二节“教育评价表的构成及编制”。 2. 衡量测验质量的四个指标分别是什么 【答题要点】:(1)衡量测量质量的四个指标分别是信度、效度、难度和区分度。(2)在答案中需阐述清楚这四个指标分别的定义是什么。(3)一个良好的测验应该具备恰当的难度和区分度,具备较高的信度和效度。(4)指出这四个指标对于测量质量的意义,即前两个指标主要是对整个测验而言,后来两个指标主要是对测量的项目而言。 相关内容可参考第三章“教育测量与评价的质量特性”。 3. 在现代社会中,具有健康人格的学生具有哪些特征

大学《教育测量与评价》试题库及答案

瑞文测验中哪一项是适用于高智力成人的() 收藏 A. B 瑞文彩图推理测验 B. A 瑞文标准推理测验 C. D联合瑞文推理测验 D. C 瑞文高级推理测验 回答错误!正确答案: D 对人的智力进行的一种客观、标准化的度量,叫做()收藏 A. D 智力测验 B. B 情商 C. C 智力 D. A 能力 回答错误!正确答案: A WAIS 的计分是() 收藏 A. A 先计算标准分 B. B 先计算智商 C. D答对1题得1分 D. C原始分转化为标准二十分 回答错误!正确答案: D 测验所要达到的某种具体的目的,叫做() 收藏 A. B测验目标 B. D 行为目标 C. C 教学目标

A 教育目标 回答错误!正确答案: C 在评价对象的集合内选择一个或若干基准,各个评价对象和基准进行比较,叫做() 收藏 A. A 绝对评价法 B. C 教育评价方法 C. D 定量分析法 D. B 相对评价法 回答错误!正确答案: D 在编制试题时,题型的分类中填空题、改错题、名词解释、简答题都属于()收藏 A. B 选择型 B. D 常用题型 C. A 提供型 D. C 开放式 回答错误!正确答案: C WISC主要测验的年龄范围是() 收藏 A. B 6-16岁 B. D 4-75 C. A 4-6.5岁 D. C 16岁以上 回答错误!正确答案: A 忧郁、淡漠、悲观、思想与行动缓慢,分数太高可能会自杀。是哪种临床表现() 收藏

A 疑病 B. B 抑郁 C. D 精神病态 D. C 癔症 回答错误!正确答案: B 由反映评价对象内涵的指标集、评价标准和量化符号构成的是()收藏 A. B 模型 B. A 框架 C. D 体系 D. C 教育评价指标体系 回答错误!正确答案: D 以班级的平均成绩为标准对学生学习成绩进行的评价为() 收藏 A. B 相对评价 B. D 需要性的评价 C. C 比较性评价 D. A 绝对评价 回答错误!正确答案: A 我国教育工作者创造的认知领域目标分类法是() 收藏 A. C 五分法和四分法 B. B 三分法 C. A 六分法 D. D 二分法

教育测量与评价》作业

一、选择题(每题1分,共15题) 1、根据某些法则与程序,用数字对事物在量上的规定性予以确定和描述的过程,这一概念是(A ) A. 测量 B. 评价 C. 测验 D. 统计 2、衡量、判断人物或事物的价值,这一概念是(B ) A. 测量 B. 评价 C. 测验 D. 统计 3、被称为教育评价的催生剂的是美国的一项著名研究,它是(D ) A. 教育研究 B. 教育测量理论研究 C. 心理测验研究 D. 八年研究 4、于1975年成立的在开展教育评价的国际交流与协作过程中,最有影响力的协会是(B ) A. 国际教育成就评价协会 B. 国际教育评估协会 C. 国际教育评价协会 D. 国际教育成就评估协会 5、测量结果的稳定性程度是指(C ) A. 效度 B. 稳定性 C. 信度 D. 可信度 6、用同一个量表(测验或评价表)对同一组被试测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的相关系数,这一概念是(B ) A.复本信度 B. 重测信度 C. 同质性信度 D. 分半信度 7、一个测验或量表实际能测出其所要测量的特性的程度,这一概念是(A ) A. 效度 B. 稳定性 C. 信度 D. 可信度 8、一个测验对于处于特定情境中的个体行为进行预测时的有效性,这一概念是(C ) A.同质性信度 B.复本信度 C.效标关联效度 D.重测信度 9、衡量测量题目质量的两个重要指标是(B ) A.信度与区分度 B.效度与信度 C.难度与效度 D.难度与区分度 10、表示每项评价指标在指标体系中所占的重要性程度,并赋予相应的值,这一概念是(D) A.评价指标 B.评价标准 C.指标权数 D.指标权重 11、在评价指标拟定过程中,经常会将评价指标按照评价对象本身的逻辑结构逐级进行分解,把分解出来的主要因素作为评价指标的方法,这种方法是(C )

教育测量与评价教案

《数学教育测量与评价》教案第一章数学教育测量与评价的学科发展 [教学目的与要求]理解数学教育测量和教育评价的含义及二者之间的关系,了解数学教育测量与评价的主要发展历程、基础教育课程改革精神及对数学教育测量与评价的要求,认识数学教育测量与评价的学科地位和作用、数学教育测量与评价对教师职业专业化的重要性。 [重点与难点]重点:数学教育测量和教育评价的含义及二者之间的关系、数学教育测量与评价的学科地位和作用。难点:数学教育测量和教育评价的含义及二者之间的关系。 [教学时数]讲授2课时,课堂讨论、学生自主学习1课时 [教学方法与手段]课堂讲授、课堂讨论与学生自主学习相结合 第一节数学教育测量与评价的基本问题 一、数学教育测量与评价的含义 二、教育评价的基本问题 三、教育评价相关概念辨析 第二节数学教育测量与评价的发展历史 一、中国是考试制度的发源地 二、中国科举制度的世界地位 三、数学教育测量学科的诞生 四、数学教育测量运动的蓬勃开展 五、美国的“八年研究”是教育评价的催生剂 六、数学教育测量与评价理论的发展 第三节数学教育测量与评价的学科地位和作用 一、数学教育测量与评价是现代教育科学研究的三大领域之一 二、数学教育测量与评价在教育改革中具有重要的作用 三、教育改革呼唤数学教育测量与评价更加科学化 四、数学教育测量与评价是教师的专业素养和能力 [课堂训练、作业思考题] [1]数学教育测量与评价有什么联系与区别? [2]教育评价与教育评估有什么联系与区别? [3]在学科专业分类中,“数学教育测量与评价”放在哪一个类别中比较合适? [4]试分析一下,狭义、中义与广义的教育评价概念有何区别? [5]怎样使用数学教育测量与评价这个概念? [6]为什么说数学教育测量与评价在教育中有重要的作用?

教育测量与评价试题

西南大学教育学院 《教育测量与评价》课程试题【A】卷 阅卷须知:阅卷需用红色墨水笔书写,得分用阿拉伯数字写在每小题题号前,用正分表示,不得分则在题号前写0;大题得分登录在相对应的分数框内;统一命题的课程应当进行集体阅卷,流水作业;阅卷后需要进行复核,发现漏评漏记或总分统计错误应及时更正;对评定分数或统分记录进行修改时,修改人必须签名。 特别提醒:考生必须遵守课程考核纪律,违者将受到严肃处理 一、选择题(本大题共15小题,2分×15=30分) 1、考试制度的发源地是(),其中一个制度的建立对世界文化发展和考试制度的建立起过重要的影响 A、中国 B、美国 C、英国 D、日本 2、20世纪初,美国的教育测量运动轰轰烈烈的开展起来,美国的()是教育评价的催 生剂。 A、五年研究 B、六年研究 C、七年研究 D、八年研究 3、下面哪种教育测量与评价属于按测量与评价被试行为表现的性质分类的() A、智力测量与评价 B、典型行为测量与评价 C、能力倾向测量与评价 D、成就测量与评价 4、根据资料获得的时间不同及测验使用的目的不同,效标关联效度可以分为:() A、同时效度和结构效度 B、结构效度和预测效度

C、同时效度和预测效度 D、结构效度和内容效度 5、李秉德提出:“教育目标分类的三维结构模型”,下面()不属于三个维度之一。 A、教育目标的组成部分 B、学生的个性心理因素 C、学生的健康程度 D、各类组成的发展水平 6、以下关于测验常模的说法,错误的是() A、有代表性的样组 B、针对某种人群 C、根据整理统计来获得资料 D、是已知的、规定的数据 7、标准分数是以标准差为单位表示测验成绩与平均分数之间的距离,下列选项中,()不属于标准分数在我国高考中的试点应用 A、建立标准分数制度是高考标准化的重要环节 B、在高考中使用原始分数不具局限性 C、高考标准分数制度由常模量表分数、等值量表分数组成 D、高考标准分数有单科标准分数转换方法及高考综合分的转换方法 8、在以下标准参照测验的定性标准-测验内容领域规范模式中,()包括说明、实例指导与题目样本、内容范围、答案范围 A、汉布莱顿模式 B、美国IOX模式 C、英国GCSE模式 D、我国高中毕业会考标准的建立模式 9、教育测量与评价方案的可用性可以从()几个方面进行阐述。 A、科学性、公平性、稳定性、针对性、区分性、简洁性 B、科学性、公平性、可行性、针对性、区分性、简洁性 C、经济性、公平性、稳定性、针对性、区分性、简洁性 D、经济性、公平性、稳定性、针对性、区分性、简洁性 10、确定测验目标应该注意() A、大概分析课程目标 B、正确选择目标

2015教育测量与评价网络作业1

一、什么是教育测量?什么是教育评价? 答:教育测量:就是针对学校教育影响下学生各方面的发展,侧重从量的规定性上予以确定和描述的过程。 教育评价:按照一定的价值标准和教育目标,利用测量和非测量的种种方法系统地收集资料信息,对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断,并为教育决策提供依据的过程。 二、分别按教学运用的时机和解释结果的参照点,测量和评价可分为哪几个类别?分别是什么? 答:(1)按测评在教学中运用的时机分类:形成性测量与评价、诊断性测量与评价、终结性测量与评价。 (2)按解释测评结果时的参照点分类:常模参照测量与评价、标准参照测量与评价、潜力参照测量与评价。 三、某次高考模拟试卷高一的5名学生做所用时间分别为170、120、110、160、130分钟;高三的5名学生做所用时间分别为50、70、90、55、45分钟;问高一和高三哪一组离散程度大? 答:答:高一用时平均值:x1=(170+120+110+160+130)÷5=138 高三用时平均值:x2=(50+70+90+55+45)÷5=62 高一用时离差平方和:∑1 =(170-138)2+(120-138)2+(110-138) 2+(160-138) 2+(130-138)2= 1024+324+784+484+64=2680 高三用时离差平方和:∑2 =(50-62)2+(70-62)2+(90-62) 2+(55-62) 2+(45-62)2 =144+64+784+49+289=1330 高一用时标准差:S1=Sqrt(2680÷5) =23.15167 高三用时标准差:S2=Sqrt(1330÷5)=16.30950 两者对比,高三标准差比高一用时标准差差距较小所以高一用时离散程度较大。

教育测量与评价考试重点整理版,DOC

课程性质和教学要求 课程的性质:《教育测量与评价》是教育测量学与教育评价学内容的整合并侧重于教育测量的一门综合性教育课程,它着力探讨对教育教学效果进行测量、评价的原理和方法,是一门带有综合性、技术性、实践性、应用性等特征的应用性学科,是实现教育科学研究与教育管理科学化所必须借助的一门科学,也是教育学专业和小学教育专业所开设的一门必修专业基础课程。 教学目标和要求:理解《教育测量与评价》的基本概念、原理和方法,能正确使用各类标准化的教育测验、会作测验质量分析、能正确解释分数的含义,并学会运用这些知识,对学校教育、教学和研究实践中的实际问题,做出比较正确与合理的判断和评价,以促进教育管理现代化、教育研究科学化。 第一章教育测量与评价的学科发展 教育测量与评价的基本问题 教育测量与评价的发展历史 教育测量与评价的学科地位和作用 1.测量的定义 史蒂文斯曾对测量作出以下定义:“就其广义来说,测量是按照法则给事物指派数字。” 我国有些学者认为:“测量是对客观事物进行某种数量化的测定”,“测量是按照一定的法则,用数字方式对事物的属性进行描述的过程”。

本书的观点:从广义上讲,测量就是根据某些法则与程序,用数字对事物在量上的规定性予以确定和描述的过程。 从以上对测量所下的各种定义可以看出,这种对事物进行区分的过程,必须是按照一定法则的,区分的结果必须能够用数字的方式进行描述的。 2.测量的要素 (1)测量的量具 测量的量具是指依据某些科学原理和法则,发展出合适的量具或制定出科学的测量方案。(2)测量的单位 不同的测量所采用的单位是不同的。 理想的测量单位必须符合两个条件:①要有确定的意义;②要有相等的价值。教育测量的单位不够完善,既无统一的单位,也不符合等距的要求。 (3)测量的参照点 量的参照点系测量的起点。要确定事物的量,必须有一个测量的起点,这个起点就叫做测量的参照点。 参照点有两种类型:①绝对参照点(绝对零点);②相对参照点(相对零点)。理想的参照点是绝对参照点,但教育测量中很难找到绝对零点,多采用人为指定的相对零点。 3.教育测量的定义与特点 教育测量的定义 教育测量,就是针对学校教育影响下学生各方面的发展,侧重从量的

教育测量与评价教案

《数学教育测量与评价》教案 第一章数学教育测量与评价的学科发展 [教学目的与要求]理解数学教育测量和教育评价的含义及二者之间的关系,了解数学教育测量与评价的主要发展历程、基础教育课程改革精神及对数学教育测量与评价的要求,认识数学教育测量与评价的学科地位和作用、数学教育测量与评价对教师职业专业化的重要性。 [重点与难点]重点:数学教育测量和教育评价的含义及二者之间的关系、数学教育测量与评价的学科地位和作用。难点:数学教育测量和教育评价的含义及二者之间的关系。 [教学时数]讲授2课时,课堂讨论、学生自主学习1课时 [教学方法与手段]课堂讲授、课堂讨论与学生自主学习相结合 第一节数学教育测量与评价的基本问题 一、数学教育测量与评价的含义 二、教育评价的基本问题 三、教育评价相关概念辨析 第二节数学教育测量与评价的发展历史 一、中国是考试制度的发源地 二、中国科举制度的世界地位 三、数学教育测量学科的诞生 四、数学教育测量运动的蓬勃开展 五、美国的“八年研究”是教育评价的催生剂 六、数学教育测量与评价理论的发展 第三节数学教育测量与评价的学科地位和作用 一、数学教育测量与评价是现代教育科学研究的三大领域之一 二、数学教育测量与评价在教育改革中具有重要的作用 三、教育改革呼唤数学教育测量与评价更加科学化 四、数学教育测量与评价是教师的专业素养和能力 [课堂训练、作业思考题] [1]数学教育测量与评价有什么联系与区别? [2]教育评价与教育评估有什么联系与区别? [3]在学科专业分类中,“数学教育测量与评价”放在哪一个类别中比较合适? [4]试分析一下,狭义、中义与广义的教育评价概念有何区别? [5]怎样使用数学教育测量与评价这个概念? [6]为什么说数学教育测量与评价在教育中有重要的作用? [7]为什么说数学教育测量与评价是教师必备的知识技能修养? [8]基础教育课程改革对考试评价制度改革提出哪些要求? 第二章数学教育测量与评价的类型和功能 [教学目的与要求]掌握数学教育测量与评价的不同标准的分类,了解形成性、诊断性和总结性测验(评价)之间的区别和联系,初步了解常模参照测验和标准参

最新教育测量与评价考试试卷

《教育测量与评价》试卷 总分:100分考试时间:50分钟 姓名:______________ 学号:______________ 考试分数______________ 一、单选题(2*13) 1、下列哪类题型不属于客观题() A填空题B判断题C选择题D论述题 2、同一量表,同一被试群体,在不同时间,两次施测,求其相关。这样得出的信度是()A复本信度B分半信度C重测信度D同质性信度 3、名称量表上的数字具有什么特性() A等比性B等距性C等级性D区别性 4、用测验来寻找被试某种能力上的特殊优点或缺点,这种测验是() A普通测验B诊断测验C预测测验D成绩测验 5、把总体中各个个体按照一定标志分为不同类型或层次,然后从各类型中随机抽取若干个个体,从而构成样本的抽样方法叫做() A整群抽样 B 机械抽样 C 分层抽样 D 单纯随机抽样 6、下列关于分半信度的描述哪一项是不正确的() A计算分半信度先要对测验分半 B要注意使那些性质不相同、联系不紧密的项目分在相同的一半 C测验越长、项目越多,两半分数的相关就越可能高 D不同的分半法可能会得到不同的信度值 7、下列关于区分度的描述哪一项是不正确的() A区分度是测验对被试实际水平的区分程度 B取值范围为0到1 C区分度越高时,试题的质量越好 D区分度是作为评价项目质量、筛选项目的主要指标与依据 8、区分度与难度之间的关系是() A 题目越难,区分度越高B题目越难,区分度越低 C 难度为1时,区分度为0 D难度为0时,区分度为1 9、测验工具是否测到了要测的东西,即测到了被试的某种心理特性、特质、结构,这就是测验的 ( ) A 信度 B 效度 C 难度 D 区分度 10、通常是以问卷的形式,提出一系列题目的人格测验的方法是( ) A 评定量表法 B 情境测验法 C 自陈量表法 D 投射测验法 11、标准分数值具有 ( ) A 可比性 B 可加性 C 可比性而无可加性 D A、B都对 12、发展常模就是某类个体正常发展进程各特定阶段的( ) A 高等水平 B 一般水平 C 低等水平 D 特定水平

教育测量与评价教案

教育测量与评价教案 Company number:【0089WT-8898YT-W8CCB-BUUT-202108】

《数学教育测量与评价》教案 第一章数学教育测量与评价的学科发展 [教学目的与要求]理解数学教育测量和教育评价的含义及二者之间的关系,了解数学教育测量与评价的主要发展历程、基础教育课程改革精神及对数学教育测量与评价的要求,认识数学教育测量与评价的学科地位和作用、数学教育测量与评价对教师职业专业化的重要性。 [重点与难点]重点:数学教育测量和教育评价的含义及二者之间的关系、数学教育测量与评价的学科地位和作用。难点:数学教育测量和教育评价的含义及二者之间的关系。[教学时数]讲授2课时,课堂讨论、学生自主学习1课时 [教学方法与手段]课堂讲授、课堂讨论与学生自主学习相结合 第一节数学教育测量与评价的基本问题 一、数学教育测量与评价的含义 二、教育评价的基本问题 三、教育评价相关概念辨析 第二节数学教育测量与评价的发展历史 一、中国是考试制度的发源地 二、中国科举制度的世界地位 三、数学教育测量学科的诞生 四、数学教育测量运动的蓬勃开展 五、美国的“八年研究”是教育评价的催生剂 六、数学教育测量与评价理论的发展 第三节数学教育测量与评价的学科地位和作用 一、数学教育测量与评价是现代教育科学研究的三大领域之一 二、数学教育测量与评价在教育改革中具有重要的作用 三、教育改革呼唤数学教育测量与评价更加科学化 四、数学教育测量与评价是教师的专业素养和能力 [课堂训练、作业思考题] [1]数学教育测量与评价有什么联系与区别 [2]教育评价与教育评估有什么联系与区别

教育测量与评价

第一章、教育测量与评价的学科发展 教育测量与评价 一.教育测量 1、测量:根据法则给事物赋予数量。(史蒂文斯) 测量:客观事物及其属性;所依据的规则或方法;数量化的结果。 2、教育测量: 广义:对于教育领域内的事物或现象,根据一定的客观标准,作缜密地考核,并依据一定的规则将考核的结果予以数量的描述。 狭义:是指对学生某些学科经过学习和训练之后,所获得的知识、技能的测量。又称成就测量、学业成绩测量或学科测量。 3、教育测量的特点: 1.间接性和推断性 2.测量对象的模糊性和测量误差的不可避免性 3.量表具有多样性,结果具有相对抽象性 4.测量目的的针对性 二.教育评价 评价:评:评定;价:价值——教育价值 教育评价:注重效果:美国的泰勒;注重资料的获得:美国的克龙巴赫、斯塔弗尔比姆; 注重评价方法、手段:中国的张秀理、日本的长谷川容 1、教育评价的概念: 教育评价是评价者对教育活动或行为主客体价值关系、价值实现过程、结果及其意义的一种认识活动过程,其核心内容是揭示教育活动或行为中的客体对主体的需要、目标的价值意义。 三.教育测量与评价的关系 联系: 教育测量就是指根据一定的理论、规则,运用一定的测量工具对教育现象进行数量化描述的过程 教育评价是对教育现象状态和价值的判断,这一判断是以对评价对象的客观描述为前提的,没有对评价对象的客观描述,就不会有对评价对象价值的客观判断 教育测量是教育评价的基础,教育评价要在教育测量所获得的客观信息的基础上进行.同时,教育测量的结果要通过评价才能获得实际意义. 教育测量与评价的区别: 第一,测量是对事物数量特征的获得。而教育评价则是对教育现象客体的价值进行判断。 第二,教育测量是一种纯客观的过程,其突出特点是客观性。而教育评价则具有两种属性,即客观性和主观性 第三,测量的任务是对事物的量的认识,而评价作为一种认识活动,是人的意识对实践活动及其结果的综合反映,它反映的是活动的过程和终点,又是新的实践活动的起点。 教育测量与评价的产生与发展过程: 一.教育测量的产生 1904年以前(教育测量的萌芽期) 中国的科举制(隋炀帝大业二年,公元606年) 科举制的特征:逐级考核、制度完备、考场严格、命题规范

北师大网络教育2017年春季《教育测量与评价》在线作业

北师大网络教育2017年春季《教育测量与评价》在线作业 作业题目列表 单选 1.根据某些法则与程序,用数字对事物在量上的规定性予以确定和描述的过程,这一概念是() A. 测量 B. 评价 C. 测验 D. 统计 参考答案:A.测量 2.衡量、判断人物或事物的价值,这一概念是() A. 测量 B. 评价 C. 测验 D. 统计 参考答案:B.评价 3.在现代测验理论的诸多模式中,最具有优越性的是() A. 经典测验理论 B. 题目反应理论 C. 心理测验理论 D. 智力测验理论 参考答案:B.题目反应理论 4.被称为教育评价的催生剂的是美国的一项著名研究,它是() A. 教育研究 B. 教育测量理论研究 C. 心理测验研究 D. 八年研究 参考答案:D.八年研究 5.于1975年成立的在开展教育评价的国际交流与协作过程中,最有影响力的协会是() A. 国际教育成就评价协会 B. 国际教育评估协会 C. 国际教育评价协会 D. 国际教育成就评估协会 参考答案:B.国际教育评估协会 6.测量结果的稳定性程度是指() A. 效度 B. 稳定性 C. 信度 D. 可信度 参考答案:C.信度 7.用同一个量表(测验或评价表)对同一组被试测两次所得结果的一致性程度,其大小等于同一组被试在两次测验上所得分数的相关系数,这一概念是() A. 复本信度

B. 重测信度 C. 同质性信度 D. 分半信度 参考答案:B.重测信度 8.一个测验或量表实际能测出其所要测量的特性的程度,这一概念是() A. 效度 B. 稳定性 C. 信度 D. 可信度 参考答案:A.效度 9.一个测验对于处于特定情境中的个体行为进行预测时的有效性,这一概念是() A. 同质性信度 B. 复本信度 C. 效标关联效度 D. 重测信度 参考答案:C.效标关联效度 10.衡量测量题目质量的两个重要指标是() A. 信度与区分度 B. 效度与信度 C. 难度与效度 D. 难度与区分度 参考答案:D.难度与区分度 11.表示每项评价指标在指标体系中所占的重要性程度,并赋予相应的值,这一概念是() A. 评价指标 B. 评价标准 C. 指标权数 D. 指标权重 参考答案:D.指标权重 12.在评价指标拟定过程中,经常会将评价指标按照评价对象本身的逻辑结构逐级进行分解,把分解出来的主要因素作为评价指标的方法,这种方法是() A. 头脑风暴法 B. 理论推演法 C. 因素分解法 D. 典型研究法 参考答案:C.因素分解法 13.一个与被试同类的团体在相同测验上得分的分布状况与结构模式,这一概念是() A. 模型 B. 常模 C. 量规 D. 参照物 参考答案:B.常模 14.我国高考标准分数采用了一种方案,这种方案是() A. 正态化转换方案 B. 对比参照方案

教育测量与评价

第一章、教育测量与评价的学科发展 填空 用数字对事物在量上的规定性予以确定,就需要有一个测量或计算的起点,这个起点叫参照点。 量表,指的是确定了测量单位和参照点并具有取值系统的测量工具。 泰勒指出 英国剑桥大学直到1720年才开始使用笔试。20世纪初,在桑代克的影响下 名词解释 教育测量:就是针对学校教育影响下学生各方面的发展,侧重从量的规定性上予以确定和描述的过程。 教育评价:是根据一定的标准,对教育事物或现象的价值进行系统的调查,在获取足够多的资料事实基础上,作出价值分析和价值判断。 简答题 教育测量的特点 ①间接性和推断性 ②测量对象的模糊性和测量误差的不可避免性 ③量表具有多样性,结果具有相对抽象性 “八年研究”的基本原则 ①应当帮助学生学习什么,即在教育计划中,应当帮助学生发展哪些思维、感觉和行动 的方式。 ②为了帮助学生达到教育目标,应当提供什么学习经验,即怎样帮助学生学习预期的东 西。 ③怎样组织学习经验,以使这些经验的累计效果最大,即怎样的学习顺序和学习经验的 整体计划会有助于学生内化他们所学之物,并将其应用于适当的环境。 ④怎样评价方案效果,即随后采取什么步骤,以不断检查期望的学习活动所发生的变化。美国的“八年研究”对传统的教育测验提出的一些批评 ①传统测验是片断的,不能全部了解知识之过程和人格之发展。 ②测验只是关注客观的信度,但对于质的妥当性已不足以说明。 ③测验是教科书主义,测验内容关注记诵教材中的知识,是片面的,不能反映学生的全 面发展。 ④对测量或考试的过分依赖必然养成个人主义与被动式的学习态度等等。 第二章、教育测量与评价的类型和功能 填空 教育测量评价可大致分成常模参照、标准参照和潜力参照。 教育测量与评价所指向的被试的行为表现,按其性质分成最佳行为和典型行为。 名词解释 1、形成性测量与评价:是在教学过程中经常实施的,在性质上大致相当于现在的中小学单元测验。形成性测量与评价的目的,对教育而言是藉此获得教学过程中连续性的反馈,了解学生的学习效果、学习历程、学习特点、学习困难等信息,作为随时修正自己教学的参考。 2、常模参照测量与评价:是将被试水平与测验常模相比较,以评价被试团体中的相对地位的一种测量与评价类型。也就是说,常模参照评价对学生学习成就的解释,是采用了相对的观点。 3、标准化测验:是指由测量专家严格按照测验编制程序而编成的一种测验,通常标准化测

教育测量与评价作业和答案

教育测量与评价作业和答案 主观题: 1、简述难度及其计算方法2、论述几种常用的人格测量量表客观题:1、以题型为顺序,易到难、客观到主观、短答案题到长答案题,是什么的原则A 检核 B 测验顺序 C 表述合理 D 拼卷2、从评价对象所承担的责任和完成任务角度提出的标准叫做 A 效能标准B职责标准 C 素质标准 D 科学标准3、每个分测验的各项得分相加,称为分测验的 A 总分 B 量表分 C 原始分 D 标准分4、标准化考试的大样本团体的成绩的平均数,叫做 A 标准化成绩 B 常模 C 参照点 D 平均成绩 5、细致的观察,评价者对被评者的实际行动进行直接的观察和记录,然后把评价结果和意见反馈给被评价者,两者一起讨论改进措施的评价方法,叫做

A 定性分析方法 B 定量分析法 C 行为目标评价法 D 临床督导评价法6、卡特尔16种人格因素量表,适用于什么样的人群 A 各种人群 B 小学以上文化程度的人群 C 高中以上文化程度的人 D 初中以上文化程度的人群7、将原始分于平均分的距离以标准差为单位表示出来的分数称为A 平均数 B 加权平均数 C 标准差 D 标准分8、如果男生用“1”表示,女生用“2”表示,这种变量称为A 等级变量 B 类别变量 C 等距变量 D 等比变量9、教育测量数据的单位不等值,不能进行加减乘除运算,大部分属于 A 类别变量 B 等级变量 C 等距变量 D 比率变量10、下列选项中哪项在教育测量中较少见 A 类别变量 B 等级变量 C 等距变量 D 比率变量11、评价者和被评价者对评价现实的体验或反映,叫做 A 评价心理B 评价现实 C 评价活动 D 评

(完整版)教育测量与评价

教育测量与评价期末复习题 一、简答 1.简述教育测量的基本要素及四种水平包括哪些? 答:(1)教育测量的基本要素包括:参照点和单位。 参照点:计算事物数量的起点,也叫零点。 绝对参照点: 绝对零点, ,如长度, , 重量。 相对参照点: 相对零点, ,如海拔高度、温度。 单位:计量事物标准量的名称。 理想的单位要符合两个条件: 同一个单位意义相同, 即确定的意义; 相邻两个单位间的差别相等。 (2)教育测量的四种水平 四、教育测量的水平(第二章25页未找到准确答案) 从所使用的参照点来说,教育和心理测量的参照点均为相对参照点。 从所使用的单位来说,教育和心理测量所使用的单位意义不太明确, 单位常常不等值。 从本质上讲,教育和心理测量的量表属于等级量表。无论是对智力,还是对能力倾向或人格的测量,都只具有等级量表的特征。 由于多数心理特征具有常态分布的特征,无绝对零点,所以我们也可把测量后直接得到的原始分数转化为常态分布下的标准分数,把这些量表当作等距量表来处理。

2.简述教育测验编制的基本程序有哪些? 答: 一、确定编制测验的目标 二、制定编题计划 三、设计测验项目 四、预测与项目分析 五、合成测验 六、测验的标准化 七、搜集信度、效度资料 八、编写测验手册 3.简述实施教育测验应注意的问题。 答:第三节、测验的实施(第4章92页未找到准确答案) (一)测试开始前的准备 主试方面: ?首先,主试在测试前要熟悉测验的结构和内容以及使用方法。 ?其次,测验实施者要熟练测验指导语并能口语清楚而流利地说出来。 ?有时还要对施测者进行必要的训练。 训练的内容包括: 1 、熟悉测验内容; 2 、掌握施测步骤; 3 、掌握记分方法;

教育测量与评价考试题目汇总

测量题目汇总 一、单选题(本题共15个小题,每小题1分,共15分。将答案填入下表) 1.与物理测量相比,以下属于教育测量特点的是( )。 A.它一般是间接测量 B.它的度量单位是绝对的 C.它的目的是特为测量服务的 D.它的作用是单一的 2. 下列量尺中,属于最高水平测度的是()。 A.类别量表 B.等级量表 C.等距量表 D.等比量表 3. 一个主试在同一时间,只测量一个被试的测验称为()。 A.难度测验 B.速度测验 C.预测测验 D.个别测验 4.区分度指数D的取值围为()。 A.[-1,0] B.[0,1] C.[-1,1] D.[-2,2] 5.提出“凡有数量的东西都可以测量”的测验学者是()。 A.桑代克 B.麦柯尔 C.王书林 D.萨蒂 6.测验难度系数P值在0.8—1.0为( D )。 A、难题 B、较难题 C、中等题 D、易题 7.测题基本上分为选择题和()。 A.是非题 B.供答题 C.论述题 D.客观题 8.原则上区分度水平()以下的题必须淘汰。 A.0.19 B.0.4 C.0.30—0.39 D. 0.20—0.29 9.下列教育测量类型属于按照测量的功能分类的是()。 A.常模参照测验和标准参照测验 B.智力测验和能力倾向测验 C.难度测验和速度测验 D.标准化测验和教师自编测验 10.下列有关信度解释正确的是()。 A.信度是有关测量结果的可信程度 B.信度越高,测验结果越是真实的 C.信度追求测量中的系统误差的最佳控制程度的估计 D.测验的项目少,测验的信度高 11.测量项目的难度为0.5时,项目的区分度值最大为()。 A.0.8 B.1.5 C.1 D.-1 12.通常所用的时限是使大约()%的被试在规定时间完成全部测验。 A.90 B.80 C.95 D.100 13.人的身高与学业成就、相貌与人的行为等现象的关系都属于()。 A.积差相关 B.零相关 C.正相关 D.负相关 14.下列估计测验信度的方法中,对信度最严格的检验方法是()。 A.再测信度 B.在一致性信度 C.复本信度 D.评分者信度 15.项目分析时一般将总分最高和最低的()的被试划分为高分组和低分组。 A.7% B.17% C.27% D.37% 二、多项选择题(本题共8个小题,每题2分,共16分。将答案填入下表)

比较教育、教育测量与评价、教育科学研究方法参考答案

比较教育参考答案 一、单项选择题) 1.D 2.C 3.C 4.C 5.D 6.A 7.C 8.A 9.A 10.D 11 B 12 C A D c 英国教育管理的特点有哪些? 英国教育管理的特色是中央和地方密切合作。英国式教育管理信念为最佳的教育管理则是充分授权于具体实施者,并依其风格处理教育事务以求实效;除非出现明显的偏差,否则不应予以干涉。2001年,作为英国中央教育行政机构的“教育就业部”被改称为“教育技能部”。现在教育技能部与地方教育当局以一种协调合作的关系,通过沟通的方式来行使教育管理职能。教育技能部正在有意扩大其权限与职能,以有利于国家教育政策得到贯彻落实,而中央教育行政部门与地方教育行政当局应当彼此沟通与协调的精神并没有因此而改变。 世界主要国家对教育督导人员的基本要求有哪些? 结合实际,谈谈在比较教育管理研究中应如何避免常见的偏差 试分析美国教育管理改革与发展的趋势 当今世界教育,无论是实行以中央集中管理为主的国家(如中国、俄罗斯、法国、新加坡等),还是实行以地方管理为主的国家(如美国、英国、德国等),都在进行改革。各个国家教育管理改革的思路和重点虽然各不相同,采用的方法也互有区别,但相互学习、相互借鉴是基本趋势。 教育实行以中央集中管理为主的国家,强调国家对教育的集中领导,政令统一,行政管理效率较高;强调统一的教育教学标准,教育质量相对均衡;教育制度规范,学校管理严格,教育教学秩序比较稳定;强调共性,强调全面发展,强调国家至上,强调集体主义精神,学生为社会服务的意识较浓;教学中强调基本知识、基本技能的传授,学生学习的知识比较系统、扎实;重视定性分析和终结性评价,考试考核比较严格。但是,这类国家的教育也存在重大缺陷,例如地方的办学积极性和学校的办学主动权发挥不够;教育教学过程中学生的个性很难得到充分自由发展;学生的创新精神和实践能力相对较弱;考试压力大,学生学习负担过重;忽视发展性评价和定量分析,教育评价不够全面等。 针对以上状况,此类国家教育管理改革的重点是:下放中央教育行政权力,改变教育行政机关职能,适当淡化行政对教育业务的干预,强化社区、家长对学校的监督;体现以人为本,提升学生在教育教学中的主体地位,促进学生个性充分发展;加强师生情感交流,注重教育教学与社会生活的联系,丰富学校生活内容;强调知识的综合性,提倡研究性学习,加强教学与生产的联系,培养学生创新精神和实践

教育测量与评价总结

学 后 心 得 学校:天津职业技术师范大学 学院:电子工程学院 班级:电信0902

《教育测量与评价》学后心得 进入大学后学了很多有关教育的课程,今天的《教育测量与评价》让我对教育有的新的认识,了解到了许多新的方法。 教育测量与评价是教育科学领域中的一门应用科学,是当今世界教育科学研究的三大领域之一,而且在教育教学过程中具有重要而广泛的应用价值。通过本课程的学习,我了解到了教育测量与评价的形成和发展,掌握教育测量与评价的一般原理和方法,树立科学的教育测量与评价理念,初步具备开展教育测量与评价的能力。该课程内容可以分为教育测量与评价的基本原理和方法、教育测量与评价的具体应用两大部分,具体包括:教育测量与评价的概念、目标、类型、原则等一般理论;教育测量与评价方案设计、实施以及教育测量与评价信息搜集与处理的方法与技术;教育测量与评价理论与方法在学生评价、教师评价、教学评价等教育测量与评价实践中的应用;国内外最新教育测量与评价理论与方法的介绍与应用。 学习教育测量与评价还能完善我们的思维方式,培养科学的思维能力和探究精神。不了解实验设计的思想、不掌握教育测量与评价的数学模型和使用条件、亦步亦趋地死套公式。我们应该有教育测量与评价的数学思维方式,吸收其严密性和逻辑性强的特点,使科研和管理的思维更趋完善。 另外,我们学习到利用教育测量与评价,可以全面地掌握教育的各种情况,及时发现教育过程中存在的问题,对教育教学任务完成的数量与质量进行控制,为促进,提高教育过程的有效性提供科学的依据。同时该课还激励了我们的学习动机,帮助了我们的记忆和促进迁移,促进我们的自我评价。 《教育测量与评价》实现了教育判断的功能,包括:测量评定的功能、事实判断的功能、价值判断的功能、问题诊断的功能、区分选拔的功能。这使教育又迈向了新的一步,教学质量得以改善。 总之,《教育教育测量与评价》不仅让我们在学习上,能力上有所提高,而且在其他方面让我们得以改善。《教育测量与评价》作为教育学的一部分,发展了教育,《教育测量与评价》作为测量学的一部分,扩

第二章 教育测量与评价的类型和功能

第二章教育测量与评价的类型和功能 第一节教育测量与评价的主要类型 一、按测量与评价在教学中运用的时机分类 ●形成性测量与评价 ●诊断性测量与评价 ●终结性测量与评价 形成性测量与评价 ●在教学过程中实施的,使教师借此获得教学过程中连续性的反馈,了解学生的学习效果、 学习历程等信息,作为修正教学的参考。 ●如:平时测验,随堂检测。 诊断性测量与评价 ●对经常表现出学习困难的学生所作的测量与评价,目的是对个人的问题行为及其原因进 行诊断。 ●注意:长期学习困难的学生可能有特别原因。 终结性测量与评价 ●一般用于教学结束后,相当于期末考试。 ●目的: ●一是检查学生一学期的学业达到了什么程度; ●二是根据终极性测量与评价的结果,评定学生的学业成绩,并将评定结果同时家长或记 入档案。 二、按解释测量结果或评价结果时的参照点分类 ●常模参照测量与评价 ●标准参照测量与评价 ●潜力参照测量与评价 常模参照测量与评价 ●测验常模简称常模,即指一定人群在测验所测特性上的普遍水平或水平分布状况。 ●常模参照测量与评价是将被试水平与测样常模相比较,以评价被试在团体中的相对地位 的一种测量与评价类型。 标准参照测量与评价 ●是将被试的表现与既定的教育目标或行为标准相比较,以评价被试在多大程度上达到该 标准。 ●学校中的考试多标准参照测量与评价。 潜力参照测量与评价 ●将被试实际水平与其自身潜在水平(潜力)相比较,以评价被试有无充分发挥自身潜力

为目的。 ●最近发展区 三、按测量与评价被试行为表现的性质分类 1、最佳行为测量与评价 以测量被试的最佳行为为目的。如成就测验或能力测验。 2、典型行为测量与评价 测量与评价被试是否具备某种(或某些)典型行为。如态度、情感、人格测验。 四、按测量与评价的内容分类 1、智力测量与评价 测量被试的智力并对被试的智力发展水平和特点作出评价。 2、能力倾向测量与评价 评价个人的潜在才能,预测个人的能力发展倾向。 3、成就测量与评价 测量并评价个人在接受教育或训练后的成就。 4、人格测量与评价 测量与评价被试的人格心理特征,如气质、性格、兴趣等。 五、教育测量与评价的其他分类 (一)按测量对象的个数 1.个别测量与评价 如:韦氏智力量表、学习障碍儿童诊断量表。 2.团体测量与评价 如:瑞文推理、气质类型量表 (二)按测验材料分类 1、文字测验 如:气质量表、霍兰德职业倾向性量表 2、非文字测验 罗夏墨迹测验、主题统觉测验 (三)按测量工具的标准程度 1.标准化测验 是指由测量专家严格按照测验编制程序而编成的一种测验。 2.非标准化测验 这类测样的编制相对自由,没有严格按照测验编制程序进行。 如教师自制的考试试卷。 第二节教育测量与评价的主要功能 一、实现教育判断的功能 ●测量评定功能 ●事实判断功能

教育测量与评价

教育测量与评价(简答题部分) 什么是表现性评价:一种性质的评定方法新型的更加直接的考察学生综合运用的知识、解决实际问题能力的方法,在促进学生发展和改进教学方面有显着作用 表现性评价 1优点:有助于测查学生综合运用所学知识解决实际问题的能力优化教学过程,使学生的能力尽可能得到发展激发学生的学习动机,为终身学习打基础注重知识技能的整合与综合运用复杂的任务表现教学性评价与教学活动有密切的联系2缺点:信度问题效度问题实用性问题耗时过多不能评价所有类型的学习目标高利害评使用表现性评价就要十分谨慎品德测试的意义:有利于学生思想上的自我教育和学校德育工作的顺利进行激励先进和鞭策后进有利于学生德育管理德育和行为科学研究的重要手 段 品德测评的类型:诊断性形成性总结性 品德测评的基本要求:外显行为测评和道德认识测评相结合单项测评和整体测评相结合定向性测评和定量测评相结合 测评指标体系确立的依据:社会的需要德育大纲德育结构学生年龄特征测评基本要求:重视指标体系的开放性教育性处理好普遍性和特殊性的关系稳定性和发展性的关系统一性的灵活性的关系 品德测评的方法、运用:定时考核(学生成绩测量)问卷测评(问卷或量表测试)项目评分(设置一些测试的项目,给予一定的分数,对学生的思想和行为表现进行测量)情景测验(设计情景,展开活动)社会关系测量(通过学生回答,来了解学生的人际关系)意向测评法(Q技术、和语义分析)行为观测法(有目的有计划的考察学生思想行为) 教师评价的特点:是一个活动过程,一个特殊的连续活动,包括一系列的方法和步骤有目的有计划的活动过程根本目的在于形成价值判断,进而做出选择评价者与被评价者是同一的 教师评价的主体:行政部门、学校、教师参评(教育行政部门依法对教育人力支援进行管理对教师的考核人工作进行指导和督导有助于提高教师的信度与效度)学生参评(是教学过程中的主体,直接承受着教师教学效能的影响)

相关文档
相关文档 最新文档