当前位置：文档库 › 教育测量与评价

教育测量与评价

第一章、教育测量与评价的学科发展

教育测量与评价

一.教育测量

1、测量:根据法则给事物赋予数量。(史蒂文斯)

测量：客观事物及其属性；所依据的规则或方法；数量化的结果。

2、教育测量：

广义：对于教育领域内的事物或现象，根据一定的客观标准，作缜密地考核，并依据一定的规则将考核的结果予以数量的描述。

狭义：是指对学生某些学科经过学习和训练之后，所获得的知识、技能的测量。又称成就测量、学业成绩测量或学科测量。

3、教育测量的特点：

1.间接性和推断性

2.测量对象的模糊性和测量误差的不可避免性

3.量表具有多样性,结果具有相对抽象性

4.测量目的的针对性

二.教育评价

评价：评：评定；价：价值——教育价值

教育评价：注重效果：美国的泰勒；注重资料的获得：美国的克龙巴赫、斯塔弗尔比姆；

注重评价方法、手段：中国的张秀理、日本的长谷川容

1、教育评价的概念：

教育评价是评价者对教育活动或行为主客体价值关系、价值实现过程、结果及其意义的一种认识活动过程，其核心内容是揭示教育活动或行为中的客体对主体的需要、目标的价值意义。

三.教育测量与评价的关系

联系:

教育测量就是指根据一定的理论、规则，运用一定的测量工具对教育现象进行数量化描述的过程

教育评价是对教育现象状态和价值的判断，这一判断是以对评价对象的客观描述为前提的，没有对评价对象的客观描述，就不会有对评价对象价值的客观判断

教育测量是教育评价的基础，教育评价要在教育测量所获得的客观信息的基础上进行.同时，教育测量的结果要通过评价才能获得实际意义．

教育测量与评价的区别：

第一，测量是对事物数量特征的获得。而教育评价则是对教育现象客体的价值进行判断。

第二，教育测量是一种纯客观的过程，其突出特点是客观性。而教育评价则具有两种属性，即客观性和主观性

第三，测量的任务是对事物的量的认识，而评价作为一种认识活动，是人的意识对实践活动及其结果的综合反映，它反映的是活动的过程和终点，又是新的实践活动的起点。

教育测量与评价的产生与发展过程：

一.教育测量的产生

1904年以前（教育测量的萌芽期）

中国的科举制（隋炀帝大业二年，公元606年）

科举制的特征：逐级考核、制度完备、考场严格、命题规范

科举制的考核方法：口试、贴经、墨义、策间、诗赋

产生在中国、发展在西方

美国贺拉斯曼1845年将“笔试”引入美国

英国费舍在1864年《作业量表集》

美国赖斯在1897年的《拼字实验》

1904—1915年教育测量的开拓期：

美国桑代克的巨著《精神与社会测量导论》问世。标志着以科学理论为指导的教育测量理论的诞生。

桑代克在这本巨著中提出：无论什么东西，只要存在，总存在于数量之中

麦克尔提出：任何东西，存在于数量中的，都可以被测量

这就是后来人们说的“凡存在的东西必有数量；凡有数量的东西都可以测量”

这两句话，看成是构成一切测验和量化评价的公理。

1909年，桑代克根据“等距原理”发明了编制量表的单位，编制了标准化的测验量表。1915---1930年教育测量的兴盛期：

在桑代克的影响下，教育测量的运动轰轰烈烈的开展

测验品种有算术测验、书法测验、学科测验、智力测验、个性测验、兴趣测验等，在数量上已有3000多种

标准化测验的问世

1930---1940年教育测量的批判期：

对教育测量批判的原因：

教育测量虽然能使教育成就定量化、客观化、标准化；但毕竟不能测量出人的学力和人格的全部内容。

第一次大战以后，人们的教育观点发生了很大的变化，不在将教育看成是单纯的传授知识，而是将人的全面发展作为教育目标。而人的全面的重要因素如：社会道德、人的情绪态度、动机兴趣、鉴赏力等是不能光靠测量的。

教育测量存在的弊端：

为测量而测量，盲目追求量化，忽视教育服务对象的整体目标与价值。

教育测量的理论基础只有心理学、统计学和测量学，而没有教育学原理。

二.教育评价的产生

1、教育评价产生的社会背景：

1929—1933年席卷美国、波及全球的经济大萧条

社会与教育危机四起

生产过剩、工厂倒闭、工人下岗

学校因经济不景气，部分学校关闭，有些学校的班级减少。

整个社会和教育皆处于反省之中

1930年美国有25%的失业，青年近乎100%找不到工作，1910年14—17岁的青年17%上大学，而到1930年上升到51%。

有相当一部分人上高中并不想上大学，而当时的美国高中设课就是为了上大学服务的，为此中学设课与失业青年的需求就产生了尖锐的矛盾

2、教育评价的起源：

美国进步主义联盟负责人艾钦于1933—1940年领导了中学课程改革实验研究，其中课程评价委员会由俄亥俄州的州立大学教授泰勒主持，这就是美国教育历史上著名的“八年研究”，也是教育评价问世的开始。

八年研究的内容：

泰勒教授选了30所参加实验的高中学生，对这些学生进行了4年中学、4年大学学习的追踪研究，历时“八年”，这也是“八年”研究的由来。

当时选进步学校和和传统学校学生各1475人，按性别、年龄、种族、学业能力倾向、家庭、社会环境、职业兴趣和嗜好等基本原则进行一一配对，进行比较。

评价是八年研究的有机组成部分，泰勒认为课程计划和编制必须回答以下四个基本问题

1、应帮助学生达到什么目标？

2、为达到目标应帮助学生学习那些预期的知识？

3、怎样组织学习过程才能使学生的学习成效最大？

4、怎样评价教学方案

结果发现：

来自实验的学生在大学四年中，每年获学术性荣誉略多；

具有更强的理智、好奇心和学习动机；

思维更精密、更系统、更客观；

对教育的意义有更清晰的看法；

对新情况有更强的应变能力；

具有更有效的解决问题的办法；

更多的参加有组织的学习团体；

获得非学术的荣誉更多些；

对职业的选择有更好的定向；

更积极的关注全国和全世界的事物。

新旧课程比较结论：

前三项经统计检验均存在显著性差异

记忆活动传统的高于进步学校，但经统计检验两者没有显著性差异

教育评价的问世：

八年研究后泰勒等人的研究结论是：

旧课程及其教育测验是教科书主义，测验内容只是要求学生记诵教材中的知识，是片面的，不能反映学生的全面发展。

泰勒提出：以全面发展的教育目标为核心和依据的两条相互依存的原理，即课程编制原理和评价活动原理，也就是泰勒原理

教育评价的创始人—泰勒：

在八年工作报告中第一次提出教育评价

这个报告被称为“划时代的教育评价宣言”

宣布了教育评价的诞生

给出了教育评价的原理、方法和手段

奠定了泰勒---教育评价之父的地位

同时也迎来了美国教育史上“泰勒时期的到来”

3、评价的发展：

1940—1957年教育评价的平稳期：

特点：

教育评价的理论在不断的进行深入研究

布鲁姆完成教育目标分类学

教育评价活动没有普及

这与当时美国的历史背景有关，二战后，美国处于“筹划与享受生活的时代”。

社会对教育的发展很少提出新的要求。

1957—1972批判泰勒模式时期：

特点：

1957年前苏联的人造卫星上天

引发美国对教育的不满

开始批判泰勒教育模式

1972----现在专业化时期

特点：

高等学校出现了许多教育评价的硕士、博士、博士后专业点

各类教育评价研究中心纷纷建立

如：美国有西密执安大学评价中心、洛杉矶加里福尼亚大学研究中心等

教育评价专著、杂志大量出版

如：《评价研究》《评价评论》《评价信息》等

4、教育测量与评价的发展趋势及特点

教育测量的政治性得到强化

教育测量的重心发生了变化

教育测量的理论得到飞跃发展

计算机技术的发展提高了测验的效率

测验的统计模型为教育测量学科发展提供强有力的理论支持

更加重视测量结果的解释

教育测量内容的发展：

评价方法由注重相对评价转向重视绝对评价

重视教育目标研究

教育评价研究中不断引入新的研究方法

越来越重视发展性教育评价理念和被评价者的参与

越来越重视元评价

越来越重视对评价结果的全面解释和慎重处理

第二章、教育测量与评价的基本原理

教育评价与测量的类型

一、教育评价的分类

1、根据评价对象的层次和内容来划分：

宏观评价：指对影响到全社会的那些指导、规范教育活动的各种因素进行的评价。

微观评价：指对某项具体的教育活动过程，对实施、管理教育活动的组织与个人．对教育活动指向的具体对象等内容进行的评价

2、按评价内容的复合程度来划分：

单项评价：指针对教育评价对象某一方面状况进行的评价。

综合评价：指对评价对象状况的方方面面作整体评价。

3、按评价的功能及用途来划分：

诊断性评价：为使教育活动的形式、内容、过程等更适合活动对象的自身条件及需要而进行的评价。如：摸底考试。

形成性评价：在教育活动过程中为不断了解活动进行的状况以便能及时对活动进行调整，进而提高活动质量进行的评价。如：单元测验。

终结性评价：指对教育活动的效果进行的评价。如：期末考试

4、按评价参照的标准来划分：

相对评价：根据评价对象的实际状况设定评价标准。评价标准在被评对象群体内部产生。

绝对评价：依据某种需要或要求设定评价标准。评价标准在被评对象群体外部产生，且标准固定。

个体内差异评价：以评价对象某一状况作为设定评价标准依据的评价。

5、按评价主体来划分：

他人评价：由活动实施者以外的人作为评价主体进行的评价。

自我评价：由活动实施者作为评价主体进行的评价。

6、按评价方法来划分：

定性评价：采用开放的形式来获取评价信息、对评价结果的性质进行说明的评价活动。

定量评价：采用结构式的方法，预先设定操作化的评价内容，收集评价对象可以量化的信息，得出数量化结果的评价活动。

二、教育测量的分类

1、根据测验目标来划分

成就测验:目标在于测量学生在各学习阶段学到了什么，旨在检测教育目标希望学生能达到的具体行为。如:学科测验如：教学阶段测验（诊断和总结性测验）

能力测验：旨在测量个体的不因外界环境影响而轻易改变的、较稳定的、表现在认知能力方面的心理特质.比如观察力、记忆力、理解力、概括力、空间能力、判断推理能力等等。也被称为“智力测验”。

能力倾向测验：目的在于测量学生的潜在学习能力及学术发展趋向。

潜在能力是指个体从未来教育或训练中可能受益的能力。

这类测验主要用于预测学生的未来成就和能力，从而可以帮助决策者和学生自己选择合适的学校、专业及最佳职业。

能力倾向测验分为：一般学习能力测验、特殊能力倾向测验。

2、根据测验分数的解释标准来划分

常模参照测验：目的在于考查被试的个体差异，一般用于衡量被试相对水平的，以选拔为目的的大规模测验。

标准参照测验：目的在于考查被试是否已达到某种标准。一般用于以教学目标为标准考查学生实际水平的测验。

常模团体

?总体要明确

?常模团体必须是被试总体的一个代表性样本

?样本的大小要适当

?注意常模团体的更新

?测验手册中必须详尽描述取样过程

常模参照测验与标准参照测验的比较：

1、从考试的目的和用途来看，它们都通过测量学生的学习成绩，考查其优劣，但常模参照性测验将考生成绩做横向比较，着眼于个别差异，主要用于选拔性测验和总结性测验等。

2、从考核目标的陈述来看，都明确具体，为编制测验提供依据，但常模参照性测验可采用一般目标或具体目标，而标准参照性测验必须采取非常具体且详细的目标。

3、从题型的选择和题目的分配来看，都需采用各种不同题型，试题必须是教学目标的有代表性的样本；常模参照性测验多采用选择题，题目分散在全学科的全部知识领域内，题目按从易到难的顺序排列；标准参照性测验较少依赖选择题，题目分别分布在一定目标中，题目按教学目标顺序排列即可。

4、从考试及考题的质量要求来看，它们都按照标准化考试的编制原则，保证考试有较高的信度和效度；

常模参照测验题目要求难易适中，强调题目的鉴别力，测验信度的估计适合用统计方法；标准参照测验的题目和学习结果直接联系，不强调题目的鉴别力，测验信度的估计不适合用统计方法。

5、从解释考试结果的依据及分数的意义来看，两种考试各有其依据；

常模参照性测验的常模是解释分数的标准，用地位量数表示考生在团体中的相对位置；

标准参照性测验中教学目标是解释分数的标准，以考生完成题目数量的百分比来表示考生的学习效果。

3、根据教育测量的标准化程度来划分：

标准化测验：指测验的编制、实施、记分、分数的解释有统一标准和严格规定的大规模的测验

标准化测验的程序：确定考试目的；编制考试蓝图（命题双向细目表）；命题、组卷、试测、入库；实测；评分，统计分析；写出指导书。

教师自编测验：教师根据教学情况自己编制测题对学生进行的测验。

4、以测量人数多少来划分：

?团体测验

?个人测验

5、根据所使用的材料和形式来划分：

?语言文字测验

?非语言文字测验

教育测量与评价量表

心理学家史蒂文斯根据测量的精确程度把量表从低级到高级分成名称量表、顺序量表、等距量表和比率量表。

名称量表：

?意义：依照某种法则给事物及属性指派名称或类别的量表。

?功能：区分性。

?数量化结果的含义：不能比较大小。

?适用的统计方法：次数的统计，如次数、众数、百分比、离散相关、卡方检验等。顺序量表：

?含义：依照某种法则给事物或人的心理现象指派名称或类别，还可以将分类结果按

数量大小进行排序。

?功能：区分性、顺序性

?数量化结果的含义：比较大小，不能进行运算。

?适用的统计方法：中位数、百分位数、等级相关系数、肯德尔和谐系数以及秩次的

方差分析。

等距量表（区间量表）：

?含义：在给事物及属性指派数字和符号时，要求各数字或等级之间的差距是相同的，

即具有相等的单位。

?功能：区分性、顺序性、等距性

?数量化结果的含义：不仅能分类、排序，还可以进行加减运算。

?适用的统计方法：均数、标准差、相关系数，t、F检验等

比率量表：

?含义：有相等单位和绝对零点的量表。

?功能：区分性、顺序性、等距性、绝对零点。

?数量化结果的含义：可以进行加减乘除四则运算。

?适用的统计方法：均数、几何平均数、标准差、相关系数，变异系数、t、F检验等。

教育测量与评价的基本原则

1、教育测量与评价原则的性质

（1）教育测量与评价原则是在教育测量与评价实践活动中总结出来的具有普遍性问题基础上提出的。

（2）教育测量与评价原则反映了人们对开展教育测量与评价活动的总体要求。

（3）教育测量与评价原则具有相对稳定性。

2、基本原则

（1）方向性原则：指通过评价内容和标准等的制定、评价过程的侧重、评价结果的肯定与否定等推动教育活动贯彻国家的教育方针，进而满足社会需求，保持良性发展的方向。（2）客观性原则：指评价主体要以真实的资料为基础，对教育活动过程和成果作出客观的价值判断。

（3）激励性原则：指教育评价应促使评价对象形成继续努力或在进一步的活动中改善不足之处，提高活动效果的动机或期望。

（4）计划性原则：指教育评价活动的开展及教育评价活动过程应根据教育活动的开展而有计划有序地进行。

（5）实效性原则：指教育评价过程应根据评价的目的与内容、评价对象的具体情况、具体的社会环境背景等作出切合实际的评价计划，采用适宜的评价方法使评价能有效地对教育活动提供指导与帮助。

（6）平等性原则：指教育评价实施者应以与评价对象共同探讨教育活动得失的平等身份进入评价活动，使评价对象将评价者作为朋友接受其评价，采纳其意见或建议。

第三章、编制教育测验的一般原理和方法

布鲁姆的教育目标分类系统把教育目标分成三个领域：

1、认知领域；

2、情感领域；

3、动作技能领域。

1、认知领域目标分类：布卢姆把认知领域的教育目标分为六级：知道、领会、运用、分析、综合、评价。

1、知道：

指对先前学习过的知识材料的简单回忆.“知道”又叫“知识”，是认知领域中最低水平的认知结果，它所要求的心理过程主要是记忆。

2、领会

领会亦称理解或领悟，是指将一种语言准确地转化成另一种语言。它又可分为转化、解释和推断三种。

3、运用

指在具体的情境中使用抽象概念，是对所学知识的初步运用.运用代表了较高水平的理解，比如用二元一次方程解答工程性质的应用题，又如把其它文献中已经提出来的新论点用来引证自己类似的实验结果。

4、分析

指将一种传播内容分解成为它的组成因素和组成部分，以便弄清各种观念之间的关系。

5、综合

指将各种要素及组成部分组成一个整体，以构成更为清楚的模式或结构。综合强调的是创造能力。

6、评价

指为了一定的目的，对某些观念和方法等的价值作出判断。包含根据内部准则判断和依据外部准则判断两方面的内容。

2、对布鲁姆教育目标分类的评价：

?从教育目标划分标准来看，布鲁姆所用的标准是测量学的，无论是知识、领会、应用、分析、综合还是评价每一个教育目标都是围绕着如何测量或操作的角度提出的。

?布鲁姆的教育目标分类便于全面描述教学目标和评定教学，但未揭示各级层次的智力技能的心理机制，因而无法指导教师用什么方法或提供什么学习条件来实现教学目标。

?总结：教育目标分类系统对认知领域中的教学目标由低到高进行划分，符合能力由简单到复杂发展原则。认知领域分类标准是测量学的，有利于指导学习结果的测量与评价。

3、测验题目类型与测量功能：

?测验题目分类:选择型和供答型。

?选择型一般要求被试在几个选项中选择正确的答案，如是非题、匹配题、选择题等，后者要求被试自己提供答案，如论文题、简答题、填空题等。

?若根据被试作答的范围和评分方法不同，又可分为主观性试题和客观性试题。

客观性试题主要是因为评分客观而得名，它的正确答案在测验前就已准备好，不同评分者各自独立评分，所得结果基本上是相同的。客观性试题一般适用于测量知识的掌握、理解、应用、分析几个层次的教学目标。客观性试题的答案明确，作答简便，因而在限定的时间内测验可以包含足够数量的试题，能保证对知识内容的覆盖。

主观性试题主要包括论述题、操作题和作文题等。它们适合于测量较高层次的教学目标，尤其适合于测量综合、评价等目标层次。主观性试题鼓励被试积极地组织所学的资料，表达自己的观点。被试在作答时，耗费的时间较长，在限定的时间内，试题数量不可能太多，对知识的覆盖面较小。由于没有明确统一的标准答案，评分易受评阅者的主观因素影响，因而误差较大。

一、客观性试题的类型及其编写技巧

(一)选择题

1．结构

选择题是由一个题干和几个选项组成。

题干一般是问题或待完成的句子，选项是几个真假不明的答案，让被试从中选出正确的答案。2．优缺点

优点：(1)可以用来测量学生各种不同层次的学习结果。

(2)评分标准统一、客观，可以利用电脑评卷，提高评卷的速度和自动化水平。

(3)可以加大试题容量，抽取广泛有效的代表性样本，使试题覆盖的知识范围广。

(4)有利于考查被试思维的敏捷性和准确的判断力。

（5）采用大量的似真选择项使结果易于诊断，通过对学生错误选项的分析便于发现学生在学习中存在的问题，以便及时纠正。

缺点:

(1) 编制选择题较花费时间，且需要专门的命题技巧。

(2)难以考核被试完全的推理能力、综合运用所学知识的能力、有效的总结能力、严密

的表述能力和写作能力和被试的发散思维(或求异思维)能力。

(3)无法测量被试的思维(解题)过程。

(4)被试可以凭猜测而选中正确答案。

3．编写原则

(1)题干意义完整并能表达一个确定的问题。

(2)题干简明，尽量不使用过于复杂的字词与语句结构，也不要使用过长的语句。

(3)题干尽量不使用否定结构。

(4)诱答项应具有似真性。

①使用学生共同的错误观念或过失来作为诱答项。

②以学生惯用的模糊性用语叙述诱答项。

③在正确选项和诱答项中使用同样“精确的”、“重要性”等词语来叙述。

④诱答项的长度和措辞的复杂性与正确选项相似。

⑤在诱答项中使用额外的线索。如固定的用词，具有科学味道的答案，以及和题干有语义上的联系等。

⑥保持选项之间的同质性。

(5)不能对正确答案有任何暗示

(6)同一测验中每一个测验试题之间应相互独立避免牵连

(7)选项的文字表述，力求简短精炼。

(8)应尽量避免“以上皆是”、“以上皆非”的选项

(二)是非题

是非题又叫做二项选择题，它通常是给被试一个句子要被试作出正误的判断。

1、优点:

(1)编制容易。

(2)记分客观，取样广泛。

缺点:

(1)仅能测量知识层次中最基本的结果，无法测量高层次的学习结果。

(2)受猜测因素的影响很大。

2．编写原则

(1)考核的内容应是重要的知识，应有考核价值。

(2)题目应多是测量理解能力，而不应测验记忆性的知识，更不要直接抄录教科书中的句子。

(3)一个题目中只能有一个中心问题，或一个重要概念，避免两个以上的概念在同一题中出现。

(4)试题应做到是非界限分明，用词准确，避免模棱两可的语句。

(5)题目陈述应简单明了，避免使用复杂的句子结构，以减少因被试的阅读能力而对测量产生的不良影响，应尽量采用正面叙述，避免用否定和双重否定的语句。

(三)填空题

1、优缺点：

填空题可用来考查被试对知识的记忆和理解能力，在诊断性测验中特别适用。受被试猜测的影响小，评分比较客观。但填空题偏重于测量被试的知识记忆程度，使用过多容易养成被试死记硬背的习惯。

2、编制原则：

（1）题意要明确、限定要严密，使空白处应填的答案是唯一的。

(2)空白中所填写的应是关键词语，并且要和上下文有密切的关系

(3)题目中空白地方不能太多，以免句子变得支离破碎，不利于被试理解题意。通常一个填空题不应超过两个空白。

(4)尽量将空白放在句子的后面或中间，而不要放在句子开头。

(5)所有空白处的线段长度应当一致，不能随正确答案文字的多少而长短不一，以免产生暗示作用。

(6)若答案是数字，应指明单位和数字的精确程度。

(四)简答题

1．特点

简答题适合测量被试对基本知识、概念和原理的掌握、记忆情况。编制较为简单、灵活，可以从不同角度、不同方向考虑，增大对知识考核的准确度和深度，并且不受猜测因素的影响。但其无法考核综合、分析、评价等高层次的教学目标;且评分也不够客观，有不同程度的正确或部分正确的答案而影响评分的客观性。

2．编制原则：

(1)问题的叙述要明确，要确实能使被试用简单的语言来回答。

(2)问题的答案应该只有一个，并且答案要简短具体。

(3)避免出只考机械记忆的题，应注重知识的应用。

(4)在考查某公式的应用时，不要给太复杂的数字，以免给计算带来麻烦。

(5)尽可能使用直接问句来提出问题。

二、主观性试题的类型及其编写要领

(一)论述题

论述题就是向被试提出问题，需要被试用自己的语言组成一份较长答案的试题。

1、优点:

(1)可以用来进行高层次的、复杂的学习结果的测量，可以用在各种学科领域，特别适用于社会科学、人文科学等。

(2)可以增进学生的思考、应用及解决问题的能力，对于被试的学习态度和学习方式可以产生积极的影响。

(3)可以促进学生写作能力的提高。

(4)试题的编制比较容易，并且受猜测因素的影响很小。

缺点：

(1)由于论述题一般都比较大，在一次考试中试题的数量不可能有很多，因此，其取样范围比较小且不均匀，影响测验的效度。

(2)评分的主观性强。

(3)因被试回答过于自由，回答方向又不尽相同，难于测得预期结果，重点容易失控。

(4)被试作答和评分阅卷都相当费时。

2．编制原则:

(1)试题应该用来测量较高层次的教学目标。如要求学生提出理由、解释变量间的关系、描述与评价资料、有系统地陈述结论等。

(2)要明确而系统地陈述问题，使被试能清楚地了解题目的要求。

(3)应采用答案具有统一定论的试题。

(4)一般不允许被试选择问题回答。

(5)为避免被试将时间集中在某一个他所不会做的题目上而影响对其他题目的回答，因此而影响考试成绩的真实性，最好在题目中能给出回答本题所需的参考时间。

(二)作文题

作文是对人的逻辑思维、形象思维、书面表达等多种能力的一种综合考查。

编制原则：

(1)根据考试的目的和需要确定考试作文的文体要求。

(2)根据社会的需要、现实生活和学生的实际设计命题。

(3)要根据被试的特点确定选材范围与写作意图，在确定选材和写作意图时，要考虑对所有被试都是公平的，并且试题应符合被试的心理特征。

(4)要给被试以发挥的余地。

第四章试卷质量分析与评价

质量分析：项目分析：难度、区分度

整体分析：信度、效度

1、难度的含义：指测题的难易程度，是指题目对学生知识和能力水平的适合程度的指标。用P 表示。

难度的计算：

1、题目分数为二分变量：正确率 P=R/N 答对人数/全体人数

适用题型：选择题、填空题、判断题等

2、题目分数为多分值：得分率

适用题型：填空题、简答题、论述题、计算题、作文题等

难度取值范围：0-1之间

卷面难度：试卷包含的所有试题难度的平均数。

常模参照测验难度取值范围：试题:0.3-0.7之间；卷面:0.5-0.6(0.6-0.7)之间

基于难度的题目分析：

? 难度过低与过高的题目原则上要淘汰，但属于必考的知识点,需重新命题,提高命题

的难度

? 由于出现科学性错误而导致难度不符，需重新命题

? 命题、内容均无大问题但难度不符的题目需进行详细分析找出原因所在

2、区分度的含义：是指测验题目对学业水平不同的考生的区分程度或鉴别能力。 1、点二列相关：

p 为该题答对人数比例；q 为该题未答对人数比例为该题答对者总分的平均分为该题未答对者总分平均分为所有考生总分的标准差

适用题型：选择题、判断题等

例、已知一测验中某选择题的通过率为0.5，答对者的测验总分平均为76分，答错者的测

对计算得到的区分度值应该再进行统计检验(根据测验人数，查相关系数显著性临界值表），才能说明试题区分度的高低。

pq S X X r t q p pb -=41.025.016

13)5.01(5.0166376==-?-=pb r

X 表示所有被试的测题得分 Y 表示所有被试的测验得分

填空题、简答题、论述题、计算题、作文题等

3 D 为鉴别指数

H 为高分组在该题的难度

L 为低分组在该题的难度

高分组：总分排序前27%的人

低分组：总分排序后27%的人

适用范围：被试人数太多时测验的区分度的估计

例、10000名，成绩排序前2700名的学生在第三题回答正确的人数为2500人，成绩排序后2700名的学生在第三题回答正确的人数为500人，按照两端分组法计算第三题的区分度。

鉴别指数的评价标准：

*难度与区分度的关系：

没有难度,就没有区分度;

试题的难度适中，则区分度较高；

难度系数过大或过小，试题的区分度都不会很好。

3、信度的含义：信度就是测量结果的可靠程度。也可认为是测量结果的稳定性程度。物理测量有信度，心理和教育测量也有信度。

常模参照测验信度的估计方法：

重测信度：（1）含义：用同一个量表（或测验）对同一组被试施测两次，所得结果的一致性程度。

（2）计算：同一组被试在两次测验上所得分数的相关系数表示。（积差相关或点二列相关）

（3）基本假设：测量对象的特质短期内不会随着时间的推移而改变。

（4）适用范围：异质性测验速度测验运动技能测验

复本信度：（1）含义：用两个平行测验测量同一组被试所得结果的一致性程度。

平行测验指试题格式、题数、难度、指导语和施测要求等方面都相同，测量的特质也相同但具体题目不同的两个测验。

（2）计算：同一组被试在两次测验上所得分数的相关系数表示。（积差相关或点二列相关）

（3）适用难度：难度测验速度测验

同质性信度：（1）含义：指测验内部所有题目间的一致性程度，也称内部一致性信度。测验的同质性信度较高，说明测验主要测的是某个单个心理特质，测验结果就反映了该心理特质的水平。

（2）估计方法：变分法、库-理法、ALF 信度

1、分半法

概念：将一个测验分成独立的两半后，所有被试在两半测题上所得分数的一致性程度。分半方法：

按题号的奇偶分半

按题目的难度分半

按题目的内容分半估计方法：斯皮尔曼-

两半测题，方差相等弗朗那根公式

两半测题，方差不等

卢伦公式： 2、库-理法：

适用条件：当测验题目全部为客观性试题时，可以用库—理法分析测验的内部一致性信度。估计方法： KR20公式：所有测题难度接近 KR21公式：所有测题难度相差较大 3、ALF 信度：也称克龙巴赫系数，当测验题目中既有客观性试题又有主观性试题时，估计测验的内部一致性信度为ALF 信度。

估计方法：

例、设某测验包含6道题(既有主观题也有客观题)，用该测验测量5名被试，测量结果如下表，估计该测验的内部一致性信度。

解：

① 求所有被试在每个题目上所得分数的方差Si2

② 求所有被试在每个题目上所得分数的方差之和ΣSi2。

③ 求所有被试所得总分的方差Sx2

④ 代入公式计算。

影响信度的因素分析：测验的长度; 测验的难度; 被试总体的特征；信度的评估方法; 测验误差。

4、效度的含义：效度是测验的准确性,即测验能够测出的欲测属性的程度

信度与效度的关系：信度高是效度高的必要而不充分条件；效度高信度一定高; 信度高效度不一定高。 ???

? ??--=∑22011X i i S q p K K KR ()???

? ??---=22111X KS X K X K K KR ???? ??--=∑2211X i S S K K α

浅谈父母教育方式对高中生学习成绩的影响

浅谈父母教育方式对高中生学习成绩的影响摘要：高中一般被认为是学生的转折点，因为这时的学生站在高考这座独木桥上，所以很多学生这时的压力都异常巨大，这个时期的学生因为压力和年龄的关系，变得非常敏感。高中生在如此压力巨大的学习环境中，有很多因素都会影响学习成绩。其中最重要就是家庭，一个家庭的条件以及家庭关系的和睦程度，都对高中生有着巨大的影响。关键词：家庭教育方式；成绩；高中生人们普遍认为，高中学生的学习成绩对于整个家庭和学校来说都是重要的，但是高中生的学习成绩一般会受到智力、环境、兴趣和行为诸多因素的影响。在整个过程当中，家庭对学生是最了解的，影响也是较大的。家庭中父母的行为、习惯、教育方式各有不同，本文着重讨论家庭中父母的教育方式对高中生学生成绩的影响，并提出相应的建议。一、家庭结构的改变自从改革开放以来，中国的经济得到了空前的发展，社会面临巨大的人口压力，随之而来的是政府的计生政策，这就导致了很多家庭的结构产生了巨大的变化。在以前，很多家庭都有许多子女，家庭氛围较为热闹，“四世同堂”也

是人们喜闻乐见的场景，但是随着计划生育政策的实施，这样的场景已经成为过去。现在高中课堂里面的学生大部分都是九零后和零零后，独生子女、丁克家庭，甚至单亲家庭也越来越多。随着人们生活节奏的加快，很多原因都会都会导致家庭离异，这些不良的因素也会在学生的心理留下烙印，家庭结构的改变，是使学生的性格受到影响的主要原因。二、家庭的教育内容现代的家庭教育包括的内容有很多，比如对学生进行思想品质教育、生活习惯养成、理道德教育、消费观念、立身处世的基本规范、劳动态度等诸多方面的内容。很多教育的内容决定着家庭对学生的教育方式，家庭中的父母对高中生的教育方式怎么样，往往也反映出了他们所采取的教育方式。父母在家庭中承担着主要的角色。用一个比喻来说就是父母是原件，家庭是打印机，而学生就是复印件，父母的行为和思想在很大程度上都影响着学生的思维和学习方式。在家庭教育的过程当中，还包含了许多情感因素，这些因素在很大程度上感染熏陶着学生，在对父母的观察中，通过自身的经历会不断地调整自己的状态，或高兴、或悲伤，在学习上也是这样，情绪很大程度上左右着学习的效果。三、现代家庭教育模式对学生的影响 1.独裁专制型在很多家庭中，会出现一些“法西斯”制度，就是这

教育测量与评价

教育测量与评价文件编码（008-TTIG-UTITD-GKBTT-PUUTI-WYTUI-8256）

《教育测量与评价》习题（一）填空题 1. _桑代克_的论着《精神与社会测量导论》一书标志着教育测量理论的诞生，泰勒领导了着名的八年研究并提出“行为目标评价模式”，最早提出了教育评价的概念，被称为“当代教育评价之父”。 2. 按照测量的精确程度，教育测量量表从低级到高级分为称名量表、顺序量表、区间量表/等距量表和比率量表。 3. 某道论述题满分12分，所有考生在这道题上的平均得分为分，则此题的难度为。 4.教育基本理论研究、教育测量与评价科学研究以及教育发展理论研究已成为现代教育科学研究的三大领域。 5. 教学工作评价的内容包括对教师的备课、上课、批改作业、课外辅导、命题考试等教学工作基本环节的评价。（二）判断题（√）1. 测验的信度受许多因素的影响。一般来讲，增加测验的长度，可以提高试题取样的代表性，因而有助于提高测验的信度。（√）2. 标准分数本身是关于原始分数的一种线性变换，因此，标准分数不改变原始分数的分布形态。（×）3. 假如某学生在期中语文统考中卷面分数为85分，又知该学生所在年级中有60％的学生成绩低于85分，则该学生的百分等级为51。（×）4. 等距变量具有等级变量的特征，要求连续数量之间的差距相等，亦即具有相等的单位。因此，等距变量可以作加减乘除运算。

（×）5. 教育评价的主要功能就是甄别和选拔，通过各个层次的教育评价可以监督教师的教学工作和学生的学习活动，确保学校教育教学工作的正常进行。（√）6. 测验试题的难度影响着测验分数的分布。（×）7. 现代测量理论是在经典测量理论的基础上发展起来的，修正了经典测量理论的不足，所以现代测量理论可以完全代替经典测量理论。（√）8. 发展性教学评价认为面面俱到的课不是好课，只是“教教材”，没有“用教材教”的课也不是好课。（三）简答题 1. 常见的指标权重分配方法有哪几种【答题要点】：常见的指标权重分配方法包括：（1）关键特征调查法；（2）两两比较法；（3）专家评判平均法；（4）倍数比较法；（5）Q分类法。答题时一是要阐述清楚这五种方法各自的内涵是什么，二是简单说明这五种方法的操作步骤。相关内容可参考第七章“制定教育评价表的一般方法和步骤”中第二节“教育评价表的构成及编制”。 2. 衡量测验质量的四个指标分别是什么【答题要点】：（1）衡量测量质量的四个指标分别是信度、效度、难度和区分度。（2）在答案中需阐述清楚这四个指标分别的定义是什么。（3）一个良好的测验应该具备恰当的难度和区分度，具备较高的信度和效度。（4）指出这四个指标对于测量质量的意义，即前两个指标主要是对整个测验而言，后来两个指标主要是对测量的项目而言。相关内容可参考第三章“教育测量与评价的质量特性”。 3. 在现代社会中，具有健康人格的学生具有哪些特征

教育测量与评价》作业

一、选择题（每题1分，共15题） 1、根据某些法则与程序，用数字对事物在量上的规定性予以确定和描述的过程，这一概念是（A ） A. 测量 B. 评价 C. 测验 D. 统计 2、衡量、判断人物或事物的价值，这一概念是（B ） A. 测量 B. 评价 C. 测验 D. 统计 3、被称为教育评价的催生剂的是美国的一项著名研究，它是（D ） A. 教育研究 B. 教育测量理论研究 C. 心理测验研究 D. 八年研究 4、于1975年成立的在开展教育评价的国际交流与协作过程中，最有影响力的协会是（B ） A. 国际教育成就评价协会 B. 国际教育评估协会 C. 国际教育评价协会 D. 国际教育成就评估协会 5、测量结果的稳定性程度是指（C ） A. 效度 B. 稳定性 C. 信度 D. 可信度 6、用同一个量表（测验或评价表）对同一组被试测两次所得结果的一致性程度，其大小等于同一组被试在两次测验上所得分数的相关系数，这一概念是（B ） A.复本信度 B. 重测信度 C. 同质性信度 D. 分半信度 7、一个测验或量表实际能测出其所要测量的特性的程度，这一概念是（A ） A. 效度 B. 稳定性 C. 信度 D. 可信度 8、一个测验对于处于特定情境中的个体行为进行预测时的有效性，这一概念是（C ） A.同质性信度 B.复本信度 C.效标关联效度 D.重测信度 9、衡量测量题目质量的两个重要指标是（B ） A.信度与区分度 B.效度与信度 C.难度与效度 D.难度与区分度 10、表示每项评价指标在指标体系中所占的重要性程度，并赋予相应的值，这一概念是（D） A.评价指标 B.评价标准 C.指标权数 D.指标权重 11、在评价指标拟定过程中，经常会将评价指标按照评价对象本身的逻辑结构逐级进行分解，把分解出来的主要因素作为评价指标的方法，这种方法是（C ）

教育测量与评价教案

《数学教育测量与评价》教案第一章数学教育测量与评价的学科发展 [教学目的与要求]理解数学教育测量和教育评价的含义及二者之间的关系，了解数学教育测量与评价的主要发展历程、基础教育课程改革精神及对数学教育测量与评价的要求，认识数学教育测量与评价的学科地位和作用、数学教育测量与评价对教师职业专业化的重要性。 [重点与难点]重点：数学教育测量和教育评价的含义及二者之间的关系、数学教育测量与评价的学科地位和作用。难点：数学教育测量和教育评价的含义及二者之间的关系。 [教学时数]讲授2课时，课堂讨论、学生自主学习1课时 [教学方法与手段]课堂讲授、课堂讨论与学生自主学习相结合第一节数学教育测量与评价的基本问题一、数学教育测量与评价的含义二、教育评价的基本问题三、教育评价相关概念辨析第二节数学教育测量与评价的发展历史一、中国是考试制度的发源地二、中国科举制度的世界地位三、数学教育测量学科的诞生四、数学教育测量运动的蓬勃开展五、美国的“八年研究”是教育评价的催生剂六、数学教育测量与评价理论的发展第三节数学教育测量与评价的学科地位和作用一、数学教育测量与评价是现代教育科学研究的三大领域之一二、数学教育测量与评价在教育改革中具有重要的作用三、教育改革呼唤数学教育测量与评价更加科学化四、数学教育测量与评价是教师的专业素养和能力 [课堂训练、作业思考题] [1]数学教育测量与评价有什么联系与区别？ [2]教育评价与教育评估有什么联系与区别？ [3]在学科专业分类中，“数学教育测量与评价”放在哪一个类别中比较合适？ [4]试分析一下，狭义、中义与广义的教育评价概念有何区别？ [5]怎样使用数学教育测量与评价这个概念？ [6]为什么说数学教育测量与评价在教育中有重要的作用？

2015教育测量与评价网络作业1

一、什么是教育测量？什么是教育评价？答：教育测量：就是针对学校教育影响下学生各方面的发展，侧重从量的规定性上予以确定和描述的过程。教育评价：按照一定的价值标准和教育目标，利用测量和非测量的种种方法系统地收集资料信息，对学生的发展变化及其影响学生发展变化的各种要素进行价值分析和价值判断，并为教育决策提供依据的过程。二、分别按教学运用的时机和解释结果的参照点，测量和评价可分为哪几个类别？分别是什么？答：（1）按测评在教学中运用的时机分类：形成性测量与评价、诊断性测量与评价、终结性测量与评价。（2）按解释测评结果时的参照点分类：常模参照测量与评价、标准参照测量与评价、潜力参照测量与评价。三、某次高考模拟试卷高一的5名学生做所用时间分别为170、120、110、160、130分钟；高三的5名学生做所用时间分别为50、70、90、55、45分钟；问高一和高三哪一组离散程度大？答：答：高一用时平均值：x1=（170+120+110+160+130）÷5=138 高三用时平均值：x2=（50+70+90+55+45）÷5=62 高一用时离差平方和：∑1 =（170-138）2+（120-138）2+(110-138) 2+(160-138) 2+(130-138)2= 1024+324+784+484+64=2680 高三用时离差平方和：∑2 =（50-62）2+（70-62）2+(90-62) 2+(55-62) 2+(45-62)2 =144+64+784+49+289=1330 高一用时标准差：S1=Sqrt(2680÷5) =23.15167 高三用时标准差：S2=Sqrt(1330÷5)=16.30950 两者对比，高三标准差比高一用时标准差差距较小所以高一用时离散程度较大。

大学《教育测量与评价》试题库及答案

瑞文测验中哪一项是适用于高智力成人的（）收藏 A. B 瑞文彩图推理测验 B. A 瑞文标准推理测验 C. D联合瑞文推理测验 D. C 瑞文高级推理测验回答错误!正确答案： D 对人的智力进行的一种客观、标准化的度量，叫做（）收藏 A. D 智力测验 B. B 情商 C. C 智力 D. A 能力回答错误!正确答案： A WAIS 的计分是（）收藏 A. A 先计算标准分 B. B 先计算智商 C. D答对1题得1分 D. C原始分转化为标准二十分回答错误!正确答案： D 测验所要达到的某种具体的目的，叫做（）收藏 A. B测验目标 B. D 行为目标 C. C 教学目标

A 教育目标回答错误!正确答案： C 在评价对象的集合内选择一个或若干基准，各个评价对象和基准进行比较，叫做（）收藏 A. A 绝对评价法 B. C 教育评价方法 C. D 定量分析法 D. B 相对评价法回答错误!正确答案： D 在编制试题时，题型的分类中填空题、改错题、名词解释、简答题都属于（）收藏 A. B 选择型 B. D 常用题型 C. A 提供型 D. C 开放式回答错误!正确答案： C WISC主要测验的年龄范围是（）收藏 A. B 6-16岁 B. D 4-75 C. A 4-6.5岁 D. C 16岁以上回答错误!正确答案： A 忧郁、淡漠、悲观、思想与行动缓慢，分数太高可能会自杀。是哪种临床表现（）收藏

A 疑病 B. B 抑郁 C. D 精神病态 D. C 癔症回答错误!正确答案： B 由反映评价对象内涵的指标集、评价标准和量化符号构成的是（）收藏 A. B 模型 B. A 框架 C. D 体系 D. C 教育评价指标体系回答错误!正确答案： D 以班级的平均成绩为标准对学生学习成绩进行的评价为（）收藏 A. B 相对评价 B. D 需要性的评价 C. C 比较性评价 D. A 绝对评价回答错误!正确答案： A 我国教育工作者创造的认知领域目标分类法是（）收藏 A. C 五分法和四分法 B. B 三分法 C. A 六分法 D. D 二分法

现代教育测量和评价学

现代教育测量与评价学 1、一次考试中某生在50名学生中排名第13名，则该生的百分等级应该是【 B 】A．13 B． 26 C． 50 D． 74 2、在现代测验理论的诸多模式中，最具有优越性的是【 B 】A.经典测验理论B．项目反应理论C．心理测验理论D．智力测验理论 3、适合于某些用于选拔和分类的职业测验的效度是【 B 】A．时间效度B．内容效度C．效标关联效度 D．结构效度 4、韦克斯勒智力测验属于【 B 】 A．限时测验和典型作为测验B．限时测验和最高成就测验C．非限时测验和典型作为测验 D．非限时测验和最高成就测验 5、测验被试回忆或辨认某些特定事实的能力的认知层次是【A 】A．知识 B．应用 C．分析 D．综合 6、学生成绩测验的主要类型有安置性测验、形成性测验、诊断性测验和【 D 】 A．智力测验 B．能力倾向测验 C．人格测验D．总结性测验 7、学业成绩是一个【 D 】 A.名义变量 B．顺序变量 C．等距变量 D．比率变量 8、通常认为|r|<0.2时称为【 A 】 A．极低相关 B．低相关 C．中等相关 D．高相关9、根据测验编制程序的严格程度，可以简单地把学业成就

测验分成教师自编课堂成就测验和【 D 】 A．标准参照测验 B．纸笔测试 C．安置性测验D．标准化成就测验 10、下面题型中属于客观题的是【 D 】 A．计算题B．证明题 C．作图题D．选择题 11、最重要的测验质量指标是【 A 】 A．难度 B．区分度 C．梯度D．效度 12、评价的重点在于“过程”的评价是【 B 】 A．诊断性评价B．形成性评价 C．总结性评价 D．整体性评价 13、在布鲁姆认知领域教育目标分类中，层次最低的是【 D 】A．领会 B．应用 C．分析D．知识 14、学生的英语测验成绩属于【 B 】 A．名义量尺B．顺序量尺 C．等距量尺 D．比率量尺 15、内容效度的评估方法不包含【 B 】 A、专家判断法 B、双向细目表法 C、统计分析法 D、经验推测法． 16、下列几种效度中，不具有效度真正意义的是【 C 】A．结构效度 B．内容效度C．表面效度 D．效标关联效度17、学期初或单元教学开始时使用的测验是【 A 】A．安置性测验 B．形成性测验 C．终结性测验 D．能力倾向性测验

教育测量与评价教案

教育测量与评价教案 Company number：【0089WT-8898YT-W8CCB-BUUT-202108】

《数学教育测量与评价》教案第一章数学教育测量与评价的学科发展 [教学目的与要求]理解数学教育测量和教育评价的含义及二者之间的关系，了解数学教育测量与评价的主要发展历程、基础教育课程改革精神及对数学教育测量与评价的要求，认识数学教育测量与评价的学科地位和作用、数学教育测量与评价对教师职业专业化的重要性。 [重点与难点]重点：数学教育测量和教育评价的含义及二者之间的关系、数学教育测量与评价的学科地位和作用。难点：数学教育测量和教育评价的含义及二者之间的关系。[教学时数]讲授2课时，课堂讨论、学生自主学习1课时 [教学方法与手段]课堂讲授、课堂讨论与学生自主学习相结合第一节数学教育测量与评价的基本问题一、数学教育测量与评价的含义二、教育评价的基本问题三、教育评价相关概念辨析第二节数学教育测量与评价的发展历史一、中国是考试制度的发源地二、中国科举制度的世界地位三、数学教育测量学科的诞生四、数学教育测量运动的蓬勃开展五、美国的“八年研究”是教育评价的催生剂六、数学教育测量与评价理论的发展第三节数学教育测量与评价的学科地位和作用一、数学教育测量与评价是现代教育科学研究的三大领域之一二、数学教育测量与评价在教育改革中具有重要的作用三、教育改革呼唤数学教育测量与评价更加科学化四、数学教育测量与评价是教师的专业素养和能力 [课堂训练、作业思考题] [1]数学教育测量与评价有什么联系与区别 [2]教育评价与教育评估有什么联系与区别

教育测量与评价164答案

《教育测量与评估》模拟试卷D 参考答案：一、概念辨析 1、信度与效度：信度：是反映测验成绩在不同条件下的一致性、连续性程度的指标。任何测量都必须具有客观性和可靠性，即测量结果不能随测量者、时间、地点的变化而变化，作为测量、测验的可靠性问题就是测验的信度问题。测验效度：测验对于所要测量的心理特质进行评定的有效程度，即测验测到所想测量的特质程度。两者的关系在于：高信度一般都具有高效度，但是高效度不一定都有高信度。 2、随机误差与系统误差：随机误差：由偶然因素引起的无规律的误差。随机误差造成同一测验对同一对象多次施测结果之间的不一致，而且每次变化的大小和方向都是不稳定的，或者说是完全随机的，使测量结果围绕某一个“值”有所涨落。系统误差：由与测验目的无关的某种常定因素引起的有规律的变化。系统误差稳定地存在于每一次测量中，使测验的多次结果有规律地偏离某一个“值”，从而造成虽然一致却不准确的测验结果。二者的区别在于，随机误差是无规律的，并且是不可克服的，系统误差是有规律的，可以通过一定的手段加以矫正。 3、事实判断与价值判断：两者既相互区别又相互联系。区别在于：事实判断是对事物的现状、属性与规律的客观描述，包括量或质的描述，在教育活动中，教育测量与教育统计都属于事实描述的范畴。事实判断的基本要求是它的客观性，即真实地反映事物的本来面目。价值判断是根据评价者的需要和愿望对客观事物作出评判。因为教育的价值由教育活动满足主体需要的程度来决定，不同的主体由于需要不同，对教育活动就可能产生不同的判断，所以，价值判断受评价者价值观念的制约。价值判断有一个显著的特点：它是一种客观性与主体性高度统一的活动。价值判断往往在事实描述的基础上进行。 4、准则与标准：所谓准则是对评价活动内容或方面质的规定(即对被评属性的规定)。它是评价方案的核心部分，它规定评价活动评什么、不评什么。评价的准则通常有两种形式，即指标和概括性问题。所谓标准是指事物质变的临界点，即事物质变过程中量的规定性。评价标准是对评价内容或方面量的规定，即要求或完成的程度或水平。评价标准表示达到什么程度才是合乎要求的，或者能被称为优良的。二、简单题： 1、定量方法在评价中的作用：（1）定量分析是我们获得评价结论的重要依据；（2）定量分析是表述评价结论最简洁的方法；（3）定量分析是提高评价客观性的重要手段；（4）为简化评价工作，节约评价工作的人力和物力提供了方法。 2、举例说明什么是“权重”：在教育评价中，权重是指根据各组成要素在整体中的地位重要性和作用大小，所分别赋予的不同数值。权重代表了评价指标的重要性程度。应该遵循原则：各指标权重的取之范围为0－1之间；各指标权重之和为1。例如：教育评价与测量考试成绩由二部分组成：平时成绩×0.3+期末考试成绩×0.7其中0. 3、0.7就是权重系数。 3、如何理解难度的相对性：合适的项目难度取决于测验的目的、内容、形式及学生被试的

浅谈新课程下的教育测量与评价

浅谈新课程下的教育测量与评价保和一中霍占军教育测量与评价是当今世界教育科学研究的三大领域之一。它不仅在教育科学体系中占有显赫的地位，而且在教育教学过程中具有重要而广泛的应用价值。由于教育测量与评价在实践中具有强烈的导向作用，因此，教育测量与评价常常成为教育改革的突破口，也往往成为课程改革的支撑点之一。第一讲教育测量与评价的学科发展本讲主要探讨教育测量与评价的基本问题，包括教育测量与评价的基本概念、教育测量与评价的学科地位、教育测量与评价的应用价值、教育测量与评价的类型和功能等问题。大家在学完本章后,应当能够定义教育测量和教育评价；认识教育测量与教育评价之间的关系；认识教育测量与评价的学科地位及社会价值；了解基础教育课程改革精神及对教育测量与评价的要求；认识教育测量与评价对教师职业专业化的重要性。教育测量与评价的基本问题（一）教育测量与评价的含义教育测量与评价是所有成功教学的基础，也是诸多教育决策的重要依据。 1、认识测量的含义与条件。任何事物都是质与量的统一体。所谓测量（measurement），从广义上讲，就是根据某些法则与程序,用数字对事物在量上的规定性予以确定和描述的过程。

要实现测量一般需要具备如下一些基本条件：首先必须依据某些科学原理和法则，发展出合适的量具,或制定出科学的测量方案。其次是必须有意义相对明确的测量单位。最后是用数字对事物在量上的规定性予以确定，就需要有一个测量或计算的起点，这个起点叫参照点。总之,测量的量具、测量的单位和测量的参照点，是测量的三个基本要素或三个基本条件。测量结果是否准确可信，依赖于科学规范的测量程序、有效性的测量工具、意义明确的测量单位和测量的参照点。 2、认识教育测量的含义与特点。教育测量，就是针对学校教育影响下学生各方面的发展，侧重从量的规定性上予以确定和描述的过程。教育测量具有如下一些鲜明的特点。第一，教育测量的间接性和推断性。第二，教育测量对象的模糊性和测量误差的不可避免性。第三点，教育测量的量表具有多样性，教育测量的结果具有相对抽象性。（二）教育评价的基本问题 1、理解评价的一般含义。广义地讲，评价泛指衡量、判断人物或事物的价值。评价活动的过程是对人物或事物的价值进行分析、衡量和判断的过程。当把“评价”一词特别地用于学校教育领域或课堂教学情境时，“评价”往往就是“教育评价”一词的简称。 2、教育评价概念的发展。国内外一些学者对“评价”一词在教育教学活动情境下的若干典型的解释：下面是国内外一些学者对“评价”

教育测量与评价

第一章、教育测量与评价的学科发展教育测量与评价一.教育测量 1、测量:根据法则给事物赋予数量。(史蒂文斯) 测量：客观事物及其属性；所依据的规则或方法；数量化的结果。 2、教育测量：广义：对于教育领域内的事物或现象，根据一定的客观标准，作缜密地考核，并依据一定的规则将考核的结果予以数量的描述。狭义：是指对学生某些学科经过学习和训练之后，所获得的知识、技能的测量。又称成就测量、学业成绩测量或学科测量。 3、教育测量的特点： 1.间接性和推断性 2.测量对象的模糊性和测量误差的不可避免性 3.量表具有多样性,结果具有相对抽象性 4.测量目的的针对性二.教育评价评价：评：评定；价：价值——教育价值教育评价：注重效果：美国的泰勒；注重资料的获得：美国的克龙巴赫、斯塔弗尔比姆；注重评价方法、手段：中国的张秀理、日本的长谷川容 1、教育评价的概念：教育评价是评价者对教育活动或行为主客体价值关系、价值实现过程、结果及其意义的一种认识活动过程，其核心内容是揭示教育活动或行为中的客体对主体的需要、目标的价值意义。三.教育测量与评价的关系联系: 教育测量就是指根据一定的理论、规则，运用一定的测量工具对教育现象进行数量化描述的过程教育评价是对教育现象状态和价值的判断，这一判断是以对评价对象的客观描述为前提的，没有对评价对象的客观描述，就不会有对评价对象价值的客观判断教育测量是教育评价的基础，教育评价要在教育测量所获得的客观信息的基础上进行.同时，教育测量的结果要通过评价才能获得实际意义．教育测量与评价的区别：第一，测量是对事物数量特征的获得。而教育评价则是对教育现象客体的价值进行判断。第二，教育测量是一种纯客观的过程，其突出特点是客观性。而教育评价则具有两种属性，即客观性和主观性第三，测量的任务是对事物的量的认识，而评价作为一种认识活动，是人的意识对实践活动及其结果的综合反映，它反映的是活动的过程和终点，又是新的实践活动的起点。教育测量与评价的产生与发展过程：一.教育测量的产生 1904年以前（教育测量的萌芽期）中国的科举制（隋炀帝大业二年，公元606年）科举制的特征：逐级考核、制度完备、考场严格、命题规范

北师大网络教育2017年春季《教育测量与评价》在线作业

北师大网络教育2017年春季《教育测量与评价》在线作业作业题目列表单选 1.根据某些法则与程序，用数字对事物在量上的规定性予以确定和描述的过程，这一概念是（） A. 测量 B. 评价 C. 测验 D. 统计参考答案：A.测量 2.衡量、判断人物或事物的价值，这一概念是（） A. 测量 B. 评价 C. 测验 D. 统计参考答案：B.评价 3.在现代测验理论的诸多模式中，最具有优越性的是（） A. 经典测验理论 B. 题目反应理论 C. 心理测验理论 D. 智力测验理论参考答案：B.题目反应理论 4.被称为教育评价的催生剂的是美国的一项著名研究，它是（） A. 教育研究 B. 教育测量理论研究 C. 心理测验研究 D. 八年研究参考答案：D.八年研究 5.于1975年成立的在开展教育评价的国际交流与协作过程中，最有影响力的协会是（） A. 国际教育成就评价协会 B. 国际教育评估协会 C. 国际教育评价协会 D. 国际教育成就评估协会参考答案：B.国际教育评估协会 6.测量结果的稳定性程度是指（） A. 效度 B. 稳定性 C. 信度 D. 可信度参考答案：C.信度 7.用同一个量表（测验或评价表）对同一组被试测两次所得结果的一致性程度，其大小等于同一组被试在两次测验上所得分数的相关系数，这一概念是（） A. 复本信度

B. 重测信度 C. 同质性信度 D. 分半信度参考答案：B.重测信度 8.一个测验或量表实际能测出其所要测量的特性的程度，这一概念是（） A. 效度 B. 稳定性 C. 信度 D. 可信度参考答案：A.效度 9.一个测验对于处于特定情境中的个体行为进行预测时的有效性，这一概念是（） A. 同质性信度 B. 复本信度 C. 效标关联效度 D. 重测信度参考答案：C.效标关联效度 10.衡量测量题目质量的两个重要指标是（） A. 信度与区分度 B. 效度与信度 C. 难度与效度 D. 难度与区分度参考答案：D.难度与区分度 11.表示每项评价指标在指标体系中所占的重要性程度，并赋予相应的值，这一概念是（） A. 评价指标 B. 评价标准 C. 指标权数 D. 指标权重参考答案：D.指标权重 12.在评价指标拟定过程中，经常会将评价指标按照评价对象本身的逻辑结构逐级进行分解，把分解出来的主要因素作为评价指标的方法，这种方法是（） A. 头脑风暴法 B. 理论推演法 C. 因素分解法 D. 典型研究法参考答案：C.因素分解法 13.一个与被试同类的团体在相同测验上得分的分布状况与结构模式，这一概念是（） A. 模型 B. 常模 C. 量规 D. 参照物参考答案：B.常模 14.我国高考标准分数采用了一种方案，这种方案是（） A. 正态化转换方案 B. 对比参照方案

教育测量与评价答案

《教育测量与评价》作业本课程作业由两部分组成。第一部分为“客观题部分”，由15个选择题组成，每题1分，共15分。第二部分为“主观题部分”，由简答题和论述题组成，共15分。作业总分30分，将作为平时成绩记入课程总成绩。客观题部分：一、选择题（每题1分，共15题） 1、根据某些法则与程序，用数字对事物在量上的规定性予以确定和描述的过程，这一概念是（ A） A. 测量 B. 评价 C. 测验 D. 统计 2、衡量、判断人物或事物的价值，这一概念是（ B ） A. 测量 B. 评价 C. 测验 D. 统计 3、被称为教育评价的催生剂的是美国的一项著名研究，它是（ D ） A. 教育研究 B. 教育测量理论研究 C. 心理测验研究 D. 八年研究 4、于1975年成立的在开展教育评价的国际交流与协作过程中，最有影响力的协会是（ B） A. 国际教育成就评价协会 B. 国际教育评估协会 C. 国际教育评价协会 D. 国际教育成就评估协会 5、测量结果的稳定性程度是指（ C ） A. 效度 B. 稳定性 C. 信度 D. 可信度 6、用同一个量表（测验或评价表）对同一组被试测两次所得结果的一致性程度，其大小等于同一组被试在两次测验上所得分数的相关系数，这一概念是（B ） A.复本信度 B. 重测信度 C. 同质性信度 D. 分半信度 7、一个测验或量表实际能测出其所要测量的特性的程度，这一概念是（ A ） A. 效度 B. 稳定性 C. 信度 D. 可信度 8、一个测验对于处于特定情境中的个体行为进行预测时的有效性，这一概念是（ C ） A.同质性信度

B.复本信度 C.效标关联效度 D.重测信度 9、衡量测量题目质量的两个重要指标是（ B ） A.信度与区分度 B.效度与信度 C.难度与效度 D.难度与区分度 10、表示每项评价指标在指标体系中所占的重要性程度，并赋予相应的值，这一概念是（ D ） A.评价指标 B.评价标准 C.指标权数 D.指标权重 11、在评价指标拟定过程中，经常会将评价指标按照评价对象本身的逻辑结构逐级进行分解，把分解出来的主要因素作为评价指标的方法，这种方法是（ C ） A.头脑风暴法 B.理论推演法 C.因素分解法 D.典型研究法 12、一个与被试同类的团体在相同测验上得分的分布状况与结构模式，这一概念是（B ） A. 模型 B. 常模 C. 量规 D. 参照物 13、我国高考标准分数采用了一种方案，这种方案是（D ） A. 正态化转换方案 B. 对比参照方案 C. 百分等级方案 D. 常模参照方案 14、最早的测验理论是（A ） A.经典测验理论 B.题目反应理论 C.心理测验理论 D.智力测验理论 15、在现代测验理论的诸多模式中，最具有优越性的是（B ）

浅谈如何提升中小学生的学科核心素养

浅谈如何提升中小学生的学科核心素养在几千年的文化传承中，我们的文化有很多精华值得借鉴和研究，我们在研究核心素养的过程中要按照本国、本地、本校的具体情况进行有针对的研究，提出具有实际操作的可行性方法。所以，在经过课题组的研究和调查，本文就如何提升中小学生核心素养，依据调查结果和经验总结，认为我们当前核心素养提升的研究需要加强综合化的指导、专业化的实践与研究、本土化的实践与推广等。标签：核心素养；实践研究；理论学习一、加强对中小学教师核心素养知识的指导在基层教育单位尤其是农村，老师的理论水平十分有限，对于核心素养具体指的是什么还有很多老师存在概念认知不清楚的现象。这主要是因为农村教师大都是“一专多能型”，一个老师要兼职好几门不同专业的课程，体育老师上数学、美术老师上语文、音乐老师上英语，这样的情况在农村学校是非常平常的事情，很多老师进入农村学校从事教学工作，基本上很难有机会直接从事直接所学的专业，因此农村老师在核心素养方面的理论知识认识不足是普遍现象。所以我们课题组经过研讨认为，教育主管机构应该在理论层面上给予农村教师专业的指导。就像我们出台的《课程标准》一样对核心素养进行全面系统的解释和阐述，让老师通过学习系统的理论知识去认识核心素养对于学生成长的作用，理解核心素养的提升有什么样的标准。老师只有对核心素养有了深入的了解，才会主动地去关注它，老师也只有认识了核心素养的提升对学生的实际作用，才会去认真的研究和实践，而这一切的基础都需要理论指导和支持，因此，提升小学生的核心素养要做的第一件事就是要强化理论指导和理论学习。二、进行专业化的实践和研究课题组的调查研究发现，在很多老师的印象中对于核心素养之类的东西都应该是语文课和思想品德课所需要研究的问题，与其他课程好像没有多大的关系。但从操作层面来看，我们要提升中小学生的核心素养就需要从学校教育的方方面面入手。学生核心素养的提升是全方位的，核心素养的理念应该深入到学校教育的每一个学科、每一项活动中去。要做到这些，我们就需要针对不同的课程进行不同的专业化实践和研究。比如我们在数学课程教学过程中去有意识地培养学生自主研究、自主探索、合作预习、小组展示等方面的能力，在培养的过程中逐步地实践核心素养对学生数学能力的要求。在体育课程的教学过程中，我们可以把对学生动手实践能力、身体协调能力、团队组织能力渗透进去。在音乐和美术课程教学过程中，我们可以把审美能力、多角度思维能力、空间与历史的链接能力培养通过具体的实践教学加进去。在科学课程的教学过程中，我们可以把实验能力、假设构思能力、解決实际问题的能力培养与核心素养的发展相结合进行研究。也就是说，我们要把核心素养的理念渗透到学校教育的所有过程中去，并且针对不同的专业进行具体的任务分解和研究。只有这样，才能够在学校教育的过程中把核心素养的提升落实到位，才能切实提高学生的核心素养。

教育测量与评价

第一章、教育测量与评价的学科发展填空用数字对事物在量上的规定性予以确定，就需要有一个测量或计算的起点，这个起点叫参照点。量表，指的是确定了测量单位和参照点并具有取值系统的测量工具。泰勒指出英国剑桥大学直到1720年才开始使用笔试。20世纪初，在桑代克的影响下名词解释教育测量：就是针对学校教育影响下学生各方面的发展，侧重从量的规定性上予以确定和描述的过程。教育评价：是根据一定的标准，对教育事物或现象的价值进行系统的调查，在获取足够多的资料事实基础上，作出价值分析和价值判断。简答题教育测量的特点 ①间接性和推断性 ②测量对象的模糊性和测量误差的不可避免性 ③量表具有多样性，结果具有相对抽象性 “八年研究”的基本原则 ①应当帮助学生学习什么，即在教育计划中，应当帮助学生发展哪些思维、感觉和行动的方式。 ②为了帮助学生达到教育目标，应当提供什么学习经验，即怎样帮助学生学习预期的东西。 ③怎样组织学习经验，以使这些经验的累计效果最大，即怎样的学习顺序和学习经验的整体计划会有助于学生内化他们所学之物，并将其应用于适当的环境。 ④怎样评价方案效果，即随后采取什么步骤，以不断检查期望的学习活动所发生的变化。美国的“八年研究”对传统的教育测验提出的一些批评 ①传统测验是片断的，不能全部了解知识之过程和人格之发展。 ②测验只是关注客观的信度，但对于质的妥当性已不足以说明。 ③测验是教科书主义，测验内容关注记诵教材中的知识，是片面的，不能反映学生的全面发展。 ④对测量或考试的过分依赖必然养成个人主义与被动式的学习态度等等。第二章、教育测量与评价的类型和功能填空教育测量评价可大致分成常模参照、标准参照和潜力参照。教育测量与评价所指向的被试的行为表现，按其性质分成最佳行为和典型行为。名词解释 1、形成性测量与评价：是在教学过程中经常实施的，在性质上大致相当于现在的中小学单元测验。形成性测量与评价的目的，对教育而言是藉此获得教学过程中连续性的反馈，了解学生的学习效果、学习历程、学习特点、学习困难等信息，作为随时修正自己教学的参考。 2、常模参照测量与评价：是将被试水平与测验常模相比较，以评价被试团体中的相对地位的一种测量与评价类型。也就是说，常模参照评价对学生学习成就的解释，是采用了相对的观点。 3、标准化测验：是指由测量专家严格按照测验编制程序而编成的一种测验，通常标准化测

教育测量与评价作业和答案

教育测量与评价作业和答案主观题: 1、简述难度及其计算方法2、论述几种常用的人格测量量表客观题：1、以题型为顺序，易到难、客观到主观、短答案题到长答案题，是什么的原则A 检核 B 测验顺序 C 表述合理 D 拼卷2、从评价对象所承担的责任和完成任务角度提出的标准叫做 A 效能标准B职责标准 C 素质标准 D 科学标准3、每个分测验的各项得分相加，称为分测验的 A 总分 B 量表分 C 原始分 D 标准分4、标准化考试的大样本团体的成绩的平均数，叫做 A 标准化成绩 B 常模 C 参照点 D 平均成绩 5、细致的观察，评价者对被评者的实际行动进行直接的观察和记录，然后把评价结果和意见反馈给被评价者，两者一起讨论改进措施的评价方法，叫做

A 定性分析方法 B 定量分析法 C 行为目标评价法 D 临床督导评价法6、卡特尔16种人格因素量表，适用于什么样的人群 A 各种人群 B 小学以上文化程度的人群 C 高中以上文化程度的人 D 初中以上文化程度的人群7、将原始分于平均分的距离以标准差为单位表示出来的分数称为A 平均数 B 加权平均数 C 标准差 D 标准分8、如果男生用“1”表示，女生用“2”表示，这种变量称为A 等级变量 B 类别变量 C 等距变量 D 等比变量9、教育测量数据的单位不等值，不能进行加减乘除运算，大部分属于 A 类别变量 B 等级变量 C 等距变量 D 比率变量10、下列选项中哪项在教育测量中较少见 A 类别变量 B 等级变量 C 等距变量 D 比率变量11、评价者和被评价者对评价现实的体验或反映，叫做 A 评价心理B 评价现实 C 评价活动 D 评

自学测验考试现代教育测量与评价网络课堂答案

教育测量与评价现代教育测量与评价学第一章教育测量与评价概述一、教育测量的含义（33分）本节测验题：智力测量属于 A. 物理测量 B. 心理测量 C. 生理测量 D. 社会测量二、教育测量的特点、教育评价的含义（35分）提出“凡物之存在必有其数量”命题的是谁？ A. 麦柯尔 B. 孟子 C. 桑戴克 D. 孔子三、教育评价的特点、教育测量与评价的产生（35分）现代教育评价产生的标志是 A. 《比纳.西蒙量表》 B. 科举考试 C. T.B.C.F制 D. “八年研究” 四、现代教育测量与评价的发展（30分）第四代教育评价”的创立者是 A. 枯巴和林肯 B. 比纳和西蒙 C. 桑代克和麦柯尔 D. 泰勒与布鲁姆五、教育测量与教育评价相关概念辨析（30分）我国教育法规定的两项基本教育制度：一是教育督导制度，二是 A. 教育评价制度 B. 教育考试制度 C. 教育测量制度 D. 教育评估制度第二章教育测量与评价的信度一、信度概述（31分）样本统计量与总体参数越接近，说明测验的信度 A. 越低 B. 无法判断 C. 越高 D. 需要验证二、重测信度、复本信度、同质性信度（一）（35分）用同一个量表对同一组被试先后施测两次，所得结果的一致性程度是A. 等值性信度

B. 等值稳定性信度 C. 分半信度 D. 重测信度三、同质性信度（二）、评分者的信度（一）（31分）若2个评分者评阅N份试卷，计算评分者的信度可用 A. 斯皮尔曼等级相关系数公式 B. 斯皮尔曼-布朗公式 C. 积差相关系数公式 D. 肯德尔和谐系数公式四、评分者的信度（二）、标准参照测验的信度（33分）估计标准参照测验的信度需要预先确定 A. 淘汰的人数 B. 达标的比例 C. 通过的人数 D. 决断的分数第三章教育测量与评价的效度一、效度概述、内容效度的含义（30分）下列适合于内容效度的测验是 A. 能力倾向测验 B. 成就测验 C. 人格测验 D. 性格测验二、内容效度的估计方法、结构效度（38分）下面哪种测验的效度不属于结构效度？ A. 智力测验 B. 焦虑测验 C. 动机测验 D. 学科测验三、效标关联效度（44分）效标关联效度也称为 A. 实证效度 B. 预测效度 C. 同时效度 D. 逻辑效度第四章教育测量与评价题目的难度和区分度一、难度及其计算、区分度及其计算（一）（40分）最适宜的难度系数是 A. 0.50 B. 0.00 C. 1.00 D. -1.00 二、区分度的计算（二）、区分度与信度和难度的关系（31分）难度系数越接近何值，题目的区分度越大？ A. 0.50

教育评价论文

教育测量与评价学科论文浅谈小学数学课堂中的激励性教学评价姓名：何沛鑫学号： ZGCQJJ2012013

浅谈小学数学课堂中的激励性教学评价重庆公共管理学院一分院何沛鑫【内容摘要】数学课堂教学评价不只是认定，更重要的是激励和调控。针对当前小学数学课堂教学评价中,由于受传统的评价影响,还存在着种种弊端。新课程的评价理念在于促进学生的全面发展，小学数学课堂教学激励性评价从?尊重差异，注重评价标准个性化的‘三个关注’；挖掘潜能，注重评价方法多样化的‘六个方法’；增进互动，注重评价主体多元化的‘四种主体’；运用语言，注重评价过程情感化的‘四种形式’。?等方面去激励学生，培养积极的学习态度，良好的学习品质，以及创新精神和实践能力，帮助学生认识自我、树立信心，为学生的终身发展奠定基础。【关键词】激励性评价课堂教学数学课堂教学评价不只是认定，更重要的是激励和调控①。二期课改倡导“以人为本”的教育思想，要求建立“立足过程，促进发展”的评价体系，关注每个学生的进步和各方面发展的潜能。《新课标》指出“评价的主要目的，就是通过对学生学习数学的行为、态度和所取得的进展的判断，使学生正确认识自己，增强学习数学的自信心，获得真实的成就感；引导和鼓励学生继续努力学习，切实改善学习态度，改进学习方法，在个性方向上充分发展、不断进步；同时使教师更好地了解学生的数学学习程度和需要，进行正确的教学决策，切实改进教学。” 然而，小学数学教学中传统的评价观念根深蒂固，忽视人文关注，把教育现象的价值判断引导到终结性结果上，强调内容与标准统一，被评价对象标准无差异之分，缺乏“不同的学生可以有不同的数学发展”的教学思想的体现；方法单一，强调评价方法都以终结性试题评价为主，且评价结果呈现仍多沿用百分制评定，缺乏数学学习过程与方法的评价；主体单一，强调教师对学生的单一主体评价，缺少多元的综合评价；过程单一，强调数学知识技能与技巧的学习水平测评，缺乏数学情感与价值观的测评；“为评价而评价”，忽视数学教学评价的有效性。长此以往，教师教无灵性，学生学无自主与创造，严重制约着学生的全面发展，与素质教育格格不入，与新课程理念背道而驰。因此，构建评价内容与标准的个性化，评价方法的多样化，评价主体的多元化，评价过程的情感化的激励性评价机制，有效促进学生全面发展刻不容缓，实施新的小学数学教学评价方式迫在眉睫。 ①上海市教育委员会；《上海市中小学数学课程标准》，100页，上海教育出版社。