当前位置：文档库 › 教育统计与测量总复习

教育统计与测量总复习

绪论

1什么是统计、教育统计、教育统计学是那些学科交叉结合的产物：统计：对事物某方面特性的量的取值从总体上加以把握与认识。教育统计：对教育领域各种现象量的取值从总体上的把握与认识，它是为教育工作的良好运行、科学管理、革新发展服务的。教育统计学是社会科学中的一门应用统计，是数理统计根教育学、心理学交叉结合的产物

2教育统计学的主要内容是什么：主要包括描述统计和推断统计。描述统计是通过列表归类、描绘图象、计算刻画数据分布特征与变量相依关系的统计量数，如平均数、标准差和相关系数等，把数据的分布特征、隐含信息，概括明确地揭示出来，从而更好地理解对待和使用数据。推断统计是教育统计的核心内容。如何利用实际获得的样本数据资料，依据数理统计提供的理论和方法，来对总体的数量特征与关系作出推论判断，即进行统计估计和统计假设检验

3什么是教育测量？根物理测量相比有可特点：测量：按一定规则给对象在某种性质的量尺上的指定值。教育测量：给所考查研究的教育对象，按一定规则在某种性质量尺上的指定值。理解教育测量抓住三个要点：（1）测量的结果就是给所测对象在一定性质的量尺上的指定值。（2）要达到目的就要按照一定规则来进行一系列工作。（3）工作如何进行和能在什么性质量尺上指定值，归根到底取决于所测对象本身的性质。教育测量的特点是间接性和要抽样进行

4“测量”“测验”“量表”的关系是什么：测量按一定规则给对象在某种性质的量尺上的指定值。而测量工具、施测与评分程序、解释分数的参照体系都以科学地实现标准化。即代表性行为样本的客观而标准化的测验，称之为标准化测验简称测验。

教育条件下的心理特质是学业成就的标准化测量，这种标准化测验叫标准化考试。标准化测验中的测量工具（考试卷或心理测试项目的集合）与解释分数的常模（或标准），都有物化的形态，合在一起称为量表。5有哪些不同性质的测量量尺：测量结果能在其上取定数值的量尺，从量化水平高低的角度可分为：名义量尺、顺序量尺、等距量尺与比率量尺。在名义量尺上所指定的数字，只具有类别标志的意义，而无性质优劣，分量多寡的意义。顺序量尺上的数字量化水平则较高，有优劣、大小、先后之别，如学业成绩评定优劣。等距量尺上的数字量化水平又更高，这种数字是单位相等但零点可任意指定的线性连续体系上的值，如温度、可比可加。比率量尺是一种有绝对零点的，等单位的线性连续体系。如身高、体重等。能加、减、乘、除

6学习教育统计与测量有何意义学习与掌握教育统计与测量学对于处在世纪之交的现代化教育工作者来说是十分必要的。这是提倡科学素养，改善知识结构，做好工作，探索规律，是教育更好地位社会主义现代化建设服务之所需。（1）教育统计与测量是教育科学管理的重要手段。教育行政部门和学校负责人，都要及时、系统、准确地把握重要教育现象的绝对量、相对量和综合指标的取值，进行动态监控。这样才能正确决策，及时采取得力措施，通过科学管理来保证教育质量、效益和切实合理的规模与发展速度。即使是普通教师，也要认真对班级的现状通过测量、调查，有准确而全面的认识。（2）教育统计与测量是教育研究的重要工具。统计的本质内容是思想方法，是逻辑。统计和测量，是我们进行教育研究设计，包括调查设计和实验设计，科学地收集资料，包括抽样和调查，特别是分析研究所获资料的强有力的方法与工具。（3）通过学习可以锻炼思想方法，掌握专门花的术语和符号，提高科学素养。教育统计就不但要求我们要善于处理确定性现象，更着重训练我们去处理好随机性现象；不但采用正确论证的方法去证实，而且十分重视使用反证法，通过证伪来求和。我们在进行学习时，就能很好地锻炼我们的思想，使我们更好地学会辩证法，具有科学的思想方法。

7你准备如何来学习教育统计与测量学（1）要切实下功夫掌握好基本概念和原理，弄清内在的逻辑和方法（2）要坚持理论联系实际，认真做好联系，并力争用心学知识来解决一些实际问题（3）要重视掌握技术工具

8测量工作按一定的规则进行，体现为三种东西即：测量工具、施测和评分的程序与要求、结果解释参照系或参照物

第一章数据分布的初步整理

1数据：用数量或数字形式表现的事实资料。

计数数据：以计算个数或次数获得的，多表现为整数。

测量评估数据：借助测量工具或评估方法对事物的某种属性指派给数字后所得的数据。

人工编码数据：以人们按一定规则给不同类别的事物指派适当的数字号码后形成的数据。

称名变量：说明某一事物与其他事物在名称、类别或属性上的不同，不说明事物之间差异的大小、顺序的先后及质的有劣。计算次数或个数，不能进行运算。

顺序变量：就事物的某一属性的多少或大小按次序将各事物加以排列的变量，具有等级性和次序性的特点。数据之间有次序和等级关系，不具有相等的单位，也不具有绝对的数量大小和零点，进行顺序递推运算。等距变量：表明相对大小，相等的单位，零点相对，不能用乘除法反映数据之间的倍比关系。比率变量：具有量的大小、相等的单位、绝对零点、进行运算，用乘除法处理数据，做比率描述

数据分布：研究一批数据时，首先关心的是这批数据中最小的是多少，最大是多少，以及这批数据从小到大是如何演变的这就是数据的分布

次数分布：一批数据中各个不同数值所出现次数多少的情况，或者是这批数据在数轴上各个区间内所出现的次数多少的情况。

数据的离散性：数据通通常意义各个分散的又一顶尖个的数字形式出现

数据的变异性：人们在得到数据的过程中，这些数据总是在一定范围内一变量的形式出现，很少有绝对相同的数据不断出现

数据的规律性：在一定范围内变化着的一组观测数据，其间潜在着某种规律性

2数据种类按来源：分计数数据、测量评估数据、人工编码数据；按反应的变量的性质分称名变量数据、顺序变量数据、等距变量数据、比率变量数据。

3数据特点：离散性、变异性、规律性

4统计一批数据的次数分布两种方法：一、按不同的测量值逐点统计次数；二、为了简缩数据以区间跨度来统计次数。如分数段统计

4相对次数分布表：相对次数：就是各组的次数f与总次数N之间的比值，若以R∫表示相对次数，则R ∫=f/N.表示1-4中第5栏里的数值就是各组的相对次数。当我们把表1-4是的第一栏和第5栏拼在一起时，便宜构成一个相对次数分布表。当我们阅读相对次数分布表时，相对次数（当然是小数）较大的组，则说明落入该组内的数据个数占全部数据个数的比例也较多；反之，则较少。它主要能反映各组数据的百分比结构。

4编制简单次数分布的步骤，说出对组限的规范写法本章有何规定：①求全距②定组数③定组距④写组限

⑤求组中值⑥归类划记⑦登记次数。本书用区间表示，左闭右开（都退0.5如20—25写作[)5.24,5.19

5以下累计与以上累计的不同：“以下”其目的在于反映位于某个数“以下”的累积次数共有多少；“以上”其目的在于反映位于某个数“以上”的累积次数共有多少

6次数分布图两种表达方式：次数直方图和次数多边图。次数直方图：由若干宽度相等、高度不一的直方条紧密排列在同一基线上构成的图形。横轴为组中值，宽度由组距i确定，纵轴为次数。次数多边图：利用闭合的的折线构成多边形以反映次数变化情况的图示方法（画法同上意思是不是柱状图二是不规则的连线）。用线段把相邻的点一次连接起来，连同横轴，构成一个闭合的多边形，即时次数多变图。从理论上讲，如若总次数无限增大，则随着组距的缩小，着写着线索接近的极限便将成为极为光滑而富有规则性的曲线，称做次数分布曲线。次数分布曲线按形状有各种不同类型①单峰对称分布曲线。正态分布曲线也是这一类型曲线中的一种②非对称曲线即偏态分布。正偏态：次数分布有朝数量大的一边偏尾，曲线高峰偏向数量小的方向，在一些考试中，若题目偏难，多数考分偏低时，可形成正偏态分布。而负偏态的次数分

布偏向正好与正偏态相反。○3倒U型次数曲线○4J型次数曲线（学习遗忘曲线）

7累计次数曲线图绘制步骤。（1）纵轴为累计次数的量尺，横轴代表测验的分数量尺（2）对于“以下”分布来讲，各个坐标点的位置，其横坐标是各组的实上限，纵坐标是累计的次数（3）用连续光滑的曲线把

点的轨迹连起来，再与横轴上最低组的实下限所在点连起来，形成“S”形曲线

8几种常用统计分析图：散点图、线形图、条形图和圆形图

9散点图：用平面直角坐标系上点的散布图形来表示两种事物之间的相关性及联系模式。适应描述二元变量的观测数据。（1）在平面直角坐标系中，横轴一般代表自变量，宗周一般代表因变量（2）点的描绘依二元观测数据而定，但在具体描绘时应注意用细线画坐标轴，用稍粗黑点描绘各个坐标点，点位置的确定安平面解析几何学中的方法（3）注意图形的比例要恰当和应有的图注说明。

10线形图：以起伏的折线表示某种事物的发展变化及演变趋势的统计图。适于描述事物在时间序列上的变化趋势，藐视一种事物随另一事物发展变化的趋势模式，比较不同人物团体在同一心理或教育现象上的变化特征几相互联系。（1）横轴代表自变量，纵轴代表因变量（2）根据有关统计事项的具体数据，在由纵横两轴所决定的平面上画记圆点，用稍粗的线段把相邻的点依次连接（3）在同一个图形中，可画若干条线（不超过3条）不同的线形图，便于比较分析。用不同的折线，在图形的适当位置上标明图例。

11条形图：用宽度相同的长条表示各个统计事项之间数量关系的图形。用于描述离散性的统计事项。有简单条形图和复合条形图。简单条形图注意（1）各个直方长条的宽度要相同，色调要一致（2）相邻长条之间的间隔要适当，根据统计项目的多少以及直方长条的宽度的0.5—1倍.复合条形图（1）各类直方长条的宽度要相同（2）不同类型的直方长条易用不同的色调加以区别，并在图形右上方适当位置上标明图例（3）把要比较的统计事项的直方长条相互分开，其间距一般取长条宽度的1—1.5倍

12圆形图：以单位圆内各扇形面积占整个圆形面积的百分比表示各统计事项在其总体中所占相应比例的图示方法。用于描述具有百分比结构数据。圆形图有其独特的功能，特别适用于描述具有百分比结构的分类数据。（1）以适当的半径作一圆，代表事物总体（2）分别以统计事项在其总体中的比例乘以圆心角，求出格相应扇形的圆心角（3）根据上述累计结果，一次用量角器把整个园划分成若干个扇形部分，并在其中标上各自的百分比数值（4）用不同的色调对不同的扇形加以区分，并在图形右边标上图例以便阅读（5）在图形的适当位置上，注明总体事物的数量，以弥补圆形图中只出现相对数而无绝对数的缺陷（6）注意整个图形的对称与协调，在图形下边适当位置标上图序与图题。

第二章次数分布的特征量数

1次数分布的特征量数：从数量方面处理，利用特定的算式或对数据结构做必要的统计处理，确定出一些能够反映与描述这批数据的全貌及特征的量数，这些量数我们称之为次数分布（一批数据）的特征量数。 2集中量数、作用集中量数：观测数据不仅具有离散性的特点，而且在多数情况下具有向某点集中的的趋势，反映次数分布集中趋势的量数。作用①向人们提供整个分布中多数数据的集结点位置②集中反映一批数据在整体上的数量大小③一批数据的典型代表值

3集中量数种类：算术平均数、中位数、众数。

4算术平均数：一批数据总和除以数据总次数所的的商。性质（1）—数据组全部观测值与其平均数的离差之和为0。（离差：一组数据中的一个数据与该组数据的算术平均数的差。X X x i i -=）（2）每一观测值都加上一个相同常数c 计算变换后数据的平均数等于原有数据的平均数加上这个常数。（若C X i +=i Y 则C X +=Y ）（3）每一观测值都乘上一个相同常数c 所得新数据的平均数，其值等于原数据的平均数乘以这个常数。（若i CX =i Y 则X C =Y ）（4）对每个观测值做线性变换，即乘上相同的常数，再加上另一常数d ，计算变换数据的平均数，其值等于原数据的平均数做相同线性变化后的结果。（线性变换，若d CX Y i i +=则d X C Y +=）特点（优点）反应灵敏、确定严密、简明易懂、概括直观、计算简便、代数运算、应用普遍。不足：（1）算术平均数需要每一个数据都加入运算，因此在数据有个别缺失的情况下则无法准确计算（2）算术平均数易受极端数据的影响，一旦在数据分布中出现个别极端数据，就会对平均数产生极大影响，从而使人对平均数产生怀疑。（即去掉一个最高分和最低分的

原因）（3）在一些特别情况下，由于个别数据的重要性不同，因此直接把数据简单相加以确定算术平均数的方法，不能充分考虑到各个数据的重要性程度。

5中位数：Mdn 位于数据分布正中间位置上的数，如果一组数据从小到大排列，则中位数通常是将这批数一分为二，居于中间的那个数。（奇数的数据取中间，偶数的取相邻两数的平均数）特点（优点）根据全部数据的个数确定位置，意义简明，对排成顺序的数据来讲，计算容易。中数计算基于中间位置相邻的部分数据，不受极端数据的影响。顺序变量的观测结果适合采用中数作为分布的集中量数。不足观测数据已分组归类或当原始数据分布中靠近中数附近有重复数据出现时，难以用观察法或简单的方法确定中数。中数一般不适合于作代数运算。由于中数不受其数据分布中两端数据的影响，中数缺乏灵敏性。应用价值①数据分布中有个别异常值或极端值出现时，用平均数作分布的代表值倒不如用中数作分布的代表值来得客观合理②在次数分布的某端或两端的数据只有次数而没有确切数量时③在一些态度测验、价值观测验或一般的民意问卷测试中，通常向被调查对象提出一些事项，要求被调查对象对这些事项排序。那么，在这种资料的信息数据整理分析中可应用中数来概括各个事项的总体排序结果

6众数Mo 一个次数分布中出现次数最多的那个数（是那个数据不是出现的次数的数）优缺点：直观易懂但不稳定，而且在一定情况下会出现两个甚至更多的众数。

7离中趋势：数据具有偏离中心位置的趋势，他反映一组数据本身的离散程度和变异性程度。

8差异量数：统计学上，把反映一组数据离散程度的量。作用（1）差异量数作为一组数据离散程度的概括化特征量数，判断一组数据与其中心位置的平均差异程度（2）比较两组数据的离散程度（3）数据的中心位置通常用平均数或中数两个集中量数来刻画，差异量数与集中量数是相互联系的。差异量数大，说明数据偏离集中量数所在位置的程度也较大。差异量数小，说明集中量数的代表性较好。常用的差异量数有平均差、标准差、方差。

9差异量数的用途和特点.(1)差异量数是用来描述一组数据的离散程度和变异性程度的量数(2)它可以大体判断一组数据与其中心位置的平均差异程度(3)还可以用这些差异量数来比较两组数据的离散程度；(4)此外，差异量数与集中量数相互联系，能够反映集中量数代表性的好坏。

9什么情况下不能使用差异量数（为何要计算差异系数）（1）两个次数分布的数据在测量单位上是不同的

（2）在一些特别场合下，尽管两组数据的测量单位相同，但两组数据的平均数相差太大，则这两组数据的差异量数一般也不易直接比较。于是要计算差异系数

10平均差：各数据与其平均数的离差绝对值的平均值AD 。优点（特点）从平均的角度反映了各个数据偏离中心位置的整体差异程度，直观易理解，科学性较强。实用性好，应用广泛。

不足：平均差指标计算中含有绝对值计算，这种计算一方面不便于利用计算器来快速处理大批数据，另一方面不便于做进一步的代数运算和处理。

11平均差计算步骤○

1求出平均数○2求出数据的离差○3求各数据离差绝对值之和○4对上述和求平均值。特别指出平均差越小越稳定；越大越不稳定即波动大）

12方差：一组数据的离差平方数的算术平均数

13标准差：一组数据方差的算术平方根用2S S =(求方差的目的是看相差多少)

14标准差运算性质（1）全组数据每一个观测值都加上一个相同的常数C 后,计算得到的标准差不变（2）若每一个观测值都乘以一个相同的常数C 后，所得到的标准差等于原标准差乘以这个常数的绝对值（3）每个观测值都乘以同一个非零常数C ，再加上另一个常数d ，所得数据的标准差等于原标准差乘以这个常数C 15差异系数：把差异量数与集中量数两相比较后所形成的相对差异量数。CV=S/X×100=标准差÷平均数。它反映相对离散程度的系数，即相对差异量数，失去单位。CV 值越大差异性越大。

16地位量数：反映次数分布中各数据所处地位的量。百分等级（百分位）：PR 反映某个观测分数以下数据个数占总个数的比例的百分数，在0到100之间取值。公式“以下累计次数”cf ÷数据总个数n 百分位数：位于特定百分等级位置上的一个数，它是次数分布中或量的尺上的一个数。如果百分等级PR=75。67，记作P75.67，读作第75.67百分位数，与其对应的百分位数是40分，其含义是说在总数是多少的人数中有

75.67%的学生分数在40分以下。未归类数据确定各数百分等级PR的步骤：（1）把观测数据从大到小依次排列（2）按不同的数据逐个统计次数，并列表记录（3）从低端开始向高端方向，计算各个观测点数据以下的累计次数（不包括本得分点次数）（4）计算各观测数据的“以下累计相对次数”，即比例数，计算方法是把“以下累计次数”cf 数据总个数n。（5）确定各观测点数据的百分等级PR，方法是把各数据的“以下累计相对次数”乘以100即可。

第三章相关系数

1直线性相关：是所有关联模式中最简单的一种，有关联的两个变量各自大体以均等的速度变化着。若以平面坐标散点图理解，其意指两个变量的成对观测数据在平面直角坐标系上描点构成的散点图会环绕在某一条直线附近分布

相关：统计学上用相关系数来定量描述两个变量之间的直线性相关的强度与方向。如相互关联着的两变量，一个增大另一个也随之增大，一个减小另一个也随之减小，变化方向一致是正相关。如相互关联着的两变量，一个增大另一个反而减小，变化方向相反是负相关。

相关系数（如何解释相关系数r）：用r表示，r在-1和+1之间取值。相关系数r的绝对值大小，表示两个变量之间的相关强度；相关系数r的正负号，表示相关的方向，分别为正相关和负相关；相关系数r=0，称零线性相关，简称零相关；相关系数|r|=1时，表示两个变量是完全相关。一般说，若观察数据的个数足够多的话，计算出来的相关系数r就会更真实的反映客观事物之间的本来面目。通常是，当0.7≤|r|＜1，称为高相关；当0.4≤|r|＜0.7时，称为中等相关；当0.2≤|r|＜0.4时，称为低相关；当|r|＜0。2时，称极低相关或接近零相关（【0.7，1）高相关；【0.4，0.7）中等相关；【0.2，0.4）低相关）

2积差相关：对一组数据离差值所得的结果进行相关的分析的方法称为极差相关。积差相关是应用最普遍、最基本的一种相关分析方法，尤其适合于对两个连续变量之间的相关情况进行定量分析。适合于对两个连续变量之间的相关情况强度和方向进行定量分析。（1）样本容量要大（n大于30）。（2）两列连续变量（比率变量或等距变量）。（3）两总体分布呈正态。（4）两变量之间存在线形关系。

3积差相关的优缺点：皮尔逊创立的极差相关法，是度量两个变量之间相关强度的有效指标，在一般情况下，人们均乐于采用。但积差相关在计算时手续较复杂，同时要求双变量均为连续变量，观测数据准确以及样本容量n要适当大些等条件。

4等级相关适应rR：根据两列顺序变量数据中各对等级数据的差计算相关系数的方法（必要时可分别把两列数据按大小顺序赋给名次等级）。适用于（1）两列观测数据都是变量数据，或其中一列数据是顺序变量数据，另一列数据是连续变量数据（2）两各连续变量的观测数据，其中有一列或两列数据的获得，只要依靠非测量方法进行粗略评估得到。

5比较积差相关和等级相关的异同相同之处：两者均是用来描述两个变量之间的直线性相关的强度与方向的量。不同之处：(1)两者适用的条件不同，积差相关适用于两个变量均是连续变量的情况，而等级相关则适用于两变量均是顺序变量。(2)计算精度不同，积差相关能更精确地描述两个变量之间的关系，而等级相关则只能粗略地描述相关的情况。

5点双列相关适应Rpb：适用于双变量数据中，有一列数据是连续变量数据，如体重、身高以及许多测验与考试分数。另一列数据是二分类的称名变量数据，如性别、态度、学习经历、考试结果等数据。

第四章测验分数的解释与运用

1分数：通过测量获得的、描述测量对象身心特性水平的数字。

原始分数：在测量工具上直接得到的测值（数字）。

相对评分分数：通过被试间相互比较而确定意义的分数。如全班冒尖，倒数第二

绝对评分分数：通过拿被试测值跟应有标准作比较来确定其意义的分数。合格不合格，达标未达标

常模：相对评分的参照物或者说是参照体系，就是所谓呢“测验常模”。“测验常模”简称常模，指一定人群在测验所测特性上的普遍水平或水平分布状况。可分为发展常模（年龄常模、年级常模）和组内常模（百分等级常模、标准分数常模）

2常模的作用：常模总是指某一具体测验（不能简单地看成是其名称所指特性）上的常模。常模总是特定的、具体的，是就一定人群在具体测验上的表现来说的

3常模建立的步骤：（1）科学抽样，从清楚明确地定义的特定人群总体中，抽取到容量足够大，具有代表性的被试样组（叫标准化样组或常模组）。（2）用拟建立常模的测验，采用规范化施册测手续与方法对标准化样组中的所有被试，实施测验，以便恰当准确地收集所有被试在该测验上的实际测值。（3）对收集道德全部资料进行统计分析处理，把握被试样组在测验上的普遍水平或水平分布状况。

4年龄常模：历史上第一个提出常模这一科学概念的是法国心理学家比纳。比纳在实际抽样调查研究的基础上，按通过率来确定项目难度并选定代表各年龄智力水平的恰当项目。发展常模就是某类个体正常发展进程各特定阶段的一般水平

5智商（IQ）=智力年龄/生理年龄×100。其缺点：这种比例智商事实上并不理想。人的智力却随年龄增大而提高和成熟，但其在各年龄阶段的发展速度并不相同，呈现现快后慢的态势，并在某年龄成熟后就趋于稳定不再变化了。

6原始分数：测验上直接获得的数值叫原始分数。而测验的年龄常模中原始分数所对应的年龄等值就叫测验的导出分数

7年级常模的缺点：（1）许多学校科目并不连年授课，所以无法求年级常模；即使是多年级授课的科目随年级的递升内容重点也不断转移（2）所得年级等值常以引起误解

8组内常模。解释被试原始分数的参照体系，以常模组的测验分数分布状态作为参照体系，说明被试特质水平在常模组内的相对位置，而不是与某一年龄或年级被试的一般水平相等同。分为百分等级常模和标准分数常模。

10百分等级本身不是等单位的量度：（1）心理和教育测验分数的分布状态，一般不会形成平行分布状态，而回形成“两头小中间大”的形状，或者如前所说，就成正态分布。（2）同样多的百分等级的差异，在中部代表的原测验分数的差异，比在尾端所代表的原测验分数的差异要小；或者说，百分等级在分数分布的中位数附近要缩小原分数的差异，而在尾端则要夸大原分数的差异。因此，百分等级不是等单位的量度。局限：百分等级值只有可比性而无可加性，不能累加求和与进一步求平均。

11标准分数标准分数是以它所属分数组的标准差为单位的，对它所属分数组的平均数的距离。

标准分数常模：用被试所测的测验分数转换成的标准分数来揭示其在常模团体中的相对地位的组内常模。12标准分数的单位是相等的：因为不论在一组分数分布的尾端还是中部，两原始测验分数之差若相等，转换出的标准分数的差也相等。即标准分数是等单位的量度，不存在尾端单位大而中部单位小的问题。标准分数是一个比值。分子是原始测验分数的离均差，它是会随测验分数取值不同而变化的；但分母却是一个固定值，是所属分数组的标准差，不随测验分数是在尾端或中部而变化，这样，就位置不同测验分数的离均差来求比值时，被比的基数都是相同的。

14建立标准分数常模的步骤：（1）从明确界定好的该测验应该测查的被试总体中，抽出一个容量足够大的代表性样组，即建立起常模组（常模团体）（2）对该代表性样组按应有规范施测该测验，获得代表性样组中每一被试的测验分数，即得到常模团体的测验数组。（3）求取常模团体的测验数组的平均数与标准差，按公式求取-3.000到3.000这一区间上若干个点上的标准分数根测验分数原始分数的对照表，就得到了标准分数常模表。

15什么叫线性变换后的标准分数？线性变换：所谓线性变换，就是对所有要作变换的值，都乘以同一确定值然后再加上另一确定值。全组数据都乘以同一确定值然后再都加上另一确定值，作出这种变换后，只会改变表现形式而不会改变其相互间地位关系的实质。Z’=100Z+500用公式表达

Z′=CZ+d。象采用公式Z′=CZ+d这样的线性变换办法，将值进一步变换后到的的标准分数常模，就叫线性变换后的标准分数常模，Z′就叫线性变换后的标准分数

公式有（1）Z’=100Z+500。(2)Z’=10Z+70。(3)Z’=AZ+B或

Z’=A(离差÷标准差)+B

16韦克斯勒智力测验求取线性变换后的标准分数常模的公式IQ=15(离差÷标准差)+100

斯坦福—比纳智力测验公式IQ=16(离差÷标准差)+100

另外T=10(离差÷标准差)+50

第五章测验质量分析

1难度：被试完成项目作答任务时所遇到的困难程度。

难度指数：定量刻画一个测验项目的被试作答困难程度的量数。常用难度指数的求法就是计算得分率或通过率。难度指数（p）取值越大并不意味着项目越难，而是越易；指数p的数字值与其代表的含义，方向恰好相反。p的取值范围0—1之间，未通过率q=1-q

2当项目难度p=0.5时被试能最好的被区分开来：一般的标准化常模参照测验目的是要尽可能把握住被试的个别差异，使被试的分数尽可能拉开距离，好中差被试能得到相应的彼此有足够的差异的分数。这样p 值尽可能接近0.5。假定通过率为0.5，测验了100名于是100人中就有50*50=2500对被试所得分数有差异，假定通过率为0.6、0.9所得分数的差异就越小，只有当项目难度愈接近0.5时，项目才愈具有区分被试的能力。

3从测验的目的出发，说明一般标准化常模参照测验、标准参照测验（目标参照测验）、筛选测验的恰当项目难度和难度分布式什么：（1）一般标准化常模参照测验：标准化常模参照测验目的是要尽可能把握住被试的个别差异，因此希望测验后所有被试的分数尽可能拉开距离，好中差被试都能得到相应的彼此有足够差异的分数。测验项目的恰当难度应该是P值尽量接近0、50。测验项目的难度取值接近0.50，项目难度的分布全距就狭窄，理想状态就是点状分布。所以对一般常模参照测验，恰当难度就是P=0.50，测验所含项目的恰当难度分布，就是围绕P=0.50，这个点尽量作窄全距分布，被试才能最好被区分。（2）标准参照测验（目标参照测验）：①其目的是要考察被试的水平是否达到应有要求。这种测验其项目的难度，就不应该由被试的实际通过率来决定，而应由项目的考核要求是否体现了应有标准或教学目标来决定②即使一个测验项目的通过率为1.00，但考核要求确实体现了应有标准或教学目标，项目的难度仍然是恰当的、合理的。相反，如果一个测验项目的通过率很低，甚至为0.00，但考核要求并无不当，体现的是应有标准和教学目标，那么，项目难度也是合理的、必要的，应予坚持。（3）筛选测验：其目的是要在某一特定水平点上，把被试分成两组，即高于这一水平的组和低于这一水平的组。这种测验就是应针对划界点（决断点）水平来确定恰当难度和恰当难度分布。总之，如果一个测验对某一被试团体来说，难度相对显得大，那么，被试团体中大多数人就会得低分，被试总分分布就会形成正偏态分布；如果一个测验对某一被试团体来说，难度相对显得小，被试团体中就会有很多人得高分，总分分布就会形成负偏态；假定被试团体在某一特定方面，其水平分布事实上是呈正态分布的，若测验项目的难度确能做到对这个被试团体来说是恰当的，那么对这个团体施测这一测验，所得被试测验总分分布自然也会呈正态分布

4什么是区分度？如何用测验内部标准法来确定项目区分度：就是项目区别被试水平高低能力的量度。如何确定区分度呢？（1）把初步编成的一组测验项目，有专家认真选拔，找出大家公认的好项目，编成一份实验性测验去施测，然后将各项目上的被试得分去跟测验总分求相关。凡是相关一致性高的项目就认定为区分力强的项目，而相关地甚至负相关的项目，就认定为区分力弱或无效的项目（2）确定项目区分度的标准就是测验总分，要考察总分高的被试在该项目上是否也得高分，总分低的被试在该项目上是否也得低分。

6 27%法求区分度指数：“高、低分组求得分率差”的办法就是将全体被试按总分多寡加以排队，然后取得分最多的27%的被试作为“高分组”，得分最少的27%的被试作为“低分组”，最后求这两个组上项目得分率（通过率）的差来作为区分度指数的取值

7 27%的使用条件：用高低分组法丢弃了中部的数据，因此只能是较为粗糙的估计值，当被试总人数够多，高分组与低分组容量都相当大时，这种估计值还是可以满足实用要求的。所以高、低分组法，是一种常用的项目区分度指数求取方法

7区间（区分度指数多高好）：所有负区分度指数都是不好的。D>0.4试题区别被试优劣的能力就很强，是性能优良的试题；0.3

8什么是测验信度、造成测验误差影响信度的因素有哪些：测验在测量它所测特质时得到的分数的一致性。

它是对测验控制误差能力的量度，是反映测验性能的一个重要的质量指标。影响因素（1）测验项目抽样不妥，语言表达引起误解，测验环境影响，施测时指导语、完成时限、主被试关系的影响或者是评分过程的偏向与误差（2）被试的动机和情绪等因素（3）大量不肯定的、作用方向各异的非系统因素的影响。

9测验信度高：测验本身抗干扰能力强，测验实施过程各方面误差因素都控制得好，多次施测时所得分数的一致性程度就会好，这就叫测验信度高

10如果从测验实施过程中实际得到的被试分数叫观察分数记作X；被试在所测特质上客观具有的水平值叫真分数记作T；那么观察分数与真分数的差就是测量误差记作E。E=X—T

11重测相关：假定同一测验向同一批被试反复施测两次，这两次施测是独立分开进行的，那么，每一被试就会在这个测验上获得两个观察分数值。当然，每个被试都只有一个真分数值。如果该测验抗拒干扰、控制误差的能力强，这批被试的两批观察分数间的一致性就会好，对宁瓣两批测值求其相关系数取值就会大；如果该测验抗拒干扰差，对这样的两批测值求其相关系数取值就会小。

信度系数利用同一测验向同一批被试重测两次所得的两批独立测值，求出其间的相关的系数，就可利用这

r。其信度系数的取值种重测相关系数来作为测验信度的估计值。这样的相关系数就叫信度系数一般记作

在0—1之间，一般不应小于0.90，最好能接近或大于0.95

稳定性系数由于重测法十分强调特质的稳定性，所以用这种方法求取的信度系数就叫稳定性系数。

12等值性系数利用平行形式相关求得的信度系数，因为特别强调两测验形式的等值关系，所以又叫等值性系数。（求法同上连续变量极差相关公式）

13内部一致性系数：（1）如何利用单一测验形式在惟一一次施测中所获资料，来据以估出测验信度的办法，这种办法之一就是“折半相关”。“折半”是指将一个测验拆成两个半测验，再计算两个半测验的相关系数，通过此相关系数来估计整个测验的信度。因此，折半相关和 —系数都被叫做测验的内部一致性系数。取值越高说明测验项目同质性好，都在有效测查同意特质。

14测量标准误：实际测验中所得测值偏离真分数的程度。记作SEM

如何运用（如何通过信度分析来检查测验的质量）：一个测验其信度系数rxx的取值处在0.00和1.00之间；当然值越高越好。一般来说，公开大规模使用的标准化测验，其信度系数的取值不应小于0.90；主要用来起预测作用的标准化测验，希望能更大一点，最好能接近或大于0.95；当然，教师自编的课堂测验，对其信度系数值的要求就不能过高

15说明何种类型的测验适于使用何种信度系数：（1）重测相关求信度系数，就特别着重考查跨时距上所得分数的一致性。因此稳定性系数多用在预测性测验上（2）用平行形式相关法求信度系数，特别强调测验内容结构要平行等值性，以便不同形式测验可互换取代使用（3）内不一致性系数强调测验中各个项目都要测查同意特质。

16什么是测验效度、为什么说它是非常重要的测验质量指标：测验效度是测验实际上测到它打算要测的东西的程度。测验效度就是测验工具的正确性问题，是测验分数的实际有效性问题，是测验质量高低的根本表现所在，是测验性能的最重要指标。测验如果根本就无效、不正确、测不到要侧的东西，就完全失去了存在的价值。

17效度的种类：效度验证工作大体分为三类即内容效度、效标关联效度和结构效度。效标关联效度又包含“并存”效度和“预测”效度这两个小类别。内容效度：测验项目构成应测行为领域代表性样本的程度。效标关联效度：测验预测个体在类似或某种特点情景下行为表现的有效度。结构效度：测验测得心理学理论所定义的某一心理结构或特质的程度。

表面效度：跟内容效度有关，指的是从被试或非专业人员看来，测验表现的是否有效的测验着应酬的东西。效标新编智力测验和高校入学考试，实际施测后所获得的值，一定要跟另一个独立实施的测量上的取值，相互关联起来，成对比较，考察其相关一致性，在数学上誻求取相关系数值，这样才能判定其正确有效性。提供效度检验标准的独立测量，测验所要预测的特质的直接而独立的量度，又叫做效度验证过程中的效标。效标关联效度验证：把测验上的实测值跟校标上的测量值两者关联起来，考察其相关一致性，从而确定测

验预测个体（即被试）在类似和特定情境下行为的有效性，这样一个测验效度的过程，就叫效标关联效度验证。

“并存”效度：效度测量值跟测验实值若能同时取得，经验证的测验正确性叫“并存”效度

“预测”效度：效度测量值跟测验实值若需间隔一段时间才能取得经验证的测验正确性叫“预测”效度

效标污染：效标测量质的评定受到了测验分数值的信息的影响。

举例说明如何防止效标污染？就是效标测量值的评定，受到了测验分数值的信息的影响。举例说来，在前例中确定高考的预测效度，就要取得学生一个学期或学年末的考试成绩，即取得效标测量值。但教师在评定学期或学年末成绩时，如果受到了高考成绩的信息的影响，凡是高考成绩高的（或低）的学生，学期或学年末成绩的评定就过宽（或过严），这就叫效标测量受到了污染，就会歪曲测验实测值跟效标测量值间的相关一致性。所以，应认真加以防止。防止效标污染的一个办法，就是使效标测量值的评定者不了解测验实测值的信息。18试述三种效度对测验考核的侧重点1.内容效度主要适应于对学业成绩测验的正确有效性的分析。教育活动是有目的的活动，教学过程后对受教育者施测的学业成绩测验，所测内容摩洛哥参照着教育目标来加以分析。主要分析测验项目所考核的知识技能覆盖面、能力水平的考核情况、以及分析各部分内容的深度广度与结构比例等。2.新编智力测验和高校入学考试，实际施测后所获得的值，一定要跟另一个独立实施的测量上的取值相互关联起来，成对比较，考察其相关一致性，在数学上就是求取相关系数值，这样才能判定其正确有效性。智力、学术能力倾向、思想流畅性、人格结构以及精神病症状的焦虑等。18什么是结构效度？请举例说明结构效度该如何验证结构效度可以通过多种途径来加以验证。比如：通过分析这些结构与特质的性质，可以推论出一些假设，然后使用测验来体验这些假设。倘若测验结果能证实这些假设，那么这就从一个测验的结构效度。我们知道，智力在人们的儿童青少年时期，会随年龄增长而发展提高，因此，智力测验的分数也应随年龄增大而增加，直到个人成熟为止。如果所编出的智力测验，施测结果说明情况确实如此，能证实这种看法，我们就说从发展成熟的角度看，所编智力测验确具较好的结构效度。再比如，两个测验如果都测同一特质，比如都测智力，其测验结果间的相关一致性就应该高兴；两个测验如果没的是不同特质，比如一个没智力一个测人格，其测验结果韹相关一致性就应该低。

18效度系数：测验分数与效标测量之间的相关系数叫效度系数，就是相关系数。

19怎样根据效度系数的高低判断一个测验的质量：效度系数不能为负数，一般的测验即使相当有效，效度系数rXY的取值也很少能超过0.70，一般取值能达到0.40就相当不错了。

20测验的估计标准误：根据测验分数来预测效量值，因为效度系数不会高到1.00，所以还是会有误差的。跟利用信度系数计算测量标准误类似，我们也可利用效度系数计算估计标准误。

21提高测验信、效度的方法：（1）测验中题目的数量应适当，不能太少（2）紧密围绕教学大纲和教学目标命题（3）考核内容应全面，并能有效代表学生应掌握的知识领域（4）测验的整体难度适当，不同类型、不同难度的题目应保持恰当比例（5）少出偏题、怪题，一般应以考察基础知识和基本能力为主。

第六章测验的主要类型与应用

1学业成就测验分类（1）根据课堂教学运用测验的一般顺序来分可把学业成就测验分成安置性测验、形成性测验、诊断性测验和终结性测验（2）根据解释测验分数的方法不同可把学业成就测验分成常模参照测验和标准参照测验两类（3）根据成就测验的实施方式与测验载体，我们把成就测验分成口头测验、纸笔测验和操作测验（4）根据测验编制程序的严格程度，可分为标准化成就测验和教师自编课堂成就测验

2安置性测验、用途学期教学或单元教学开始，确定学生实有水平针对性作好教学安排而经常使用的测验。（1）学生是否具备成功学习这一课程或单元必须的基本知识和技能（2）对于学习的内容，已经了解和掌握那些内容，提示教师处理教材(3)不同学生的学习能力兴趣习惯特点是什么，提供教学模式教学安排。

3形成性测验及用途教学进行过程中用于检查学生掌握知识和进步情况。覆盖单元中有限的学习内容，用于改进学习和教学。为师生双方提供有关学习成败的连续反馈信息。(1)对成功的学习起强化作用(2)暴露学习中不足以便改正与完善。

4诊断性测验及用途特点（或区别）探测与确定学习困难原因而施测的一类测验。与其他测验的区别：（1）注重于与诊断相关的目标，对每一特定的目标需要包括大量题目，每个题目之间只有很小的差别（2）测验

题目依据于对成功学习特殊技巧的详细分析以及常见的学习错误的分析研究（3）题目难度较低，重在确定学生所犯学习错误的类型以及学习困难根源所在（4）一般限于课堂教学中有限部分内容，按若干部分的测验分数与测验记录来分析，很少用测验全部内容。

5终结性测验课程结束或教学大周期结束，确定教学目标达到程度和学生对预期学习结果掌握程度的测验。目的（1）对学生的学习作出全部的检查总结，平定分数或等级（2）评价教师教学的有效性（3）预测学生以后学习情况。特点（1）包含广泛的教学内容，是一门课程或一个学期教学内容的有效抽样（2）具有更高的概括水平，不仅检查基本术语概念原理方法的掌握，还要从教学内容教学目标上检查运用知识分析解决问题的综合能力（3）题目内容有广泛性和代表性（4）题目的难度分布全距相对大一些

6常模参照测验、用途参照着常模使用相对位置描述测验成绩水平的一种测验。（1）鉴别与评价学生的能力发展水平，有利于个别差异的诊断与研究（2）用于教育工作中的选拔与分馏的决策。

7标准参照测验、用途—跟一组规定明确的知识能力标准或教学目标内容对比时，对学习者的测验成绩做出解释的测验。（1）说明学习者掌握所规定的教学内容的程度，以便做出掌握和未掌握，合格和不合格的分类决策（2）通过标准参照测验给学习者一个成绩，提供出学习者学习经历和已达水平的证明资料（3）评价课堂教学与课程编制的有效性。

8常模参照测验与标准参照测验的差异：①常模参照测验的成绩通常是一种相对评分，说明被试在某一被试团体中的相对地位；而标准参照测验的成绩通常是一种绝对评分，说明被试达成某一教学目标，或掌握某一范围内的知识技能的实有程度②常模参照测验在设计意图上比较强调对个体能力的区分鉴别，而标准参照测验在设计意图上考虑的是测验内容抽样是否良好地代表一组既定的能力标准或既定的教学目标③常模参照测验通常涉及更广泛的、难以明确限定的学习内容与能力目标，对每一项而标准参照测验相对来讲，测验内容集中在限定的学习任务上，对每一项学习任务或目标通常用较多数量的题目来测量

9常模参照测验与标准参照测验的相同点1.一般都以所学过的教学内容为命制题目的素材。2.它们都使用大体相同的题目类型。3.它们都要讲究测验的质量（如信度与效度等）4.它们通常都有相同的答题方式及评分准则。5.它们通常都以相同的方式来安排题目以构成试卷等等。

10口头测验的定义、使用领域、方法：口头测验即口试方法。在下列领域能特别适用（1）使用特定语言回答问题的能力（2）综合有关信息提出问题的能力（3）阐述观点为自己的观点作解释与辩护的能力（4）口头表达时逻辑思维及概括能力（5）知识理解的广度与深度（6）态度气质情感的特殊表现。方法（1）高声朗读（2）教师提问（3）题目签中随即抽选回答（4）按预设问题发言（5）小组讨论随意发言（6）一般会谈（7）根据图片或设置的情景讲故事（8）角色扮演。

11纸笔测验的优缺点优点①提高测验的效率，即同时可以进行大团体的测验②便于完整记录学生在题目作答上的反应③便于施测和评分过程的规范化和标准化从而提高学业成就测验的信度与效度④便于对测验中答题信息的分析研究。缺点（1）不能对学生的回答或观点做及时的询问（2）测量的教学目标，局限于认知领域，对于动作技能情感目标难以测量（3）特别是那些过分注重客观题的纸笔测验，往往只涉及到课程内容中有明确界定的掌握性结果，对发展性目标中的心智技能重视不够。

12操作测验的原则：①实践性为主的原则。应以动手操作为主，不能停留在笔试形式下考查实验操作知识的方式上②全面性原则。要尽力考核到实验计划与设计、实验的实施与操作、实验的分析与解释、实验报告撰写等环节；因此可结合笔试、口试和演示进行③客观化原则。要建立在行为观察的基础上，客观地评价学生的实验技能

13标准化成就测验定义、特点：标准化成就测验是有专家编制的，按照系统的科学程序组织实施，建立统一的标准并对测量误差作了严格控制的学业成就测验。其特点①由有关教育测量专家和学科专家编制②实现了测验全过程的标准化③测验题目经过专家审查，常常还抽取代表性被试样本进行预测④备有测验指导手册⑤通常备有等价的或平行的几份测验⑥测验的质量经过检验，信度高、效度好⑦标准化成就测验还具有相对稳定性的特点

14教师自编课堂成就测验定义、特点：有教师个人或教师集体综合课堂教学要求而编制的学业成就测验，统称为教师自编课堂成就测验。特点①简易性②灵活性③随意性④测量性能较差

15命题双向细目表：是一个关于考试内容和考查目标的双向列联表，它是关于一门课程教学内容和掌握层次两个维度下的考试命题抽样方案，因而成为命题人员着手命题、审题、制卷乃至作效度验证时进行工作的一个根本依据。编制涉及到三方面的内容1.如何从教育目标出发办公室本课程的考查目标层次。2.如何概括选列考试内容要目。3.如何办公室每一考查目标层次在每一考试内容要目上的分数比重。

16编制命题双向细目表的方法步骤（命题双向细目表的内容）：编制命题细目表通常以教学大纲或考试大纲为依据，主要步骤是1、确定考试内容要目并把它排列在表中最左边一栏上。按教材章节名称罗列；根据教学内容知识块罗列。2、界定该科目考查的掌握目标层次从低到高排在表中顶端第一行有关格子上。

3、确定各项考试内容要目下的分数比重。

4、把每一项考试内容的分数比重逐一分配到若干必要的考查目标即掌握层次上去，形成网格的分数分配方案。

布卢姆认知领域的分类及意义：布卢姆认为作为完整的教育目标应当包括三个主要的领域：认知领域、情感领域和动作技能领域。布卢姆把认知领域中的行为目标分为六个不同的层次，它们依次是知识（识记）、领会、应用、分析、综合和评价①知识：回忆或辨认某些特定的事实。因此，布鲁姆认知领域中的评价能力层次仍然是属于人的认识能力方面的范畴，是认识能力的一个飞跃，它与平常我们所讲凭借直觉情感体验所作出的态度表达这类简单反应性评价不同，是理性的评价。②领会：初步理解材料的意义。评价能力层次在教学或者考试过程中常表现为：它代表理解的最低水平，是通往更高水平理解的基础。③应用：能够运用已学过的材料。这一层次的学习成就需要比领会更高水平的理解与掌握。④分析：把事物整体分解为部分，以便了解整体与部分以及部分与部分之间的关系。这一层次的学习成就代表着比领会和应用更高的智力活动水平，要求能在一定程度上把握事物的内部联系、对象和环境的关系，与人们的行动逻辑。⑤综合：把各个部分有机地组织成一个整体的能力。在综合能力层次中，人们需要有较多的知识储备；需要对局部和整体相互关系的理解；需要再造性想象和创造性想象性想象；需要多方位、多层次的思维方式；也需要下面推理和逆向推理的相互配合。⑥评价：根据一定的标准对事物的价值作出合乎逻辑的判断，如对小说、诗歌、电影、哲学流派、环保方案、测验设计等作出价值判断的行为与能力。评价是认知目标层次中的最高层次，它是基于前面五个层次之上的更复杂的思维活动，含有较丰富的创造性想象，同时也不可避免地包含个人情感因素的认识与调控，是认知领域的过渡环节。

17评价三个相互联系的要素一是评价的参照标准，它可以是事先给定的准则，也可以是由学生自己确定的评价标准；二是事物本身具有的内在逻辑证据，我们可以把它置于一定的标准上（外在标准或内在标准）进行比较；三是考生的知能结构，它是把事物内再逻辑证据放在参照标准之上进行比较分析的一种高层次的能力(这正是我们想要测量的一种能力)。

18评价能力层次在教学或考试过程中的表现：批判某种错误观点；评价某些文艺作品；评述某一重要事件；评价某项发明的社会价值；或者是比较某两个事物之间的异同点、优缺点；或者是评价与论证几个设计方案的可行性；等等。

20学业成就测验中考试题目类型分为客观题、主观题

21客观题、优缺点：有一些考试题目，如果评分规则一旦明确下来，只要依照这些规则，无论谁去评分，都会得出相同的分数，典型的客观题类型常见的有填空题、简答题、是非题、匹配题、单项选择题或多项选择题等。优缺点毫无疑问，客观题对学习成就以及能力方面的测量是一种高效和有用的题目类型，它们可以测量学习成就领域中从简单到复杂、从低级到高级的广泛的学习结果，测量效率高、信息量大、信度高、测验评分与计分误差控制得好，因而，有相当广泛的应用前景。当然，客观题也确有自己的明显不不足，主要是难于有效地，直接地测量学生在语言表达、思维分析过程以及创造技能方面的高级学习成就。因而，过分偏重客观题可能会创造成学生或教育人员忽视阅读、写作、表达、创造、组织综合材料等方面的高级能力的训练。另一方面，我们还要特别强调，只有在认真精心命题时，客观题的优点才能真正实现。22填空题和简答题的异同填空题和简答题在许多情况下都可以用一个词、短语、数字或符号来回答，它们都是由被试自行提供给答案的题目类型，在本质上是相同的，只是提出问题的方式不同。填空题用一个不完全的句子，而简答题则通常是直接提问，即简单问句。

23是非题的定义、优缺点是非题由一个陈述句构成，要求学生判断真或假、是或非、对或错等。是非题

最广泛的用途是测量学生辨别真假、判断是非的能力，有利于鼓励学生在学习过程中对内容材料进行准确的学习与理解，形成陈述句进行正误判断的能力。是非题还有一个优点就是比较容易设计，而且可以在单位时间内回答更多的题目。但这种题型的缺陷也是明显的，一是容易猜测（猜对的可能性又50%）；二是适合于用是非题来测量的学习成就其范围有限，而且在措词上稍不严谨就容易把学生误导到题目测量目标的本意之外去。

24匹配题的定义、优缺点匹配题通常包括两个并列的栏目：一栏叫前体栏，另一栏叫答案栏。匹配题的主要优点是形式简捷，可以在短时间内和有限的篇幅内测量大量具有逻辑或明确相关关系的事物。匹配题的主要缺陷是仅限于测量相对简单的事物联系以及依赖于记忆的实际材料。

25选择题的优缺点优点：1选择题不仅可以准确地测量简单的学习结果，而且可以测量理解、应用、分析及综合等领域中更为复杂的高级的学习成就。2选择题兼具其他几种客观题型的优点，同时还克服了其他客观题型的一些缺点。如它避免了简答题经常存在的题意不清的缺陷，克服了是非题的简单判断所带来的过高的猜测概率等。3选择题答题方式简便，在单位时间内可以考查更广泛的学习内容范围，提高测验效率。4选择题题型规范，答题方式可以采用专用答题卡和特殊型号的铅笔，因而它适用于考试机器评分，提高了评分的效率与准确性，能有效控制阅卷者的评分误差，确保了评分的客观性。5选择题采用大量似真的诱惑选项，这给教师分析学生的理解错误与学习困难提供易于诊断的线索，因而，在诊断性学业成就测验中广泛采用精心编制的选择题型。缺点：1选择题制要求学生识别与选择正确答案，因而不大适合测量诸如数学和自然科学领域许多需要解题技巧、展示学生思维过程及特点方面的学习成就。2选择题制要求学生识别与选择正确答案，因而，减少了对学生自己回忆与自己提供正确答案方面的学习要求，这可能会消弱对低年级学生巩固知识以及掌握各学科基本知识方面的要求。3选择题的解题思路要求归一与归真，因此，选择题既不能考查学生组织与表达自己观点的能力，也不能考查学生的思维发散力与创造力。4选择题在编题时，要求的技巧性较高，特别是要考查学生的分析、综合等方面的高级学业成就时，不仅在题目内容取材与表达方面需要精心思考，而且要编出若干个似是而非的、具有同样强的迷惑作用的干扰项，确实需要花费更多的智慧与精力。因而，编制选择题需要专门技能和创造性。

26什么是半客观题概念或术语的解释题、简单计算题、所有在内容受到明确限制后并使评分更为客观的短答案题，以及用典型客观题作为提问的阅读理解题等，都是客观性较强的题型，国外一些文献中则称之为半客观题。

27如何正确对待主观题主观题突出的特点和长处①不允许简单猜测，适于考察分析综合能力、组织表达能力以及计算与推论等较为复杂的心智技能②提倡自由反应，有利于考察应用能力乃至创造能力③可以获得较为丰富的作答反应过程资料，便于分析被试的技能、策略和知识缺陷等④内容和形式更为接近教学与实践中的问题情境，被试不陌生、好接受，教师命拟比较方便。主观题不足①作答反应费事，有大量的书写任务，造成被试“忙于写而无暇想”，“手指累而头脑松” ②单位时间中施测的问题量减少，限制了测验内容的覆盖面，不利测验效率的提高③允许被试以文字技巧和作答风格来搪塞胡弄主试，靠“模棱两面可的词句”与“面面俱到的分析”来赚得高分④评分易受阅卷者主观因素的影响

28什么是题库、要求(1)题库就是具有必要侧量性能参数的大量试题的有机集合（2）建设题库的要求：①题库中的试题不仅要量大，而且每—试题都要性能优良；②查明试题性能参数(如难度、区分度等)取值要表达在同—度量系统上；③题库中的试题要结构合理．不能缺失某一内容方面，某一难度水平的试题；④题库中试题的数量比例要跟学科内在结构相类同；⑤题库试题必须有序储存，形成有机集合。1题库中试题不仅要量大，而且每一试题都要性能优良；2还要试题性能参数（如难度、区分度等）都以及查明，取值要表达在同一度量系统上。3题库中的试题要结构合理，不能缺失某一内容方面，某一难度水平的试题；4其数量比例要跟学科内在结构相类同。5题库试题必须有序贮存，形成有机结合。要求科学的编码系统，给每一试题赋给特殊的编号。通过特定号码，把同一试题的题文、题图、答案和有关资料对应相联，从而能准确、迅速地检索与调用。6现在的大型题库都由计算机贮存和管理。7科学的题库不是“古董仓库”，只具有贮存性；而是具有极强的生成性，是高效开展考试业务的锐利武器。

29什么是计算机自适应测验当有了前述那种科学的大型题库，又由计算机来管理和施测，就可以实际上

实现这种适应性测验。这时，计算机已经不是一个简单的信息贮存和传递的工具，而是一个“智能化决策者”。计算机应用于测验的施测和评分，主要有两种方式。一是仍为固定项目组施测，这叫基于计算机的测验（可简称为CBT）。二是计算机化自适应测验（可简称为CAT）。如前所说，计算机要贮存管理着大型题库，并充当一个“智能化决策者”。施测可分为量阶段：第一，试验性探查阶段。第二，精确估出真值阶段。项目反映论(可简称为IBT).

30什么是项目反应理论项目反映论有人说是量表化理论，它径直去探讨试题的答对可能跟被试水平和试题性能的关系，采用一种数字模型来描述和反应这种关系。

31在试题的项目反应曲线上，怎样来认识试题的难度、区分度和猜测参数?项目反应曲线的位置参数b，刻画的就是试题难度，即难度参数。项目反应曲线的陡峭程度即拐点处切线夹角的大小，可以刻画项目的区分被试水平优劣的能力。而a值跟夹角成正比，所以a值就是项目的区分度参数。这样，项目反应曲线的位置和形状（包括曲线中部的陡度和下尾渐近线高度）就明确刻画了项目的测量特征，所以，它又叫项目特性曲线（可简记ICC）

32心理测验：通过对一组标准刺激所引起的行为样组的客观分析，对人们的心理特征及个别差异进行估测、描述和诊断的方法。特点1在测验编制过程中通过试验性测试，进行了深入的项目分析；2测验的施测与评分做到了严重规范化（又称标准化）；3科学地抽取确具代表性的常模样组，并在此基础上建立了测验常模；4切实地验证了测验的信度和效度，保证了测验质量。标准化心理测验有较高的科学价值与应用价值。大凡世界先进发达的国家，它们在各级各类的、工商企业、军事单位、医疗机构、人事部门等机构均已较普遍地采用科学的心理测验方法，作为测量与评估人们的心理与行为特征的有效工具。

33心理量表按照科学方法及系统的程序所编制的心理测验，称为标准化心理测验，有时也成为心理量表34心理测验主要用途①人才选拔②人员安置与人事管理③临床心理学研究④学校心理服务⑤建立和检验假设

35在学校心理服务过程中，心理测验的应用范围（1）把心理学与传统德育工作方法相结合，起到相得益彰、优势互补的作用，收集学生心理资料，了解其心理特点和个别差异（2）了解与评估学生能力结构及发展水平，探测职业能力倾向，开发学生的潜能天赋，指导学生升学和就业，并给学习困难者和学习方法不适应者作有效地分析、诊断和辅导帮助（3）了解特殊学生个体在特定环境下的心理问题

36心理测验的主要类型①测验编制程序是否系统、科学和完备可分为标准化心理测验和非标准化心理测验②根据测验实施时每次可测试一个人还是可同时测试一批人可分为个别心理测验和团体心理测验③根据测验有无严格与苛刻的时间限制可分为限时测验和非限时测验④根据测验材料（刺激）是语言文字形式还是非语言文字可分成文字式心理测验和非文字式心理测验⑤根据测验引起的被试反应的特点可分为最高成就测验和典型作为测验（6）根据测验内容的性质，可分为智力测验、能力倾向测验、创造力测验以及人格测验等

37智力智力是一个人理解、处理和适应其周围世界的最一般的能力，是观察能力、注意能力、记忆能力、想象能力、思维能力等各种认识能力的综合，并且以抽象思维能力为核心。

38国内常见的智力类型①比纳智力测验②斯坦福—比纳智力测验③韦克斯勒智力测验④瑞文标准推理测验和⑤中小学生团体智力筛选测验

39韦氏儿童智力量表的结构韦氏儿童智力量表的结构与成人智力量表类似，包括文字测验和非文字（操作性）测验两大部分。前者属于言语量表，后者属于操作量表。2韦氏儿童智力量表包括12个子测验，其中语言部分占6个子测验，操作部分也有6个子测验。3施测后对照常模可独立给出被试言语部分的智商IQ、操作部分的智商IQ以及总测验的智商IQ值。

40瑞文标准推理测验的优点（特点）张厚粲教授主持，根据英国心理学瑞文1938年设计的“标准图形渐进测验”修订的一种非文字智力测验。适用的年龄范围宽，测验对象不受文化、种族与语言的限制，还可以用于生理缺陷者。测验可个别进行，也可团体实施。适用方便，省时省力，结果解释直观简单，测验具有较高的信度与效度。

41智力水平的分类:如常（IQ超过130）、正常（IQ在70以上和130以内）、低常（IQ在70以下）三类。

对于智力正常者又可再分为三种：IQ在70-89之间，称智力偏低；IQ在90-109之间的，称智力中常；IQ 在110-129之间，称智力偏高。

42智力超常的儿童的特点：1.具有浓厚的好奇心和旺盛的求知欲。2.观察敏锐，分辨力细致。3.注意力集中，记忆力强。4.思维具有灵活、敏捷和独创的特点。5.坚持、勤奋和自信。点

43智力落后的儿童的特征1.学习困难重重，抽象思维能力很低，一再留级。2.对周围的不能适应，难以自理生活。3.兴趣狭隘，注意力不易集中。

44结合实际谈谈智力测验在学前教育及学校教育中作用1.智力测验是一种科学的和有用的量具，但我们必须正确地使用智力量具以及正确对待智力测验的结果。在学前及学校教过程中，智力落后的人数比例虽然较少，但对他们的教育却事关重大。教育工作者有责任及早了解儿童的心智发展状况，对那些智力落后以及心智不健全者实施特殊教育。2.在中小学教学中，应当了解那些学习困难的学生究竟是因智力偏低所造成，还是其他因素造成，以便采取适当的教学补救和教育管理措施，这对于贯彻因材施教的原则是十分重要的。

45能力倾向、特点：能力倾向是指一个人获得新的知识、能力和技能的内在潜力。其特点相对广泛性、相对稳定性、潜在可能性。

46能力倾向测验：是一种旨在预测未来成功可能性的一种测验，是一种潜能测验。

47职业能力倾向测验、分类及英文简称职业能力倾向测验是测量人的某种潜能，从而预测人在一定职业领域中成功可能性的心理测验。一类是一般职业能力倾向测验，主要用于较广泛领域中的就业指导和人员安置。另一类是特殊职业能力倾向测验，主要考察人是否具有从事某种职业工作的潜在能力。1.一般能力倾向测验GATB测验。当今世界应用很广的另外两个职业能力倾向测验是：由美国心理公司出版的《能力倾向区分测验(DAT)》，由美国教育与工业测验服务中心出版的《职业能力安置表（CAPS）》。2.行政职业能力倾向测验（AAT）。。

48国家公务员录用考试中的行政职业能力倾向测验包括的内容1.知觉速度与准确性测验。2数量分析测验。

3.资料分析测验。

4.言语表达与理解测验。

5.判断推理测验。

49学习能力倾向测验学习能力测验旨在测量一般的学习能力和潜力，即是否具备较好的进一步学习与研究的潜在能力，而不是已在学校中学到了多少知识。

50什么是创造力（发散思维）、基本特征创造力是指独创的解决问题的能力，包括产生新的想法、发现新的问题、创造新的事物等方面的能力。发散思维的能力是创造力的主要部分。吉尔福特认为，发散思维所表现出来的一个人的外在的行为，即代表这个人的创造力。发散性思维在行为上表现三种基本特征：流畅性、变通性、独特性

51简述创造力与学业成就以及创造力与智力之间的关系：发现创造思维能力的发展特点与智力及逻辑推理能力的发展特点是有区别的；创造力与智力之间虽有正相关的趋势，但这种相关不是简单的相关。创造力与学业成就之间通常也有不等程度的正相关趋势，但也不是简单的相关。因此：1.心理学家认为，我们不能简单地用智力测验或成就测验来推测人的创造力，也不能用创造力测验简单地来预测人的智力与学业成就。2.特别是在学校教育中，更不能抛开智力开发和课堂教学引导而凭空地去发展学生的创造力。3.心理学家和许多教育专家早已认识到，创造活动是一种高级而复杂的心理活动，创造力本身已超出认知因素或智力因素的范畴，与人的个性因素有着紧密的联系。因此，培养青少年学生的创造力需要从智力因素、个性因素以及技能因素等方面入手，才能收到更好的教育效果。

52人格（个性）人格又称个性。心理学中人格一词，通常指人的性格、气质、兴趣、态度、价值观、动机、适应、理想、信念、品德等心理特征与意识倾向性的总和。

53人格测验的方法：人格测验的方法与类型主要有自陈量表法、投射测验法、情境测验法、评定量表法54自陈量表法：又称自陈问卷法，它通常是以问卷的形式，提出一系列题目。每个问题陈述一种人的心理或行为上的典型表现，要被试判断所陈述的情况在多大程度上符合自己的情形，并作出相应的回答。

55爱森克人格测验三维结构理论：他在对人格进行研究的进程中，悉心搜集了大量有关非认知方面的行为特征，通过因素分析，最终归纳出三个互相成正交的人格维度，从而系统地提出他的人格三维结构理论。

他认为决定人格的三个基本因素是内外倾性（E）、情绪性（N）和精神性（P），人们在这个基本方面的不同倾向和不同表现程度，便构成千姿百态的人格类型。艾森克在大量实验研究的基础上，编制出版了著名的艾森克人格测验，简记为EPQ。

56 16PF：卡特尔十六种人格因素测验。卡特尔十六种人格因素测验，简称为16PE，它是由美国伊利诺州大学人格及能力测验研究所心理学家卡特尔（R.B.Catell）于20世纪50年代后期开始编制的人格测验，在世界上享有很高的声誉。

57卡特尔6PF的用途：1.卡特尔16PF可以为我们揭示多方面的人格信息。除了能够提供有关16种基本人格因素特征方面的信息之外，还可以在此基础上向人们提供有关复合的人格特征，这些复合的人格特征包括被试的适应性与焦虑、内向与外向性、感情用事与安详性、怯懦与果断性等方面。2.16PF中有关基本人格因素的测验结果，通过必要的计算，我们还可以对被试的心理健康、专业成就、创造心理以及在新环境下成长与适应等方面，从人格因素的角度进行判断和预测。因此，卡特尔16PF是一个具有多方面用途的人格测验。

58投射测验法：它的基本假设是：一个人对结构不明确和朦胧不清的刺激之反应，会映现出其人格特性。换句话说，这些刺激本身并不含有一定的意义，然而它们所引发的反应则具有特殊意义的，此一意义来自被试对刺激的主观解释和想法，在不知不觉中投身出其心理的的需求、个性、情绪、动机、冲突、防卫等等内在特性。

58.投射测验技术的种类：1.联想技术。其特征是要求被试对测验刺激所引发的第一个字词或意象作出反应，如字词联想和墨迹即属此类。2.构造技术。其特征是要求被试对某图形构建一个一个故事，譬如主题统计学测验就是典型的例子。3.完成技术。其特征是让被试针对测验刺激之未完成任务的语句、文字段落、故事情节等加以完成，如常见的语句完成测验、故事完成测验即属此类。4。表达技术。其特征是要求被试进行一项表达性活动，如绘画测验、游戏技术与心理剧表演等皆属此类。

59什么是情境测验法指的是把被试置于种特定情境中以观察其行为反应，然后对其人格特征作出评鉴的一种方法。

60简述情境测验的类型常见的情境测验有两种，一种是品格教育测验，另一种是情境压力测验。一、品格教育测验。常见的品格教育测验有：1.考试作弊。2.好书的诱惑。3.说谎与夸耀。4.分发物品情境。5.道德故事情境。二、情境压力测验。1.障碍问题情境测验。2.无领导的团体讨论。3.公文包测验。4.“商业游戏”情境测验。5.“司法模拟测验”。

60.1情境压力测验：是让被试置身一种经特别设计的紧张、恶劣甚至危险的情境中，使被试有一种情绪上的压力，或者把被试安排在实际生活呈个具有特别压力与困境的场合，然后由主试直接或间接地在暗中对被试进行观察记录，以此来了解被试的人格特征与能力。

60.2品格教育测验：品格教育测验的基本假设认为，人的某些心理侧面在通常的情境中由于受到人的意识控制，其表现可能不真实，只有在“独处”或没有人监视的情境下流露出来。

61评定量表的特点：结构明确、各条目描述精练、内容丰富、施测简便，通过知情人对被评者心理特质与行为特质的评价，不仅可判断每一条目内容在被评者身上是否存在，而且还可以按照量表设计的标准，作出等级评定或内容描述。

62简述评定量表的几种形式：1.数字等级评定。2.图表描述评定。3.检选式评定。4.脸谱图形评定。

62.1数字等级评定：是用数字来评定一组用以描述个体人格特质或行为发词句条目，要求评定者在事先提供的一个顺序数字系列中，给被评者的各种心理特质或行为确定一个适当的数字等级。这些等级一般设5个等级或7个等级。

62.2图表描述评定：是在每一题目下设有图尺量表刻度，通常用1-5或1-7自然数字来表示几个刻度，并在若干个刻度下面，用语言描述其刻度值大小的行为与心理特征，由评定者根据被试的表现给予密不通风评定。

62.3检选式评定则是事先向评定者提供由许多形容词或陈述句组成的一览项目表，评定者将项目表中所列的各个项目所提示的人格与行为，逐一与被评者进行对照，尔后把其中最能描述与反映被评者心理特征、

行为特征的项目挑选出来，最后再进行分析。

62.4脸谱图形评定：是通过一系列简单、形象而有趣的脸谱与图形，来直观形象地反映人的情绪特征、行为特征及外貌特征等，由评定者对被评者的行为、表情、态度、情绪、容貌等事项进行对照评定。

第七章随机变量、概率分布与抽样分布

1统计方法的分类：描述统计、推断统计

2描述统计：是用各种统计方法描写各种变量取值的各种统计特征的。

2.1描述统计研究内容：比如我们用列表、绘图的方法来描写数据的分布形态特征；用计算集中量数的办法来描写数据的集中趋势。用计算相关系数的办法来描写两个变量的依从连带关系。显然，在科学研究中，我们需要描写是研究对象总体的各种特征，因此，撕碎统计所操作的对象最好是我们研究对象的数据总体。3推断统计：通过对样本的研究来达到研究总体的目的，推断总体性质。

3.1推断统计研究内容：由于推断的基本依据是样本，因此必须研究如何使所抽取的样本对总体有最好的代表性，由于是依据样本推断总体性质，因此必须找到样本与总体的联系媒介，经研究发现这个媒介就叫抽样分布。

4现象的分类：确定性现象、不确定性想象

5确定性现象（非随机现象）：是指在相同的条件下其结果也一定相同的现象。是其他数学学科如函数论等研究的对象。

6不确定性现象（随机现象）：是指在相同的条件下其结果却不一定相同的现象。是统计学研究的主要对象。7记录各种随机试验结果的变量为随机变量。记录各种非随机试验结果的变量为非随机变量，也称确定性变量、函数变量。随机变量有的是连续性随机变量，有的是非连续性变量，非连续性随机变量也称离散性随机变量。

8概率：试验次数较少时，事件发生的频率是一个很不稳定的数，但随着试验次数的增多，频率值会越来越稳定地趋向于一个固定数值，我们把这个数值称为事件A发生的概率，记作为P （A）。通俗地说，某事件发生的概率就是该事件发生的可能性大小。

9事件：统计学中把随机试验的各种可能结果称作为事件，记作为事件A、事件B等等。

10频率在一轮随机试验中，某一事件A发生的次数F与总试验次数N之比被称为该轮试验中事件A发生的频率。

11按照概率的定义，概率的取值范围在区间[0，1]上，如某个事件概率为P=0，表示该事件不可能发生，这样的事件称为不可能事件。如某个事件概率为1，表示该事件肯定发生，这样的事件称为必然事件，在实际研究中更多事件的概率介于0与1之间，人们把发生概率很小的事件，如概率小于0.05，或0.01，称为小概率事件

12正态分布（特征）（常态分布）：（1）是连续性随机变量中常见的一种概率分布形态。（2）正态分布是由平均数和标准差唯一决定的，且平均数为0，标准差为1。（3）从形态看，正态分布是一条单峰、对称呈钟形的曲线，其对称轴为过x=μ的纵线。曲线在X=μ点取得最大值。从x=μ点开始，曲线向正负两个方向递减延伸，不断向X轴逼近，但永不与X轴相交，因此曲线在正负两个方向上都以X轴为渐进线。（4）一个随机变量服从正态分布的最大特点是其取值在平均数附近的概率很大，而取值离平均数越远，其概率越小。我们平时说的学生成绩总是两头小中间大，正式正态分布这一特征的通俗描述。（5）在这许许多多的正态分布中有平均数为0、标准差为1的正态分布可以作为正态分布的一个典型代表，（标准），其他各种正态分布都可以通过一定的数学方法与它相互转化，为此人们将它称为标准正态分布。

16标准正态分布的面积：在标准正态分布中，夹中间面积90%的两个Z值分别为±1.64;夹中间面积95%的两个Z值分别为±1.96;夹中间面积99%的两个Z值分别为±2.58

17标准正态分布的区间：-3到+3之间，如果分成五等的四个点是-1.8，-0.6，+0.6，+1.2.

200人的正态分组表：

成为总体。

18.1个体总体中的每一个元素都称为个体

18.2样本从总体中抽取的部分个体组成的全体城为样本。

18.3总体与样本的区别:1。是不是具有同一特征的个体都已包含在所研究的群体内，是的话该群体为总体，否则为样本。2.在总体数据基础上求取的各种特征量数我们称其为参数，应用样本数据计算的各种特征量数我们称其为统计量。凡是总体参数一律用希腊字母代表。凡是样本统计量则一律用拉丁字母代表。联系：总体有时又称母体，样本有时又称子样，总体与样本的关系类似于亲子之间的遗传与变异的关系。样本来自于总体，是总体的一部分，具有承接总体各种特征的固有的特点，因此样本对总体具有代表性，但是，样本毕竟浊总体，样本与总体是有差异的。样本与总体的差异我们称其为栅栏误差。

18.4无限总体：总体所含个体数，有的无限多，叫无限总体。

18.5有限总体：有的只含有限数额个体，叫有限总体。

18.6总体规模：总体所含个体数叫总体规模。一般用N代表。

18.7样本容量：样本所含个体数叫样本容量，般用n代表。

18.8参数在总体数据基础上求取的各种特征量数我们称其为参数。

18.9统计量应用样本数据计算的各种特征量数我们称其为统计量

19.1参数、统计量的规定：

素是抽样方法

20随机抽样方法①简单随机抽样②分层抽样③分阶段抽样④等距抽样

21随机抽样方法原则①机会均等②相互独立。简单随机抽样最常见的形式就是抽签。较严谨的简单随机抽样是借助随机数码表而作的随机抽样

22借用随机数码表做简单随机抽样的步骤一、对总体的所有元素进行编号，一般以0号或1号开始。二、根据最大编号的位数确定随机数码的使用位数。三、按从上到下或其他明确顺序，抄录随机数表中不大于总体最大编号的所有随机数，直到抄满个数等于入样元素数。四、按抄录的数码从总体中将对应元素取出组成所需样本。

23分层抽样：当总体较大，所抽样本容量比较小，总体内部结构复杂时所采用的一种抽样方法。原则是总体中各部分元素之间的差异要大于各部分元素之内的差异。实质是将总体中各部分按其容量在总体规模中的比分派到样本结构中去，然后抽样。步骤分两步进行①按比例求出各部分入样元素数②各部分按要求的人样数用简单随机抽样的方法产生入样元素，最终合成总样本。优点是基本保持总体的分布形态。

24分阶段抽样：分阶段抽样实际上进行两次抽样，第一次是以“部分”为元素进行抽样，然后再在人样的这些“部分”中抽取入样元素。

25等距抽样：适用于总体很大样本较小总体无中间层次结构的抽样。步骤等距抽样的第一步也是首先对总体所有元素编号，所编号码应该是连续有序的。第二步计算每相邻两入样元素的间隔距离。第三步是在第一间隔中随机确定第一个入样元素的号码，比如说取定为00003。第四步则开始抽取入样元素

26要认识抽样分布必须学会识别三种分布：总体分布、子样分布和抽样分布

27抽样分布：从一个总体中随机抽取若干个等容量的样本，计算每个样本的某个特征量数，由这些特征量数形成的分布，称为这个特征量数的抽样分布。

27.1抽样分布研究内容：抽样分布就是样本统计量的取值分布。每一个特征量数的抽样分布都有它自己的形态特点，也有它独特的分布参数值。研究抽样分布就果确定不同条件下形成的抽样分布各是什么形态，它们的分布参数如平均数、标准差等又分别是多大。

27.2平均数的抽样分布：所考察的是抽取到的样本的平均数的分布，所以称为平均数的抽样分布。 27.3标准差的抽样分布：如果所考察的是样本标准差，则称为标准差的抽样分布。

27.4特征量数的抽样分布：样本何种特征量数取值所形成的分布，就称该种特征量数的抽样分布。 28试分析在不同情况下平均数抽样分布的形态：（1）原总体正态、总体方差已知情况下的平均数抽样分布。根据统计学的研究结果，如果一个总体服从正态分布，而且已知这个总体方差的值，那么，从这个总体中随机抽取若干个等容量的样本，所得样本平均数的分布，也就是我们所说的平均数的抽样分布服从正态分布。（2）原总体正态,总体方差未知情况下的平均数的抽样分布：服从的是自由度为n-1的t 分布（3）原总体非正态，但样本较大情况下的平均数抽样分布。据概率论研究，如果原总体非正态或者原总体分布情况不明，那么不管原总体方差已知还是未知，平均数的抽样分布都是渐近服从正态分布，其总体平均数还是原总体平均数，其标准差，也就是平均数的抽样标准误差，在总体方差已知时为。n SE x σ=总体方差未知时1

-=n S SE x 29 t 表示的意义是：总体正态、总体方差未知的平均数抽样分布服从的是自由度为n-1的t 分布。如在一个自由度为10的t 分布中用概率0.05去查，可得t 分数为2.228.其实际含义是t 分数落在±2.228之外的概率为0.05

30抽样标准误：抽样分布的标准差为抽样标准误差。它是刻画所抽样本的离散程度的专门指标，为此还给了一个专门的符号SE ，有时也称为抽样标准误。

第八章参数差异显著性检验

1小概率事件：在教育统计中常常把概率取值小于0.05或小于0.01的随机事件称为小概率事件概率小概率事件原理：认为小概率事件在一次抽样中不可能发生的原理

显著性水平：在统计假设检验中，公认的小概率实践的概率值被称为统计假设检验的显著性水平。记作α。在教育统计中，α值常取0.05和0.01两个水平，偶而也有取0.001的。在假设检验中，α的取值越小，称此假设检验的显著性水平越高。

2统计假设检验中使用的假设一种称为虚无假设，一种称为备择假设。虚无假设又称为原假设、零假设，以符号H0表示。虚无假设在假设检验中将被视作为已知条件而应用，因此虚无假设应是一个相对比较明确的陈述命题，一定要含有“等于什么”的成分。备择假设又称解消假设，研究假设等，以符号H1表示。备择假设作为虚无假设的对立假设而存在，因此它也是一个陈述命题，备择假设是对虚无假设的否定.从逻辑上看是非此即彼的。

3统计量：应用样本数据计算的各种特征量数

检验统计量统计量是根据检验目的和抽样分布而设计的，专门用于统计假设检验，因此被称为检验统计量。检验统计量的计算中要用到与检验参数相应的样本统计量。

4统计假设检验的思想方法：统计假设检验就是一种带有概率值保证的反证法

5为什么统计假设检验从逻辑过程看是一种反证法：统计检验人员常常希望证明本备则假设是正确的，但却不直接证明备则假设的正确性，而是从与备择假设对立的虚无假设出发，以虚无假设为条件，采集样本数据，确定抽样分布，计算检验统计量，考察检验统计量取值的概率，如果最终发现这是一个小概率事件，

那就是根据小概率事件原理推翻虚无假设。研究者必须保证在整个过程中除所作虚无假设外的一切工作都是严密、科学的。由于虚无假设与备择假设是一对护肤命题，也就是所说的非彼即此的，推翻了虚无假设，备择假设就自然成立了。

6为什么说统计假设检验就是一种带有概率值保证的反证法：所谓带有概率值保证是指用反证的反法作的统计假设检验。最终推翻虚无假设是由于所求的检验统计量的取值为一小概率事件，而根据小概率事件原理推翻虚无假设的。根据小概率事件原理作决策思想方法，但并不保证每次的决策都是正确。换句话说，这一推翻虚无假设的决策也是可能犯错误的，只是犯错误的概率比较小，而决策正确的概率比较大，而且这个决策正确的概率是由我们控制的，是可以计算的。这是假设检验“带有概率保证”的含义。

6统计假设检验这种反证法与一般反证法有什么差异：1.数学反证法最终推翻假设的依据一定是出现了百分之百的谬误，因此推翻假设的决策无论是从决策逻辑还是从决策内容看都是百分之百正确的。而统计假设检验的反证法最终推翻虚无假设的依据是一个小概率事件，从决策逻辑角度看是百分之百的正确的，但其决策的内容却是有可能出错的。也就是说，根据所计算的结果是一小概率事件，依据决策逻辑，决策者只能作出推翻虚无假设的决策，而不应有其他选择，但是所推翻的虚无假设的内容却有可能是正确的，只是这种可能性很小而已。因此，我们说统计假设检验这种反证法最终推翻假设不可能像数学反证法推翻假设那样百分之百的正确。2.数学中使用反证法，其最终结果一定是推翻原假设，而统计假设检验这种反证法的最终结果却有可能无充分理由推翻原虚无假设，因为很可能我们依据样本数据计算的检验统计量的取值概率并不是一个小概率，因此也就无理由怀疑虚无假设的正确性。如果是数学反证法最终推不出谬误，不能推翻原假设，这一反证过程也就不成立。而统计假设检验却不是，如果最终所求的检验统计量的取值并不是一个小概率事件，同样可以以“无充分理由拒绝原虚无假设”作结论，整个检验过程还是成立的，只是结论不同而已。

7统计假设检验步骤①根据题目的设问提出检验假设②选定显著性水平α③根据检验目的和已知条件找到相应的抽样分布④写出检验统计量计算公式并按已知数据条件计算检验统计量值⑤根据显著性水平α在抽样分布中确定临界值和危机域（6）将求得的检验统计量值与临界值作比较，根据其是否进入危机域而作出是否拒绝虚无假设的统计结论。

8统计决策的两种错误、如何控制：在统计假设检验决策时可能犯的错误由两种类型：一种是虚无假设属真而被拒绝的错误。这种错误统计上称为I型错误，又称为“拒真”错误。另一种是虚无假设实伪而未被拒绝的错误，称为Ⅱ型错误，又称为“纳伪”错误。控制：要降低犯I型错误就是提高显著性水平即减少a的值，降低犯Ⅱ型错误就要加大样本的容量。

9统计假设检验中冒犯I型错误的概率大小就等于显著性水平α值的大小，β同时也是犯Ⅱ型错误的概率值符号。Ⅱ型错误称为β错误

10影响Ⅱ型错误概率大小的因素有三个：第一因素是客观的真值与假设的伪值两者之间的差异。第二因素是α值的大小。α值越大，犯Ⅱ型错误的概率就越小，α值越小，β就越大。第三因素是样本容量。样本容量越大，犯Ⅱ型错误的概率就越小；样本容量越小，犯Ⅱ型错误的概率就越大

11（简述统计假设检验中如何选择单、双侧检验方法）双侧检验：如果检验的目的为了判断某个总体参数是否等于某个定值，或者是为了推断某两个总体参数是否相等的检验。在抽样分布的两个尾侧各有一个临界值。危机域各有一块。单侧检验：如果检验的目的为了推断某个总体参数是否大于或小于某个定值，或者是为了推断某两个总体参数之间有无大于或小于的关系的检验。在抽样分布的一个尾侧设有临界值。危机域只有一块。

14临界值：统计上根据显著水平@求出的、提供比较标准的值称为假设检验的临界值

危机域：把临界值以远的抽样分布曲线下的区域称为危机域。

15 X1平均数-X2平均数的抽样分布形态以及它的各种参数估计公式主要受到四个因素的影响：第一是受到两个总体是否相关的影响，第二是受到两个总体分布是否正态的影响，第三是受到两个总体方差是否已知以及是否相等的影响，第四是受到所抽样本容量的影响

16判断相关总体和独立总体：相关总体就是两总体相关系数不等于0，独立总体就是两总体的相关系数等

于0，在实际检验中，我们依据这两种情况来判断相关总体与独立总体：第一种情况是看所检验的两列分数是不是统一批实验对象的两列分数。第二种情况看是不是一一严格配对的两批实验对象的两列分数。除了上述两种之外的的数据，一律判为独立正体。

21方差齐性检验：在统计学中检验两个或两个以上总体方差是否相等有一个专门的术语叫做方差齐性检验。

21.1总体的方差齐性：如果所有总体方差都相等被称为这些总体的方差齐性。

21.2总体的方差非齐性：如果其中有一对总体方差不相等，则称这些总体的非齐性。

21.3总体方差差异性显著检验：两个总体方差是否齐性的检验也称为两总体方差差异性显著检验。 22总体方差差异性显著检验方法：（1）双侧：上册F 表查，下侧根据公式求（互为倒数）

（1）单侧（同上）但只有一个。

23总体相关显著性检验：检验总体相关系数p 等不等于的问题，如果检验结果是p 不等于0我们就说总体相关显著。

第九章卡方的检验

1卡方、公式：χ2（读作卡方）是检验实际观测次数与理论期待次数之间差异程度的指标。表达式X 2=ΣΚ（?Ο-?e）/?e ?o 表示实际观测的次数，?e 表示理论期待次数；连加和Σ号上方的字母K 表示K 组数据连加。

2 χ2的意义：①若实际观测次数f0和理论期待次数fe 完全相同，则χ2=0，表明观测的次数分布与设想的总体的理论次数分布没有差异②当实际观测次数f0和理论期待次数fe 相差越大时，则χ2值也越大，这表明观测的次数分布与设想的总体的理论次数分布之间的差异也越大

3卡方的分布于正态分布、T 分布的差异：Ｘ2通常是正偏态。Ｘ2

永远不会有负值，这一点与 Z 分布和t 分布有所不同；Ｘ2分布是正偏态分布，是非对称的分布， z 分布于t 分布的共同特点是均为对称的分布，平均数μ 所在点是对称轴所经过的中心点；与 t 分布曲线随着自由度df 的改变而有所改变，但当自由度df → ∞ 时，Ｘ2

分布曲线就会变成一条正态分布曲线。 4 χ2分布特点①χ2≥0，即χ2值从0到正无穷大②当自由度df≥3时，χ2分布是单峰正偏态分布，各曲线的尾巴都向右边（正方向）无限延伸，但终不与横轴相交③当自由度df>30时，χ2分布曲线基本上是对称的分布，而且随着自由度df 的增大，越来越接近正态分布形式④χ2分布具有可加性，比如，自由度df=4的χ2分布加上自由度df=6的χ2分布，其结果是自由度df=10的χ2分布⑤当自由度df=1时的χ2分布，它与标准正态分布Z 值的平方正好相等；即df=1时，χ2=Z2

5 举例说明()αα

=>22x x P 表示意义：()05.0841.32=>x P 说明自由度为1的卡方统计量式的值超过3.841的概率最多只有5%。

6如何使用卡方分布表Ｘ2值表中，列出了不同的自由度（表中最左端纵向列出自由度从1到30）、不同显著水平（表中顶端一行横向列出14个不同的显著的水平值）下的Ｘ2分布的临界值Ｘ2a 。

7 χ2检验的主要作用：是基于实际观测次数和理论期待次数之间差异程度的χ2统计量实得值的概率考察，检验如下两类问题：第一，检验某抽样观测数据的分布是否与某一理论分布相一致，即总体分布的拟合良度检验。第二，检验双向分类列联表数据下，两个分类特征（即两个因素变量）之间是彼此相关还是相互独立的问题，这类问题称为独立性检验。

8利用χ2检验进行分布的拟合良度检验和双向分类数据下的两变量的独立性检验，其一般步骤：①根据所存在问题的实际特点，提出虚无假设（H0）。这里的虚无假设总是“没有显著性差异”的假定，或“两个变量相互独立（即相关为零）”的假定②χ2检验最重要的、最关键的一步是如何从虚无假设出发，确定各类事物的理论期待次数③根据χ2统计量公式计算实得的χ2值④选取适当的显著性水平α值，并确定自由度df ，然后在χ2值表中找到临界值χ2⑤做出接受虚无假设或拒绝虚无假设的统计决策。其原则是①当所确定的实得χ2值大于临界值χα2时，我们可拒绝虚无假设（H0），并接受研究假设（Ha ）②当所确定的实得χ2值小于临界值χα2时，我们便没有充分理由拒绝虚无假设（H0）故暂认为虚无假设是成立的，把虚

全国2011年04月高等教育自学考试教育统计与测量试题及答案(试卷+答案)

全国2011年4月高等教育自学考试教育统计与测量试题（课程代码：00452）一、单项选择题（本大题共15小题，每小题2分，共30分）在每小题列出的四个备选项中只有一个是符合题目要求的，请将其选出并将答题卡的相应代码涂黑。错涂、多涂或未涂均无分。 1. 下列哪些学科与数理统计相交叉结合产生教育统计学( ) A. 教育学、生理学 B. 教育学、心理学 C. 社会学、教育学 D. 生理学、心理学 2. 下列关于教育统计与教育测量的关系，叙述正确的是( ) A. 教育统计与教育测量相互独立 B. 教育统计是教育测量的基础 C. 教育统计在教育测量提供的数据的基础上进行 D. 教育统计为教育测量提供数据 3. 下列属于比率变量的是( ) A. 人的血型 B. 五级记分制 C. 气温 D. 身高 4. 在统计分析图中，圆形图通常用于描述( ) A. 二元变量的观测数据 B. 某种事物在时间序列上的变化趋势 C. 离散性变量的统计事项 D. 具有百分比结构的分类数据 5. 假设某小学生语文平时、期中、期末的成绩分别为95、80、86，平时、期中、期末权重按2:3:5分配，那么该生语言总平均成绩为( ) A. 85 B. 86 C. 87 D. 88 6. 题6图这相相关散点图表示( ) A. 相关很高，是正相关 B. 相关很高，是负相关 C. 相关很低，是正相关 D. 相关很低，是负相关 7. 下列叙述正确的是( ) A. 同一被试不同测验上的原始分数可以比较 B. 同一被试不同测验上的原始分数不可以比较 C. 不同年龄组间的离差智商值不可以比较 D. 同一被试不同测验上的标准分数不可以比较 8. 布卢姆认知领域分类中衡量个体根据一定的标准对事物的价值作出合乎逻辑的判断的行为目标属于( ) A. 评价 B. 综合 C. 分析 D. 领会 9. 韦克斯勒智力测验属于( ) A. 限时测验和典型作为测验 B. 限时测验和最高成就测验

2011年4月教育统计与测量试题及答案

2011年4月高等教育自学考试教育统计与测量试题课程代码：00452 一、单项选择题(本大题共l5小题，每小题2分，共30分) 在每小题列出的四个备选项中只有一个是符合题目要求的，请将其代码填写在题后的括号内。错选、多选或未选均不得分。 1.下列哪些学科与数理统计相交叉结合产生教育统计学（） A.教育学、生理学 B.教育学、心理学 C.社会学、教育学 D.生理学、心理学 2.下列关于教育统计与教育测量的关系，叙述正确的是（） A.教育统计与教育测量相互独立 B.教育统计是教育测量的基础 C.教育统计在教育测量提供的数据的基础上进行 D.教育统计为教育测量提供数据 3.下列属于比率变量的是（） A.人的血型 B.五级记分制 C.气温 D.身高 4.在统计分析图中，圆形图通常用于描述（） A.二元变量的观测数据 B.某种事物在时间序列上的变化趋势 C.离散性变量的统计事项 D.具有百分比结构的分类数据 5.假设某小学生语文平时、期中、期末的成绩分别为95、80、86，平时、期中、期末权重按2∶3∶5分配，那么该生语文总平均成绩为（） A.85 B.86 C.87 D.88 6.题6图这个相关散点图表示（） A.相关很高，是正相关 B.相关很高，是负相关 C.相关很低，是正相关题6图 D.相关很低，是负相关 7.下列叙述正确的是（） A.同一被试不同测验上的原始分数可以比较 B.同一被试不同测验上的原始分数不可以比较 C.不同年龄组间的离差智商值不可以比较 D.同一被试不同测验上的标准分数不可以比较

8.布卢姆认知领域分类中衡量个体根据一定的标准对事物的价值作出合乎逻辑的判断的行为目标属于（） A.评价 B.综合 C.分析 D.领会 9.韦克斯勒智力测验属于（） A.限时测验和典型作为测验 B.限时测验和最高成就测验 C.非限时测验和典型作为测验 D.非限时测验和最高成就测验 10.在某英语测验中，一位学生的成绩为59分，若该测验的测量标准误为2.68，那么该生的真分数可能是（） A.55.5 B.56 C.60 D.62 11.标准化成就测验是（） A.形成性测验 B.终结性测验 C.既可以是标准参照成就测验也可以是常模参照成就测验 D.既不是标准参照成就测验也不是常模参照成就测验 12.某市有小学200所，要在该市小学生中抽取一个容量为80的随机样本，考虑到小学生年龄偏低，允许一所小学抽取2个学生，应采用（） A.随机抽样 B.分层抽样 C.分阶段抽样 D.等距抽样 13.原总体非正态，总体方差未知，且样本容量n≥30的平均数抽样分布为（） A.F分布 B.t分布 C.χ2分布 D.正态分布 14.关于统计假设检验，下列说法正确的是（） A.使用反证法 B.最终结论一定是推翻原假设 C.若虚无假设被推翻，则整个检验过程不成立 D.它所依据的是小概率事件有可能发生的原理 15.若要比较两个或两个以上独立总体方差差异显著性检验，应采用（） A.F检验 B.t检验 C.χ2检验 D.Z检验二、名词解释题(本大题共4小题，每小题3分，共12分) 16.标准分数 17.常模参照测验 18.命题双向细目表 19.测验信度

《教育统计与测量评价》复习题及参考答案

本课程复习题所提供的答案仅供学员在复习过程中参考之用，有问题请到课程论坛提问。本复习题页码标注所用教材为：福师1203考试批次《教育统计与测量评价》复习题及参考答案一 … 一、单项选择题（每题1分，共10分） 1、体育运动会中各个项目的名次为“第1名,第2名,第3名……”,这一变量属于（）。 A、称名变量 B、顺序变量 C、等距变量 D、比率变量 2、某次考试之后对数据进行统计分析，求得第46百分位数是64分，这意味着考分高于64分的考生人数比例为（）。 A、36％ B、46％ C、54％ D、64％ 3、下列分类是属于按照解释结果的参照点划分的（） A、形成性与总结性测量与评价 B、智力与成就测量与评价 C、常模参照与标准参照测量与评价 D、诊断性与个人潜能测量与评价 4、标准分数Z与百分等级之间关系（）。 A、可以互相推出 B、没有关系、 C、百分等级PR大于Z分数 D、在一定条件下Z分数和PR值一一对应 5、在正态分布中，已知概率P(0＜Z≤＝，试问：概率P（Z>）的值为（）。 A、B、C、D、 6.下列分类属于按照教学时机划分的是（） A、形成性与总结性测量与评价 B、智力与成就测量与评价 C、常模参照与标准参照测量与评价 D、诊断性与个人潜能测量与评价 7.适合于某些用于选拔和分类的职业测验的效度种类是（）。 A.时间效度 B. 内容效度 C. 效标关联效度 D. 结构效度 8. 统计学中反映一组数据集中趋势的量是下面哪个选项（）。 A、平均差 B、差异系数 C、标准差 D、中数。 9.某次考试之后对数据进行统计分析，求得第90百分位数是78分，这意味着考分高于78分的考生人数比例为（）。 A、90％ B、10％ C、78％ D、22％ 10. 考试中对学生进行排名，常见的名次属于什么变量（） A、称名 B、顺序 C、等距 D、比率答案提示：

小学教育统计与测量

1.什么是教育统计?它的主要内容有哪些？教育统计就是把数学中的概率论与数理统计的理论与方法应用到教育领域而形成的一门应用学科。主要内容包括描述统计、推断统计。 2.测量的量表有哪几种？各有什么特点？称名量表：它的数字只起对事物的特性进行区别或分类的作用，没有数量的大小、多少、位次和倍数关系。等级量表：既无相等的单位，又无绝对零点。等距量表:其结果可进行加、减运算，无绝对零点，分类性、有序性、等距性。比率量表:单位相等，有绝对零点，可进行加减乘除运算。 3.什么是教育测量？它有什么特点？教育测量就是根据教育学、心理学、测量学的理论和原则，通过各种测验和观察，对所研究的教育现象分派数字。特点：1.教育测量对象的复杂性和不明确性2.教育测量方法的间接性3.教育测量结果的相对性。 4.教育工作者学习教育统计与测量的意义是什么？ 1.掌握教育科学研究的重要工具 2.掌握科学的教育管理手段 3.提高教学水平 4.锻炼科学的思维和推理能力。第二章 2.从数据性质的角度找出与其他不同类的数据：D.30摄氏度 3.测量数据0.101的实限B.[0.1005 ,0.1015） 4.一组限为70~79，不属于该组的数据是：C.79.5 5.编制次数分布表最关键的两个步骤是：A.求全距与定组数 6.向下累计次数的含义是某一组：C.以上各组次数的总和 7.某小学在学雷锋活动月中，各年级涌现出的好人好事分别为：一年级男生12件、女生15件；二年级男生16件、女生24件；三年级男生11件、女生13件；四年级男生20件、女生24件；五年级男生18件、女生15件；六年级男生5件、女生10件根据上述资料，请编制一个适当的统计表，并绘制相应的统计图。 8某小学六年级学生参加校园绿化植树活动，总计需要植树120棵（其中松树46棵，柳树24棵，杨树50棵）。请绘制一个适当的统计表，并绘制相应的统计图。 9根据下列数据资料请编制一个次数分布表并绘制相应的次数分布图。 58 79 66 76 75 83 56 70 71 73 85 80 73 72 75 56 78 59 61 74 68 55 76 74 41 61 91 45 71 82 68 69 63 50 61 84 60 65 71 77 62 78 84 85 92 97 70 88 47 66 78 38 67 63 70 66 73 77 72 61 73 68 72 74 76 77 87 61 47 52 69 66 52 76 79 68 66 62 64 69 63 65 68 68 66 67 71 72 69 78 10完成下列次数分布表：

00452教育统计与测量试卷及参考答案201107.doc

2011年7月高等教育自学考试全国统一命题考试教育统计与测量试题课程代码：00452 1、4、10、11 一、单项选择题（本大题共15小题，每小题2分，共30分）在每小题列出的四个备选项中只有一个是符合题目要求的，请将其代码填写在题后的括号内。错选、多选或未选均不得分。 1．学习教育统计与测量的意义在于它是( ) A．提高教学水平的重要手段B．教育科学管理的重要手段 C．提高逻辑思维能力的重要手段D．认识个体心理特征的重要手段 2．教育测量的突出特点是( ) A．直接性与随机进行B．精确性与抽样进行 C．间接性与抽样进行D．外显性与随机进行 3．在研究中，用数字符号“1”表示男生，用数字符号“0”表示女生，这里数字“1”和“0”属于 ( ) A．称名变量数据B．顺序变量数据 C．等距变量数据D．比率变量数据 4．在统计分析图中，条形图通常用于描述( ) A．二元变量的观测数据B．某种事物在时间序列上的变化趋势 C．具有百分比结构的分类数据D．离散性变量的统计事项 5．下列属于差异量数的是( ) A．算术平均数B．平均差 C．中数D．众数 6．组内常模可以分为( ) A．百分等级常模与标准分数常模B．百分等级常模与年龄常模 C．标准分数常模与年级常模D．年龄常模与年级常模 7．在标准化常模参照测验中，测验项目的恰当难度是尽量接近( ) A．0.50 B．被试的通过率 C．1.00 D．特定的划界点（或称决断点）水平 8．主观题的优点是( ) A．测验效率高B．作答容易 C．能有效控制阅卷者的评分误差D．可以考察分析综合能力 9．下列以非文字著称的智力测验是( ) A．韦克斯勒智力测验B．斯坦福一比纳智力测验

教育统计与测量练习题库及答案

《教育统计与测量》课程练习题库及答案本科一、名词解释 1.教育统计:是运用数理统计的原理和方法研究教育现象数量表现和数理关系的科学。 2.变量:是指可以定量并能取不同数值的事物的特征。 3. 算术平均数:所有观察值的总和除以总频数后所得之商。 4.频率:就是随机事件A在n次试验中出现了m（m≤n）次,则m与n的比值就是频率,用公式表示就是 W(A)= 5.测验设计:是指测验编制者对测验形式、时限、题量、题目编排、测验指导手册等进行的设计工作。 6. 测验效度:就是测验实际上测到它打算要测的东西的程度。 7.描述统计:是研究如何将收集到的统计数据，用统计图表或者概括性统计量数反映其数量表现和数理关系的统计方法。 8.名称变量:又称类别变量，是指其数值只用于区分事物的不同类别，不表示事物大小关系的一种变量。顺序变量又称等级变量，是指其数值用于排列不同事物的等级顺序的变量。 9. 离散变量:又称间断变量，是指在一定区间内不能连续不断地取值的变量。 10.总体:是根据统计任务确定的同一类事物的全体。 11.教育测量学：就是根据一定的法则用数字对教育效果或过程加以确定。教育测量学是以现代教育学、心理学和统计学作为基础，运用各种测试方法和技术手段，对教育现状、教育效果、学业成就及其能力、品格、学术能力倾向等方面进行科学测定的一门分支学科。 12. 自由应答式试题;是指被试可以自由地应答，只要在题目限制的范围内，可在深度、广度，组织方式等方面享有很大自由地答题方式。 13.随机变量:是指表示随机现象各种结果的变量。 14. 连续型变量:是指在其所取的任何两值之间可以作无限地分割，即能连续不断地获取数值的变量。 15.度量数据:是指用一定的工具或按一定的标准测量得到的数据。 16. 正相关:两个变量变化方向一致的相关。 17. 同质性χ2检验：在双向表的χ2检验中，如果是判断几次重复实验的结果是否相同，叫做同质性χ2检验。 18. 难度：就是被试完成项目作答任务时所遇到的困难程度。 19. 比率变量：等距变量又称间隔变量，是指其数值可以用于表明事物距离差异大小的变量。比率变量是指数值不仅能反映数字之间的间隔大小。还能说明数字之间比率关系的变量。

《教育统计与测量》练习题库及答案

n m 华中师范大学网络教育学院《教育统计与测量》课程练习题库及答案本科一、名词解释 1.教育统计:是运用数理统计的原理和方法研究教育现象数量表现和数理关系的科学。 2.变量:是指可以定量并能取不同数值的事物的特征。 3. 算术平均数:所有观察值的总和除以总频数后所得之商。 4.频率:就是随机事件A 在n 次试验中出现了m （m ≤n ）次,则m 与n 的比值就是频率,用公式表示就是W(A)= 5.测验设计:是指测验编制者对测验形式、时限、题量、题目编排、测验指导手册等进行的设计工作。 6. 测验效度:就是测验实际上测到它打算要测的东西的程度。 7.描述统计:是研究如何将收集到的统计数据，用统计图表或者概括性统计量数反映其数量表现和数理关系的统计方法。 8.名称变量:又称类别变量，是指其数值只用于区分事物的不同类别，不表示事物大小关系的一种变量。顺序变量又称等级变量，是指其数值用于排列不同事物的等级顺序的变量。 9. 离散变量:又称间断变量，是指在一定区间内不能连续不断地取值的变量。 10.总体:是根据统计任务确定的同一类事物的全体。 11.教育测量学：就是根据一定的法则用数字对教育效果或过程加以确定。教育测量学是以现代教育学、心理学和统计学作为基础，运用各种测试方法和技术手段，对教育现状、教育效果、学业成就及其能力、品格、学术能力倾向等方面进行科学测定的一门分支学科。 12. 自由应答式试题;是指被试可以自由地应答，只要在题目限制的范围内，可在深度、广度，组织方式等方面享有很大自由地答题方式。 13.随机变量:是指表示随机现象各种结果的变量。 14. 连续型变量:是指在其所取的任何两值之间可以作无限地分割，即能连续不断地获取数值的变量。 15.度量数据:是指用一定的工具或按一定的标准测量得到的数据。

《教育统计与测量》练习题库参考答案

《教育统计与测量》课程练习题库一、名词解释 1.教育统计 2.变量 3.算术平均数 4.频率 5.测验设计 6.测验效度 7.描述统计 8.名称变量 9.离散变量 10.总体 11.教育测量学 12.自由应答式试题 13.随机变量 14.连续型变量 15.度量数据 16.正相关 17.同质性χ2检验 18.难度 19.比率变量 20.样本 21.概率 22.负相关 23.独立性χ2检验 24.情境测验法 25.推断统计 26.等距变量 27.随机误差 28.双向表 29.心理测验 30.职业能力倾向测验 31.非随机变量 32.个体 33.心理量表 34.分层抽样 35.标准误 36.零假设二、填空题 1.统计学含_____和_____ 两大类。 2.依据变量的性质,变量分为名称变量顺序变量,等距变量和_____。 3.X1=1,在数轴上只表示一个点,则X变量是_____。 4.91.5是一个连续数据,它的真正范围是_____。

5.一次全县调考后,算得其标准差为δ=15,某校参加考试的人数为49人,其标准误是_____。 6.教育测量具有_____、_____ 和_____ 的特点。 7.口头测验的方法有高声朗读教师提问,随机抽答,专题发言,小组讨论,师生一般会谈,_____ 和_____ 。 8.情境测验的主要类型有_____ 和_____ 。 9.教育统计具有_____ 和_____ 的特点。 10.教室里有20个学生，取这个数值的变量称为_____。 11.Y1=1，在数轴上表示为一个区间，则y变量是_____。 12.资料来源有两个方面，即_____和_____。 13.统计图由标题、图号、图目_____ 和_____ 五部分构成。 14.点二列相关在教育测验中可用来计算_____。 15.标准正态分布（也称Z分布）的离差统计量公式是_____。 16.效度分为内容效度、结构效度和_____。 17.教育统计具有_____ 和_____ 的特点。 18.统计表一般由_____、_____、_____、_____、_____和_____ 组成。 19.教育测量的主要工具是_____ 。 20.测验题目的编排形式有两种，即_____ 和_____ 。 21.将简答题、填空题归于客观题的理由是_____ 。 22.独立样本平均数之差的标准误的公式是_____。 23.在标准正态分布图形中，α=.05时的临界（Z值）是_____和_____。 24.一般正态曲线有_____ 条。 25.编制统计图表的工作属于_____。 26.问卷调查法分为两类，分别是_____ 和_____ 。 27.统计表的种类分为简单表、分组表、_____ 。 28.教育测量有四种量表，它们是称名量表，顺序量表，等距量表和_____ 。 29.韦氏儿童智力量表包括_____ 个测验。 30.客观题中最灵活的一种题型是_____。 31.相关样本平均数之差的标准误的公式是_____。 32.在标准正态分布图形中，α=0.01时的临界（Z值）是_____和_____。 33.依据变量是否具有随机性，变量分为_____ 和_____。 34.在一次体育比赛中，某班获得团体第1名，取这个数值的变量称为_____。 35.非随机误差包括_____和_____。 36.教育调查的常用方法有_____和____。 37.A班50人，B班48人，要比较两班某次考试后的成绩分布状况，应该用_____ .图形表示。 38.教育测量学研究内容主要是_____ 。 39.智力超常人的智商是_____ ，智力正常人的智商是_____ ，低常人的智商是____ 。 40.布卢姆把认知领域分为知识；领会；应用；分析；综合和_____六个层次。 41.将学生的兴趣分为“很有兴趣、有兴趣、较有兴趣、无兴趣、很无兴趣”五个等级，并分别用“5、4、3、2、1”表示。取这些数值的变量称为_____ 。 42.随机误差的来源包括_____ 和____。 43.数据14、2、17、9、13的中位数是_____

教育统计与测量试卷C

2013年教育统计与测量函授试卷 C 卷（注：本试卷需用计算器）一、单项选择题（每题1分，共20分） 1、学生美术课的成绩得分（五分制，即优秀、良好、中等、及格、不及格分别计为5、4、3、2、1分）属于：（） A 称名数据 B 顺序数据 C 等距数据 D 比率数据 2、已知某次数分布表的三组组限是：15-19，20-24，25-29，则该组的组距是：（） A 4 B 5 C 4.5 D 5.5 3、某生在军训时打靶的成绩为10，8，4，9，10，8环，适合于表示该生成绩稳定性的特征值是：（） A 算术平均数 B 标准分数 C 中位数 D 标准差

4、下列能反映数据分布离散趋势的特征量数是（） A 相关系数 B 地位量数 C 集中量数 D 差异量数 5、这组数据{6，17，21，9，16，12，10，7，8}的中位数是： ( ) A 7 B 8 C 10 D 16 6、一组数据的离差平方和的平均数是：（） A百分位差 B标准差 C平均差 D方差 7、下列相关中，属于负相关的是：（） A青少年身高与体重之间的相关； B五笔打字时间长短与打字错误率之间的相关； C高中生物理成绩与化学成绩的相关； D大学生智商与年龄之间的相关； 8、比较适合于计算婚姻状况（单身、在婚）和自学考试成绩（及格、不及格）之间相关关系的是：（） A 积差相关 B 等级相关 C 质量相关 D 品质相关 9、下列各种统计过程中，不属于推论统计的是：（） A计算一组数据的平均数和标准差； B总体平均数的区间估计； C进行平均数的差异显著性检验； D进行方差分析；

教育统计与测量试题

全国2005年7月高等教育自学考试教育统计与测量试题课程代码：00452 一、单项选择题（本大题共15小题，每小题2分，共30分）在每小题列出的四个备选项中只有一个是符合题目要求的，请将其代码填写在题后的括号内。错选、多选或未选均无分。 1．下列各种测量中，不．能直接测量的是（） A．体重B．身高 C．胸围D．智力水平 2．下列变量中属于称名变量的是（） A．学生的体温B．学生的身高 C．学生所在的班级D．学生的外语考试成绩 3．中数的缺点是（） A．不简明B．含义不明确 C．缺乏灵敏性D．易受极端值影响 4．记录随机试验结果的变量称为（） A．随机变量B．函数变量 C．确定性变量D．非随机变量 5．下列相关系数中，相关最强的是（） A．-0.90 B．-0.32 C．0.12 D．0.53 6．某份语文试卷满分为100分，现要分析试卷中作文题（满分为30分）的区分度，应采用（） A．等级相关法B．积差相关法 C．点双列相关法D．列联相关法 7．常模参照测验主要用于（） A．鉴别与评价学生的能力水平B．评价课堂教学与课程编制的有效性C．提供学习者个人学习经历和已达水平D．说明学习者掌握所规定教学内容的程度8．通过被试间相互比较而确定分数意义的评分称为（） A．相对评分B．绝对评分 C．相互评分D．团体评分 00452# 教育统计与测量试题第1 页共4页

9．某儿童的智力相当于6岁5个月水平，而他的实际年龄是5岁2个月，那么他的智商约为（） A．116 B．118 C．120 D．124 10．用重测相关估计信度时存在的局限是（） A．对所测特质的稳定性有限制 B．对测验项目的难度排列有限制 C．只能在一定时间间隔内重测才能得到重测相关 D．对测验的内容范围、测验难度、试题类型等有限制 11．以下关于效度的叙述中，完全正确的是（） A．同样的测验在多种使用目的下表现出种种不同程度的正确有效性 B．测验有效与否及程度如何是一个很明确的指标，与测验的类型无关 C．通常我们能够说明测验的正确性，而不能从根本上说明测验的有用性 D．心理和教育测验所测验特质或结构是一目了然的，所以测验效度不会引起争议 12．编制标准化常模参照测验时，测验项目的难度最好为（） A．0.20左右B．0.50左右 C．0.70左右D．0.90左右 13．统计假设检验中，如果显著性水平值减小时，则会（） A．增加I型错误B．减少II型错误 C．减少I型错误D．同时增加两类错误 14．随机事件概率的取值区间是（） A．-1≤P≤1 B．0≤P≤1 C．0

福师考试批次《教育统计与测量评价》复习题及参考答案

《教育统计与测量评价》复习题一及参考答案一、单项选择题（每题1分，共10分） 1、同时掷两个骰子，出现11个点的概率为（） A、1/6 B、1/12 C、1/18 D、1/36 2、复本信度和重测信度这两种方法的最大差别是（）。 A、不是同一批被试 B、计算误差大小 C、不是同一份测验 D、计算方法 3.之所以中学校长不能直接用高考各科原始分数来评价各科教师教学质量,是因为( ) A.考试信度不高 B. 原始分可比性差 C. 考试内容不同 D.考试效度不好 4、测验蓝图设计是关于（）。 A、测验内容和试验题型的抽样方案 B、测验内容和考查目标的抽样方案 C、试验时间和测验题目的抽样方案 D、测验时间和考查目标的抽样方案 5、若根据题目答案的范围和评分误差的大小,可以把测验题目分为（）。 A、选择题和填空题 B、选择题和供答题 C、客观题和主观题 D、论文题和操作题 6.简单算术平均数，简称平均数，它可以反映一组数据的（）。 A. 分布范围 B. 差异大小 C.整体取值水平 D. 离散程度 7.标准分数Z与百分等级之间关系（）。 A、可以互相推出 B、没有关系

C、百分等级PR大于Z分数 D、在一定条件下Z分数和PR值一一对应 8、某次考试之后对数据进行统计分析，求得第46百分位数是64分，这意味着考分高于64分的考生人数比例为（）。 A、36％ B、46％ C、54％ D、64％ 9.下列分类是属于按照解释结果的参照点划分的（） A、形成性与总结性测量与评价 B、智力与成就测量与评价 C、常模参照与标准参照测量与评价 D、诊断性与个人潜能测量与评价 10.在正态分布中，已知概率P(0＜Z≤1.96)＝0.4750，试问：概率P（Z>1.96）的值为（）。 A、0.9750 B、0.9500 C、0.0500 D、0.0250 答案： 1.C 2.C 3.C 4.B 5.C 6.C 7.D 8.C 9.C 10.B 二、绘制统计图（共10分）请按以下的分布统计资料，绘制相对次数分布直方图与多边图（可画在同一个坐标框图上）

教育统计与测量网上综测答案

教育统计与测量复习题答案

《教育统计与测量》练习题一一、简答与计算 1.编写教育测验试题时需要遵循哪些要求？ 2.学生的情感发展目标主要包括哪些层次？如何测量？ 3.某市六年级英语统一考试平均成绩为72分，该市某小学六年级22份试卷的分数分别为：70，75，55，88，73，72，74，65，80，59，63，76，81，83，60，78， 67，54， 69，66，50，68。问该校六年级英语平均成绩是否与全市英语平均成绩一致？ 5.某工厂招青年工人，有1000人参加考试，拟录用300人，已知考试的平均成绩为70分，标准差为8分，成绩服从正态分布，试确定最低录取线应是多少分？ 6.如何确定测验试题的难度水平？ 7.填空题编制的原则是什么？ 8.某市600名小学生的数学竞赛成绩服从正态分布，其平均成绩为65分，标准差为15分，利用正态分布曲线下的面积推求60分以下，60—70分， 70—80分，80分以上各段可能占总人数多大比例？并估计各分数段各有多少人？ 9．某小学语文教师为了提高小学生的写作能力，在三年级中进行写作技能训练。他从所任课的班级中随机抽取20名学生，采取配对设计的方法，将学生配成10对，分为实验组和控制组。两个月后进行写作技能测试，结果如下。问这位教师的训练方法是否有显著性成效？ 10.某地区用自编的量表测得全区四年级学生的注意力集中水平与学科成绩之间的相关系数为0.45，现从此地区的一所小学中随机抽取24名四年级学生，用此量表测得他们注意力集中水平与学科成绩之间的相关系数为r=0.54。问这一相关系数是否与全区的研究结果有显著性差异？ 11.简述客观性测验的优势。 12.常模参照测验和目标参照测验的主要区别及其应用时机。 13．从某实验学校从三年级中随机抽取47名学生，进行阅读能力训练。训练前进行一次测验，测验结果的平均成绩为71分，标准差为8.2分。训练两个月后，又采用等值测验进行测试，平均成绩为76分，标准差为9.6分，两次测验的相关系数为0.53。问阅读能力训练对提高学生的阅读能力是否有促进作用？ 14．家庭经济状况属于上、中、下的高三毕业生，对于是否愿意报考师范大学有三种不同的

《教育统计与测量》练习题库与答案

向等方面进行科学测定的一门分支学科。 12. 自由应答式试题;是指被试可以自由地应答，只要在题目限制的范围内，可在深度、广度，组织方式等方面享有很大自由地答题方式。 13.随机变量:是指表示随机现象各种结果的变量。 14. 连续型变量:是指在其所取的任何两值之间可以作无限地分割，即能连续不断地获取数值的变量。 15.度量数据:是指用一定的工具或按一定的标准测量得到的数据。 16. 正相关:两个变量变化方向一致的相关。 17. 同质性χ2检验：在双向表的χ2检验中，如果是判断几次重复实验的结果是否相同，叫做同质性χ2检验。 18. 难度：就是被试完成项目作答任务时所遇到的困难程度。 19. 比率变量：等距变量又称间隔变量，是指其数值可以用于表明事物距离差异大小的变量。比率变量是指数值不仅能反映数字之间的间隔大小。还能说明数字之间比率关系的变量。 20. 样本：总体是根据统计任务确定的同一类事物的全体。个体是构成总体的每个基本单位。样本是从总体中抽取的作为观察对象的一部分个体。21.频率：就是随机事件A在n次试验中出现了m（m≤n）次，则m与n的比值就是频率，用公式表示就是W(A)= ，概率又称“机率”或“然率”，表示随机事件发生可能性大小的量。 22. 负相关：两个变量变化方向相反的相关。 23. 独立性χ2检验：在双向表的χ2检验中，如果要判断两种分类特征之间是否有依从关系，叫做独立性χ2检验。 24.情境测验法：指的是把被试置于一种特定情境中以观察其行为反应，然后

教育统计与测量试题及答案

2011年7月高等教育自学考试教育统计与测量试题课程代码：00452 一、单项选择题（本大题共15小题，每小题2分，共30分）在每小题列出的四个备选项中只有一个是符合题目要求的，请将其代码填写在题后的括号内。错选、多选或未选均不得分。 1．学习教育统计与测量的意义在于它是( B ) A．提高教学水平的重要手段B．教育科学管理的重要手段 C．提高逻辑思维能力的重要手段D．认识个体心理特征的重要手段 2．教育测量的突出特点是( C ) A．直接性与随机进行B．精确性与抽样进行 C．间接性与抽样进行D．外显性与随机进行 3．在研究中，用数字符号“1”表示男生，用数字符号“0”表示女生，这里数字“1”和“0”属于( A ) A．称名变量数据B．顺序变量数据 C．等距变量数据D．比率变量数据 4．在统计分析图中，条形图通常用于描述( D ) A．二元变量的观测数据B．某种事物在时间序列上的变化趋势 C．具有百分比结构的分类数据D．离散性变量的统计事项 5．下列属于差异量数的是( B ) A．算术平均数B．平均差 C．中数D．众数 6．组内常模可以分为( A ) A．百分等级常模与标准分数常模B．百分等级常模与年龄常模 C．标准分数常模与年级常模D．年龄常模与年级常模 7．在标准化常模参照测验中，测验项目的恰当难度是尽量接近( A ) A．0.50 B．被试的通过率 C．1.00 D．特定的划界点（或称决断点）水平 8．主观题的优点是( D ) A．测验效率高B．作答容易 C．能有效控制阅卷者的评分误差D．可以考察分析综合能力 9．下列以非文字著称的智力测验是( C ) A．韦克斯勒智力测验B．斯坦福一比纳智力测验 C．瑞文标准推理测验D．中小学生团体智力筛选测验 10．抽样时，总体比较大，所抽样本容量比较小，并且总体各部分元素之间的差异大于各部分元素之内的差异的情况下，应采用( D )

《教育统计与测量》答案

《教育统计与测量》答案一、简答与计算 1.客观性测验的优势是：第一，适合展开大规模测验；第二，题量大，信息范围广；第三，试题分布均匀；第四，阅卷容易；第五，评分结果客观、公正、可靠；第六，用于测量知识的掌握、理解、应用、分析等 2.常模参照测验是以学生团体的平均成绩作为参照标准，就某学生得分的高低来说明其在学生团体中的相对位置（或名次），将学生分类排队。其特点是学生成绩的高低是相对的。它着重学生个人之间的横向比较，适于区分学生的成绩水准，可供选拔、编班、编组之用。这种测验目的主要是在于考查被试的个体差异，衡量被试的相对水平。常模参照测验要求测得的分数变异性要大，得分的范围要广，要求试题有很强的鉴别力。凡是参照规定的教学目标，核对学生的测验得分，评定其是否达到标准以及达标程度的测验，都属于标准参照测验。特点是学生成绩的高低是绝对的，不在所在的群体中横向比较。标准参照测验主要用于基本知识、基本技能的测量，用于诊断及个别指导。 3．H0：，：>，=3.93 由于计算的=3.93>Z0.01=2.33，所以在0.01水平上拒绝原假设，接受备择假设。结论为训练前后两次测验的平均成绩差异非常显著，训练后学生进步很大，阅读训练对提高学生的阅读能力有较大的促进作用。 4. 5. 分别带入公式求得：算术平均数为77，中位数是7 6.8，S= 7.509分，Q=5.425分。 6.采用2 χ检验。带入2χ计算公式得2χ=10.39，P＜0.05，结论为学生是否愿意报考师范大学与家庭经济状况有关。二、论述与计算 1. 2．先进行方差齐性检验。=2.786，=6.39，<，P>0.05，方差齐性。方差分析总表来源平方和SS自由度df均方MS F 组间组内总体147.8 1968.2 2116 3 20 23 49.27 98.41 0.5 通过检验发现，F值小于临界值，这四组平均数之间没有显著性差异，也就是说不同的学习条件学生的学习成绩间没有显著性差异。

2015年1月全国自考教育统计与测量考前押题试卷(一)

2015年1月全国自考教育统计与测量考前押题试卷(一) 一、单项选择题（本大题共15小题，每小题2分，共30分）在每小题列出的四个备选项中只有一个是符合题目要求的，请将其代码填写在题后的括号内。错选、多选或未选均无分。第1题一个次数分布中出现次数最多的那个数为() A. 众数 B. 中位数 C. 平均数 D. 集中量数【正确答案】 A 【你的答案】本题分数2分第2题凡反映次数分布中各数据所处地位的量，叫() A. 集中量数 B. 地位量数 C. 差异量数 D. 位置量数【正确答案】 B 【你的答案】本题分数2分第3题【正确答案】 D 【你的答案】本题分数2分第4题观察分数(X)、真分数(T)及误差分数(E)三者之间的关系式为() A. T＝X＋E B. X＝T－E

C. T＝E－X D. X＝T＋E 【正确答案】 D 【你的答案】本题分数2分第5题把成就测验分成口头测验、纸笔测验和操作测验是根据()来划分的。 A. 成就测验的实施方式与测验载体 B. 成就测验的实施方式 C. 解释测验分数的方法不同 D. 测验分数的不同【正确答案】 A 【你的答案】本题分数2分第6题 F分布的最大特点是() A. 一个正偏态分布 B. F值均为正值，其最小值为0 C. F曲线的上尾侧以横轴为渐近线 D. 同时受到两个自由度的制约【正确答案】 D 【你的答案】本题分数2分第7题考察整个测验的质量指标，即考察测验() A. 效度 B. 信度 C. 效度和信度 D. A、B、C都不是【正确答案】 C 【你的答案】本题分数2分第8题

A. 1 B. 2 C. 3 D. A、B、C都不对【正确答案】 A 【你的答案】本题分数2分第9题【正确答案】 B 【你的答案】本题分数2分第10题【正确答案】 B 【你的答案】本题分数2分第11题被试的智力年龄对生理年龄的比为() A. 智商 B. 离差智商 C. 身心智商 D. A、B、C都不对【正确答案】 A

《教育统计与测量》试卷及答案

高等师范院校《教育统计与测量》课程考试卷级县（市区）层次专业姓名得分一、单项选择题(本大题共15小题，每小题2分，共30分) 1.教育测量是( ) A.观测个体行为表现，推断其内部心理特征 B.直接测量个体内部心理特征 C.测量个体外在行为表现 D.根据个体心理特征，推断其外在行为表现 2.下列数据中，运算结果只是反映位次顺序关系的是( ) A.称名变量数据 B.顺序变量数据 C.等距变量数据 D.比率变量数据数据的特点的是( ) 3.下列不属于．．． A.离散性 B.顺序性 C.变异性 D.规律性 4.某校某班学生的家庭出身统计情况是：农民32％，工人28％，干部30％，其他10％。若要直观描述这组统计数据宜采用( ) A.散点图 B.线形图 C.条形 D.圆形图 5.某小学一年级学生平均体重为25千克，标准差为3.7千克，平均身高为110厘米，标准差为 6.2厘米，那么该小学一年级学生的体重差异程度与身高差异程度的关系是( ) A.体重差异程度小于身高差异程度 B.体重差异程度大于身高差异程度 C.体重差异程度等于身高差异程度 D.体重差异程度与身高差异程度无法比较

6.比纳智力测验运用的常模属于( ) A.百分等级常 B.标准分数常模 C.年级常模 D.年龄常模的是( ) 7.下列对误差的理解不正确．．． A.误差可以避免 B.误差可以控制 C.误差是客观存在的 D.误差可以分为测量误差和抽样误差 8.高考属于( ) A.标准参照测验 B.诊断性测验 C.常模参照测验 D.形成性测验 9.选择题的优点是( ) A.编题要求技巧不高 B.能考查学生思维发散力 C.有助于学生巩固知识 D.能测量理解、应用领域中复杂的高级的学习成就 10.小概率事件是指( ) <0.05 <0.1>0.05 >0.1 11.下列不属于发散性思维特征的是( ) ．．． A.流畅性 B.变通性 C.突发性 D.独特性 12.在次数分布表中，若要用代数区间来表示“60~65”，恰当的是( ) A.[59.5，64.5] B.[59.5，64.5) C.(59.5，64.5] D.(59.5，64.5) 13.衡量测验工具的正确性的指标是( ) A.测验难度 B.测验效度 C.测验信度 D.测验区分度 14.对两独立总体大样本的平均数差异的显著性检验应采用( ) 检验检验 C.χ2检验检验 15.在统计假设检验中，区分双侧检验与单侧检验的关键在于( ) A.样本的分布 B.临界值的确定 C.检验的目的 D.总体参数是否已知

全国4月高等教育自学考试教育统计与测量试题及答案解析历年试卷及答案解析

全国2018年4月高等教育自学考试教育统计与测量试题课程代码：00452 第一部分选择题一、单项选择题(本大题共15小题，每小题2分，共30分)在每小题列出的四个选项中只有一个选项是符合题目要求的，请将正确选项前的字母填在题后的括号内。 1.学生的英语测验成绩属于( ) A.名义量尺 B.顺序量尺 C.等距量尺 D.比率量尺 2.常用于描述离散性随机变量统计事项的统计图是( ) A.条形图 B.次数直方图 C.次数多边图 D.散点图 3.下列统计量中对数据变化灵敏性最差的是( ) A.方差 B.平均差 C.算术平均差 D.中位数 4.下列统计量中不适于作进一步代数运算的是( ) A.算术平均数 B.加权平均数 C.平均差 D.标准差 5.某城市调查8岁儿童的身高情况，所用单位为厘米，根据这批数据计算得出的差异系数( ) A.单位是厘米 B.单位是米 C.单位是平方厘米 D.无单位 6.下列相关系数中表示两列变量间的相关强度最小的是( ) A. 0.90 B. 0.10 C. -0.40 D. -0.70 7.下列几种效度中，不具有效度真正意义的是( ) A.结构效度 B.内容效度 C.表面效度 D.效标关联效度 8.选择题的主要缺点是( ) A.编题难度较大 B.评分主观 C.测量的学习内容范围较窄 D.保密性差 9.任何一个随机事件发生的概率的取值区间是( ) A. 0