文档库 最新最全的文档下载
当前位置:文档库 › 假设检验——非参数检验

假设检验——非参数检验

假设检验——非参数检验
假设检验——非参数检验

假设检验(二)——非参数检验

假设检验的统计方法,从其统计假设的角度可分为两类:参数检验与非参数检验。上一节我们所介绍的Z 检验、t 检验,都是参数检验。它们的共同特点是总体分布正态,并满足某些总体参数的假定条件。参数检验就是要通过样本统计量去推断或估计总体参数。然而,在实践中我们常常会遇到一些问题的总体分布并不明确,或者总体参数的假设条件不成立,不能使用参数检验。这一类问题的检验应该采用统计学中的另一类方法,即非参数检验。非参数检验是通过检验总体分布情况来实现对总体参数的推断。

非参数检验法与参数检验法相比,特点可以归纳如下: (1)非参数检验一般不需要严格的前提假设; (2)非参数检验特别适用于顺序资料;

(3)非参数检验很适用于小样本,并且计算简单;

(4)非参数检验法最大的不足是没能充分利用数据资料的全部信息; (5)非参数检验法目前还不能用于处理因素间的交互作用。

非参数检验的方法很多,分别适用于各种特点的资料。本节将介绍几种常用的非参数检验方法。

一.2

χ检验

2χ检验主要用于对按属性分类的计数资料的分析,对于数据资料本身的分布形态不作任何

假设,所以从一定的意义上来讲,它是一种检验计数数据分布状态的最常用的非参数检验方法。

2χ检验的方法主要包括适合性检验和独立性检验。

(一)2

χ检验概述

2χ是实得数据与理论数据偏离程度的指标。其基本公式为:

∑-=e

e f f f 2

02

)(χ (公式11—9) 式中,0f 为实际观察次数,e f 为理论次数。

分析公式可知,把实际观测次数和依据某种假设所期望的次数(或理论次数)的差数平方,除以理论次数,求出比值,再将n 个比值相加,其和就是2

χ。观察公式可发现,如果实际观察

次数与理论次数的差异越小,2χ值也就越小。当0f 与e f 完全相同时,2

χ值为零。

2χ值的特点为:① 2χ值具有可加性。② 2χ值永远不会小于零。③ 2χ值的大小随着实

际次数与理论次数之差的大小而变化。

利用2

χ值去检验实际观察次数与理论次数的差异是否显著的方法称为2

χ检验。

2χ检验有两个主要的作用:第一,可以用来检验各种实际次数与理论次数是否吻合的问题,

这类问题统称为适合性检验;第二,判断计数的两组或多组资料是否相互关联还是相互独立的问题,这类问题统称为独立性检验。

2χ检验的具体步骤与t 检验基本相同。

第一,建立虚无假设。例如假定实测次数与理论次数无显著差异,差异仅由机会造成。 第二,计算理论次数,并求出2

χ值。

第三,统计推断。根据df 数目和选定的显著性水平,查2

χ值表得出超过实得2

χ值的概率。把概率的大小,作为接受或拒绝假设的依据。

表11—9 2

χ检验统计决断规则

(二)适合性检验

适合性检验是应用2

χ检验方法的一种。它主要适用于检验实际观测次数与理论次数之检查以是否显著,它所面对的研究对象主要是一个因素多项分类的计数资料,所以又称为单因素分类

2χ检验或单项表的2χ检验。适合性检验的种类主要有无差假设的适合性检验和实际次数分布

是否属于正态分布的适合性检验,下面逐一进行简要介绍。

1. 无差假设的适合性检验

所谓无差假设是指各项分类的次数没有差异,理论次数完全按概率相等的条件计算,即理论次数= 总数/分类项数

例1,随机抽取70名学生,调查他们对高中分文理科的意见,回答赞成的有42人,反对的有28人。问对分科的意见有无显著差异?

解:此例只有两种分类。因此应有理论次数e f =70×0.5=35(人) 检验步骤:

(1)建立假设: 0H :300==e f f , 1H :e f f ≠0 (2)计算2

χ值:

∑-=e

e f f f 202

)(χ=

8.235)3528(35)3542(2

2=-+- (3)统计推断。 首先确定自由度df ,2

χ检验的自由度一般等于分类项数减1,本例df =2 — 1 = 1。查df = 1的2

χ表,)

05.0,1(2χ

=3.84,故有 2χ<)

05.0,1(2

χ

,因此应在0.05显著性水

平上保留虚无假设,拒绝备择假设。其结论为:学生对高中文理分科的态度的差异不显著。

例2,某大学某系的46位老年教师中,健康状况属于良好的有15人,中等的有20人,比较差的有11人,问该系老教师中三种健康状况的人数是否一样?

解:此例有三种分类。因此应有理论次数e f = 3

46

= 18(人) 检验步骤:

(1)建立假设: 0H :健康状况好、中、差三种人数相同 1H :健康状况好、中、差三种人数不相同 (2)计算2

χ值:

∑-=e

e f f f 202

)(χ=

44.318)1811(18)1820(18)1815(2

22=-+-+- (3)统计推断。 首先确定自由度df ,本例df = 3— 1 = 2。查df = 2的2

χ表,

)05.0,2(2χ=5.99,故有 2χ<)05.0,2(2χ,因此应在0.05

显著性水平上保留虚无假设,拒绝备择

假设。其结论为:该系老教师中,健康状况好、中、差三种人数无显著差异。

2.实际次数分布是否属于正态分布的适合性检验

2χ检验还可以通过将正态分布的概率转换为理论次数的数值,来检验某些实际次数分布是

否属于正态分布。

例3,今对某校100名学生进行操行评定,分优、良、中、差四等,评定结果为:优19人、良39人、中35人、差7人。试检验其分布的形式是否属于正态分布?

解: 检验步骤:

(1)建立假设: 0H :评定结果服从正态分布 1H :评定结果不服从正态分布 (2)计算2

χ值:

首先需求出理论次数。正态分布的各部分理论次数,是通过正态分布图中面积比率乘以总次数得出的。在正态分布情况下,正态曲线底边上±3σ之内几乎包含了全部量数,因此我们可将正态分布底线长度从-3σ至+3σ分为四个等分,每等分为1.5σ,其面积比率为:

第一等分(优)的面积:上限3σ,下限为1.5σ。1.5σ~3σ之间的面积比率为: 0.4987-0.4332=0.0655,即7%。

第二等分(良)的面积:位于0~1.5σ之间,其面积比率为0.4332,即43%。 第三等分(中)的面积:位于0~-1.5σ之间,其面积比率为0.4332,即43%。

第四等分(差)的面积:位于-1.5σ~-3σ之间的面积比率为:0.4987-0.4332=0.0655,即7%。

根据各等分的面积比率,乘以总人数,即可得出理论次数。如:优的人数为7%×100=7,良的人数为43%×100=43。同理可求出中的人数为43,差的人数为7。即优的 e f =7,良的e f =43,中的e f =43,差的e f =7。代入(公式11—9)有:

=

2

χ43.227

)77(43)4335(43)4339(7)719(2

222=-+-+-+- (3)统计推断。 首先确定自由度df ,本例df = 4— 1 = 3。查df = 2的2

χ表,

)05.0,3(2χ=7.81,)01.0,3(2χ= 11.345,故有 2χ>)01.0,3(2χ,因此应在

0.01显著性水平上拒绝

虚无假设,接受备择假设。其结论为:此评定结果不服从正态分布。

(三)独立性检验

独立性检验也是2

χ检验的一个重要应用。如果想研究两个或两个以上因素之间是否具有独立性,就可利用2

χ独立性检验。独立性检验一般都采用表格的形式来显示观察结果,所以独立性检验也称为列联表分析。当检验对象只有两个因素而且每个因素只有两项分类的列联表就称为2×2列联表或四格表;而一个因素有R 类,另一个因素有C 类,这种表称之为R ×C 表。本节只讨论二维列联表的情况。

关于二维列联表的独立性检验,需注意几个问题:

第一,独立性检验的虚无假设是二因素(或多元素)之间是独立的或无关联,被择假设是二因素(或多因素)自荐有关联或者说差异显著。一般多用文字叙述而很少用符号代替。

第二,独立性检验的理论次数是直接由列联表所提供的数据推算出来的。如果用Ri f 表示第i 行的和,Cj f 表示第j 列的和,N 为所有数据值和,则第i 行第j 列的方格内的理论次数为:

N

f f f j

i ij C R e ?=

(公式11—10)

第三,二维列联表自由度与二因素各自的分类项数有关。设R 为行分类项数(行数),C 为列分类项数(列数),则自由度为: )1)(1(--=C R df 。

1.2×2列联表的独立性检验

2×2列联表就是把样本按两种性质分组,并排成两行两列的表,它是最简单的列联表,简称为四格表。2×2列联表用以进行两个组彼此独立互无关联的检验。

独立性检验

下面我们从样本的不同情况出发,分别介绍相应的检验方法。

独立样本的2×2列联表的独立性检验

独立样本4格表的独立性检验,既可以用计算2

χ的基本公式(公式11—9)计算,也可用下面的简捷公式计算:

2

χ=)

)()()(()(2

d b c a d c b a bc ad N ++++- (公式11—11)

式中:d c b a ,,,分别是四格表内的实计数。

表11—10 2×2列联表的 2

χ值计算示意表

d

例4,设有甲乙两区,欲测验两区中学教学水平,各区随机抽取500名初三学生,进行统一试题的数学测验,其结果是:甲区及格学生为475人,不及格为25人;乙区及格学生460人,不及格为40人,问甲区中学与乙区中学的数学测验成绩的差异是否显著?

解: 检验步骤:

(1)建立假设:0H :甲区中学与乙区中学数学测验成绩无显著差异 1H :甲区中学与乙区中学数学测验成绩差异显著 (2)计算2

χ值:

表11—11 甲区中学与乙区中学的数学测验成绩表

根据简捷公式:

2

χ=

=????-??500

93565500)2546040475(10002

3.68 (3)统计推断。 首先确定自由度df ,本例df =(2-1)(2-1)=1,查df =1的2

χ表,

)05.0,1(2χ=3.84,故有 2χ<)05.0,1(2χ,因此应在

0.05显著性水平上保留虚无假设,拒绝备择

假设。其结论为:甲区中学与乙区中学数学测验成绩无显著差异。

例5,随机抽取某校男生250名,女生240,进行体育达标考核,结果如下表 问体育达标水平是否与性别有关?

表11—12 体育达标考核情况表

解:检验步骤:

(1)建立假设:0H :体育达标水平与性别无关 1H :体育达标水平与性别有关

(2)计算2

χ值:利用基本公式 ∑-=e

e f f f 2

02

)(χ,其理论次数为:

11e f =

85.14662835=? 15.206638

3512=?=e f 15.1366283121=?=

e f 85.1766

38

3122=?=e f

2

χ =

006.085

.17)85.1718(15.13)15.1313(15.20)15.2020(85.14)85.1415(2

222=-+-+-+- (3)统计决断: 首先确定自由度df ,本例df =1,查df =1的2χ表,)

05.0,1(2

χ=3.84,

故有 2

χ<)

05.0,1(2χ

,因此应在0.05显著性水平上保留虚无假设,拒绝备择假设。其结论为:

体育达标水平与性别无关。

相关样本的2×2列联表的独立性检验

相关样本2×2列联表的独立性检验的简捷

公式为:

2

χ=c

b c b +-2

)( (公式11—12)

例6,110名教师培训普通话,培训2天前后两次测验通过情况如下表,问2天的训练是否有显著效果?

表11—13 40天前后两次测验通过情况表

解:检验步骤:

(1)建立假设:0H :2天训练无显著效果 1H :2天训练有显著效果 (2)计算2

χ值:

将上表中的数据代入(公式11—12),有:

2

χ=c

b c b +-2)(=

08.02426)2426(2=+- 本例也可以用求理论次数的方法计算2

χ值。同一组教师两次测验结果只涉及到b (第一次通过而第二次未通过者)和 c (第一次未通过二第二次通过者)。根据虚无假设,b 和 c 的理论次数均为

252

24262=+=+=

c b f e ,所以 ∑-=e

e f f f 202

)(χ=08.025)2524(25)2526(2

2=-+- 用简捷公式和用理论次数计算出的2

χ值相同。使用时可任选一种。 (3)统计决断: 首先确定自由度df ,本例df =1,查df =1的2χ表,)

05.0,1(2

χ=3.84,

故有 2

χ<)

05.0,1(2χ

,因此应在0.05显著性水平上保留虚无假设,拒绝备择假设。其结论为:

2天训练无显著效果。

二.符号检验

顾名思义,符号检验是以正负号为依据所进行的假设检验方法,它是非参数检验中最简单的一种。

(一)符号检验概述

符号检验法是通过两个相关样本的每对数据之差的符号进行检验,从而比较两个样本的显著性。具体地讲,若两个样本差异不显著,正差值与负差值的个数应大致各占一半。

符号检验与参数检验中相关样本显著性t检验相对应,当资料不满足参数检验条件时,可采用此法来检验两相关样本的差异显著性。

根据符号检验判断差异显著性时也要查表找出相应的临界值。但特别应注意的是在某一显著性水平下,实得的r值大于表中r的临界值时,表示差异不显著,这一点与参数检验时的统计量和临界值的判断结果不同。

表11—14 单侧符号检验统计判断规则

(二)符号检验的计算方法

符号检验的具体检验方法因样本大小的不同而不同。

1.小样本(N<25)时的检验方法

例7,研究人员将三岁儿童经配对而成的实验组进行颜色试验教学,对照组不进行此种教学。后期测验得分如表11—15。问颜色教学是否有显著效果?

表11—15 实验组和对照组测验得分比较表

解: 检验步骤:

(1)建立假设: 0H :颜色教学无显著效果 1H :颜色教学有显著效果

(2)求差数并记符号:计算1X 与2X 每对数据的差数,“+”的个数+n =7,“-”的个数-n =3,差数为0不予考虑。于是有:n =+n +-n = 7 + 3 = 10。将+n 和 -n 中较小的一个记为r ,本例

r =3。

(3)统计决断:根据n =+n +-n = 7 + 3 = 10及显著性水平,查符号检验表寻找r 的临界值,05.0r =1,而实际的r =3, 有 r >05.0r 。由于符号检验表是单侧检验表,进行双侧检验时,其显著性水平应乘以2。所以本例应在0.10显著性水平上保留虚无假设,拒绝备择假设。其结论为:颜色教学无显著效果。

2. 大样本(N >25)时的检验方法

对于差值的正负号差异的检验本属于二项分布的问题,当样本容量较大即(N >25)时,二项分布近似于正态分布,因此可用Z 比率作为检验统计量。检验公式为:

2

2)5.0(N

N

r Z

-

±=

(公式11—13)

式中:r 为+n 或-n 的数值,N 为+n 与-n 之和。±0.5为校正数,当r >2

N

时用r -0.5, 当r <

2

N

时用r +0.5。 例8,某省幼教培训中心,对30名幼儿园教师进行手工技能培训,培训前后的测验结果如表11—16,试问培训前后的两次测验结果差异是否显著?

表11—16 30名幼儿园教师培训前后的两次测验结果

解: 检验步骤:

(1)建立假设: 0H :手工技能培训无显著效果 1H :手工技能培训有显著效果

(2)求差数并记符号:计算1X 与2X 每对数据的差数,“+”的个数+n = 9,“-”的个数

-n =21,差数为0不予考虑。于是有:N =+n +-n = 9 + 21 = 30。将+n 和 -n 中较小的一个

记为r ,本例r = 9。

由于样本容量比较大,则可使用(公式11—13)计算:

64.174.25.42

30

230

)5.010(2

2)5.0(-=-=-+=-

+=

N

N r Z

(3)统计决断:因为

Z <1.96,所以本例应在0.05显著性水平上保留虚无假设,拒绝备

择假设。其结论为:手工技能培训无显著效果。

符号检验法的优点是不需要对所要检验的两个总体的分布形态做任何假定,并且计算简便。其最大的缺点是它只考虑符号,不考察差数的大小,因而失去样本所提供的一部分信息。对于同一样本数据,采用符号检验的精确度,只相当于t 检验的60%,因此除了小样本,一般不使

用符号检验。

三.秩和检验

秩和检验方法最早是由维尔克松提出,叫维尔克松两样本检验法。后来曼—惠特尼将其应用

到两样本容量不等(21n n ≠)的情况,因而又称为曼—惠特尼U 检验。这种方法主要用于比较两个独立样本的差异。

(一)适用范围

如果两个样本来自两个独立的但非正态获形态不清的两总体,要检验两样本之间的差异是否显著,不应运用参数检验中的t 检验,而需采用秩和检验。

(二)检验方法

1.两个样本的容量均小于10的检验方法 检验的具体步骤:

第一步:将两个样本数据混合并由小到大进行等级排列(最小的数据秩次编为1,最大的数据秩次编为21n n +)。

第二步:把容量较小的样本中各数据的等级相加,即秩和,用T 表示。

第三步:把T 值与秩和检验表中某α显著性水平下的临界值相比较,如果1T <T <2T ,则两样本差异不显著;如果T ≤1T 或T ≥2T ,则表明两样本差异显著。

例9,某年级随机抽取6名男生和8名女生的英语考试成绩如表11—17所示。问该年级男女生的英语成绩是否存在显著差异?

表11—17 男、女生英语考试成绩表

解: 检验步骤:

(1)建立假设: 0H :男女生的英语成绩不存在显著差异 1H :男女生的英语成绩存在显著差异

(2)编排秩次,求秩和:

T = 13 + 7 + 14 + 12 + 5.5 + 11= 62.5

(3)统计推断:根据1n =6,2n =8 , α=0.05, 查秩和检验表,T 的上、下限分别为1T = 29 ,2T =61,有T >2T ,结论是:男女生的英语成绩存在显著差异。

3. 两个样本的容量均大于10的检验方法

当两个样本容量都大于10时,秩和 T 的分布接近于正态分布,因此可以用Z 检验,其基本公式为:

12

)

1(2)

1(2121211++?++-=

n n n n n n n T Z (公式11—14)

式中:T 为较小的样本的秩和。

例10,某校演讲比赛后随即抽出两组学生的比赛成绩如表11—18,问两组成绩是否有显著差异?

表11—18 演讲成绩表

解: 检验步骤:

(1)建立假设: 0H :两组成绩不存在显著差异 1H :两组成绩存在显著差异 (2)编排秩次,求秩和:

1n =12,2n =14,T =144.5,代入公式,有:

12

)1(2)1(2121211++?++-

=

n n n n n n n T Z ==++??++-

12)

11412(14122)

11412(125.14490.044.191625.144-=- (3)统计推断:因为

Z <1.96,则应保留虚无假设,拒绝备择假设。结论是:两组的演讲

比赛成绩不存在显著差异。

<

第二讲 非参数统计检验

第二讲 非参数检验 1. 实验目的 1.了解非参数假设检验基本思想; 2.会用SAS 软件中的proc npar1way 过程进行非参数假设检验和proc freq 过程进行列联表的独立性检验。 2. 实验要求 1.会用SAS 软件建立数据集,并进行统计分析; 2.掌握proc npar1way 过程进行非参数假设检验的基本步骤; 3.掌握proc freq 过程进行列联表的独立性检验的基本步骤。 3. 实验基本原理 3.1 符号检验 0:H 两种方法的处理效果无显著性差异 令10 i i I i ?=? ?第个个体中新方法优于对照方法第个个体中新方法劣于对照方法 1,2,,i N = 统计量1 N N i i S I ==∑ N S 表示新方法的处理效果优于对照方法的配对组总数。若新方法的处理效果显著的优于对 照方法,则N S 的值应明显偏大。因此,若对给定的置信水平α,有 {}N P S c α≥<, 则拒绝0H 。 0H 为真时,(1)N S 服从二项分布1(,)2 b N (),()24 N N N N E S Var S = =。拒绝域为: {}N N S S c > (2) 由中心极限定理可知,当 2 , N N S N - →∞的零分布趋于标准正态分布。

拒绝域为 :N S u α?? ????>???????? 3.2 Wilcoxon 秩和检验 (1)单边假设检验 0:H 两种方法的处理效果无显著性差异 as 1:H :新方法优于对照方法。 用于检验0H 的统计量为:1n s i i W I ==∑ 若对给定的置信水平α,有 {}s P W c α≥<,则拒绝0H 。且s W 的分布列为: 0#{;,}{}H s w n m P W w N n == ?? ??? 根据观测结果计算s W 的观测值0s W ,计算检验的p 值: 00 {}{} s H s s H s k w p P W w P W k ≥=≥= =∑ 然后将p 值与显著水平α作比较,若p α<,则拒绝0H ,否则接受0H 。 (2)双边假设检验 给定的显著水平21,c c 和α应该满足: ε=≥+≤}{}{2100c W P c W P A H A H 仅由上式还不能唯一确定21c c 和,当我们对两种方法谁优谁劣不得而知时,通常取 2 }{}{2100α = ≥=≤c W P c W P A H A H 若利用p 值进行检验,设A A W ω的观测值为 ,计算概率值 }{}{00A A H A A H W P W P ωω≤≥或 由对称性可知,检验的p 值为上述两概率中小于1/2的那一个的2倍。例如

假设检验——非参数检验

假设检验(二)——非参数检验 假设检验的统计方法,从其统计假设的角度可分为两类:参数检验与非参数检验。上一节我们所介绍的Z 检验、t 检验,都是参数检验。它们的共同特点是总体分布正态,并满足某些总体参数的假定条件。参数检验就是要通过样本统计量去推断或估计总体参数。然而,在实践中我们常常会遇到一些问题的总体分布并不明确,或者总体参数的假设条件不成立,不能使用参数检验。这一类问题的检验应该采用统计学中的另一类方法,即非参数检验。非参数检验是通过检验总体分布情况来实现对总体参数的推断。 非参数检验法与参数检验法相比,特点可以归纳如下: (1)非参数检验一般不需要严格的前提假设; (2)非参数检验特别适用于顺序资料; (3)非参数检验很适用于小样本,并且计算简单; (4)非参数检验法最大的不足是没能充分利用数据资料的全部信息; (5)非参数检验法目前还不能用于处理因素间的交互作用。 非参数检验的方法很多,分别适用于各种特点的资料。本节将介绍几种常用的非参数检验方法。 一.2 χ检验 2χ检验主要用于对按属性分类的计数资料的分析,对于数据资料本身的分布形态不作任何 假设,所以从一定的意义上来讲,它是一种检验计数数据分布状态的最常用的非参数检验方法。 2χ检验的方法主要包括适合性检验和独立性检验。 (一)2 χ检验概述 2χ是实得数据与理论数据偏离程度的指标。其基本公式为: ∑-=e e f f f 2 02 )(χ (公式11—9) 式中,0f 为实际观察次数,e f 为理论次数。 分析公式可知,把实际观测次数和依据某种假设所期望的次数(或理论次数)的差数平方,除以理论次数,求出比值,再将n 个比值相加,其和就是2 χ。观察公式可发现,如果实际观察

SPSS非参数检验之卡方检验

SPSS 中非参数检验之一:总体分布的卡方(Chi-square )检验 在得到一批样本数据后,人们往往希望从中得到样本所来自的总体的分布形态是否和某种特定分布相拟合。这可以通过绘制样本数据直方图的方法来进行粗略的判断。如果需要进行比较准确的判断,则需要使用非参数检验的方法。其中总体分布的卡方检验(也记为χ2检验)就是一种比较好的方法。 一、定义 总体分布的卡方检验适用于配合度检验,是根据样本数据的实际频数推断总 体分布与期望分布或理论分布是否有显著差异。它的零假设H0:样本来自的总体分布形态和期望分布或某一理论分布没有显著差异。 总体分布的卡方检验的原理是:如果从一个随机变量尤中随机抽取若干个观察样本,这些观察样本落在X 的k 个互不相交的子集中的观察频数服从一个多项分布,这个多项分布当k 趋于无穷时,就近似服从X 的总体分布。 因此,假设样本来自的总体服从某个期望分布或理论分布集的实际观察频数同时获得样本数据各子集的实际观察频数,并依据下面的公式计算统计量Q ()2 1 k i i i i O E Q E =-=∑ 其中,Oi 表示观察频数;Ei 表示期望频数或理论频数。可见Q 值越大,表示 观察频数和理论频数越不接近;Q 值越小,说明观察频数和理论频数越接近。SPSS 将自动计算Q 统计量,由于Q 统计量服从K-1个自由度的X 平方分布,因此SPSS 将根据X 平方分布表给出Q 统计量所对应的相伴概率值。 如果相伴概率小于或等于用户的显著性水平,则应拒绝零假设H0,认为样本来自的总体分布形态与期望分布或理论分布存在显著差异;如果相伴概率值大于显著性水平,则不能拒绝零假设HO ,认为样本来自的总体分布形态与期望分布或理论分布不存在显著差异。 因此,总体分布的卡方检验是一种吻合性检验,比较适用于一个因素的多项分类数据分析。总体分布的卡方检验的数据是实际收集到的样本数据,而非频数数据。 二、实例 某地一周内各日患忧郁症的人数分布如下表所示,请检验一周内各日人们忧

第二讲-非参数统计检验

第二讲非参数检验 1. 实验目的 1. 了解非参数假设检验基本思想; 2. 会用SAS 软件中的proc nparlway 过程进行非参数假设检验和 proc freq 过程 进行列联表的独立性检验。 2. 实验要求 1. 会用SAS 软件建立数据集,并进行统计分析; 2. 掌握proc nparlway 过程进行非参数假设检验的基本步骤; 3. 掌握proc freq 过程进行列联表的独立性检验的基本步骤。 3. 实验基本原理 3.1符号检验 H 0:两种方法的处理效果无显著性差异 令 li = * 1 第i 个个体中新方法优于对照方法 .0 第i 个个体中新方法劣于对照方法 i=1,2,|||,N 统计里S N N =瓦I i i T S N 表示新方法的处理效果优于对照方法的配对组总数。 若新方法的处理效果显著的优于对 照方法,则S N 的值应明显偏大。因此,若对给定的置信水平 [,有 P 「S N - 八 则拒绝H 0。 1 N N (1) S N 服从二项分布b(N ,-) E(S N ) ,Var (S N ) 。拒绝域为: 2 2 4 'S N S N c ; H 。为真时, (2)由中心极限定理可知,当 的零分布趋于标准正态分布

3.2 Wilcox on 秩和检验 (1)单边假设检验 H o :两种方法的处理效果无显著性差异 as H i ::新方法优于对照方法。 n 用于检验H o 的统计量为:W s I i i 4 若对给定的置信水平,有P [W s - C 「:〉,则拒绝H o 。且W s 的分布列为: P H °{W S = w #{w ;n ,m} ' 了 N 、 1 1 n 根据观测结果计算W s 的观测值W s 0,计算检验的p 值: p= P H o {W s - W s }八 P H °{W S 二 k} k _w s 然后将p 值与显著水平:?作比较,若p ::: :?,则拒绝H 0,否则接受H 0。 (2)双边假设检验 给定的显著水平:-,C |和c 2应该满足: P H 0{W A 乞 c 1} P H 0{W A - c 2} = 仅由上式还不能唯一确定 &和C 2,当我们对两种方法谁优谁劣不得而知时,通常取 P H °{W A 22 c 1} = P H °{W A - c 2} = ~ 若利用p 值进行检验,设 W A 的观测值为'A ,计算概率值 P H °{W A - A }或P H °{W A 「A } 由对称性可知,检验的p 值为上述两概率中小于1/2的那一个的2倍。例如 0 乞 P H °{ W A - ' A ^V 2 则 p = 2P H 0{W A - ? ■ A }。求出 p 值后,若 p

回归分析与非参数检验---侯-(1)

大连民族学院 数学实验报告 课程:统计软件—SPSS 实验题目:线性回归分析与非参检验 系别:理学院 专业:统计学 姓名:侯祥飞 班级:141班 指导教师:滕颖俏 完成时间:2016 年10 月30

日 实验目的: 掌握线性回归分析的主要目标及其具体操作,能够读懂基本分析结果,掌握计算结果之间的数量关系,并能够写出回归方程,对回归方程进行各种统计检验。了解SPSS非参数检验的具体操作,能够解释分析结果。 实验内容、实验步骤、实验结果及分析 一、线性回归分析 (一)9.5 粮食总产量 1.实验内容 先收集到若干年粮食总产量以及播种面积、使用化肥量、农业劳动人数等数据,请利用建立多元线性回归方程,分析影响粮食总产量的主要因素。数据文件名为“粮食总产量.sav”。 2.实验步骤 步骤:分析→回归→线性→粮食总产量导入因变量、其余变量导入自变量→确定;分析→回归→线性→(向后)→确定 3.实验结果及分析

上表进行了拟合优度检验,由于该方程有多个解释变量,因此参考调整判定系数(0.986)较接近1,因此认为拟合有度较高,被解释变量可以被模型解释的部分较多,不能被解释的部分较少。 上表进行了回归方程的显著性检验,由于Sig为0小于0.05,所以拒绝原假设,认为各回归系数不同时为0,被解释变量与解释变量全体的线性关系是显著的,可以建立线性模型。 上表进行了回归系数的显著性检验,可以看出除粮食播种面积与农业劳动者人数变量的P-值均大于0.05,所以接受原假设,认为这

些偏回归系数与0无显著性差异,它们与被解释变量的线性关系是不显著的,不应该保留在方程中。影响程度来由大到小依次是风灾面积、施用化肥量、总播种面积和年份(排除农业劳动者人数和粮食播种面积对粮食产量的影响)。 得回归方程为:7.4567.26817.126215.68037.8934 =-+++-, Y X X X X 其中X1,X2,X3,X4分别为年份,总播种面积,施用化肥量,风灾面积比例。 (二)9.6 销售量 1.实验内容 一家产品销售公司在30个地区设有销售分公司。为研究产品销售量(y)与该公司的销售价格(x1)、各地区的年人均收入(x2)、广告

非参数假设检验法及其运用

非参数假设检验法及其运用 摘要:在国际金融危机下,以中国股市数据为依据,运用S-plus 统计分析软件和Excel ,对中国股市正态分布假设进行了Kolmogorv拟合优度检验,运用方差平方秩检验方法,比较分析了上证指数和深证综指的波动性。 关键字:股市;Kolmogorov拟合优度检验;秩检验。 引言:对中国股市分布的研究,国内各学者对中国股市进行了非参数检验。王金玉、李霞、潘德惠(2005)通过引入一种新的估计方法“非参数假设检验方法”,以达到对证券投资咨询机构,对证券市场大盘走势预测准确度的估计。周明磊(2004)运用非参数非线性协整检验,对上证指数与深成指间协整关系进行了研究,结论是:上证指数与深圳成指之间确实存在非线性的协整关系。方国斌(2007)从分析中国股市收益率序列的特征入手,寻找描述中国股市波动性特征的合适的统计模型。 在研究相关文献的基础上,将非参检验应用于中国股市统计特征的研究。运用Kolmogorov拟合优度检验,对中国股市进行了正态分布假设检验;运用方差平方秩检验方法,比较分析了上海指数和深圳综指的波动性。 正文: 一、Kolmogorov拟合优度检验以及方差的平方秩检验方法。 (一)Kolmogorov拟合优度检验 1. 原假设和备择假设 原假设H :样本来自于正态分布总体。 备择假设H 1 :样本不是来自于正态分布总体。 2. 检验统计量 令S (x) 是样本X 1、X 2 、…X n 、的经验分布函数,F*(x)是完全已知的假设分布函数, 则检验统计量T为S (x) 与F*(x)的最大垂直距离,即:T = sup| F*(x)- S (x)|。 3. P值计算 近似P值可以通过在表A13中插值得到,或者利用2倍的单边检验的P值。 单边P值= 1 )] 1( [ 1 1 - - - = ? ? ? ? ? + ? ? ? ? ? - - ?? ? ? ? ? ∑j j n t n j n j t n j t j n 这里t的是检验统计量的观测值,[n(1-t)] 且是小于等于n(1-t)的最大整数。当给定的显著性水平α大于或等于P值时,拒绝原假设。 在本文中,该检验是运用S-plus 统计分析软件实现的。 (二) 方差的平方秩检验 1. 原假设和备择假设 ( 1 ) 双边检验 1 原假设H :除了它们的均值可能不同外,X和Y同分布。

两独立样本t检验和非参数检验的实证分析

龙源期刊网 https://www.wendangku.net/doc/145643906.html, 两独立样本t检验和非参数检验的实证分析作者:张家骥 来源:《经营者》2013年第11期 摘要:教学质量是靠具体课程完成,课程的建设是教学质量提升的重要环节和基本保证。本文简述了概率论与数理统计重点课程建设的必要性,重点在于对课程建设前后分层随机抽样得来的样本进行实证分析。实证分析主要从基本统计分析、参数检验、非参数检验三个大的方面进行,尤其是非参数检验方面,又具体利用了三种不同的检验法进行分析推断。 关键词:t检验;非参数检验;显著性水平;频数分析 概率论与数理统计是我国高等院校理工类、经济类、管理类各专业的一门重要公共基础课程,同时也是一门应用广泛,适用性强的工具课。此门课程的教学为学生的其他专业课及其将来毕业后的工作、继续深造等方面奠定必要的数学基础,而且对培养学生的逻辑思维能力、分析判断问题能力、统计观点、应用能力和创新能力均有着特殊而又重要的作用,是培养高素质综合型人才的重要保证。 笔者本身是东华理工大学理学院的一线教师,这两年来,同时在江西财经大学统计学院读研究生。在此期间,笔者主持的“概率论与数理统计”重点课程建设项目小组一直在努力的探索和研究,收获了一些成果。本文的主要目的是针对进行重点课程建设这几年来,对搜集到的学生该门课程的考试成绩从统计学的角度进行实证分析。尤其是从参数检验和非参数统计两个重要角度进行探究,论证这几年来进行课程建设是否让学生成绩取得了明显的提高。 本文数据来源于东华理工大学所有开设了概率论与数理统计课程的学院,分别收集了2010学年第二学期(即下半年)概率成绩和2012学年第二学期概率成绩。总共十个学院,进行分层随机抽样,对每个学院随机抽取10名学生,最终获到两组样本,每组各100个样本点。下面开始进行实证分析: 一、基本统计分析 对数据的分析首先从基本统计分析入手。通过基本统计分析,掌握数据的基本统计特征,同时迅速把握数据的总体分布形态。而基本统计分析往往先从频数分析开始,由于成绩数据均为定距型数据,直接采用频数分析不利于对其分布形态的把握,因此先对数据分组后再进行频数分析。SPSS频数分析的操作如下:选择菜单【Analyze】→【Descriptive】→【Frequencies】,结果如下: 从上面的统计表中可以看出,进行重点课程建设后,平均分有了明显的提高,而且从频数分布表可以看出,第3组第4组即中高分数段百分数有了明显提升。从数据的角度初步说明课程建设有效果,学生成绩明显改善。

假设检验——非参数检验

假设检验(二)——非参数检验 假设检验的统计方法,从其统计假设的角度可分为两类:参数检验与非参数检验。上一节我们所介绍的Z 检验、t 检验,都是参数检验。它们的共同特点是总体分布正态,并满足某些总体参数的假定条件。参数检验就是要通过样本统计量去推断或估计总体参数。然而,在实践中我们常常会遇到一些问题的总体分布并不明确,或者总体参数的假设条件不成立,不能使用参数检 验。这一类问题的检验应该采用统计学中的另一类方法,即非参数检验。非参数检验是通过检验总体分布情况来实现对总体参数的推断。 非参数检验法与参数检验法相比,特点可以归纳如下: (1)非参数检验一般不需要严格的前提假设; (2)非参数检验特别适用于顺序资料; (3)非参数检验很适用于小样本,并且计算简单; (4)非参数检验法最大的不足是没能充分利用数据资料的全部信息; (5 )非参数检验法目前还不能用于处理因素间的交互作用。 非参数检验的方法很多,分别适用于各种特点的资料。本节将介绍几种常用的非参数检验方法。 一.2检验 2 检验主要用于对按属性分类的计数资料的分析,对于数据资料本身的分布形态不作任何假设,所以从一定的意义上来讲,它是一种检验计数数据分布状态的最常用的非参数检验方法。 2 2 检验的方法主要包括适合性检验和独立性检验。 (一)2检验概述 2 是实得数据与理论数据偏离程度的指标。其基本公式为: 2 ( f0 f e)(公式11—9) f e 式中,f0 为实际观察次数,f e 为理论次数。 分析公式可知,把实际观测次数和依据某种假设所期望的次数(或理论次数)的差数平方,除以理论次数,求出比值,再将n 个比值相加,其和就是2。观察公式可发现,如果实际观察

SPSS的参数检验和非参数检验

S P S S的参数检验和非 参数检验 公司内部档案编码:[OPPTR-OPPT28-OPPTL98-OPPNN08]

实验报告 SPSS的参数检验和非参数检验 学期:_2013__至2013_ 第_1_学期 课程名称:_数学建模专业:数学 实验项目__SPSS的参数检验和非参数检验实验成绩:_____ 一、实验目的及要求 熟练掌握t检验及其结果分析。熟练掌握单样本、两独立样本、多独立样本的非参数检验及各种方法的适用范围,能对结果给出准确分析。 二、实验内容 使用指定的数据按实验教材完成相关的操作。 1、给幼鼠喂以不同的饲料,用以下两种方法设计实验: 方式1:同一鼠喂不同的饲料所测得的体内钙留存量数据如下: 方式2:甲组有12只喂饲料1,乙组有9只喂饲料2,所测得的钙留存量数据如下:

请选用恰当方法对上述两种方式所获得的数据进行分析,研究不同饲料是否使幼鼠体内钙的留存量有显着不同。 2、为分析大众对牛奶品牌是否具有偏好,随机挑选超市收集其周一至 周六各天三种品牌牛奶的日销售额数据,如下表所示: 请选用恰当的非参数检验方法,以恰当形式组织上述数据进行分析,并说明分析结论。 实验报告附页 三、实验步骤 (一) 方式1: 1、打开SPSS软件,根据所给表格录入数据,建立数据文件; 2、选择菜单Analyze-Compare means-Paired-Samples T Test,出现窗口; 3、把检验变量饲料1,饲料2 选择到Paired Variables框,单击OK。方式2: 1、打开SPSS软件,根据所给表格录入数据,建立数据文件; 2、选择菜单Analyze-Compare means-Independent-Samples T Test,出现窗口 3、选择检验变量饲料到Test Variable(s)框中。 4、选择总体标志变量组号到Grouping Variables框中。 5、单击Define Groups按钮定义两总体的标志值1、2,单击OK。

方差分析与非参数检验

北京建筑大学 理学院信息与计算科学专业实验报告 课程名称《数据分析》实验名称方差分析与非参数检验实验地点基C-423 日期2017.3.30 (1)熟悉数据的基本统计与非参数检验分析方法; (2)熟悉撰写数据分析报告的方法; (3)熟悉常用的数据分析软件SPSS。 【实验要求】 根据各个题目的具体要求,完成实验报告。 【实验内容】 1、附件给出某年房屋价格的相关数据,请选用恰当的分析方法,对影响房屋价格的因素进行分析。(注意数据要调整成标准的格式,变量值、组别(字符变量转换成数值变量))(单因素方差分析选择其中两个因素、双因素方差分析选择其中任一对因素即可) 2、附件给出管理才能评分的相关数据,请选用恰当的分析方法,分析该评分数据是否服从正态分布。 3、附件给出了某体育比赛的两位裁判打分数据,请选用恰当的分析方法,检验该两组评分分布是否有显著差异。(注意数据要调整成标准的格式,变量值、组别) 4、附件给出了减肥茶数据,请选用恰当方法分析,检验该减肥茶是否对减肥有显著效果。(注意数据要调整成标准的格式,变量值、组别) 【分析报告】 1、对影响房屋价格的因素进行分析。(单因素方差分析选择其中两个因素、双因素方差分析选择其中任一对因素即可)。 表1-1(a) 装修状况对均价影响的单因素方差分析结果 均价 平方和df 均方 F 显著性 组间79.180 1 79.180 62.408 .000 组内230.914 182 1.269 总数310.094 183 表1-1(b) 所在区县对均价影响单因素方差分析结果 均价 平方和df 均方 F 显著性 组间91.919 3 30.640 25.279 .000 组内218.174 180 1.212 总数310.094 183 表1-1(a)是装修状况对均价影响的单因素方差分析结果。可以看到:观测变量均价的离差平方总和为310.094;如果仅考虑装修状况单个因素的影响,则均价总变差中,不同装修状况可解释的变差为79.180,抽样误差引起的变差为230.914,它们的方差分别为79.180和1.269,相除所得的F统计量的观测值为62.408,对应的概率P-值近似为0.如果显著性水平α为0.05,由于概率P-值小于显著性水平α,应拒绝原假设,认为不同装修状况对均价的平均值产生了显著影响,不同装修状况对均价的影响效应不全为0。 表1-1(b)是所在区县对均价影响单因素方差分析结果。可以看到:如果仅考虑所在区县单个因素的影响,则均价总变差310.094中不同所在区县可解释的变差为91.919,抽样误差引起的变差为218.174,

参数、非参数检验操作步骤

参数、非参数检验操作步骤 参数检验 非参数检验 对象 针对参数做的假设 针对总体分布情况做的假设 使用范围 等距数据和比例数据(度量) 定类数据和定序数据(名义和有序) 分布 正态分布 正态、非正态分布 内容 Means 检验 单样本T 检验 独立样本T 检验 配对样本T 检验 卡方检验(均匀分布) 二项分布检验(两个变量) 游程检验(随机分布) K-S 检验(正态分布检验) 参数检验 一 Means 过程 Means 过程用于统计分组变量的的基本统计量,这些基本统计量包括:均值(Mean )、标准差(Standard Deviation)、观察量数目(Number of Cases)、方差(Variance)。 1数据编辑窗口输入分析的数据 2 分析→比较均值→均值 因变量、自变量的选择可根据实际情况。 “选项”

3 结果分析

P<0.05,拒绝原假设,显著性强。 结果报告,分别给出暴雨前和暴雨后卵量的统计量:暴雨前有13个样本,平均数122.3846,标准差15.95065,方差254.423; 暴雨后有13个样本,平均数104.4615,标准差15.10858,方差228.269;总体26个样本,平均数113.4231,标准差17.75426,方差315.214。 方差分析表,共有六列,第一列说明方差的来源,Between Groups是组间的,Within Groups 组内的,Total 总的。第二列为平方和,其大小说明了各方差来源作用的大小。第三列为自由度。第四列为均方,即平方和除以自由度。第五列F值是F统计量的值,其计算公式为模型均方除以误差均方,用来检验模型的显著性。第六列是F统计量的显著值,由于这里的显著值0.007小于0.05,所以模型是显著的,降雨对卵量有显著影响。 二单一样本的T检验 T检验是检验单个变量的均值与指定的检验值之间是否存在显著差异。如:研究人员可能想知道一组学生的IQ平均分与100分的差异。 1 分析→比较均值→单一样本的T检验

非参数检验卡方检验实验报告

大理大学实验报告 课程名称生物医学统计分析 实验名称非参数检验(卡方检验) 专业班级 姓名 学号 实验日期 实验地点 2015—2016学年度第 2 学期

Fisher 的精确检验:精确概率法计算的卡方值(用于理论数E<5)。 不同的资料应选用不同的卡方计算方法。 例为2*2列联表,df=1,须用连续性校正公式,故采用“连续校正”行的统计结果。 X2=,P(Sig)=<,表明灭螨剂A组的杀螨率极显着高于灭螨剂B组。 例 表3 治疗方法* 治疗效果交叉制表 计数 治疗效果 123 合计 治疗方法11916540 21612836 31513735合计504120111 分析:表3是治疗方法* 治疗效果资料分析的列联表。 表4 卡方检验 X2值df渐进 Sig. (双侧) Pearson 卡方 1.428a4.839

似然比4.830线性和线性组合.5141.474 有效案例中的 N111 a. 0 单元格(.0%) 的期望计数少于 5。最小期望计数为。 分析:表4是卡方检验的结果。自由度df=4,表格下方的注解表明理论次数小于5的格子数为0,最小的理论次数为。各理论次数均大于5,无须进行连续性校正,因此可以采用第一行(Pearson 卡方)的检验结果,即 X2=,P=>,差异不显着,可以认为不同的治疗方法与治疗效果无关,即三种治疗方法对治疗效果的影响差异不显着。 例 表5 灌溉方式* 稻叶情况交叉制表 计数 稻叶情况 123 合计 灌溉方式114677160 2183913205 31521416182合计4813036547 分析:表5是灌溉方式* 稻叶情况资料分析的列联表。

数理统计 实验三 非参数假设检验

西北农林科技大学实验报告 学院名称:理学院专业年级: 姓名:学号: 课程:数理统计学报告日期: 实验三非参数假设检验 一.实验目的 1.验证某产品的合格率是否是否低于0.9. 2.检验某地区儿童身高是否符合正态分布。 3.为研究心脏病猝死人数与日期的关系,收集到168个观测数据, 利用这批样本数据推断猝死人数与日期的关系是否为2.8:1:1:1:1:1:1. 4.某工厂用甲乙两种工艺生产同一种产品,利用样本数据检验两种 工艺下产品使用寿命是否存在显著差异。 二.实验要求 用spss实现非参数假设检验,包括二项式检验,单样本正态分布检验,两个独立样本检验,卡方检验。 三.实验内容 (一)验证某产品的合格率是否是否低于0.9. 打开文件“非参数检验(产品合格率)”,点击分析->非参数检验->旧对话框->二项式,把数据“是否合格”添加到检验变量列表,把检验比例默认的0.5该为题目要求的0.9(如图所示)。

点击确定得到结论(如图所示)。 结论: 0.80.90.1930.05(1p) 0.90.123w p P p n ????--??≥=>??-??????? 由上表知,SPSS 的悖假设检验案例比例小于0.9的,并且在精确显著(单侧)值sig=0.193>0.05,即接受原假设检验,即二项式检

验的案例比例是大于0.9的。 (二)检验某地区儿童身高是否符合正态分布。 打开文件“非参数检验(单样本KS-儿童身高)”,点击分析->非参数检验->旧对话框->1样本,把数据“周岁儿童的身高(sg)”添加到检验变量列表,检验分布默认为常规,即正态(如图所示)。 点击确定得到结论(如图所示)。

参数检验和非参数检验

一.单因素方差分析(one-way ANOVA),用于完全随机设计的多个样本均数间的比较,其统计推断是推断各样本所代表的各总体均数是否相等。 完全随机设计(completely random design)不考虑个体差异的影响,仅涉及一个处理因素,但可以有两个或多个水平,所以亦称单因素实验设计。在实验研究中按随机化原则将受试对象随机分配到一个处理因素的多个水平中去,然后观察各组的试验效应;在观察研究(调查)中按某个研究因素的不同水平分组,比较该因素的效应。 二. T检验,亦称student t检验(Student's t test),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布资料。t检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。它与Z检验、卡方检验并列。 t检验 t检验分为单总体检验和双总体检验。 单总体t检验时检验一个样本平均数与一个已知的总体平均数的差异是否显著。当总体分布是正态分布,如总体标准差未知且样本容量小于30,那么样本平均数与总体平均数的离差统计量呈t分布。 单总体t检验统计量为: 双总体t检验是检验两个样本平均数与其各自所代表的总体的差异是否显著。双总体t 检验又分为两种情况,一是独立样本t检验,一是配对样本t检验。 独立样本t检验统计量为:

S1 和S2 为两样本方差;n1 和n2 为两样本容量。(上面的公式是1/n1 + 1/n2 不是减!) 配对样本t检验统计量为: t检验的适用条件 (1) 已知一个总体均数; (2) 可得到一个样本均数及该样本标准差; (3) 样本来自正态或近似正态总体。 t检验步骤 以单总体t检验为例说明: 问题:难产儿出生体重n=35,X拔=3.42,S =0.40,一般婴儿出生体重μ0=3.30(大规模调查获得),问相同否? 解:1.建立假设、确定检验水准α H0:μ = μ0 (无效假设,null hypothesis) H1:μ≠μ0(备择假设,alternative hypothesis,) 双侧检验,检验水准:α=0.05 2.计算检验统计量

SPSS的参数检验和非参数检验

实验二 SPSS的参数检验和非参数检验 (验证性实验 4学时) 1、目的要求:熟练掌握t检验及其结果分析。熟练掌握单样本、两独立 样本、多独立样本的非参数检验及各种方法的适用范围,能对结果给 出准确分析。 2、实验内容:使用指定的数据按实验教材完成相关的操作。 3、主要仪器设备:计算机。 练习: 1、给幼鼠喂以不同的饲料,用以下两种方法设计实验: 鼠体内钙的留存量有显著不同。 2、为分析大众对牛奶品牌是否具有偏好,随机挑选超市收集其周一至周六各天 并说明分析结论。 1 参数检验概述 假设检验的基本思想 .事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立; .采用逻辑上的反证法,依据统计上的小概率原理。

2 单样本的T检验 2.1检验目的: ?检验单个变量的均值是否与给定的常数(总体均值)之间是否存在显著差异。如:分析学生的IQ平均分是否为100分;大学生考研率是否为5%。 ?要求样本来自的总体服从或近似服从正态分布。 2.2 单样本T检验的实现思路 ?提出原假设: ?计算检验统计量和概率P值 ●给定显著性水平与p值做比较:如果p值小于显著性水平,小概率事件在 一次实验中发生,则我们应该拒绝原假设,反之就不能拒绝原假设。 2.3 单样本t检验的基本操作步骤 1、选择选项Analyze-Compare means-One-Samples T test,出现窗口: 2、在Test Value框中输入检验值。 3、单击Option按钮定义其他选项。Option选项用来指定缺失值的处理方法。其中,Exclude cases analysis by analysis表示计算时涉及的变量上有缺失值,则剔除在该变量上为缺失值的个案;Exclude cases listwise表示剔除所有在任意变量上含有缺失值的个案后再进行分析。可见,较第二种方式,第一种处理方式较充分地利用了样本数据。在后面的分析方法中,SPSS对缺失值的处理方法与此相同,不再赘述。另外,还可以输出默认95%的置信区间。 至此,SPSS将自动计算t统计量和对应的概率p值。 3 两独立样本的T检验 3.1 两独立样本T检验的目的 ?利用来自两个总体的独立样本,推断两个总体的均值是否存在显著性差异; ?两独立样本的样本容量可以相等,也可以不相等; ?样本来自的总体服从或近似服从正态分布。 方差齐性检验(Levene F方法): ?计算两组样本的均值 ●计算各个样本与本组均值的平均离差绝对值; ●利用单因素方差分析推断两独立总体平均离差绝对值是否有显著差异。 ●在对两独立样本进行T检验时,两组样本方差相等和不等时使用的计算t 值的公式不同,所以首先进行方差F检验。用户需要根据F检验的结果自己判断选择t检验输出中的哪个结果,得出最后结论。如果推断两总体方差相等则看方差相等的T检验值和P值,如果推断两总体方差不相等则看方差不相等的T检验值和P值。 3.2 两独立样本T检验的实现思路 ?提出原假设:两总体均值不存在显著差异: ●计算统计量和P值:首先利用F检验确定两个总体的方差是否相等;然后 再选择合适的T统计量计算观测值和概率P值; ●根据显著性水平和概率P值进行统计决策。 3.3 两独立样本t检验的基本操作步骤 进行两独立样本t检验之前,正确地组织数据是一个非常关键的任务。SPSS 要求将两组样本数据存放在一个SPSS变量中,同时,为区分哪些样本来自哪个

SPSS的参数检验和非参数检验

实验报告SPSS的参数检验和非参数检验 学期:_2013__至2013_ 第_1_学期 课程名称:_数学建模专业:数学 实验项目__SPSS的参数检验和非参数检验实验成绩:_____ 一、实验目的及要求 熟练掌握t检验及其结果分析。熟练掌握单样本、两独立样本、多独立样本的非参数检验及各种方法的适用范围,能对结果给出准确分析。 二、实验内容 使用指定的数据按实验教材完成相关的操作。 1、给幼鼠喂以不同的饲料,用以下两种方法设计实验: 鼠体内钙的留存量有显著不同。 2、为分析大众对牛奶品牌是否具有偏好,随机挑选超市收集其周一至周六各天 并说明分析结论。 实验报告附页

三、实验步骤 (一) 方式1: 1、打开SPSS软件,根据所给表格录入数据,建立数据文件; 2、选择菜单Analyze-Compare means-Paired-Samples T Test,出现窗口; 3、把检验变量饲料1,饲料2 选择到Paired Variables框,单击OK。 方式2: 1、打开SPSS软件,根据所给表格录入数据,建立数据文件; 2、选择菜单Analyze-Compare means-Independent-Samples T Test,出现窗口 3、选择检验变量饲料到Test Variable(s)框中。 4、选择总体标志变量组号到Grouping Variables框中。 5、单击Define Groups按钮定义两总体的标志值1、2,单击OK。 (二) 1、打开SPSS软件,根据所给表格录入数据,建立数据文件; 2、选择菜单Analyze->Nonparametric->k Independent sample 3、选择待检验的若干变量入包装1,包装2,包装3到Test Variable(s)框中; 4、选择推广的平均秩检验(Friedman检验),单击OK。 四、实验结果分析与评价 (一): 方式1: 由上表知:两配对变量饲料1和饲料2对应的概率p值为0.108>0.05通过了检验,可以认为两配对变量饲料1和饲料2无相关关系。 由上表知:吃饲料1和饲料2的幼鼠分别有9人,其中喂以饲料1的9只幼鼠体内平均钙留存量为32.578;而喂以饲料2的9只幼鼠体内平均钙留存量为34.267。

第5章 K个相关样本的非参数检验

1 第五章 K 个相关样本的非参数检验 §5.1 几个概念 在参数检验中,我们常常对三个或三个以上的总体的均值进行相等性检验,使用的方法是方差分析,在非参数分析中也会遇到同样的问题,检验多个总体的分布是否相同。更严密的说,当几个总体的分布相同的条件下,讨论其位置参数是否相等。方差分析过程需要假定条件,F 检验才有效。可有时候所采集的数据常常不能满足这些条件,像多样本比较时一样,我们不妨尝试将数据转化为秩统计量,因为秩统计量的分布与总体分布无关,可以摆脱总体分布的束缚。秩方法在方差分析中的应用。 1、 处理—样本; 2、 区组—因素 在K 个不同的条件下,对n 个受试者进行试验。得下列数据: §5.2 Kruskal Wallis 检验 在比较两个以上的总体时广泛使用的Kruckal-Wallis 检验,就是对两个以上的秩样本进行比较的非参数方法,实质上它是两样本比较时的Wilcoxon 方法在多于两个样本时的推广。 在该测验中,首先计算全体样本中的秩,遇到数据出现相等,即存在“结”的 情况时,采用“平均秩”手段让它们分享它们理应所得的秩和,再对数据(秩)进行方差分析,但构造的统计量并不是组间平均平方和除以组内平均平方和,而是KW=组间平方和/总平方和的平均数,KW 表示Kruskal-Wallis 统计量。 k M M M H === 210: 。至少一对位置参数不等 :1H

2 KW 统计量的观察值是我们判定各组之间是否存在差异的有力依据,因为我们需要检验的原假设是各组之间不存在差异,或者说各组样本来自的总体具有相同的中心(均值或中位数)。Kruskal-Wallis 统计量的计算步骤为: 将 k 组数据混合,并从小到大排列,列出等级,如有相同数据则取平均等级,如果原假设为不真,某个总体的位置参数太大,则其观测值也倾向于取较大的值,则该总体的观测值的秩和也会偏大,因而导致 ∑=+- += N i i i N N R n N N S 1 2 )2 1() 1(12 偏大,其中j n j ij i n R R j /1 ∑== 。 S N 的含义是:∑=+- N i i i N R n 1 2 )21(是组间离差平方和 2 1 )2 1(1 1 ∑=+- -N i N i N ?? ????+--=∑=212 )21(11N i N N i N 12 )1(+= N N ∑=+- += N i i i N N R n N N S 1 2 )2 1() 1(12 在原假设为真的条件下,只要k 大于3, KW 很快地依分布趋于自由度为(k-1)的)1(2 -k χ分布。 例:从我国上市公司中分别随机抽取了工业、商业、建筑业、交通运输业等四个行业,其在1999年的总资产报酬率如下: 问四个行业资产报酬率是否有显著性差异.

SPSS的参数检验和非参数检验

实验报告 SPSS的参数检验和非参数检验 学期:_2013__至2013_ 第_1_学期 课程名称:_数学建模专业:数学 实验项目__SPSS的参数检验和非参数检验实验成绩:_____ 一、实验目的及要求 熟练掌握t检验及其结果分析。熟练掌握单样本、两独立样本、多独立样本的非参数检验及各种方法的适用范围,能对结果给出准确分析。 二、实验内容 使用指定的数据按实验教材完成相关的操作。 1、给幼鼠喂以不同的饲料,用以下两种方法设计实验: 方式1:同一鼠喂不同的饲料所测得的体内钙留存量数据如下: 方式2:甲组有12只喂饲料1,乙组有9只喂饲料2,所测得的钙留存量数据如下:

请选用恰当方法对上述两种方式所获得的数据进行分析,研究不同饲料是否使幼鼠体内钙的留存量有显着不同。 2、为分析大众对牛奶品牌是否具有偏好,随机挑选超市收集其周一至周 六各天三种品牌牛奶的日销售额数据,如下表所示: 请选用恰当的非参数检验方法,以恰当形式组织上述数据进行分析,并说明分析结论。

实验报告附页 三、实验步骤 (一) 方式1: 1、打开SPSS软件,根据所给表格录入数据,建立数据文件; 2、选择菜单Analyze-Compare means-Paired-Samples T Test,出现窗口; 3、把检验变量饲料1,饲料2 选择到Paired Variables框,单击OK。方式2: 1、打开SPSS软件,根据所给表格录入数据,建立数据文件; 2、选择菜单Analyze-Compare means-Independent-Samples T Test,出现窗口 3、选择检验变量饲料到Test Variable(s)框中。 4、选择总体标志变量组号到Grouping Variables框中。 5、单击Define Groups按钮定义两总体的标志值1、2,单击OK。(二) 1、打开SPSS软件,根据所给表格录入数据,建立数据文件; 2、选择菜单Analyze->Nonparametric->k Independent sample 3、选择待检验的若干变量入包装1,包装2,包装3到Test Variable(s)框中; 4、选择推广的平均秩检验(Friedman检验),单击OK。 四、实验结果分析与评价 (一): 方式1: 由上表知:两配对变量饲料1和饲料2对应的概率p值为>通过了检

非参数检验 SPSS操作

非参数检验的SPSS操作 前面一章介绍的二项分布的比率检验、配合度检验——卡方检验和1-Sample K-S检验等都属于非参数检验。这一节我们主要结合前面参数假设检验一章讲过的t检验以及方差分析一章讲过的方差分析,来进一步分析,当参数检验的前提条件不满足时,两个样本和多个样本平均数差异的SPSS操作方法。 一、两个独立样本的差异显著性检验 两独立样本的的差异显著性检验只有在满足如下条件时才能进行T检验:变量为正态分布的连续测量数据。若数据不满足这样的条件,强行进行T检验容易造成错误的结论。在数据不能满足这种参数检验的条件下,我们可以选择非参数检验方法进行。与两独立样本差异显著性检验相对应的方法可以在SPSS主菜单Analyze / Nonparametric Tests / 2 Independent Samples…中得到。 1.数据 采用本章第一节中例2的数据(数据文件“9-4-1.sav”),具体介绍操作过程。 2.理论分析 对于数据文件9-4-1.sav中的数据,目的是检验男女生之间注意稳定性是否存在显著差异,注意稳定性测量的结果虽然是测量数据但是从总体上来看不满足正态分布的前提假设,另外不同性别的学生可以看成是两组独立的样本,因此对上述资料的检验可以用非参数的独立样本的检验方法。 2.操作过程 (1)在SPSS主菜单中选择Analyze / Nonparametric Tests / 2 Independent Samples…得到两个独立样本非参数检验的主对话框(图9-1),把因变量atten选入到检验变量表列(Test Independent-Sample

相关文档
相关文档 最新文档