文档库 最新最全的文档下载
当前位置:文档库 › §5 非参数检验(纲要)

§5 非参数检验(纲要)

§5.非参数检验

参数检验:估计或检验总体参数统计分析方法对总体有特殊要求,如t检验要求总体符合正态分布,F 检验要求误差呈正态分布且各组方差齐等,这些方法称为参数检验。

非参数检验:数据的总体分布未知或无法确定,统计分析不是针对总体参数,而是针对总体的某些一般性假设(如总体分布)的检验方法。

5.1.1 主要功能

适用于有明显分类特征的某些数据,主要用于检验属于某一类的对象或实际观测数与根据某理论假设所期望的频数间是否有显著差异。

5.1.2 实例操作

例5-1某地一周内各日死亡数的分布如下表,请检验一周内各日的死亡危险性是否相同?

星期一二三四五六日

死亡数11 19 17 15 13 16 19

5.1.2.1 数据准备

在数据编辑器窗口,定义变量名:各日为Day,死亡数为Death。按顺序输入数据,结果见死亡危险性.sav。

1.Data菜单→Weight Cases...命令项→弹出Weight Cases对话框;

2.核选weight cases by,选Death并点击【➢】钮使之进入Frequency框,定义死亡数为权数;

3.再点击OK钮即可。

13.1.2.2 统计分析步骤

1.Statistics菜单→Nonparametric Tests…→Chi-Square...命令项→弹出Chi-Square Test对话框。

2.从变量名列表框中选变量(Day)并【➢】移入到Test variable框中,则对其对应的数据进行检验。

其他选项的意义:

Expected Range栏: 确定对变量中的那些数据进行检验。

◎Get from data: 全部数据参与检验(默认)。

◎Use specified range: 确定自定义的下限和上限。

Expected Values:

◎All categories equal: 假设变量中各组数据的期望值相等(默认)。检验服从均匀分布时选此项。

◎Values: 窗口中输入数值→Add,移入到右侧框中,重复可以输入多个数值,它们将被作为需要检验分布的期望值。

Exact钮→弹出Exact Test对话框:

◎Asymptotic only: 缺省,根据假设的分布采用渐进逼近方法计算显著性。

◎Monte Carlo: 设置置信度和最大迭代次数。

◎Exact: 设置计算时间限制。>30mins时,建议用Monte Carlo法。

Option钮→弹出Chi-Square Test: Options对话框: 设置描述统计量和缺失值处理方法。

3.点击OK钮即可。

注:卡方检验要求所有单元中的期望值≥1,并且有20%以上的单元中的期望值≥5。

5.1.2.3 结果解释

在结果输出窗口中将看到如下统计数据:

运算结果显示一周内各日死亡的理论数(Expected)为15.71,即一周内各日死亡均数;还算出实际死亡数与理论死亡数的差值(Residual);卡方值χ2 = 3.4000,自由度df= 6 ,P = 0.7572 ,可认为一周内各

日的死亡危险性是相同的。

DAY

Observed N Expected N Residual

1 11 15.7 -4.7

2 19 15.7 3.3

…………

7 19 15.7 3.3

Total 110

Test Statistics

DAY

Chi-Square 3.400

df 6

Asymp. Sig. .757

a 0 cells (.0%) have expected frequencies less than 5.

The minimum expected cell frequency is 15.7.

例5-2掷骰子120次,记录各点数出现的频数于下表,以检验骰子各点出现的频数是否服从均匀分布?

数据记录于文件掷骰子.sav。(先要给频数加权,检验点数)

点数 1 2 3 4 5 6

频数15 15 20 21 23 26

5.2 Binomial检验

5.2.1 主要功能

从只能划分为两类的数据总体中抽取的所有可能结果,要么是对立分类中的一类(比例为P),要么是另一类(比例为1-P),则二项检验可检验能否认为从样本观察到的两类比例来自具有指定P值的总体。

5.2.2 实例操作

例5-3某地某一时期内出生40名婴儿,其中女性12名,男性28名。问这个地方出生婴儿的性比例与通常的男女性比例(总体概率约为0.5)是否不同?

5.2.2.1 数据准备

在数据编辑器窗口,定义变量和变量标签。按出生顺序输入数据,婴儿性比.sav。

5.2.2.2 统计分析

1.Statistics菜单→Nonparametric Tests...→Binomial...命令项→弹出Binomial Test对话框;

2.Test Variable框:将变量名列表框中的待分析变量(婴儿),【➢】移入到该框;

3.Define Dichotomy框:确定数据获取方式。

◎Get from data: 从原数据文件获取分类数据;

◎Cut point: 输入一个数值,将以该值为界将原数据分为2组(依变量标签值确定,如0.5,

1或1.5等)。

4.在Test框:键入数值(缺省为0.5)作为二项中属于第一项的概率,其他同前;

5.点击OK钮即可。

Binomial Test

Category N Observed Prop. Test Prop. Asymp. Sig. (2-tailed) Baby Group 1 0=男孩28 .70 .50 .018

Group 2 1=女孩12 .30

Total 40 1.00

a Based on Z Approximation.

5.2.2.3 结果解释

在结果输出窗口中将看到如下统计数据:二项分布检验表明,女婴12名,男婴28名,观察概率为0.7000(即男婴占70%),检验概率为0.5000,二项分布检验的结果是双侧概率为0.0177,可认为男女比例的差异有高度显著性,即与通常0.5的性比例相比,该地男婴比女婴明显为多。

5.3 Runs检验

5.3.1 主要功能

SPSS应用游程总个数检验方法,检验一组数据是否来自同一总体或差异不明显,服从同一分布。既考察按随机顺序得到的一组样本的观测值是否表现出足够的随机性。

5.3.2 实例操作

例5-4某村发生一种地方病,其住户沿一条河排列,调查时对发病的住户标记为“1”,对非发病的住户标记为“0”,共26户:

0 1 1 0 0 0 1 0 0 1 0 0 0 0 1 1 0 0 1 0 0 0 0 1 0 1

问病户的分布排列是呈聚集趋势,还是随机分布?

13.3.2.1 数据准备

激活数据管理窗口,定义住户变量为地方病。按住户顺序输入数据,发病的住户为1,非发病的住户为0。地方病.sav

13.3.2.2 统计分析

1.Statistics菜单→Nonparametric Tests→Runs Test...项→弹出Runs Test对话框。

2.将变量名列表框中endemic【➢】移入Test Variable框。在临界割点Cut Point框中有四个选项:□Median:用数据中位数作断点(缺省);□Mode:用众数作临界割点;

□Mean:用均数作临界割点;□Custom:用指定值作临界割点;

本例选Custom项,在其方框中键入1(本例是0、1二分变量,故临界割点值用1)。

3.其他按照卡方检验设置,点击OK。

5.3.2.3 结果解释

在结果输出窗口中将看到如下统计数据:

检验结果可见本例游程个数为14,检验临界割点值(Test value)= 1.00,小于1.00者有17个案例,而大于或等于1.00者有9个案例。Z = 0.3246,双侧P = 0.7455。所以认为此地方病的病户沿河分布的情况无聚集性,而是呈随机分布。

Runs Test

endemic

Test Value 1

Total Cases 26

Number of Runs 14

Z .325

Asymp. Sig. (2-tailed) .746

a User-specified.

5.4 1-Sample K-S检验

5.4.1 主要功能

对单样本进行Kolmogorov-Smirnov Z检验,它将一个变量的实际频数分布与正态分布(Normal)、均匀分布(Uniform)、泊松分布(Poisson)进行比较。

5.4.2 实例操作

例5-5某地成年男子144人红细胞计数(万/立方毫米)的频数资料如下,问该资料是否呈正态分布?

红细胞计数人数红细胞计数人数

420- 440- …520- 2

4

25

540-

560-

640-

24

22

1

5.4.2.1 数据准备

在数据编辑器窗口,定义频数变量名为频数,依次输入人数资料,红细胞频数.sav。

5.4.2.2 统计分析

1.Statistics菜单→Nonparametric Tests→1-Sample K-S ...项→弹出One-Sample Kolmogorov-Smirnov Test框。

2.在变量名列表框中选f,点击【➢】使之移入Test Variable框;

3.在Test Distribution框中有4个选项(Normal, Uniform, Poisson, Exponential),表明与这些分布形式相比较,再点击OK钮即可。

5.4.2.3 结果解释

在结果输出窗口中将看到如下统计数据:K-S正态性检验的结果显示,Z值=0.718,双侧P值=0.681,可认为该地正常成年男子的红细胞计数符合正态分布。

One-Sample Kolmogorov-Smirnov Test

频数

N 12

Normal Parameters

Mean 12.08 Std. Deviation 9.32

Most Extreme Differences Absolute .207 Positive .207 Negative -.163

Kolmogorov-Smirnov Z .718

b Calculated from data.

例5-6在一大批相同型号的电子元件中随机抽取10只作使用寿命(h)试验,测得结果如下:

420 500 920 1380 1510 1650 1760 2100 2320 2350。试问该电子元件的使用寿命是否服从均值为1500h的指数分布?元件寿命.sav

One-Sample Kolmogorov-Smirnov Test

使用寿命

N 10

Exponential parameter. Mean 1491.0000

Most Extreme Differences Absolute .304 Positive .207 Negative -.304

Kolmogorov-Smirnov Z .960

Asymp. Sig. (2-tailed) .315

a Test Distribution is Exponential.

b Calculated from data.

注:缺省时系统将样本数据的均值作为指数分布的均值,如表中所示,P值大于0.05故接受零假设,即

服从均值为1491的指数分布。

由于问题是问是否服从均值为1500的指数分布,故需做进一步设置,进一步设置方法是用Syntax命令语句编程,在程序中指定分布参数的大小,然后运行。有2种方法可以使用:

1.File→New…Syntax…选项→SPSS语句编辑器,输入命令语句。

2.在Test Variable框,核选完后单击Paste钮完成。

NPAR TESTS

/K-S (NORMAL 0, 1)= time

/K-S (UNIFORM 800, 2000)= time

/K-S (POISSON 1500)= time

/K-S (EXPONENTIAL 1500)= time.

One-Sample Kolmogorov-Smirnov Test

TIME

N 10

Exponential parameter. Mean 1500

Most Extreme Differences Absolute .301 Positive .209 Negative -.301

Kolmogorov-Smirnov Z .953

Asymp. Sig. (2-tailed) .323

a Test Distribution is Exponential.

b User-Specified

5.5 2 Independent Samples过程

5.5.1 主要功能

可对两个独立样本的均数、中位数、离散趋势、偏斜度等进行差异比较检验。

5.5.2 实例操作

例5-7调查某厂的铅作业工人7人和非铅作业工人10人的血铅值(μg / 100g)如下,问两组工人的血铅值有无差别?

非铅作业组铅作业组

5 5

6

7 9 12 13 15 1

8 21 17 18 20 25 34 43 44

5.5.2.1 数据准备

在数据编辑器窗口,定义分组变量为group,变量标签1为非铅组,2为铅组,血铅值为Pb。按顺序输入数据。血铅含量比较.sav

5.5.2.2 统计分析

1.Statistics菜单→Nonparametric Test→2 Independent Samples...项→ Two-Independent-Samples-Test框。

2.在变量名列表框中选Pb和group,分别点击【➢】使之进入Test Variable框(对应数据作为检验对象)和Grouping Variable框(对应变量作为分组变量);

3.单击Define Groups...钮→Two Independent Samples: Define Groups框,定义Group 1为1,Group 2为2,点击Continue钮返回Two-Independent-Samples-Test对话框;

4.在Test Type框中有四种检验方法:

□Mann-Whitney U:检验两个独立样本是否来自同一总体(最强的非参数检验,本例选此方法);

□Kolmogorov-Smirnov Z:推测两个样本是否来自具有相同分布的总体;

□Moses extreme reactions:检验两个独立样本之观察值的散布范围是否有差异存在,以检验两

个样本是否来自具有同一分布的总体;

□Wald-Wolfowitz runs:考察两个独立样本是否来自具有相同分布的总体。

5.点击OK钮。

5.5.2.3 结果解释

在结果输出窗口中将看到如下统计数据:

结果表明,第1组的均值的秩(Mean Rank)为5.95,第2组的平均秩次为13.36,U = 4.5,W = 93.5,精确双侧概率P = 0.0012,可认为铅作业组工人的血铅值高于非铅作业组。

Ranks

group N Mean Rank Sum of Ranks μg / 100g 1=非铅组10 5.95 59.50

2=铅组7 13.36 93.50

Total 17

Test Statistics

μg / 100g

Mann-Whitney U 4.500

Wilcoxon W 59.500

Z -2.980

Asymp. Sig. (2-tailed) .003

Exact Sig. [2*(1-tailed Sig.)] .001

a Not corrected for ties.

b Grouping Variable: group

5.6 k Independent Samples检验

5.6.1 主要功能

调用此过程可对多个独立样本进行中位数检验和Kruskal-Wallis H检验。

5.6.2 实例操作

例5-8随机抽样得以下三组人的血桨总皮质醇测定值(μg / L),试比较有无差异?

正常人单纯性肥胖皮质醇增多症

0.4

1.9 …

7.0 0.6

1.2

13.6

9.8

10.2

24.0

5.6.2.1 数据准备

在数据编辑器窗口,定义分组变量和变量标签group,正常人为1,单纯性肥胖为2,皮质醇增多症为3,总皮质醇测定值(pzc)。按顺序输入数据。血浆皮质醇测定.sav

5.6.2.2 统计分析

1.Statistics菜单→Nonparametric Tests→k Independent Samples...项→Tests for Several Independent Samples框。

2.在变量名列表中选pzc和group,点击【➢】钮使之进入Test Variable框和Grouping Variable框;

3.点击Define Range...钮→K Independent Samples: Define Range框,定义Mininum为1,Maxinum为3,点击Continue钮返回Two-Independent-Samples-Test对话框;

4.在Test Type框中有3个检验方法的选项:

□Kruskal-Wallis H: 为单向方差分析,检验多个样本在中位数上是否有差异(本例);

□Median: 为中位数检验,检验多个样本是否来自具有相同中位数的总体;

□Fireman: 检验多个样本是否来自同一个总体。

5.单击OK钮。

5.6.2.3 结果解释

在结果输出窗口中将看到如下统计数据:

结果表明,1至3组的平均秩次(Mean Rank)分别为9.65、11.75、25.10,χ2值为18.1219,P = 0.0001;可认为三组人的血桨总皮质醇测定值有差异,根据本例情况可看出皮质醇增多症组高于其他两组人。

Ranks

group N Mean Rank

μg / L 1=正常10 9.65

2=肥胖10 11.75

3=增生症10 25.10

Total 30

Test Statistics

μg / L

Chi-Square 18.130

df 2

Asymp. Sig. .000

a. Kruskal Wallis Test;

b. Grouping Variable: group

5.7 2 Related Samples过程

5.7.1 主要功能

对两个相关样本资料(如配对、配伍资料)进行秩和检验。

5.7.2 实例操作

例5-9随机研究饲料中缺乏Vit E对大鼠肝中Vit A含量的关系,将大鼠按性别相同、体重相近的原则配成8对,并将每对大鼠随机分为2组(正常饲料组、Vit E缺乏饲料组),一定时间后杀死大鼠,测定肝中Vit A含量,结果如下表,问:饲料中缺乏Vit E对大鼠肝中Vit A含量有无影响?

大鼠对别正常饲料组Vit E 缺乏饲料组

1 2 …8 37.2

20.9

31.9

25.7

25.1

18.3

5.7.2.1 数据准备

在数据编辑器窗口,定义变量:饲料中Vit E正常的变量名为正常组,Vit E 缺乏饲料组变量名为缺乏组,按顺序输入数据。维生素缺乏试验.sav

5.7.2.2 统计分析

1.Statistics菜单→Nonparametric Tests→ 2 Related Samples...项→Two-Related-Samples Tests对话框。

2.在变量名列表框中连续选正常组,缺乏组,在Current Selections栏的Variable 1处出现正常组,Variable 2处出现缺乏组;

3.击【➢】钮,使正常组----缺乏组(表明是配对变量)进入Test Variable(s) List框。

4.在Test Type框中选择检验方法:

□Wilcoxon:配对符号秩检验。

□Sign:符号检验。适用于不适合用定量测量而能将每一对的2个成员互相分出等级的问题。

□Marginal Homogeneit检验。

□McNemar:变化显著检验。以研究对象作自身对照,检验其“前后”的变化是否显著,该法适用于相关的二分变量数据。

5.点击Options...钮 弹出Two-Related-Samples: Options框,在Statistics栏中选Decriptive项。

6.点击Continue钮返回Two-Related-Samples Tests对话框,之后点击OK钮即可。

5.7.2.3 结果解释

在结果输出窗口:配对符号秩和检验(Wilcoxon Matched-Pairs Signed-Ranks Test)结果中,其平均秩分别为5.00 和1.00 ,Z = -2.3805,双侧P = 0.0173,可认为两组大鼠肝中Vit A含量有差别,饲料中缺乏Vit E会使大鼠肝中Vit A含量降低;但符号检验(Sign Test)的结果,双侧P = 0.0703,则认为两组大鼠肝中Vit A含量无差别。此时,应取配对符号秩和检验结果,因其较为敏感,效率较高。

Descriptive Statistics

N Mean Std. Deviation Minimum Maximum

正常组8 34.7500 6.6485 20.90 41.40

缺乏组8 26.2375 5.8206 18.30 34.00

Wilcoxon Matched-Pairs Signed-Ranks Test: Ranks

N Mean Rank Sum of Ranks 缺乏组-正常组Negative Ranks 7a 5.00 35.00

Positive Ranks 1b 1.00 1.00

Ties 0c

Total 8

a 缺乏组<正常组;

b 缺乏组>正常组;

c 正常组=缺乏组

Test Statistics b

缺乏组- 正常组

Z -2.380a

a. Based on positive ranks;

b. Wilcoxon Signed Ranks Test

Sign Test: Frequencies

N

E缺乏组-正常组Negative Differences 7a

Positive Differences 1b

Ties 0c

Total 8

a 缺乏组<正常组;

b 缺乏组>正常组;

c 正常组=缺乏组

Test Statistics b

a. Binomial distribution used;

b. Sign Test

5.8 K Related Samples过程

5.8.1 主要功能

可对多个相关样本资料(如配伍资料)进行秩和检验。

5.8.2 实例操作

例5-10用某药治疗血吸虫病患者,在治疗前和治疗后一周、二周和四周各测定7名患者血清SGPT 值的变化,以观察该药对肝功能的影响,结果如下表,问:患者四个阶段的血清SGPT值有无不同?

患者编号

治疗前

SGPT值

治疗后SGPT值

一周二周四周

1 2 …7 63

90

64

188

238

207

138

220

185

54

144

87

5.8.2.1 数据准备

激活数据管理窗口,定义变量名依次为:治疗前(bef)、治疗后一周为aftweek1、二周为aftweek2、四周为aftweek4,按顺序输入各组SGPT数据,血吸虫病治疗.sav。

5.8.2.2 统计分析

1.Statistics菜单→Nonparametric Tests→k Related Samples...项→Tests for Serveral Related Samples框。

2.在变量名列表框中选bef、aftweek1、aftweek2和aftweek4,点击【➢】钮使之进入Test框。

3.在Test Type框中有三种选项:

□Friedman:双向方差分析,考察多个相关样本是否来自同一总体;

□Cochran's Q:McNemar检验作(2相关样本)推广到多样本,用于定性和二分字符变量。

□Kendall's W:Kendall和谐(协和)系数检验,通过计算Kendall和谐系数W,

以检验多个相关样本是否来自同一分布的总体。

本例选Friedman和Kendall’s W两种检验方法,

4.再单击Statistics...钮→弹出K Related-Samples:Statistics框,在Statistics栏中选Decriptive项,要求计算均数、标准差等指标,点击Continue钮返回K Related-Samples Tests对话框;最后点击OK钮即可。

5.8.2.3 结果解释

在结果输出窗口中将看到如下统计数据:

首先显示的是四个变量before、w1、w2、w4的例数、均数、标准差、最大值和最小值。

接着显示检验结果:

Friedman双向方差分析,平均秩次分别1.29、3.86、3.00和1.86 ,χ2= 16.7143,P = 0.0008,可认为患者四个阶段的血清SGPT值有显著差别。

Kendall和谐系数检验,平均秩次分别1.29、3.86、3.00和1.86 ,和谐系数W = 0.7959,χ2= 16.7143,P = 0.0008,结论同前。Friedman Test

Ranks Test Statistics

Mean Rank N 7

bef 1.29 Chi-Square 16.714 aftweek1 3.86 df 3

aftweek2 3.00 Asymp. Sig. .001

aftweek4 1.86

a Friedman Test

Kendall's W Test

Mean Rank N 7 bef 1.29 Kendall's W .796 aftweek1 3.86 Chi-Square 16.714

aftweek2 3.00 df 3

aftweek4 1.86 Asymp. Sig. .001

a Kendall's Coefficient of Concordance

第6章 非参数检验

第六章非参数检验 在前面的章节中我们介绍了多种假设检验的方法,例如单个总体的t检验、基于两个独立样本的t检验、基于两个匹配样本的t检验、方差分析等。在这些检验都需要对总体的分布特征作出某些假设(例如在t检验和方差分析中都需要假设总体服从正态分布),然后根据检验统计量的抽样分布对总体参数(如均值、比率等)进行检验。这类检验方法称为参数检验。我们前面强调过,在需要的假设条件不满足的情况下,特别是小样本的情况下,t检验、F检验都是不适用的。 那么,如何检验数据是否来自正态分布或者其他分布?在参数检验假设条件不满足的情况下如何对相应的问题进行分析?非参数检验方法可以帮助我们回答这类问题。在这一章中,我们将首先简要说明非参数检验的概念和优缺点,然后介绍几种常见的非参数检验方法及其在SPSS中的实现方法。 第一节非参数检验概述 非参数检验(nonparametric tests)也称为与总体分布无关的检验(distribution free tests),与参数检验相比,在非参数检验中不需要对总体分布的具体形式作出严格假设,或者只需要很弱的假设。大部分非参数检验都是针对总体的分布进行的检验,但也可以对总体的某些参数进行检验。 与参数检验相比,非参数检验主要有以下几个方面的特点: (1)非参数检验不需要严格假设条件,因而比参数检验有更广泛的适用面。 (2)非参数检验几乎可以处理包括定类数据和定序数据在内的所有类型的数据,而参数检验通常只能用于定量数据的分析。 (3)虽然对于满足参数检验的假设条件的数据也可以采用非参数检验法进行分析,但在参数检验和非参数检验都可以使用的情况下,由于非参数检验没有充分利用样本内所有的数量信息,因此其检验的功效(power)要低于参数检验方法。也就是说,在备择假设为真的情况下,采用参数检验方法拒绝原假设的概率要高于非参数检验的方法,从而更容易发现显著的差异。 在假设检验中,犯取伪错误的概率记为β,则1-β越大,意味着当备择假设为真时,拒绝原假设的概率越大,检验的判别能力就越好;1-β越小,意味着当备择假设为真时,拒绝原假设的概率越小,检验的判别能力就越差。可见1-β是反映统计检验判别能力大小的重要指标,我们称之为检验功效或检验力。 根据非参数检验的以上特点,在以下情况下应当首选非参数方法进行统计推断: (1)参数检验中的假设条件不满足,从而无法应用。例如总体分布为偏态或分布形式未知,且样本为小样本时。 (2)检验中涉及的数据为定类或定序数据。 (3)所涉及的问题中并不包含参数,如判断某样本是否为随机样本,判断某样本是否来自正态分布等。 (4)对各种资料的初步分析。

非参检验概述 Non Parametric Test

非参数检验 知识引入 比较两个总体间的差异,我们比较熟悉的是可依据总体方差是否已知,选择使用正态Z检验或t检验法。但如果有明显的证据表明,这些参数型检验法不能使用时又该如何呢?非参数检验法对此提供了解决方案。 作为参数检验的一种推广,非参数检验有何特点?它的使用有什么样的要求?本章首先对非参数检验进行概述,接着按照和参数检验对应的原则分别介绍用于两组比较的非参数检验法和用于多组比较的非参数检验法。 第一节非参数检验概述 假设检验分为参数检验和非参数检验。 参数检验是在已知总体分布的条件下(一般要求总体服从正态分布)对一些主要的参数(如均值、百分数、方差、相关系数等)进行的检验,有时还要求某些总体参数满足一定条件。如独立样本的T检验和方差分析不仅要求总体符合正态分布,还要求各总体方差齐性。教材第八章之前所介绍的统计方法都是参数检验法。 非参数检验则不考虑总体分布是否已知,常常也不是针对总体参数,而是针对总体的某些一般性假设(如总体分布的位置是否相同,总体分布是否正态)进行检验。 非参数检验方法简便,不依赖于总体分布的具体形式因而适用性强,但灵敏度和精确度不如参数检验。一般而言,非参数检验适用于以下三种情况:①顺序类型的数据资料,这类数据的分布形态一般是未知的;②虽然是连续数据,但总体分布形态未知或者非正态,这和卡方检验一样,称自由分布检验;③总体分布虽然正态,数据也是连续类型,但样本容量极小,如10以下(虽然T检验被称为小样本统计方法,但样本容量太小时,代表性毕竟很差,最好不要用要求较严格的参数检验法)。因为这些特点,加上非参数检验法一般原理和计算比较简单,因此常用于一些为正式研究进行探路的预备性研究的数据统计中。当然,由于非参数检验许多牵涉不到参数计算,对数据中的信息利用不够,因而其统计检验力相对参数检验也差得多。 前面所学到的参数检验法在非参数法中都能找到替代的方法,因此按照和参数检验法相对应的原则可对非参数检验法进行如下分类:

非参数检验

非参数检验 非参数检验是一种利用数据的分布情况,来判断总体参数是否存在差异的统计学方法。它通过对样本数据进行排序、秩次差分等计算,不依赖于总体的任何分布假设,从而有效 地避免了假设检验的潜在问题。 非参数检验是一种不依赖于正态分布等总体分布假设的统计方法。它常用于处理那些 无法明确表达总体分布的数据,例如顺序等级或名目类别等数据。非参数检验能够帮助研 究者在不了解总体分布情况的情况下,对样本数据所代表的总体参数进行有效估计和推 断。 为什么要使用非参数检验? 通常情况下,研究者在进行实验或调查时,只能获得小规模样本数据,无法获得完整 的总体数据。而传统的参数检验方法可能会假设总体分布具有特定形态的分布假设,这在 某些情况下可能会导致假设检验的错误推断。因此,非参数检验成为了一个更为可靠的方法,它不需要任何对总体分布的预设,可以适用于各种数据类型的场景。 在以下情况下,非参数检验的使用是非常适合的: 1. 样本数据不属于正态分布。 2. 样本数据中包含异常值。 3. 样本数据中存在较大的离散差异。 4. 样本规模较小,总体参数无法得到明确描述。 在非参数检验的应用中,根据所比较的数据类型和检验目的的不同,可以经常使用以 下几种检验方法: 1. Wilcoxon符号秩检验:用于检验有序对数据是否存在显著性差异。 2. Mann-Whitney U检验(也称为Wilcoxon秩和检验):用于比较两个独立样本之间的差异。 3. Kruskal-Wallis H检验:用于比较多个独立样本之间的差异。 5. McNemar检验:用于比较配对样本之间的差异。 以上非参数检验方法的应用范围非常广泛,不同场景中的应用也有所不同。 结论

K个相关样本的非参数检验

第五章 K 个样本的非参数检验 1 第五章 K 个样本的非参数检验 §5.1 几个概念 在参数检验中,我们常常对三个或三个以上的总体的均值进行相等性检验,使用的方法是方差分析,在非参数分析中也会遇到同样的问题,检验多个总体的分布是否相同。更严密的说,当几个总体的分布相同的条件下,讨论其位臵参数是否相等。方差分析过程需要假定条件,F 检验才有效。可有时候所采集的数据常常不能满足这些条件,像多样本比较时一样,我们不妨尝试将数据转化为秩统计量,因为秩统计量的分布与总体分布无关,可以摆脱总体分布的束缚。秩方法在方差分析中的应用。 1、 处理—因素, 条件,k 个构成k 个总体; 2、 区组—样本点,每个处理下j n (或N )个样本点。 在K 个不同的条件下,对N 个受试者进行试验。得下列数据,ij x 为第i 个样本在第j 个条件下的观测值: §5.2 Kruskal Wallis 检验 在比较两个以上的总体时广泛使用的Kruckal-Wallis 检验,就是对两个以上的秩样本进行比较的非参数方法,实质上它是两样本比较时的Wilcoxon 方法在多于两个样本时的推广。 在该测验中,首先计算全体样本中的秩,遇到数据出现相等,即存在“结”的情 况时,采用“平均秩”手段让它们分享它们理应所得的秩和,再对数据(秩)进行方差分析,但构造的统计量并不是组间平均平方和除以组内平均平方和,而是KW=组间平方和/总平方和的平均数,KW 表示Kruskal-Wallis 统计量。 k M M M H === 210:

第五章 K 个样本的非参数检验 2 。 至少一对位臵参数不等:1H KW 统计量的观察值是我们判定各组之间是否存在差异的有力依据,因为我们需要检验的原假设是各组之间不存在差异,或者说各组样本来自的总体具有相同的中心(均值或中位数)。Kruskal-Wallis 统计量的计算步骤为: 将 k 组数据混合,并从小到大排列,列出等级,如有相同数据则取平均等级,如果原假设为不真,某个总体的位臵参数太大,则其观测值也倾向于取较大的值,则该总体的观测值的秩和也会偏大,因而导致 2 1 121()(1)2k N i i i N S n R N N =+=-+∑ 偏大,其中1 /j n j ij j i R R n == ∑。 S N 的含义是: 2 1 1()2 k i i i N n R =+- ∑是组间离差平方和 2 1)2 1(11∑=+--N i N i N ?? ? ???+--=∑=212)21(11N i N N i N 12 ) 1(+= N N 2 1121()(1)2 k N i i i N S n R N N =+=-+∑ 在原假设为真的条件下,只要k 大于3, KW 很快地依分布趋于自由度为(k-1)的 )1(2-k χ分布。 例:从我国上市公司中分别随机抽取了工业、商业、建筑业、交通运输业等四个行业,其在1999年的总资产报酬率如下:

非参数检验(卡方检验),实验报告

非参数检验(卡方检验),实验报告 评分 大理大学实验报告 课程名称 生物医学统计分析 实验名称 非参数检验( 卡方检验) 专业班级 姓 名 学 号 实验日期 实验地点 20xx—20xx 学年度第 2 学期一、 实验目得对分类资料进行卡方检验。 二、实验环境 1 、硬件配置:处理器:Intel(R) Core(TM) i5-4210U CPU 1、7GHz 1、7GHz 安装内存(RAM):4、00GB 系统类型:64 位操作系统 2 、软件环境:IBM SPSS

Statistics 19、0 软件 三、实验内容(包括本实验要完成得实验问题及需要得相关知识简单概述) (1) 课本第六章得例6、1-6、5 运行一遍,注意理解结果; (2)然后将实验指导书得例1-4 运行一遍,注意理解结果。 四、实验结果与分析 (包括实验原理、数据得准备、运行过程分析、源程序(代码)、图形图象界面等) 例例6 、1 表1 灭螨A A 与灭螨B B 杀灭大蜂螨效果得交叉制表 效果合计杀灭未杀灭组别灭螨A 32 12 44 灭螨B 14 22 36 合计46 34 80 分析: 表1就是灭螨A与灭螨B杀灭大蜂螨效果得样本分类得频数分析表,即交叉列联表。 表2 卡方检验 X2 值df 渐进Sig、(双侧) 精确Sig、(双侧) 精确Sig、(单侧) Pearson 卡方9、277a 1 、002 连续校正b 7、944 1 、005 似然比9、419 1 、002 Fisher 得精确检验 、003 、002 有效案例中得N 80 a、0 单元格(、0%) 得期望计数少于5。最小期望计数为

非参数检验实验报告

学院: ______________________ 参赛队员: ___________________ 参赛队员: ___________________

目录 一、实验目的 (1) 1.了解假设检验的基本容; (1) 2.了解卡方检验; (1) 3.了解二项分布检验; (1) 4.了解两个独立样本检验; (1) 5.学会运用spss软件求解问题; (1) 6.加深理论与实践相结合的能力。 (1) 二、实验环境 (1) 三、实验方法 (1) 1.卡方检验; (1) 2.二项分布检验; (1) 3.两个独立样本检验。 (1) 四、实验过程 (1) 问題一: (1) 1.1实验步骤 (2) 1.1.1辙入数据 (2) 1.1.2选择:数据加权个案 (2) 1.1.3选择:分析今非参数检验今旧对话框今卡方 (2) 1.1.4将变量面值放入检验变量列表 (3) 1.1.5观察结果 (3) 1.2输出结果 (3) 1.3结果分析 (3) 问題二: (3) 2.1问題叙述 (3) 2.2提出假设 (4) 2.3实验步骤 (4) 2.3. 1导入excel文件数据 (4) 2.3. 2二项分布检验 (5) 2.3.3辙出结果 (6) 2.4结果分析 (6) 问題三: (6) 3.1实验步骤 (6) 3.1.1数据的输入 (6) 3.1.2 选择 (7) 3.1.3检验变量 (7)

3.2输出结果 (7) 3.3结果分析 (9) 五、实验总结 (9) 参数检验 一、实验目的 1.了解假设检验的基本容; 2.了解卡方检验; 3.了解二项分布检验; 4.了解两个独立样本检验; 5•学会运用spss软件求解问题; 6•加深理论与实践相结合的能力。 二、实验环境 Spss、 office 三、实验方法 1.卡方检验; 2.二项分布检验; 3.两个独立样本检验。 四、实验过程 问题一: 掷一个6而骰子300次,用数字1、2、3、4、5、6分别代表6个而,检验骰子是否均匀

非参数检验

非参数检验Nonparametric Tests菜单 概述 非参数统计是统计分析的重要组成部分,其优点是适用范围广(通用的统计方法),可用于等级资料和开口资料,缺点是检验效能低。目前,非参数统计的一般性统计分析的理论发展远远不及参数检验完善,比较完善的可供使用的方法也不多。比如多个样本间两两比较的非参数检验,虽然已有好几种方法可资利用,但由于在理论上仍存在争议,权威的统计软件(如SAS和SPSS)均没有提供这方面的方法。 虽然这些权威的统计软件没有提供两两比较的非参数方法,但是,国产的统计软件大都提供了两两比较的方法。因此建议大家:如果真的要做这方面的非参数分析,不如直接用PEMS、SPLMWIN、NOSA等国产软件,免得用SPSS等只能做一半。 在SPSS中,提供了8种非参数检验方法,放入了Nonparametric Tests菜单中,分为两大类: (一)分布类型的检验过程: 亦称拟合优度检验方法,即检验样本所来自的总体是否服从某种理论分布。 1、Chi-square test:用卡方检验来检验变量的几个取值所占百分比是否和我们期望的比例有统计学差异。比如我们在人群中抽取了一个样本,可以用该方法来分析四种血型所占的比例是否相同(都是25%),或者是否符合我们所给出的一个比例(如分别为10%、30%、40%和20%,随便举例)。请注意该检验和我们一般所用的卡方检验不太一样,我们一般作的卡方检验要用crosstable菜单来完成,见上一章,而不是这里讨论。 2、Binomial T est:用于检测所给的变量是否符合二项分布,变量可以是两分类的,也可以是连续性变量,然后按你给出的分界点一分为二。 3、Runs T est:用于检验某变量的取值是否是围绕着某个数值随机地上下波动,该数值可以是均数、中位数、众数或人为制定。一般来说,如果该检验P值有统计学意义,则提示有其他变量对该变量的取值有影响,或该变量存在自相关。 4、One-Sample Kolmogorov-Smirnov T est(1-Sample K-S..):采用柯尔莫诺夫-斯米尔诺夫检验来分析变量是否符合某种分布,可以检验的分布有正态分布、均匀分布、Poission分布和指数分布。 (二)分布位置的检验过程: 用于检验样本所在的总体分布位置或形状是否相同。我们平时所说的,所用的非参数检验方法实际上指的就是这一类方法。具体包含以下几种方法: 1、T wo-Independent-Samples T ests:即成组设计的两样本均数比较的非参数检验。 2、T ests for Several Independent Samples:成组设计的多个样本均数比较的非参数检验,此处不提供两两比较方法。 3、T wo-Related-Samples T ests:配对设计两样本均数的非参数检验。 4、T ests for Several Related Samples:配伍设计多个样本均数的非参数检验,此处同样不提供两两比较。 本次实习只要求掌握分布位置的检验过程

STATA 第五章 多组计量资料比较的非参数检验命令与输出结果说明

第五章多组计量资料比较的非参数检验命令与输出结果说明 对于计量资料不满足正态分布要求或方差不齐性,但样本资料之间是独立抽取的,则可以应用秩和检验方法进行比较两组资料的中位数是否有差异。STATA 命令为: ranksum 观察变量, by( 分组变量) 例:研究不同饲料对雌鼠体重增加的关系。表中用x表示雌鼠体重增加(克), . ranksum x, by(group) Two-sample Wilcoxon rank-sum (Mann-Whitney) test group obs rank sum expected 1 1 2 140.5 120 2 7 49.5 70 combined 19 190 190 unadjusted variance 140.00 adjustment for ties -0.12 adjusted variance 139.88 Ho: x(group==1) = x(group==2) z = 1.733 Prob > |z| = 0.0830 望值为70;③秩和统计检验量z;④对于无效假设Ho对应的p值。 在本例中,虽然第二组的秩和为49.5而期望值估计为70,但p值为0.0832,所以根据该资料和统计结果一般不能认为用高蛋白饲料喂养能明显增加雌鼠的体重。 多组资料中位数比较(完全随机化设计资料的检验)

对于完全随机化设计资料的比较,若各组资料不全服从正态分布(即:至少有一组的资料均不服从正态分布)或各组的资料方差不齐性,则可以用Kruskal and Wallis方法进行检验(Ho:各组的中位数相同)。STATA命令为: kwallis 观察变量,by(分组变量) 例:50只小鼠随机分配到5个不同饲料组,每组10只小鼠。在喂养一定时间后,测定鼠肝中的铁的含量(mg/g)如表所示:试比较各组鼠肝中铁的含量是否有显著性差别。用x 表示鼠肝中铁的含量以及用group=1,2,3,4,5分别表 Kruskal-Wallis equality-of-populations rank test group Obs Rank Sum 1 10 188.50 2 10 280.50 3 10 420.00 4 10 95.00 5 10 291.00 chi-squared = 27.856 with 4 d.f. probability = 0.0001 chi-squared with ties = 27.858 with 4 d.f. probability = 0.0001 值。 本例结果表明:5组的中位数有显著的差异。即:5个不同饲料组的小鼠肝脏中铁的含量有显著差异,说明小鼠肝脏中铁的含量与喂养的饲料有关。

第十一章非参数检验

第十一章 非参数检验 前面有关章节讨论的参数检验都要求总体服从一定的分布,对总体参数的检验是建立在这种分布基础上的。例如,两样本平均数比较的t 检验和多个样本平均数比较的F 检验,都要求总体服从正态分布,推断两个或多个总体平均数是否相等。本章引入另一类检验——非参数检验(non-parametric test )。非参数检验是一种与总体分布状况无关的检验方法,它不依赖于总体分布的形式,应用时可以不考虑被研究的对象为何种分布以及分布是否已知。非参数检验主要是利用样本数据之间的大小比较及大小顺序,对两个或多个样本所属总体是否相同进行检验,而不对总体分布的参数如平均数、标准差等进行统计推断。当样本观测值的总体分布类型未知或知之甚少,无法肯定其性质,特别是观测值明显偏离正态分布,不具备参数检验的应用条件时,常用非参数检验。非参数检验具有计算简便、直观,易于掌握,检验速度较快等优点。 非参数检验法从实质上讲,只是检验总体分布的位置(中位数)是否相同,所以对于总体分布已知的样本也可以采用非参数检验法,但是由于它不能充分利用样本内所有的数量信息,检验的效率一般要低于参数检验方法。例如,非配对资料的秩和检验,其效率为t 检验的86.4%,就是说以相同概率判断出差异显著,t 检验所需的样本个数要少13.6%。非参数检验内容很多,本章只介绍常用的符号检验(sign test ),秩和检验(rank-sum test )和等级相关分析(rank correlation analysis )三种。 第一节 符号检验 一、配对资料的符号检验 (一)配对资料符号检验的意义 配对资料符号检验是根据样本各对数据之差的 正负符号多少来检验两个总体分布位置的异同,而不去考虑差值的大小。每对数据之差为正值用“+”表示,负值用“-”表示。可以设想如果两个总体分布位置相同,则正或负出现的次数应该相等。若不完全相等,至少不应相差过大,否则超过一定的临界值就认为两个样本所来自的两个总体差异显著,分布的位置不同。显然这种检验比较的是中位数而不是平均数,当分布对称时,中位数与平均数相等。 (二)配对资料符号检验的基本步骤 1、提出无效假设与备择假设 H O :甲、乙两处理差值d 总体中位数=0; H A :甲、乙两处理差值d 总体中位数≠0。 此时进行两尾检验。若将H A 中的“≠”改为“<”或“>”,则进行一尾检验。 2、计算差值并赋予符号 求甲、乙两个处理的配对数据的差值d ,d >0者记为“+”,d <0者记为“-”,d =0记为“0”。统计“+”、“-”、“0”的个数,分别记为0,,n n n -+,令-++=n n n 。检验的统计量为K ,等于+n 、-n 中的较小者,即},min{-+=n n K 。

10非参数秩和检验

10非参数秩和检验 在统计学中,非参数检验是一种统计方法,它不依赖于数据的分布参数。秩和检验(Wilcoxon rank-sum test)是非参数检验中最常使用的一种方法,它用于比较两组独立样本的差异。 非参数检验适用于以下情况: 1.数据不满足正态分布假设。 2.样本容量较小,无法通过中心极限定理来近似正态分布。 3.数据包含离群值,对正态分布假设产生影响。 秩和检验是一种非参数统计方法,它基于数据的秩次而不是原始测量数值。这种方法对异常值和偏态数据有较好的适应性。秩和检验常用于比较两组样本,判断它们是否来自于同一总体分布。 下面将详细介绍秩和检验的步骤和原理。 步骤: 1.收集样本数据,包括两组独立样本的观测值。 2.对两组样本的测量值进行合并,并给每个测量值分配一个秩次,按照从小到大的排序分配秩次。如果有相同的测量值,可以为它们分配平均秩次。 3.计算两组样本的秩和:分别将两组样本中的秩次相加。 4.根据下面的原理和公式计算秩和检验的统计量。 5.根据临界值或P值判断两组样本的差异是否显著。

原理: 秩和检验的原理是基于零假设(两组样本来自于同一总体分布)和备择假设(两组样本来自于不同的总体分布)。秩和检验的统计量是两组样本的秩和之差的绝对值。 考虑两组样本X和Y,秩和检验的零假设为H0:X和Y来自于同一总体分布,备择假设为H1:X和Y来自于不同的总体分布。 秩和检验的统计量(记作W)可通过以下公式计算: W = min(WX, WY) 其中,WX和WY分别是样本X和样本Y的秩和。 计算出统计量W后,可以根据秩和检验的临界值或计算出的P值进行假设检验,并判断两组样本的差异是否显著。通常情况下,如果拒绝零假设,即P值小于设定的显著性水平(通常为0.05),则认为两组样本存在显著差异。 总结: 非参数秩和检验是一种用于比较两组独立样本的方法,它不依赖于数据的分布参数。秩和检验的步骤包括收集样本数据、计算秩次、计算秩和统计量和进行假设检验。秩和检验常用于样本容量较小、数据不满足正态分布假设或包含离群值的情况。

《非参数统计》课程教学大纲

非参数统计 Non-parametricStatistics 一、课程基本信息 学时:48(含实验8学时) 学分:3 考核方式:考试,平时成绩占总成绩30%。 中文简介:非参数统计为有效地分析试验设计及其实际问题中所获得的数据提供了丰富的统计工具。本课程从问题背景与动机、方法引进、理论基础、计算机实现、应用实例等诸多方面介绍了非参数统计方法,其内容包括:基于二项分布的检验、列联表、秩检验、Ko1mogorov-Smirnov 型统计量等。本课程在强调实用性的同时,突出了应用方法与理论的结合。在人才培养体系中,该课程属于选修课程,但建议每个统计学专业的学生必须掌握若干种非参数统计方法,以其作为其他重要统计方法的补充。特别是针对名义数据分析及有序数据分析时相当有用。 二、教学目的与要求 非参数统计是研究随机现象存在的统计规律的学科,其在经济、工农业生产和科学技术等领域有广泛的应用,是一门应用性很强的一门课程。本课程(1)使学生掌握非参数理论的基本原理和方法,重点掌握单样本,多样本的位置检验和尺度检验,以及相关检验和分布检验。注意与参数统计的区别;(2)结合实际例子,运用非参数理论,提高学生运用该工具解决实际问题的能力。(3)使学生进一步掌握具体与抽象、偶然与必然、特殊与一般等辨证关系,培养学生辨证唯物主义观点。 三、教学方法与手段 教学中主要采用课堂教学的方法,当中穿插大量的案例,同时预留课堂讨论与练习的时间让学生进行实际的操作。 本课程同时设立计算机上机课程,由老师自编实验指导书详细指导学生进行上机实践,强调动脑与动手相结合,理论与实践相结合。

o 五、推荐教材和教学参考资源 教材:非参数统计:基于R语言案例分析,柳向东编,暨南大学出版社,2010年12月(第1版) 参考资料:

统计学习题 第十一章 非参数检验

第十一章非参数检验 第一节符号检验 符号检验的方法·符号检验的特点和作用 第二节配对符号秩检验 配对符号秩检验的方法·配对符号秩检验的效力 第三节秩和检验 秩和检验的方法·秩和检验的近似 第四节游程检验 游程的概念·游程检验的方法·差符号游程检验 第五节累计频数检验 累计频数检验的方法·累计频数检验的应用 一、填空 1.非参数检验,泛指“对分布类型已知的总体进行参数检验”()的所有检验方法。 2.符号检验的零假设就是配对观察结果的差平均起来等于()。 3.理论研究表明,对于配对样本非正态分布的差值d,()是最佳检验。 4.秩和检验检验统计量U是U1和U2中较()的一个。 5.秩尺度之统计量的均值和标准差只取决于()。 6.()常被用作经验分布与理论分布的比较。 7.绝对值相等的值,应将它们的秩()。 8.符号检验,在分布自由检验中称为()。 9.符号检验和配对符号秩检验,都只适用于()样本。 10.数据序列ABBABAAABABBABBAAAAAB的总游程数是() 二、单项选择 1.下列检验中,不属于非参数统计的方法的是()。 A总体是否服从正态分布 B 总体的方差是否为某一个值 C 样本的取得是否具有随机性 D 两组随机变量之间是否相互独立 2.下列情况中,最适合非参数统计的方法是()。 A反映两个大学新生成绩的差别 B 反映两个大学新生家庭人均收入的差别 C 反映两个大学三年级学生对就业前景的看法差别 D反映两个大学在校生消费水平的差别 3.不属于非参数检验的是()。 A符号检验B游程检验C累计频数检验 D F检验 4.在累计频数检验中,卡方的自由度为()。 A n1 B 2 C n2 D n1+n2

第二讲-非参数统计检验

第二讲非参数检验 1.实验目的 1.了解非参数假设检验基本思想; 2.会用SAS软件中的proc npar1way过程进行非参数假设检验和proc freq 过程进行列联表的独立性检验。 2. 实验要求 1.会用SAS软件建立数据集,并进行统计分析; 2.掌握proc npar1way过程进行非参数假设检验的基本步骤; 3.掌握proc freq过程进行列联表的独立性检验的基本步骤。 3.实验基本原理 3.1 符号检验 两种方法的处理效果无显著性差异 令 统计量 表示新方法的处理效果优于对照方法的配对组总数。若新方法的处理效果显著的优于对照方法,则的值应明显偏大。因此,若对给定的置信水平,有,则拒绝。 为真时,(1)服从二项分布。拒绝域为: (2)由中心极限定理可知,当的零分布趋于标准正态分布。

拒绝域为: 3.2 Wilcoxon秩和检验 (1)单边假设检验 两种方法的处理效果无显著性差异 as :新方法优于对照方法。 用于检验的统计量为: 若对给定的置信水平,有,则拒绝。且的分布列为: 根据观测结果计算的观测值,计算检验的p值: 然后将值与显著水平作比较,若,则拒绝,否则接受。 (2)双边假设检验 给定的显著水平应该满足: 仅由上式还不能唯一确定,当我们对两种方法谁优谁劣不得而知时,通常取 若利用p值进行检验,设,计算概率值 由对称性可知,检验的p值为上述两概率中小于1/2的那一个的2倍。例如

则。求出p值后,若p

基于秩次的非参数检验-中山医科大学(精)

第七章基于秩次的非参数检验 前言: 1. 问题的提出: 前面学习了连续型资料两组样本均数差异的假设检验方法:★小样本用t检验,条件是变量服从正态分布和方差齐。 ★大样本用Z检验(中心极限定理)。 如果是小样本,变量的分布不清、已知不服从正态分布或经数学转换后仍不服从正态分布时,如何检验两个样本或多个样本均数差异的统计学意义呢? ★需要一种不依赖于分布假定的检验方法,即非参数检验。 2. 基本概念: 前面介绍的检验方法首先假定变量服从特定的已知分布(如正态分布),然后对分布的参数(如均数)作检验。这类检验方法称为参数检验。

今天介绍的检验方法不对变量的分布作严格假定,检验不针对特定的参数,而是模糊地对变量分布的中心位置或分布形态作检验。这类检验称非参数检验,由于其对总体分布不作严格假定,所以又称任意分布检验。 (1)非参数检验的优点:a. 不受总体分布的限制,适用范围广。 b. 适宜定量模糊的变量和等级变量。 c. 方法简便易学。 (2)缺点:对于适合用参数检验的资料,如用非参数检验会造成信息的丢失,犯第Ⅱ类错误的概率增大,造成检验功效下降。 (3)基于秩次的非参数检验(秩和检验)的基本思想: 例:假设有一组观察值为1.1, 1.3, 1.7, 4.3, 11.4 。 显然这一变量不服从正态分布,观察值间差异较大,既不对称,标准差也较大。 如果将变量作转换,变成秩变量Y=1,2,3,4,5,则分布对称了,观察值间的差异也均匀了,标准差也减小了。 对秩和分布的中心位置(平均秩和)作检验,这就是秩和检验。

一.配对样本的符号秩检验(Wilcoxon signed rank test): 例7.1:研究出生先后的孪生兄弟智力是否存在差异? 表7.3 12对孪生兄弟智力测试结果 对子号兄的得分弟的得分兄弟得分差秩次 1 86 88 2 3 2 71 77 6 7 3 77 76 -1 -1.5 4 68 64 -4 -4 5 91 9 6 5 5.5 6 72 72 0 - 7 77 65 -12 -10 8 91 90 -1 -1.5 9 70 65 -5 -5.5 10 71 80 9 9 11 88 81 -7 -8 12 87 72 -15 -11

假设检验——非参数检验

假设检验(二)——非参数检验 假设检验的统计方法,从其统计假设的角度可分为两类:参数检验与非参数检验。上一节我们所介绍的Z 检验、t 检验,都是参数检验。它们的共同特点是总体分布正态,并满足某些总体参数的假定条件。参数检验就是要通过样本统计量去推断或估计总体参数。然而,在实践中我们常常会遇到一些问题的总体分布并不明确,或者总体参数的假设条件不成立,不能使用参数检 验。这一类问题的检验应该采用统计学中的另一类方法,即非参数检验。非参数检验是通过检验总体分布情况来实现对总体参数的推断。 非参数检验法与参数检验法相比,特点可以归纳如下: (1)非参数检验一般不需要严格的前提假设; (2)非参数检验特别适用于顺序资料; (3)非参数检验很适用于小样本,并且计算简单; (4)非参数检验法最大的不足是没能充分利用数据资料的全部信息; (5 )非参数检验法目前还不能用于处理因素间的交互作用。 非参数检验的方法很多,分别适用于各种特点的资料。本节将介绍几种常用的非参数检验方法。 一.2检验 2 检验主要用于对按属性分类的计数资料的分析,对于数据资料本身的分布形态不作任何假设,所以从一定的意义上来讲,它是一种检验计数数据分布状态的最常用的非参数检验方法。 2 2 检验的方法主要包括适合性检验和独立性检验。 (一)2检验概述 2 是实得数据与理论数据偏离程度的指标。其基本公式为: 2 ( f0 f e)(公式11—9) f e 式中,f0 为实际观察次数,f e 为理论次数。 分析公式可知,把实际观测次数和依据某种假设所期望的次数(或理论次数)的差数平方,除以理论次数,求出比值,再将n 个比值相加,其和就是2。观察公式可发现,如果实际观察

非参数假设检验

非参数假设检验 篇一:实验八非参数假设检验 实验八非参数假设检验 ? 单样本非参数检验 ? 两个独立样本非参数检验 ? 多个独立样本非参数检验 ? 两个配对样本非参数检验 ? 多个配对样本非参数检验 一、单样本非参数检验 选择:分析Analyze==>非参数检验Nonparametric Tests ==>…… 1、基本功能 对单个总体的分布形态进行推断的方法。 其中方法包括:卡方检验、二项分布检验、K-S检验以及变量值随机性检验等。 2、方法简介 卡方检验 ? 卡方检验可以进行拟合优度的检验,即可以根据样本数据,推断 总体分布与期望分布或某一理论分布是否存在显著差异,可检验样本是否服从正态、均匀、 Poisson等分布。

卡方检验是一种吻合性检验,通常适用于多项分类值总体分布的分析。 ? 零假设H0:样本来自的总体分布与期望分布或某一理论分布无显 著差异。 ? 操作步骤 1、选择分析Analyze==>非参数检验Nonparametric Tests ==>χ检验Chi-Square;2 2、将待检验的变量选择到Test Variable 框; 3、在Expected Range框选项中确定参与分析的样本范围,其中Get from data表示所有样本都参与分析;Use Specified Range 表示只有在取值范围内的样本才参与分析; 4、在Expected Values框中给出各个pi值,其中All categories equal表示所有子集的pi都相同,即期望分布为均匀分布;Value框后可依次输入pi值,并可单击进行增加、修改和删除。 二项分布检验 ? 二项分布检验是要通过样本数据检验样本来自的总体是否服从指 定的概率值为p的二项分布。 ? 零假设H0:样本来自的总体与指定的二项分布无显著差异。 ? 操作步骤 1、选择分析Analyze==>非参数检验Nonparametric Tests ==>

相关文档