文档库 最新最全的文档下载
当前位置:文档库 › 秩转换的非参数检验

秩转换的非参数检验

秩转换的非参数检验
秩转换的非参数检验

秩转换的非参数检验

基本概念

1.参数检验方法(parametric test):总体分布类型已知的条件下对其参数进行估计或检验。(如t-test, F- test)

2.非参数检验方法(nonparametric test):一种不依赖总体分布的具体形式,也不对参数进行估计或检验的统计方法来分析此类资料这种方法不受总体参数的影响,检验的是分布或分布位置,而不是参数。这样的检验方法称为非参数检验(如基于秩次的检验)

3.秩次(rank)):秩统计量,是指全部观察值按某种顺序排列的位序。在一定程度上

反映了等级的高低。

4.秩和(rank sum):同组秩次之和。在一定程度上反映了等级的分布位置

非参数检验的优缺点:

优点:无严格的条件限制,且多数非参数统计方法较为简单,易于理解和掌握,应用范

围广

缺点:对适宜参数统计的资料,若用非参数统计处理,常损失部分信息,降低检验效能。总结:因此对适合参数统计条件的资料或经变量变换后适合参数统计的资料,应最好用

参数统计。但资料不具备用参数统计的条件时,非参数统计是很有效的分析方法

适用范围:

(1)总体分布为偏态或分布形式未知的计量资料(尤其在n<30的情况下)。

(2)等级资料。

(3)个别数据偏大或数据的某一端无确定的数值。

(4)各总体方差不齐。

检验步骤

1、检验假设H0:差值的总体中位数Md=0 H1:差值的总体中位数Md≠0 α=0.05

2、求差值

3、编秩:依差值的绝对值从小到大编秩遇差值为0的对子,舍去不计,同时样本量减一遇差值绝对值相等则取平均秩,称为相同秩(ties)然后按差值的正负对秩次冠以正负号

4、求检验统计量:任取正秩和或负秩和为T

5、确定P值并做出统计推断(查附表9,内大外小原则)

正态近似法(n>50时)超出附表9范围,可用正态近似法作u检验。

两样本比较的秩和检验

基本思想:如果H0 成立,即两组分布位置相同,则A组的实际秩和应接近理论秩和n1(N+1)/2; (B组的实际秩和应接近理论秩和n2(N+1)/2).或相差不大,差值很大的概率应很小。如果相差较大,超出了预定的界值,则可认为H0不成立。

检验步骤

1、检验假设

H0:两总体中位数相等M1=M2

H1:两总体中位数不等M1≠M2 α=0.05

2、编秩:各组数据混合依观测值从小到大编秩遇观测值相等则取平均秩

3、求秩和:分别计算各组秩和

4、求检验统计量:

当n1=n2时,取秩和较小者为检验统计量

当n1≠n2时,取样本量较小的秩和为检验统计量

5、确定P值并做出统计推断(查附表10,内大外小原则)

多样本比较的秩和检验

本法利用多个样本的秩和推断各样本分别代表的总体的位置有无差别,相当于单因素方

差分析的非参数检验,此法适用于有序分类资料及不宜用参数检验的数值变量资料,该

法亦称为H检验

检验步骤

1、检验假设H0:各总体分布H1:各总体分布不全相同α=0.05

2、编秩:各组数据混合依观测值从小到大编秩遇观测值相等则取平均秩

3、求秩和:分别计算各组秩和

4、求检验统计量:

5、确定P值并做出统计推断(H近似服从ν=k?1的χ2分布)

配伍组比较的秩和检验

检验步骤

1、检验假设H0:各总体分布相同H1:各总体中位数不全相等α=0.05

2、编秩:同区组数据依观测值从小到大编秩遇观测值相等则取平均秩

3、求秩和:分别计算各处理组秩和

4、求检验统计量:

5、确定P值并做出统计推断(查附表12M界值表)

小结

1、参数统计方法:是一类依赖总体分布的具体形式的统计方法

2、非参数统计方法:是一类不依赖总体分布具体形式的统计方法

3、秩和检验的操作步骤

建立检验假设编秩次计算秩和

确定P值做出推断

秩和检验统计量判断:查表/正态近似

频数表同秩次较多,一般结果须用校正公式

多样本秩和检验如有意义,一般不做两两比较,如需比较,可采用bonferroni校正法

秩转换的非参数检验

秩转换的非参数检验 基本概念 1.参数检验方法(parametric test):总体分布类型已知的条件下对其参数进行估计或检验。(如t-test, F- test) 2.非参数检验方法(nonparametric test):一种不依赖总体分布的具体形式,也不对参数进行估计或检验的统计方法来分析此类资料这种方法不受总体参数的影响,检验的是分布或分布位置,而不是参数。这样的检验方法称为非参数检验(如基于秩次的检验) 3.秩次(rank)):秩统计量,是指全部观察值按某种顺序排列的位序。在一定程度上 反映了等级的高低。 4.秩和(rank sum):同组秩次之和。在一定程度上反映了等级的分布位置 非参数检验的优缺点: 优点:无严格的条件限制,且多数非参数统计方法较为简单,易于理解和掌握,应用范 围广 缺点:对适宜参数统计的资料,若用非参数统计处理,常损失部分信息,降低检验效能。总结:因此对适合参数统计条件的资料或经变量变换后适合参数统计的资料,应最好用 参数统计。但资料不具备用参数统计的条件时,非参数统计是很有效的分析方法 适用范围: (1)总体分布为偏态或分布形式未知的计量资料(尤其在n<30的情况下)。 (2)等级资料。 (3)个别数据偏大或数据的某一端无确定的数值。 (4)各总体方差不齐。 检验步骤 1、检验假设H0:差值的总体中位数Md=0 H1:差值的总体中位数Md≠0 α=0.05 2、求差值 3、编秩:依差值的绝对值从小到大编秩遇差值为0的对子,舍去不计,同时样本量减一遇差值绝对值相等则取平均秩,称为相同秩(ties)然后按差值的正负对秩次冠以正负号 4、求检验统计量:任取正秩和或负秩和为T 5、确定P值并做出统计推断(查附表9,内大外小原则)

基于秩次的非参数检验

基于秩次的非参数检验 1. 问题的提出 前面学习了连续型资料两组样本均数差异的假设检验方法: 小样本用t检验,条件是变量服从正态分布和方差齐;大样本用标准正态分布的Z检验。 如果是小样本,变量的分布不清,或者已知不服从正态分布或经变量转换后仍不服从正态分布时,如何检验两个样本或多个样本均数差异的统计学意义呢? 需要一种不依赖于分布假定的检验方法,即非参数检验。 2. 基本概念 前面介绍的检验方法首先假定分析变量服从特定的已知分布(如正态分布),然后对分布参数(如均数)作检验。

这类检验方法称参数检验(parametric test)。 今天介绍的检验方法不对变量的分布作严格假定,检验不针对特定的参数,而是模糊地对变量的中心位置或分布位置作比较。这类检验称非参数检验(nonparametric test),由于其对总体分布不作严格假定,所以又称任意分布检验。(distribution-free test) 非参数检验的优点: a.不受总体分布的限制,适用范围广。 b.适宜定量模糊的变量和等级变量。 c.方法简便易学。 缺点: 如果是精确测量的变量,并且已知服从或者经变量转换后服从某个特定分布(如正态分布),这时人为地将精确测

量值变成顺序的秩,将丢失部分信息,造成检验功效能下降。基于秩次非参数检验(秩和检验)的基本思想 假设变量X有观察值1.1, 1.3, 1.7, 4.3, 11.4 显然这变量不服从正态分布,观察值间差异较大,既不对称,标准差也较大。但如果将变量作转换,变成秩变量 Y=1,2,3,4,5,则分布对称了,观察值间的差异也均匀了,标准差也减小了。然后对这秩分布的中心位置(中位数)作检验,这就是秩和检验。 7.1 配对样本的符号秩检验(Wilcoxon signed rank test)例7.1为研究出生先后的孪生兄弟间智力是否存在差异,12对孪生兄弟测试的结果见表7.3。 表7.3 12对孪生兄弟测试结果

spss-非参数检验-K多个独立样本检验( Kruskal-Wallis检验)案例解析

spss-非参数检验-K多个独立样本检验( Kruskal-Wallis检验)案例解析 2011-09-19 15:09 最近经常失眠,好痛苦啊!大家有什么好的解决失眠的方法吗?希望知道的能够告诉我,谢谢啦,今天和大家一起探讨和分下一下SPSS-非参数检验--K个独立样本检验( Kruskal-Wallis检验)。 还是以SPSS教程为例: 假设:HO: 不同地区的儿童,身高分布是相同的 H1:不同地区的儿童,身高分布是不同的 不同地区儿童身高样本数据如下所示: 提示:此样本数为4个(北京,上海,成都,广州)每个样本的样本量(观察数)都为5个 即:K=4>3 n=5, 此时如果样本逐渐增大,呈现出自由度为K-1的平方的分布,

(即指:卡方检验) 点击“分析”——非参数检验——旧对话框——K个独立样本检验,进入如下界面: 将“周岁儿童身高”变量拖入右侧“检验变量列表”内,将“城市(CS)变量” 拖入“分组变量”内,点击“定义范围” 输入“最小值”和“最大值”(这里的变量类型必须为“数字型”)如果不是数字型,必须要先定义或者重新编码。 在“检验类型”下面选择“秩和检验”( Kruskal-Wallis检验)点击确定 运行结果如下所示:

对结果进行分析如下: 1:从“检验统计量a,b”表中可以看出:秩和统计量为:13.900 自由度为:3=k-1=4-1 下面来看看“秩和统计量”的计算过程,如下所示: 假设“秩和统计量”为 kw 那么:

其中:n+1/2 为全体样本的“秩平均” Ri./ni 为第i个样本的秩平均 Ri.代表第i个样本的秩和, ni代表第i个样本的观察数) 最后得到的公式为: 北京地区的“秩和”为:秩平均*观察数(N) = 14.4*5=72 上海地区的“秩和”为:8.2*5=41 成都地区的“秩和”为:15.8*5=79 广州地区的“秩和”为:3.6*5=18

第十章 基于秩次的非参数检验

第十章基于秩次的非参数检验习题 一、选择题 1.两小样本均数比较,方差不齐时,下列说法不正确的是(). A. 采用秩和检验 B. 采用t′检验 C. 仍用t检验 D. 变量变换后再作决定 E. 要结合正态性检验结果方能作出决定 H是(). 2. 两样本秩和检验的 A. 两样本秩和相等 B. 两总体分布相同 C. 两样本分布相同 D. 两总体秩和相等 E. 两总体均数相等 3. 在统计检验中是否选用非参数统计方法(). A. 要根据研究目的和数据特征作决定 B. 可在算出几个统计量和得出初步结论后进行选择 C. 要看哪个统计结论符合专业理论 D. 要看哪个P值更小 E. 既然非参数统计对资料没有严格的要求,在任何情况下均能直接使用 4. 配对样本差值的Wilcoxon符号秩和检验,确定P值的方法是(). A. T越大,P值越小 B.T越大,P值越大 C. T值在界值范围内,P值小于相应的α D. T值在界值范围内,P值大于相应的α E. T值在界值范围上,P值大于相应的α 5. 成组设计两样本比较的秩和检验,其检验统计量T是(). A. 为了查T界值表方便,一般以秩和较小者为T B. 为了查T界值表方便,一般以秩和较大者为T C. 为了查T界值表方便,一般以例数较小者秩和为T D. 为了查T界值表方便,一般以例数较大者秩和为T E. 当两样本例数不等时,任取一样本的秩和为T都可以查T界值表

多样本定量资料比较,当分布类型不清时应选择(). A. 方差分析 B. t检验 C. Z检验 D. Kruskal-Wallis检验 E. Wilcoxon检验 6. 多组样本比较的Kruskal-Wallis检验中,当相同秩次较多时,如果用H值而不用校正后 H值,则会(). 的 c A.提高检验的灵敏度 B.把一些无差别的总体推断成有差别 C. 把一些有差别的总体推断成无差别 D.Ⅰ、Ⅱ类错误概率不变 E. 以上说法均不对 二、简答题 1. 对于完全随机设计两样本定量资料的比较,如何选择统计方法? 2. 为什么在秩和检验编秩次时不同组间出现相同数据要给予“平均秩次”,而同一组的相同数据不必计算“平均秩次”? 3. 多组定量资料比较时,统计处理的基本流程是什么?

SPSS-非参数检验—两独立样本检验_案例解析

SPSS-非参数检验—两独立样本检验案例解析 2011-09-16 16:29 好想睡觉,写一篇博文,希望可以减少睡意,今天跟大家研究和分享一下:spss非参数检验——两独立样本检验, 我还是引用教程里面的案例,以:一种产品有两种不同的工艺生产方法,那他们的使用寿命分别是否相同 下面进行假设:1:一种产品两种不同的工艺生产方法,他们的使用寿命分布是相同的 2:一种产品两种不同的工艺生产方法,他们的使用寿命分布是不相同的 我们采用SPSS进行分析,数据如下所示: 点击“分析”选择“非参数检验” 再选择“旧对话框——2个独立样本检 验如下所示:

在检验类型下面选择"Mann-Whitney U “ 检验类型(Mann-whitney u 检验等同于对两组数据的Wilcoxon秩和检验和Kruskal-Wallis检验,主要检验两个样本的总体在某些位置上是否相等。) 两种工艺类型分别为:甲种工艺和乙种工艺分别用定义值为“1” 和 “2”将“工艺类型”变量拖入“分组变量”下拉框内,点击“定义组”按钮,在组别1 和组别 2 中分别填入 1和2,点击继续按钮 选择“使用寿命”作为“检验变量”点击确定,得到分析结果如下:

下面对结果,我将进行详细分解: 1:N 代表变量个数,甲种工艺秩和为 80 乙种工艺秩和为 40, 下面来分析“秩和”这个结果如何出来的 第一步:我们将”使用寿命“这个变量按照“从小到大”的顺序进行排序,得到如下结果:

得到数据如下: 甲种工 艺: 661 669 675 679 682 692 693 乙种工艺: 646 649 650 651 652 662 663 672 我们将“甲种工艺”和“乙种工艺”两组数据进行合并排序,并且对两组数据进行“秩次排序”分别用“序号”代替以上数据 序号分别为: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 得到以下结果: 甲种工艺为: 6 9 11 12 13 14 15 (加起来刚好等于80)

秩转换的非参数检验

非参数检验是相对于参数检验而言地. 参数检验——如果总体分布为已知地数学形式,对其总体参数作假设检验. 计量资料——正态分布——假设检验——检验、检验 计量资料:不满足参数检验条件地假设检验方法,一变量变换,二非参数检验(等级资料)非参数检验对总体分布不作严格假定(任意分布检验) 秩转换 ————推断一个总体表达分布位置地中位数(非参数)和已知、两个或多个总体地分布是否有差别. 秩转换地非参数检验时先将数值变量资料自小到大,或等级资料从弱到强转换成秩后,再计算检验统计量,其特点是假设检验地结果对总体分布地形状差别不敏感,只对总体分布地位置差别敏感.文档来自于网络搜索 配对样本比较地符号秩检验 符号秩检验符号秩和检验 ——用于配对样本差值地中位数和比较 ——用于单个样本中位数和总体中位数比较 配对样本差值地中位数和比较———————<——————————— ——目地是推断配对样本差值地总体中位数是否和有差别 ——即推断配对地两个相关样本所来自地两个总体中位数是否有差别. 平均秩——相同秩—————————————>——————————— 单个样本中位数和总体中位数比较——————————————————— ——目地是推断样本所来自地总体中位数和某个已知地总体中位数是否有差别 ——用样本各变量值和地差值,即推断差值地总体中为数和是否有差别 本法地原理 ()界值表制作地原理 ()正态近似法地原理 第二节两个独立样本比较地秩和检验———————— 秩和检验() ————用于推断计量资料或等级资料地两个独立样本所来自地两个总体分布是否有差别. ——————推断两个总体分布地位置是否有差别. 原始数据地两样本比较————计量资料为原始数据 频数表资料和等级资料地两样本比较 ————计量资料为频数表资料,是按数量区间分组 ————等级资料是按等级分组 本法地原理 界值表制作地原理 正态近似法地原理 、检验 第三节完全随机设计多个样本比较地检验 一、多个独立样本比较地检验 ————用于推断计量资料或等级资料地多个独立样本所来自地多个总体分布是否有差别. 原始数据地多个样本比较————计数资料为原始数据—————————— 频数表资料和等级资料地多个样本比较 ————计量资料为频数表资料,是按数量区间分组 ————等级资料是按等级分组 本法地原理 界值表制作地原理 地近似法原理

SPSS学习笔记非参数检验

学习必备欢迎下载 总体分布未知,不会涉及有关总体分布的参数 1.单样本非参数检验:卡方分布,二项分布,K-S检验,变量值随机性检验 2.两独立样本非参数检验:两独立样本所来自的总体分布是否存在显著差异 3.两配对样本非参数检验 4.多独立样本非参数检验 5.多配对样本非参数检验 得到样本数据后,判断总体分布:直方图、P-P图、Q-Q图,或非参数检验 1.1 卡方检验: 根据样本数据,推断总体分布于期望分布或某一理论分布是否存在显著性差异,是一种吻合性检验,离散型数据。 原假设:样本来自总体的分布与期望分布或某一理论分布无显著性差异。 Eg:心脏病猝死人数与日期。 1.2二项分布检验: 检验总体是否服从指定概率为P的二项分布, 原假设:样本来自的总体与指定的二项分布无显著差异。 用于:二值型数据,性别,是否合格,是否为三好学生,硬币正反面等,用01表示。 注:检验概率值(检验比例) 1.3单样本K-S检验: 样本来自的总体是否与某一理论分布有显著差异,是一种拟合优度的检验方法。 用于:探索连续性变量的分布。正态分布(normal)、均匀分布(uniform)、指数分布(ex.)、泊松分布。 原假设:样本来自的总体与指定的理论分布无显著差异。 另外,对于数据量很大的连续型变量,可以用图形直观判断。 P-P图:数据与理论分布一致时,各个数据点应落在对角线上。 Q-Q图:如果数据与理论分布无显著差异,点应分布在0横线附近。(没找到啊?) 2 Test type: Mann-Whitney: 秩:变量值排序的名次或位置 K-S检验: 游程检验Wald-wolfwitz Runs 极端反应检验Moses Extreme Reactions:踢出极端值前后P值变化情况,是否踢出。注:不同分析方法对同批数据的分析,结论可能不相同,要反复进行探索性分析,还要注意方法本身侧重点上的差异性。 4 中位数检验强调位置,Kruskal-Wallis检验侧重分析平均秩,Jonckheere比较同相对数。 ~~~~不懂~ 5 mean rank 平均秩 P值说明平均秩是否存在显著差异 Kendall检验中,W协同系数接近于1时,说明是一致的。

第十章基于秩次的非参数检验

第十章 1. 两样本定量资料比较的假设检验,首先应考虑。 A. 用t 检验 B. 用秩和检验 C. t检验与秩和检验 D 资料符合t检验还是秩和检验的条件 E. X2检验 2.在作等级资料的比较时,宜用。 A. t 检验 B. X2检验 C. 秩和检验 D. F检验 E. 方差分析 3. 在作两样本均数比较时,已知均小于30,总体方差不齐且呈极度偏峰的资料 宜用。 A. t ′检验 B. t 检验 C.U检验 D. 秩和检验 E t ′检验和秩和检验均可 4.非参数统计的应用条件是。 A. 样本数据来自正态总体 B.若两组比较,要求两样本方差相等 C.总体分布类型未知 D.要求样本例数很大 E.总体属于某种已知的分布类型 5.在进行成组设计两样本秩和检验时,以下检验假设中正确的是。 A. H O两样本对应的总体均数相同 B. H O两样本均数相同 C. H O两样本对应的总体分布位置相同 D. H O两样本的中位数相同 E. H O两样本差值的中位数相同 6.配对设计的符号检验的基本思路是:如果检验假设成立,则对样本来 说。 A.正秩和的绝对值与负秩和的绝对值不会相差很大 B.中的秩和为零 C.正秩和的绝对值与负绝对值不会相差很大 D.正秩和的绝对值与负绝对值相等 E.符号相同,按顺序编秩 7.秩和检验和t 检验相比,其优点是。 A.计算更简便 B.公式更为合理 C. 检验效能高 D.抽样误差小 E.不受分布限制 8.秩和检验是一种。

A.U检验 B. X2检验 C.F检验 D.非参数检验 E.以上都不对 9.非参数统计不适合。 A.正态分布且方差齐的资料 B.偏态分布的资料 C.半定量资料 D.有过大值或小值的资料 E.以上均不可 11.不同人群血清反应(- + ++)资料比较宜用: A.t检验 B.X2检验 C.秩和检验 D.F检验 E. Z检验 12.成组设计两样本比较的秩和检验,其检验统计量T是。 A.以秩和较小者为T B. 以秩和较大者为T C.以例数较小者秩和为T D. 以例数较大者秩和为T E.当两样本例数不等时,科任区一样本的秩和为T 13.请指出下列五个秩和检验的结果哪个是错误的。 A.配对计量资料n=12,T+=7,T-=71,查得T0.05=13~65,P<0.05 B.配对计量资料n=8,T+=12,T-=24,查得T0.05=3~33,P<0.05 C.两组计量资料n1=12, n2=10,T1=173,T2=80,查得T0.05=84~146,P<0.05 D.两组计量资料n1=10, n2=10,T1=55,T2=155,查得T0.05=78~132,P<0.05 E.两组计量资料n1=9, n2=13,T1=58,T2=195,查得T0.05=73~134,P<0.05 14.配对设计的符号秩合检验中,其检验假设H0为。 A 差值总体均数等于零即u d=0 B 差值总体均数不等于零即u d≠0 C 差值总体中倍数等于零即M d=0 D 差值总体中位数不等于零即M d≠0 E 以上都不对 二.是非题: 1.两样本比较的秩和检验,当n1>10,n2-n1>10时采用检验属于参数检验。 ()2.完全随机设计多组独立样本比较的秩和检验得P<0.05,X需进行两两比较。 ()3.非参数检验有称任意分布检验,其意义为与任何分布无关。 ( )

SPSS的参数检验和非参数检验

S P S S的参数检验和非 参数检验 公司内部档案编码:[OPPTR-OPPT28-OPPTL98-OPPNN08]

实验报告 SPSS的参数检验和非参数检验 学期:_2013__至2013_ 第_1_学期 课程名称:_数学建模专业:数学 实验项目__SPSS的参数检验和非参数检验实验成绩:_____ 一、实验目的及要求 熟练掌握t检验及其结果分析。熟练掌握单样本、两独立样本、多独立样本的非参数检验及各种方法的适用范围,能对结果给出准确分析。 二、实验内容 使用指定的数据按实验教材完成相关的操作。 1、给幼鼠喂以不同的饲料,用以下两种方法设计实验: 方式1:同一鼠喂不同的饲料所测得的体内钙留存量数据如下: 方式2:甲组有12只喂饲料1,乙组有9只喂饲料2,所测得的钙留存量数据如下:

请选用恰当方法对上述两种方式所获得的数据进行分析,研究不同饲料是否使幼鼠体内钙的留存量有显着不同。 2、为分析大众对牛奶品牌是否具有偏好,随机挑选超市收集其周一至 周六各天三种品牌牛奶的日销售额数据,如下表所示: 请选用恰当的非参数检验方法,以恰当形式组织上述数据进行分析,并说明分析结论。 实验报告附页 三、实验步骤 (一) 方式1: 1、打开SPSS软件,根据所给表格录入数据,建立数据文件; 2、选择菜单Analyze-Compare means-Paired-Samples T Test,出现窗口; 3、把检验变量饲料1,饲料2 选择到Paired Variables框,单击OK。方式2: 1、打开SPSS软件,根据所给表格录入数据,建立数据文件; 2、选择菜单Analyze-Compare means-Independent-Samples T Test,出现窗口 3、选择检验变量饲料到Test Variable(s)框中。 4、选择总体标志变量组号到Grouping Variables框中。 5、单击Define Groups按钮定义两总体的标志值1、2,单击OK。

基于秩次的非参数检验

第七章基于秩次的非参数检验 前言: 1. 问题的提出: 前面学习了连续型资料两组样本均数差异的假设检验方法:★小样本用t检验,条件是变量服从正态分布和方差齐。 ★大样本用Z检验(中心极限定理)。 如果是小样本,变量的分布不清、已知不服从正态分布或经数学转换后仍不服从正态分布时,如何检验两个样本或多个样本均数差异的统计学意义呢? ★需要一种不依赖于分布假定的检验方法,即非参数检验。 2. 基本概念: 前面介绍的检验方法首先假定变量服从特定的已知分布(如正态分布),然后对分布的参数(如均数)作检验。这类检验方法称为参数检验。

今天介绍的检验方法不对变量的分布作严格假定,检验不针对特定的参数,而是模糊地对变量分布的中心位置或分布形态作检验。这类检验称非参数检验,由于其对总体分布不作严格假定,所以又称任意分布检验。 (1)非参数检验的优点:a. 不受总体分布的限制,适用范围广。 b. 适宜定量模糊的变量和等级变量。 c. 方法简便易学。 (2)缺点:对于适合用参数检验的资料,如用非参数检验会造成信息的丢失,犯第Ⅱ类错误的概率增大,造成检验功效下降。 (3)基于秩次的非参数检验(秩和检验)的基本思想: 例:假设有一组观察值为1.1, 1.3, 1.7, 4.3, 11.4 。 显然这一变量不服从正态分布,观察值间差异较大,既不对称,标准差也较大。 如果将变量作转换,变成秩变量Y=1,2,3,4,5,则分布对称了,观察值间的差异也均匀了,标准差也减小了。 对秩和分布的中心位置(平均秩和)作检验,这就是秩和检验。

一.配对样本的符号秩检验(Wilcoxon signed rank test): 例7.1:研究出生先后的孪生兄弟智力是否存在差异? 表7.3 12对孪生兄弟智力测试结果 对子号兄的得分弟的得分兄弟得分差秩次 1 86 88 2 3 2 71 77 6 7 3 77 76 -1 -1.5 4 68 64 -4 -4 5 91 9 6 5 5.5 6 72 72 0 - 7 77 65 -12 -10 8 91 90 -1 -1.5 9 70 65 -5 -5.5 10 71 80 9 9 11 88 81 -7 -8 12 87 72 -15 -11

非参数检验的SPSS操作

第八节非参数检验的SPSS操作 前面一章介绍的二项分布的比率检验、配合度检验——卡方检验和1-Sample K-S检验等都属于非参数检验。这一节我们主要结合前面参数假设检验一章讲过的t检验以及方差分析一章讲过的方差分析,来进一步分析,当参数检验的前提条件不满足时,两个样本和多个样本平均数差异的SPSS 操作方法。 一、两个独立样本的差异显著性检验 两独立样本的的差异显著性检验只有在满足如下条件时才能进行T检验:变量为正态分布的连续测量数据。若数据不满足这样的条件,强行进行T检验容易造成错误的结论。在数据不能满足这种参数检验的条件下,我们可以选择非参数检验方法进行。与两独立样本差异显著性检验相对应的方法可以在SPSS主菜单Analyze / Nonparametric Tests / 2 Independent Samples…中得到。 1.数据 采用本章第一节中例2的数据(数据文件“9-4-1.sav”),具体介绍操作过程。 2.理论分析 对于数据文件9-4-1.sav中的数据,目的是检验男女生之间注意稳定性是否存在显著差异,注意稳定性测量的结果虽然是测量数据但是从总体上来看不满足正态分布的前提假设,另外不同性别的学生可以看成是两组独立的样本,因此对上述资料的检验可以用非参数的独立样本的检验方法。 2.操作过程 (1)在SPSS主菜单中选择Analyze / Nonparametric Tests / 2 Independent Samples…得到两个独立样本非参数检验的主对话框(图9-1),把因变量atten选入到检验变量表列(Test Independent-Sample Tests)中去,把gender选到分组变量(Grouping Variable)中,并单击Define Groups…,在随后打开的对话框中分别键入1与2,单击Continue回到主对话框如图9-1所示。在Test Type中有四个可选项,其中最常用的是第一种方法Mann-Whitney U(又称秩和检验法)。

spss实验报告—非参数检验

实验报告 ——(非参数检验) 实验目的: 1、学会使用SPSS软件进行非参数检验。 2、熟悉非参数检验的概念及适用范围,掌握常见的秩和检验计算方法。 实验内容: 1、某公司准备推出一个新产品,但产品名称还没有正式确定,决定进行抽样调 查,在受访200人中,52人喜欢A名称,61人喜欢B名称,87人喜欢C 名称,请问ABC三种名称受欢迎的程度有无差别?(数据表自建) SPSS计算结果如下: 此题为总体分布的卡方检验。 零假设:样本来自总体分布形态和期望分布没有显著差异。即ABC三种名称受欢迎的程度无差别,分布形态为1:1:1,呈均匀分布。 观察结果,上表为200个观察数据对A、B、C三个名称(分别对应1,2,3)的喜爱的期望频数以及实际观察频数和期望频数的差。从下表中可以看出相伴概

率值为0.007小于显著性水平0.05,因此拒绝零假设,认为样本来自的总体分布与制定的期望分布有显著差异,即A、B、C三种名称受欢迎的程度有差异。 2、某村庄发生了一起集体食物中毒事件,经过调查,发现当地居民是直接饮用 河水,研究者怀疑是河水污染所致,县按照可疑污染源的大致范围调查了沿河居民的中毒情况,河边33户有成员中毒(+)和均未中毒(-)的家庭分布如下:(案例数据run.sav) -+++*++++-+++-+++++----++----+---- 毒源 问:中毒与饮水是否有关? SPSS计算结果如下: 此题为单样本变量值随机检验 零假设:总体某变量的变量值是随机出现的。即中毒的家庭沿河分布的情况随机分布,与饮水无关。 相伴概率为0.036,小于显著性水平0.05,拒绝零假设,因此中毒与饮水有关。 3、某试验室用小白鼠观察某种抗癌新药的疗效,两组各10只小白鼠,以生存日数作为观察指标,试验结果如下,案例数据集为:npara1.sav,问两组小白鼠生存日数有无差别。 试验组:24 26 27 30 32 34 36 40 60 天以上 对照组:4 6 7 9 10 10 12 13 16 16 SPSS计算结果如下: 此题为两独立样本非参数检验。 (1)两独立样本Mann-Whitney U检验:

SPSS非参数检验之一卡方检验

SPSS 中非参数检验之一:总体分布的卡方(Chi-square )检验 在得到一批样本数据后,人们往往希望从中得到样本所来自的总体的分布形态是否和某种特定分布相拟合。这可以通过绘制样本数据直方图的方法来进行粗略的判断。如果需要进行比较准确的判断,则需要使用非参数检验的方法。其中总体分布的卡方检验(也记为χ2检验)就是一种比较好的方法。 一、定义 总体分布的卡方检验适用于配合度检验,是根据样本数据的实际频数推断总体分布与期望分布或理论分布是否有显着差异。它的零假设H0:样本来自的总体分布形态和期望分布或某一理论分布没有显着差异。 总体分布的卡方检验的原理是:如果从一个随机变量尤中随机抽取若干个观察样本,这些观察样本落在X 的k 个互不相交的子集中的观察频数服从一个多项分布,这个多项分布当k 趋于无穷时,就近似服从X 的总体分布。 因此,假设样本来自的总体服从某个期望分布或理论分布集的实际观察频数同时获得样本数据各子集的实际观察频数,并依据下面的公式计算统计量Q () 2 1 k i i i i O E Q E =-=∑ 其中,Oi 表示观察频数;Ei 表示期望频数或理论频数。可见Q 值越大,表示观察频数和理论频数越不接近;Q 值越小,说明观察频数和理论频数越接近。SPSS 将自动计算Q 统计量,由于Q 统计量服从K-1个自由度的X

平方分布,因此SPSS将根据X平方分布表给出Q统计量所对应的相伴概率值。 如果相伴概率小于或等于用户的显着性水平,则应拒绝零假设H0,认为样本来自的总体分布形态与期望分布或理论分布存在显着差异;如果相伴概率值大于显着性水平,则不能拒绝零假设HO,认为样本来自的总体分布形态与期望分布或理论分布不存在显着差异。 因此,总体分布的卡方检验是一种吻合性检验,比较适用于一个因素的多项分类数据分析。总体分布的卡方检验的数据是实际收集到的样本数据,而非频数数据。 二、实例 某地一周内各日患忧郁症的人数分布如下表所示,请检验一周内各日人们忧郁数是否满足1:1:2:2:1:1:1。 实施步骤: 1、打开SPSS ,导入数据。

spss-非参数检验-K多个独立样本检验(-Kruskal-Wallis检验)案例解析

spss-非参数检验-K多个独立样本检验(-Kruskal-Wallis检验)案例解析

spss-非参数检验-K多个独立样本检验( Kruskal-Wallis检验)案例解析2011-09-19 15:09 最近经常失眠,好痛苦啊!大家有什么好的解决失眠的方法吗?希望知道的能够告诉我,谢谢啦,今天和大家一起探讨和分下一下SPSS-非参数检验--K 个独立样本检验( Kruskal-Wallis检验)。 还是以SPSS教程为例: 假设:HO: 不同地区的儿童,身高分布是相同的 H1:不同地区的儿童,身高分布是不同的 不同地区儿童身高样本数据如下所示: 提示:此样本数为4个(北京,上海,成都,广州)每个样本的样本量(观察数)都为5个 即:K=4>3 n=5, 此时如果样本逐渐增大,呈现出自由度为K-1的平方的

分布,(即指:卡方检验) 点击“分析”——非参数检验——旧对话框——K个独立样本检验,进入如下界面: 将“周岁儿童身高”变量拖入右侧“检验变量列表”内,将“城市(CS)变量” 拖入“分组变量”内,点击“定义范围” 输入“最小值”和“最大值”(这里的变量类型必须为“数字型”)如果不是数字型,必须要先定义或者重新编码。 在“检验类型”下面选择“秩和检验”( Kruskal-Wallis检验)点击确定 运行结果如下所示:

对结果进行分析如下: 1:从“检验统计量a,b”表中可以看出:秩和统计量为:13.900 自由度为:3=k-1=4-1 下面来看看“秩和统计量”的计算过程,如下所示: 假设“秩和统计量”为 kw 那么:

其中:n+1/2 为全体样本的“秩平均” Ri./ni 为第i个样本的秩平均 Ri.代表第i个样本的秩和, ni代表第i个样本的观察数) 最后得到的公式为: 北京地区的“秩和”为:秩平均*观察数(N) = 14.4*5=72 上海地区的“秩和”为:8.2*5=41 成都地区的“秩和”为:15.8*5=79 广州地区的“秩和”为:3.6*5=18

非参数检验 SPSS操作

非参数检验的SPSS操作 前面一章介绍的二项分布的比率检验、配合度检验——卡方检验和1-Sample K-S检验等都属于非参数检验。这一节我们主要结合前面参数假设检验一章讲过的t检验以及方差分析一章讲过的方差分析,来进一步分析,当参数检验的前提条件不满足时,两个样本和多个样本平均数差异的SPSS操作方法。 一、两个独立样本的差异显著性检验 两独立样本的的差异显著性检验只有在满足如下条件时才能进行T检验:变量为正态分布的连续测量数据。若数据不满足这样的条件,强行进行T检验容易造成错误的结论。在数据不能满足这种参数检验的条件下,我们可以选择非参数检验方法进行。与两独立样本差异显著性检验相对应的方法可以在SPSS主菜单Analyze / Nonparametric Tests / 2 Independent Samples…中得到。 1.数据 采用本章第一节中例2的数据(数据文件“9-4-1.sav”),具体介绍操作过程。 2.理论分析 对于数据文件9-4-1.sav中的数据,目的是检验男女生之间注意稳定性是否存在显著差异,注意稳定性测量的结果虽然是测量数据但是从总体上来看不满足正态分布的前提假设,另外不同性别的学生可以看成是两组独立的样本,因此对上述资料的检验可以用非参数的独立样本的检验方法。 2.操作过程 (1)在SPSS主菜单中选择Analyze / Nonparametric Tests / 2 Independent Samples…得到两个独立样本非参数检验的主对话框(图9-1),把因变量atten选入到检验变量表列(Test Independent-Sample

SPSS的参数检验和非参数检验

实验二 SPSS的参数检验和非参数检验 (验证性实验 4学时) 1、目的要求:熟练掌握t检验及其结果分析。熟练掌握单样本、两独立 样本、多独立样本的非参数检验及各种方法的适用范围,能对结果给 出准确分析。 2、实验内容:使用指定的数据按实验教材完成相关的操作。 3、主要仪器设备:计算机。 练习: 1、给幼鼠喂以不同的饲料,用以下两种方法设计实验: 鼠体内钙的留存量有显著不同。 2、为分析大众对牛奶品牌是否具有偏好,随机挑选超市收集其周一至周六各天 并说明分析结论。 1 参数检验概述 假设检验的基本思想 .事先对总体参数或分布形式作出某种假设,然后利用样本信息来判断原假设是否成立; .采用逻辑上的反证法,依据统计上的小概率原理。

2 单样本的T检验 2.1检验目的: ?检验单个变量的均值是否与给定的常数(总体均值)之间是否存在显著差异。如:分析学生的IQ平均分是否为100分;大学生考研率是否为5%。 ?要求样本来自的总体服从或近似服从正态分布。 2.2 单样本T检验的实现思路 ?提出原假设: ?计算检验统计量和概率P值 ●给定显著性水平与p值做比较:如果p值小于显著性水平,小概率事件在 一次实验中发生,则我们应该拒绝原假设,反之就不能拒绝原假设。 2.3 单样本t检验的基本操作步骤 1、选择选项Analyze-Compare means-One-Samples T test,出现窗口: 2、在Test Value框中输入检验值。 3、单击Option按钮定义其他选项。Option选项用来指定缺失值的处理方法。其中,Exclude cases analysis by analysis表示计算时涉及的变量上有缺失值,则剔除在该变量上为缺失值的个案;Exclude cases listwise表示剔除所有在任意变量上含有缺失值的个案后再进行分析。可见,较第二种方式,第一种处理方式较充分地利用了样本数据。在后面的分析方法中,SPSS对缺失值的处理方法与此相同,不再赘述。另外,还可以输出默认95%的置信区间。 至此,SPSS将自动计算t统计量和对应的概率p值。 3 两独立样本的T检验 3.1 两独立样本T检验的目的 ?利用来自两个总体的独立样本,推断两个总体的均值是否存在显著性差异; ?两独立样本的样本容量可以相等,也可以不相等; ?样本来自的总体服从或近似服从正态分布。 方差齐性检验(Levene F方法): ?计算两组样本的均值 ●计算各个样本与本组均值的平均离差绝对值; ●利用单因素方差分析推断两独立总体平均离差绝对值是否有显著差异。 ●在对两独立样本进行T检验时,两组样本方差相等和不等时使用的计算t 值的公式不同,所以首先进行方差F检验。用户需要根据F检验的结果自己判断选择t检验输出中的哪个结果,得出最后结论。如果推断两总体方差相等则看方差相等的T检验值和P值,如果推断两总体方差不相等则看方差不相等的T检验值和P值。 3.2 两独立样本T检验的实现思路 ?提出原假设:两总体均值不存在显著差异: ●计算统计量和P值:首先利用F检验确定两个总体的方差是否相等;然后 再选择合适的T统计量计算观测值和概率P值; ●根据显著性水平和概率P值进行统计决策。 3.3 两独立样本t检验的基本操作步骤 进行两独立样本t检验之前,正确地组织数据是一个非常关键的任务。SPSS 要求将两组样本数据存放在一个SPSS变量中,同时,为区分哪些样本来自哪个

相关文档
相关文档 最新文档