第七章 假设检验
【思考与练习】
一、思考题
1.解释零假设与备择假设的含义。 2.简述假设检验的基本步骤。
3.举例说明单侧检验与双侧检验的选择。
4.解释I 型错误、II 型错误和检验效能,并说明它们之间的关系。 5.简述假设检验与置信区间估计的联系。
二、案例辨析题
为了比较非洛地平与常规药物治疗高血压的疗效差异,某医生随机抽取100名原发性高血压患者,分别测量患者接受非洛地平治疗前后的血压差值,计算得其21.5X =mmHg ,8.0S =mmHg 。现已知常规药能使高血压患者的血压平均下降20mmHg 。该医生对其进行了t 检验,零假设是μμ0=,备择假设是μμ0≠,检验水准0.05α=。计算得 1.875t =,按100ν=查t 界值表,得0.10P 0.05<<,故接受0H ,认为非洛地平与常规药物治疗高血压的疗效无差别。你认为该结论正确吗?请说明理由。
三、最佳选择题
1.比较两药疗效时,下列可作单侧检验的情形是
A .已知A 药与
B 药均有效 B .已知A 药与B 药均无效
C .已知A 药不会优于B 药
D .已知A 药与B 药差不多好
E .不知A 药好还是B 药好 2.假设检验的基本步骤是
A .计算检验统计量、确定P 值、做出推断结论
B .建立无效假设、建立备择假设、确定检验水准
C .建立无效假设、计算检验统计量、确定P 值
D .确定单侧检验或双侧检验、选择t 检验或Z 检验、估计I 型错误概率和II 型错误概率
E.建立检验假设和确定检验水准、计算检验统计量、确定P值并做出统计推断3.假设检验时,若检验水准α=0.05,则下列关于检验结果的说法正确的是A.若P<0.05,则不拒绝
H,此时可能犯II型错误
B.若P<0.05,则拒绝
H,此时可能犯II型错误
C.若P<0.05,则不拒绝
H,此时可能犯I型错误
D.若P>0.05,则拒绝
H,此时可能犯I型错误
E.若P>0.05,则不拒绝
H,此时可能犯II型错误
4.假设检验时,所犯II型错误概率最小的检验水准α为
A.0.01 B.0.025 C.0.05
D.0.10 E.0.20
5.有关两样本均数的比较,检验统计量t越大
A.说明总体参数差别越大
B.说明总体参数差别越小
C.说明样本统计量差别越大
D.说明样本统计量差别越小
E.越有理由认为两总体参数不等
6.在样本均数与已知总体均数比较的t检验中,结果 3.24
t=,
0.05/2,2.086
t
ν
=,
0.01/2,2.845
t
ν=,按检验水准0.05
α=,可认为此样本均数
A.与该已知总体均数不同
B.与该已知总体均数差异很大
C.所对应的总体均数与已知总体均数差异很大
D.所对应的总体均数与已知总体均数相同
E.所对应的总体均数与已知总体均数不同
7.下列关于单侧检验和双侧检验的说法正确的是
A.采用单侧检验更好
B.采用双侧检验更好
C.采用单、双侧检验都无所谓
D.根据专业知识确定采用单侧检验还是双侧检验
E.根据检验统计量的计算结果确定采用单侧检验还是双侧检验
8.样本均数与已知总体均数比较的t检验时,P值越小说明
A.样本均数与已知总体均数差别越小
B.样本均数与已知总体均数差别越大
C.样本所对应的总体均数与已知总体均数差别越大
D.越有理由认为样本均数与已知总体均数不同
E.越有理由认为样本所对应的总体均数与已知总体均数不同
9.下列关于I型错误概率α和II型错误概率β的说法不正确的是
A.当样本量确定时,α越小,β越大
B.当样本量确定时,α越大,β越小
C.欲减小犯I型错误的概率,可取较小α
D.欲减小犯II型错误的概率,可取较大α
E.若样本含量足够大,可同时避免犯这两型错误
四、综合分析题
1.已知服用某种营养素一个疗程后,受试者某项生化指标平均增加52个单位。一家研究所对该营养素进行改进后,随机抽取受试者36名服用新产品一个疗程,测得该生化指标平均增加了53个单位,标准差为2.0个单位。问该营养素新产品是否比旧产品的效果好?
2.经研究显示,汉族正常成年男性无名指长度的均数为10.1cm。某医生记录了某地区12名汉族正常成年男性无名指长度(cm)资料如下:
10.05 10.33 10.49 10.00 9.89 10.15 9.52 10.33 10.16 10.37 10.11 10.27
问该地区正常成年男性无名指长度是否大于一般汉族成年男性?
3.将18名某病患者随机分成两组,分别用药物A或药物B治疗,观察治疗前后血红蛋白含量(g/L)的变化,结果见表7-1。
表7-1 某病患者经A、B两药治疗前后的血红蛋白含量(g/L)
A 病人号 1 2 3 4 5 6 7 8 9 治疗前36 44 53 56 62 58 45 43 26
药 治疗后 47 62 68 87 73 58 69 49 50 B 药
病人号 1 2 3 4 5 6 7 8 9 治疗前 56 49 67 58 73 40 48 36 29 治疗后
81
86
70
62
84
76
58
49
60
问:(1) A 、B 两药是否都有效? (2) A 、B 两药的疗效是否有差别?
【习题解析】
一、思考题
1.零假设又称无效假设,记为0H ,表示其差异是由抽样误差引起的;备择假设又称对立假设,记为1H ,表示其差异是因为比较的对象之间存在本质不同造成的。
2.假设检验的基本步骤如下:
(1)建立检验假设,确定检验水准; (2)计算检验统计量; (3)确定P 值,做出统计推断。
3.选用双侧检验还是单侧检验需要根据分析目的及专业知识确定。例如,在临床试验中,比较甲、乙两种治疗方法的疗效是否有差异,目的只要求区分两方法有无不同,无需区分何者为优,则应选用双侧检验。如果有充分的理由认为甲法疗效不比乙法差,此时应选用单侧检验。若从专业角度无法确定的情况下,一般应采用双侧检验。
4.拒绝实际成立的0H 所犯的错误称为I 型错误,记为α。不拒绝实际不成立的
0H 所犯的错误称为II 型错误,记为β。如果两个总体参数间确实存在差异,即1
H 成立(例如0μμ≠),按照现有检验水准,使用假设检验方法能够发现这种差异(即拒绝0H )的能力被称为检验效能,记为(1β-)。
三者的关系为:当样本量固定时,α与β成反比,与(1β-)成正比。如果把
α设置得很小,势必增大犯II 型错误的概率,从而降低检验效能;反之,如果重点在于减少β,势必增加犯I 型错误的概率,从而降低了置信度。要同时减小
α和β,只有通过增加样本含量来实现。
5.假设检验与置信区间估计的联系是:二者都属于统计推断的范畴,对于同一资料其统计推断结论是等价的。此外,置信区间在回答差别有无统计学意义的同时,还能提供一些假设检验不能提供的信息,并可以提示差别是否具有实际意义。因此,置信区间与假设检验的作用是相辅相成的,将两者结合起来,可以提供更为全面的统计推断信息。
二、案例辨析题
该结论是错误的。因为在进行两均数比较的假设检验时,当P ≤0.05时,说明两总体均数相同是一小概率事件,我们认为在一次试验中几乎不会发生,于是得出拒绝0H ,接受1H 的结论,即使犯错误,概率也小于5%;但是当P >0.05时,对于不拒绝0H 认为两总体均数相同这一结论无任何概率保证,得出错误结论的概率可能很大。故本例正确的说法应该是:按0.05α=水准,不拒绝0H ,差异无统计学意义,尚不能认为非洛地平与常规药物治疗高血压的疗效不同。
三、最佳选择题
1.C 2.E 3.E 4.E 5.E 6.E 7.D 8.E 9.E
四、 综合分析题
1.解:本题是样本均数与已知总体均数的比较,用单样本资料的t 检验,具体步骤如下:
(1)建立检验假设,确定检验水准
0H :0μμ==52 1H :0μμ>=52
0.05α=
(2)计算检验统计量 53=X , 2.0S = X X t S μ-=
3=,36135ν=-= (3)确定P 值,做出统计推断
查t 界值表,得0.0050.0025<
2.解:本题是样本均数与总体均数的比较,用单样本资料的t 检验,具体步骤如下:
(1)建立检验假设,确定检验水准
0H :0μμ= 1H :0μμ>
0.05α=
(2)计算检验统计量 X =10.1392,S =0.2595 X X t S μ-=
=12
/2595.01
.101392.10-=0.523,12111ν=-= (3)确定P 值,做出统计推断
查t 界值表,得0.25P >。按0.05α=水准,不拒绝0H ,差别无统计学意义,尚不能认为该地区正常成年男性无名指长度大于一般汉族成年男性。
SPSS 操作 数据录入:
打开SPSS Data Editor 窗口,点击Variable View 标签,定义要输入的变量,x 表示该地区正常成年男性中指长度(cm);再点击Data View 标签,录入数据(见图7-1,图7-2)。
图7-1 Variable View 窗口内定义要输入的变量x
图7-2Data View窗口内录入数据
分析:
Analyze →Compare Means →One Sample T Test
Test Variable(s)框:x
Test Value框:10.10
输出结果
从SPSS输出结果可以看出,t=0.523,自由度df (即ν)为11,双侧检验双尾概率为0.611,本例为单侧检验,因此其概率P=0.3055。结论同前。
3.解:A 药、B 药两组均为配对设计资料,故用配对t 检验进行分析。
(1) A 药:设d =治疗后血红蛋白含量–治疗前血红蛋白含量 1)建立检验假设,确定检验水准
0H :0=d μ,即A 药治疗前后患者血红蛋白的差值的总体均数为0 1H :0≠d μ,即A 药治疗前后患者血红蛋白的差值的总体均数不为0
0.05α=
2)计算检验统计量
15.5556d =,
9.7610d S =, 3.2537d S = 15.5556 4.7813.2537
d d t S =
==,918ν=-= 3)确定P 值,做出统计推断
查t 界值表,得0.002/28 4.501t =,,
0.001/28 5.041t =,,故0.001
B 药:同理,对B 药可得到治疗前后该指标差值的样本均数为18.8889,标准差为13.4856,标准误为4.4952, 4.202t =,8ν=,0.002
(2)首先进行Levene 方差齐性检验,得 3.021F =,0.05P >,还不能认为两总体方差不齐,两组差值可用两独立样本均数比较的t 检验。
1)建立检验假设,确定检验水准
0H :21d d μμ=,即两种药物治疗前后血红蛋白差值的总体均数相等 1H :21d d μμ≠,即两种药物治疗前后血红蛋白差值的总体均数不等
0.05α=
2)计算检验统计量
115.5556d =,
218.8889d =,230.7932c S =,129n n ==
12
12
d d d d t S --=
=)/1/1(22221n n S d d c +-
0.601=-,99216ν=+-=
3)确定P 值,做出统计推断
以|t |值查t 界值表,得0.50/2160.690t =,,||0.6010.690t =<,0.50P >,按
0.05α=水准,不拒绝0H ,差别无统计学意义,尚不能认为两种药物的疗效不
同。
SPSS 操作 数据录入:
打开SPSS Data Editor 窗口,点击Variable View 标签,定义要输入的变量,a 表示治疗前血红蛋白的测量值,b 表示治疗后血红蛋白的测量值,g 表示分组变量(1为A 药组,2为B 药组);再点击Data View 标签,录入数据(见图7-3,图7-4)。
图7-3 Variable View 窗口内定义要输入的变量a ,b 和g
图7-4Data View窗口内录入数据第一问分析:
Transform → Compute…
Target Variable框:d
Numeric→Expression框:b-a
Data → Split File…
:Organize output by groups:
Groups Based on框:分组(group)
Analyze→Compare Means→One Sample T Test…
Test Variable(s)框:d
Test Value框:0
输出结果
a
a a
a
第二问分析:
Data → Split File …
:Analyze all cases, do not create groups : Analyze →Compare Means →Independent-Samples T Test … Test Variable(s)框:d
Grouping Variable 框:分组[]group Group1框:1 Group2框:2
输出结果