文档库

最新最全的文档下载
当前位置:文档库 > 独立性检验学案二

独立性检验学案二

第44课时 独立性检验的基本思想及其初步应用(二)

学习目标:

1、进一步掌握2

K 的计算公式及它的实际意义,掌握计算这种判断的可靠程度的具体做法. 2、加强与现实生活相联系,学会用数据来准确描述两个变量的关系,明确数学在现实生活中的重要作用和实际价值。

教学重点;

独立性检验的基本思想、实施步聚

教学难点:

独立性检验的基本思想、随机变量2

K 的含义

教学工具:

Powerpoint 、Excel 教学过程:

(一) 复习引入

1、独立性检验:这种利用随机变量2K 来确定是否能以给定把握认为“两个分类变量有关系”的方法。

2、独立性检验的步聚

第一步:提出假设检验问题0H :吸烟与患肺癌没有关系?1H :吸烟与患肺癌有关系;

第二步:选择检验的指标2

2

()K ()()()()

n ad bc a b c d a c b d -=++++(它越小,原假设“H 0:吸烟与

患肺癌没有关系”成立的可能性越大;它越大,备择假设“H 1:吸烟与患肺癌有关系”成立的可能性越大;

独立性检验学案二

(二)

推进新课 阅读教材P 94页-P 96页

材料:下面是吸烟与患肺癌的2×2列联表,其等高条形图如下:

独立性检验学案二

独立性检验学案二

在等高条形图中,深色条的高分别表示不吸

烟和吸烟样本中患肺癌的频率.从等高条形图中我们直观上认为吸烟更容易引发肺癌.更进一步有(列联表中数字用字母代替)

独立性检验学案二

我们发现不吸烟等高条形图中深色条的“高”=b

a +,吸烟等高条形图中深色条的“高”

=d c c +,于是将“形”转化为“数”来说:b a a +和d c c +相差很大时,就判断吸烟和患肺癌有关系。

小结:一般地,假设有两个分类变量X 和Y ,它

独立性检验学案二

们的取值分别为},{21x x 和},{21y y ,其样本频率数列联表如右:那么我们可以总结出一种直观判断1H :

X 和Y 有关系的思路,即

b a a +和d

c c

+相差很大时,就判断两个分类变量之

间有关系。

注:(1)因为)|(11x X y Y P ==≈

b a a +,)|(21x X y Y P ==≈d

c c

+,所以实际上我们在判断两个条件概率)|(11x X y Y P ==和)|(21x X y Y P ==是否相等。如果判断它们相等,就意味着X 和Y 没有关系,否则就认为它们有关系。

(2)上面的这种直观判断不足之处在于不能给出推断“两个分类变量有关系”犯错误

概率,而独立性检验可以弥补这个不足。

(三)典例分析

阅读教材P95页例1完成以下问题:

例1变式 某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革的关系,随机抽取了189名员工进行调查,其中支持企业改革的调查中,工作积极的54人,工作一般的32人,而不太赞成企业改革的调查中,工作积极的40人,工作一般的63人。

(1 根据以上数据建立一个2×2列联表;

(2) 利用图形判断企业的全体员工对待企业改革的态度与其工作积极性是否有关系?

(也可以根据b a a +和d

c c

+差额角度进行判断)

(3) 能否在犯错误的概率不超过0.005的前提下认为员工对待企业改革的态度与其工作积极性有关系? 解:(1)根据题设条件,得到2×2列联表如下:

独立性检验学案二

独立性检验学案二

的高分别表示工作积极和工作一般样本中不赞成的频率,比较图中两个深色条的高可以发现,工作一般样本中不赞成的频率明显高于工作积极样本中不赞成的频率,因此可以认为工作积极性与对待企业改革的态度有关系。

(3)提出假设

0H :企业的全体员工对待企业改革的态度与其工作积极性无关。

根据(1)中列联表的数据,可以求得2

K 的

观测值为759.10103

869594)32406354(1892

≈????-??=

k

独立性检验学案二

由上表可知005.0)879.7(2=≥K P ,即在0H 成立的条件下,随机变量2

K 以99.5%的大概率在[)879.7,0上取值,而在[)+∞

,879.7上取值的是小概率事件,只有0.5%(在实际应用中,我们通常认为在一次试验中几乎不可能发生)。

因为10.759>7.879,所以在一次随机试验中小概率事件居然发生了,即0H 不成立。也所以,在犯错误的概率不超过0.005的前提下认为全体员工对待企业改革的态度与其工作积极性有关系。

小结:利用随机变量2

K 检验两个分类变量是否相关,可以从数字上精确定位,较准确,步骤如下:

(1)假设两分类变量无关; (2)在此前提下计算2K 的观测值;

(3)查表,若706.2

(四)巩固练习

1、在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有

关”的结论,并且有99%以上的把握认为这个结论是成立的。下列说法中正确的是(C ) A 100个吸烟者中至少有99人患肺癌;

B 1个人吸烟,那么这个人有99%的概率患有肺癌;

C 100个吸烟者中一定有患肺癌的人;

D 100个吸烟者中可能一个患肺癌的人也没有.

2、统计推断,当 k ≥3.84 时,至少有95%的把握说事件A 与B 有关;当 k <2.706 时,认为没有充分的证据显示事件A 与B 是有关的.

3、下列关于2K 的说法中正确的是( C )

A 同一问题中, 2K 的值不随随变量的取值变化而变化;

B 2K 的值越大,两个事件的相关性越强;

C 2K 是用来判断两个分类变量是否有关系的随机变量,只对于两个分类变量适合;

D 2

K 观测值k 的计算公式为k=n(ad-bc)

(a+b)(c+d)(a+c)(b+d)

4、独立性检验所采用的思路是:要研究A 、B 两类型因子彼此相关,首先假设这两类因子彼此 无关 ,在此假设下构造统计量2K ,如果2K 的观测值较大,那么在一定程度上说明假设 不成立 .

独立性检验学案二

5、用两个分类变量X 和Y ,其中一组观测值为如下的2×2列联表 其中a,15-a 均为大于5的整数,则a 取何值时有90%的把握认为“X 和Y 之间有关系”? 解:要使X 和Y 之间有90%的把握认为有关系,则2K ≥2.706 而2

K =65[a(30+a)-(20-a)(15-a)]220×45×15×50=13(13a-60)2

60×90

≥2.706,

解得a ≥7.19或a ≤2.04

因为a >5且15-a >5,a ∈Z ,所以a=8或9 (五)课时小结

1、独立性检验的基本思想及其应用

2、随机变量2

K 的含义及P(2

K ≥k 0)意义

(六)作业 P 97习题3.2 T 1