文档库 最新最全的文档下载
当前位置:文档库 › 第九章 列联分析(ok)

第九章 列联分析(ok)

第九章 列联分析(ok)
第九章 列联分析(ok)

第九章 列联分析

9.1 欲研究不同收入群体对某种特定商品是否有相同的购买习惯,市场研究人员调查了四个不同收入组的消费者共527人,购买习惯为:经常购买,不购买,有时购买。调查结果如下表所示。

要求:

(1)提出假设。 (2)计算χ2值。

(3)以α=0.1的显著性水平进行检验。

解:(1)根据题意,要求检验不同收入群体对某个商品的购买习惯是否相同,因此虚拟假设应为各组消费者对对该商品的偏好比例相同,即:

123412340:0.31:,,,H H ππππππππ====不全相等

(2)计算样本统计量χ2

(3) χ2的自由度为(3-1)*(4-1)=6,α=0.1,计算χ20.1(6)=10.64,

χ2>χ20.1(6),故拒绝H0,不同收入组的消费者对该商品的购买习惯存在显著差异。

9.2从总体中随机抽取了n=200的样本,调查后按不同属性归类,得到如下结果:

n1=28,n2=56,n3=48,n4=36,n5=32

依据经验数据,各类别在总体中的比例分别为:

π1=0.1,π2=0.2,π3=0.3,π4=0.2,π5=0.2

以α=0.1的显著性水平进行检验,说明现在的情况与经验数据相比是否发生了变化(用P值)

解:虚拟假设

H0:样本数据的各类数据的比例与总体中各类数据的比例相同

H1:样本数据的各类数据的比例与总体中各类数据的比例不同

计算样本统计量χ2

χ2的自由度为(5-1)=4,P=0.007远小于显著性水平α=0.1,故拒绝H0,现在的情况与经验数据相比已经发生了变化(显著差异)。

9.3某报社关心其读者的阅读习惯是否与其文化程度有关,随机抽查了254位读者,得到如下数据:

以0.05的显著性水平检验读者的阅读习惯是否与文化程度有关。解:此题要求文化程度与阅读习惯是否独立,故设虚拟假设为H0:读者的阅读习惯与文化程度是无关的

H1:读者的阅读习惯与文化程度是相关的

计算样本统计量计算χ2

χ2的自由度为(4-1)*(4-1)=9,α=0.05,计算χ20.05(9)=16.91,

χ2>χ20.1(9),故拒绝H0,该报读者的阅读习惯与文化程度存在相关性。

9.4教学改革后学生有了更多的选课自由,但学院领导在安排课程上也面临新的问题。例如,MBA研究生班的学生选课学年之间的变化非常大,去年的学生很多人选会计课,而今年的学生很多人选市场营销课。由于事先无法确定究竟有多少学生选各门课程,所以无法有效地进行教学资源的准备。有人提出学生所选课程与其本科所学专业有关。为此学院领导对学生本科所学专业和MBA三门课程的选修课程情况做了统计,得到如下结果:

要求:

(1)以0.05的显著性水平检验学生本科所学专业是否影响其读MBA期间所选课程。

(2)计算P值。

解:根据题意,需要检验本科所学专业与MBA期间所选课程的相关性(独

立性),故设

H0:学生本科所学专业与其读MBA期间所选课程无关;

H1:学生本科所学专业与其读MBA期间所选课程是相关的。

计算样本统计量计算χ2

χ2的自由度为(4-1)*(3-1)=6,α=0.05,计算χ20.05(6)=12.59,

χ2>χ20.05(6),故拒绝H0,学生本科所学专业与其读MBA期间所选课程有关。(2)P(14.59,6)=0.0237,P < 0.05。

9.5 计算练习题9.1中的φ系数、c 系数和V 系数。 解:

0.1831?=

0.1801c ==

0.1295

V ===如有侵权请联系告知删除,感谢你们的配合!

第九章 列联分析(ok)

第九章 列联分析 欲研究不同收入群体对某种特定商品是否有相同的购买习惯,市场研究人员调查了四个不同收入组的消费者共527人,购买习惯为:经常购买,不购买,有时购买。调查结果如下表所示。 要求: (1)提出假设。 (2)计算χ2值。 (3)以α=的显著性水平进行检验。 解:(1)根据题意,要求检验不同收入群体对某个商品的购买习惯是否相同,因此虚拟假设应为各组消费者对对该商品的偏好比例相同,即: 123412340:0.31:,,,H H ππππππππ====不全相等 (2)计算样本统计量χ2

(3) χ2的自由度为(3-1)*(4-1)=6,α=,计算χ(6)=, > χ2>χ(6),故拒绝H0,不同收入组的消费者对该商品的购买习惯存在显著差异。 从总体中随机抽取了n=200的样本,调查后按不同属性归类,得到如下结果: n1=28,n2=56,n3=48,n4=36,n5=32 依据经验数据,各类别在总体中的比例分别为: π1=,π2=,π3=,π4=,π5= 以α=的显著性水平进行检验,说明现在的情况与经验数据相比是否发生了变化(用P值) 解:虚拟假设 H0:样本数据的各类数据的比例与总体中各类数据的比例相同 H1:样本数据的各类数据的比例与总体中各类数据的比例不同.

计算样本统计量χ2 χ2的自由度为(5-1)=4,P=远小于显著性水平α=,故拒绝H0,现在的情况与经验数据相比已经发生了变化(显著差异)。 某报社关心其读者的阅读习惯是否与其文化程度有关,随机抽查了254位读者,得到如下数据: 以的显著性水平检验读者的阅读习惯是否与文化程度有关。 解:此题要求文化程度与阅读习惯是否独立,故设虚拟假设为 H0:读者的阅读习惯与文化程度是无关的

第9章 列联分析

第9章列联分析 选择题: 1.列联分析是利用列联表来研究()。 A.两个分类变量的关系 B.两个数值型变量的关系 C.一个分类变量和一个数值型变量的关系 D.两个数值型变量的分布 分布的自由度为()。 2.设R为列联表的行数,C为列联表的列数,则2 A. RB. C C. R×CD. (R-1)×(C-1) 3.列联表中的每个变量()。 A.只能有一个类别B.只能有两个类别 C.可以有两个或两个以上的类别D.只能有三个类别 4.一所大学准备采取一项学生在宿舍上网收费的措施,为了解男女学生对这一措施的看法,分别抽取了150名男学生和120名女学生进行调查,得到的结果如下: 男学生女学生合计赞成45 42 87 反对105 78 183 合计150 120 270 这个表格是()。 A. 4×4列联表B. 2×2列联表 C. 2×3列联表D. 2×4列联表 5.一所大学准备采取一项学生在宿舍上网收费的措施,为了解男女学生对这一措施的看法,分别抽取了150名男学生和120名女学生进行调查,得到的结果如下: 男学生女学生合计赞成45 42 87 反对105 78 183 合计150 120 270 这个列联表的最右边一列称为()。 A.列边缘频数B.行边缘频数 C.条件频数D.总频数 6.一所大学准备采取一项学生在宿舍上网收费的措施,为了解男女学生对这一措施的看法,分别抽取了150名男学生和120名女学生进行调查,得到的结果如下: 男学生女学生合计赞成45 42 87 反对105 78 183 合计150 120 270 这个列联表的最下边一行称为()。 A.列边缘频数B.行边缘频数 C.条件频数D.总频数 7.一所大学准备采取一项学生在宿舍上网收费的措施,为了解男女学生对这一措施的看法,分别抽取了150名男学生和120名女学生进行调查,得到的结果如下: 男学生女学生合计

第九章-列联分析(ok)电子教案

第九章 列联分析 9.1 欲研究不同收入群体对某种特定商品是否有相同的购买习惯,市场研究人员调查了四个不同收入组的消费者共527人,购买习惯为:经常购买,不购买,有时购买。调查结果如下表所示。 要求: (1)提出假设。 (2)计算χ2值。 (3)以α=0.1的显著性水平进行检验。 解:(1)根据题意,要求检验不同收入群体对某个商品的购买习惯是否相同,因此虚拟假设应为各组消费者对对该商品的偏好比例相同,即: 123412340:0.31:,,,H H ππππππππ====不全相等 (2)计算样本统计量χ2

(3)χ2的自由度为(3-1)*(4-1)=6,α=0.1,计算χ20.1(6)=10.64, χ2>χ20.1(6),故拒绝H0,不同收入组的消费者对该商品的购买习惯存在显著差异。 9.2从总体中随机抽取了n=200的样本,调查后按不同属性归类,得到如下结果: n1=28,n2=56,n3=48,n4=36,n5=32 依据经验数据,各类别在总体中的比例分别为: π1=0.1,π2=0.2,π3=0.3,π4=0.2,π5=0.2 以α=0.1的显著性水平进行检验,说明现在的情况与经验数据相比是否发生了变化(用P值) 解:虚拟假设 H0:样本数据的各类数据的比例与总体中各类数据的比例相同 H1:样本数据的各类数据的比例与总体中各类数据的比例不同 计算样本统计量χ2 χ2的自由度为(5-1)=4,P=0.007远小于显著性水平α=0.1,故拒绝H0,现在的情况与经验数据相比已经发生了变化(显著差异)。

9.3某报社关心其读者的阅读习惯是否与其文化程度有关,随机抽查了254位读者,得到如下数据: 以0.05的显著性水平检验读者的阅读习惯是否与文化程度有关。 解:此题要求文化程度与阅读习惯是否独立,故设虚拟假设为 H0:读者的阅读习惯与文化程度是无关的 H1:读者的阅读习惯与文化程度是相关的 计算样本统计量计算χ2

第九章列联分析(ok)

第九章 列联分析 欲研究不同收入群体对某种特定商品是否有相同的购买习惯,市场研究人员调查了四个不同收入组的消费者共527人,购买习惯为:经常购买,不购买,有时购买。调查结果如下表所示。 要求: (1)提出假设。 (2)计算χ2值。 (3)以α=的显著性水平进行检验。 解:(1)根据题意,要求检验不同收入群体对某个商品的购买习惯是否相同,因此虚拟假设应为各组消费者对对该商品的偏好比例相同,即: 123412340:0.31:,,,H H ππππππππ====不全相等 (2)计算样本统计量χ2

(3) χ2的自由度为(3-1)*(4-1)=6,α=,计算χ(6)=, χ2>χ(6),故拒绝H ,不同收入组的消费者对该商品的购买习惯存在显著差异。 从总体中随机抽取了n=200的样本,调查后按不同属性归类,得到如下结果: n 1=28,n 2 =56,n 3 =48,n 4 =36,n 5 =32 依据经验数据,各类别在总体中的比例分别为: π 1=,π 2 =,π 3 =,π 4 =,π 5 = 以α=的显著性水平进行检验,说明现在的情况与经验数据相比是否发生了变化(用P值) 解:虚拟假设 H :样本数据的各类数据的比例与总体中各类数据的比例相同 H1:样本数据的各类数据的比例与总体中各类数据的比例不同 计算样本统计量χ2

,现在的情χ2的自由度为(5-1)=4,P=远小于显著性水平α=,故拒绝H 况与经验数据相比已经发生了变化(显著差异)。 某报社关心其读者的阅读习惯是否与其文化程度有关,随机抽查了254位读者,得到如下数据: 以的显著性水平检验读者的阅读习惯是否与文化程度有关。 解:此题要求文化程度与阅读习惯是否独立,故设虚拟假设为 :读者的阅读习惯与文化程度是无关的 H H1:读者的阅读习惯与文化程度是相关的 计算样本统计量计算χ2

统计学第9章--列联分析

第9章列联分析 9.1 分类数据与列联表 例:某集团公司下属四个分公司。现该集团欲进行一项改革,由于涉及到各分公司的利益,希望对各分公司职工的态度有所了解。所以从四个分公司中随机选取420名员工进行调查,结果如下表所示: 关于改革方法的调查结果 9.1.1 列联表的构造 列联表:是由两个以上的变量进行交叉分类的频数分布表。 每个单元:反应两方面的信息 行R:态度变量行合计:RT 列C:单位变量列合计:CT ?列联表:24?列联表 R C 9.1.2 列联表的分布 1 观察值的分布

总合计(样本容量):N 百分比: RT N 2 期望值的分布 期望值: CT N ? 9.1.3 观察值与期望值频数对比分布表 9.2 拟合优度检验 9.2.1 思路: 如果各分公司员工对改革方案的态度一致 则各分公司员工赞成或反对该方案的比例应该相同 即1234ππππ=== 其中i π为第i 个分公司赞成改革方案的比例 那么,对比分布表中相应的观察值与期望值就应该非常接近

9.2.2 检验统计量:2χ 设0f 为观察值频数 e f 为期望值频数 2 2 0()e e f f f χ-=∑ 9.2.3 判断准则 当2χ大于某临界值时,拒绝态度一致的原假设——右单侧检验 即22 αχχ>时,拒绝原假设 自由度(1)(1)R C =-- 完成上面的例题 解: 01234:H ππππ=== 各分公司员工对这项改革的态度一致 1:H 上面等式不全相等 各分公司员工对这项改革的态度不一致 2χ计算表

2 2 0()e e f f f χ-=∑=3.0319 自由度(1)(1)R C =--=3 0.1α=,查表得:2 0.1 (3) 6.251χ= 由于3.0319<6.251,所以不能拒绝原假设,即认为四个分公司员工对这项改革的态度是一致的。 例:从总体中随机抽取200n =的样本,调查后按不同属性归类,得到如下结果: 1234528,56,48,36,32n n n n n ===== 依据以往经验,各类别在总体中的比例分别为: 123450.1,0.2,0.3,0.2,0.2πππππ===== 请以0.1α=的显著性水平检验,说明现在的情况与经验数据相比是否发生了显著变化。 解: 012345:0.1,0.2,0.3,0.2,0.2H πππππ===== 没有发生显著变化 1:H 上面等式不全相等 发生了显著变化 12000.120e f =?=,22000.240e f =?=,32000.360e f =?=, 42000.240e f =?=,52000.240e f =?=, ()()()()()2 2 02 2 2 2 2 ()282056404860364032402040 60 40 40 14 e e f f f χ-=-----= + + + + =∑

第九章 列联分析

第九章列联分析 9.1 分类数据与列联表 本章核心思想:定性与定性之间的关系分析,即两个分类变量之间或者一个顺序变量与一个分类变量的关联以及关联程度问题研究。 对象:分类数据 复习要求:理解分类数据定义,掌握列联表的结构、各种分布表(列联表分布)以及表内数据代表的意义,能根据给出图表填写分布表内相关数据。 9.1.1分类数据:一种非数字数据,数据表现为类别反映不同调查对象的特征。(ps:统计数据分为分类数据、顺序数据、数值数据) 分类变量的结果表现为类别例如:性别(男, 女) 各类别用符号或数字代码来测度使用分类或顺序尺度 你吸烟吗? 1.是;2.否你赞成还是反对这一改革方案? 1.赞成;2.反对 9.1.2列联表结构(由两个以上的变量交叉分类的频数分布表) 1、行变量的类别用r表示,ri 表示第i个类别 2、列变量的类别用c表示,cj 表示第j个类别 3、每种组合的观察频数用fij表示 4、表中列出了行变量和列变量的所有可能的组合,所以称为列联表 5、一个r 行c列的列联表称为r c列联表 9.1.3列联表的分布:观测值与期望值分布(查看教材247—248页) 9.2 χ2(卡方)检验:两个分类变量之间关系分析检验 基本思想:考察观测频数与期望频数之间的吻合程度 考点:自由度的计算、用χ2进行拟合优度检验(无差假设检验)、相关性检验9.2.1公式: 理论证明,实际观察次数(f o)与理论次数(f e),又称期望次数)之差的平方再除以理论次数所得的统计量,近似服从卡方分布,可表示为: 这是卡方检验的原始公式,其中当f e越大(f e≥5),近似得越好。显然f o与f e相差越大,卡方值就越大;f o与f e相差越小,卡方值就越小;因此它能够用来表示f o与f e相差的程度。根据这个公式,可认为卡方检验的一般问题是要检验名义型变量的实际观测次数和理论次数分布之间是否存在显著差异。

第九章-列联分析(ok)

第九章-列联分析(ok)

第九章列联分析 9.1欲研究不同收入群体对某种特定商品是否有相同的购买习惯,市场研究 人员调查了四个不同收入组的消费者共527人,购买习惯为:经常购买,不购买,有时购买。调查结果如下表所示 要求: (1)提出假设。 (2)计算X值。 (3)以a=0.1的显著性水平进行检验。 解:(1)根据题意,要求检验不同收入群体对某个商品的购买习惯是否相同,因此虚拟假设应为各组消费者对对该商品的偏好比例相同,即: H 0 : 1 2 3 4 0.3 H1:1, 2, 3, 4不全相等 (2)计算样本统计量X

⑶ X 的自由度为(3-1) * (4-1) =6, a=0.1,计算X o.1 (6) =10.64, X> X o.1(6),故拒绝H0,不同收入组的消费者对该商品的购买习惯存在显 9.2从总体中随机抽取了n=200的样本,调查后按不同属性归类,得到如下结果: n1=28,n2=56,n3=48,n4=36,n5=32 依据经验数据,各类别在总体中的比例分别为: n=0.1, 7i2=0.2, n=0.3, n=0.2, n=0.2 以a=0.1的显著性水平进行检验,说明现在的情况与经验数据相比是否发生了变化(用P值) 解:虚拟假设 H0:样本数据的各类数据的比例与总体中各类数据的比例相同 H1 :样本数据的各类数据的比例与总体中各类数据的比例不同计算样本统计量X X的自由度为(5-1)=4,P=0.007远小于显著性水平a=0.1,故拒绝H0, 现在的情况与经验数据相比已经发生了变化(显著差异)。

9.3某报社关心其读者的阅读习惯是否与其文化程度有关,随机抽查了254 位读者,得到如下数据: 以0.05的显著性水平检验读者的阅读习惯是否与文化程度有关。解:此题要求文化程度与阅读习惯是否独立,故设虚拟假设为H o:读者的阅读习惯与文化程度是无关的 H1 :读者的阅读习惯与文化程度是相关的 计算样本统计量计算X

相关文档