学生姓名:胡智昊学号:31405714
一、实验项目名称:实验报告(二)
二、实验目的和要求
(一)掌握列联分析的软件应用
(二)掌握方差分析的软件应用
三、实验内容
1.为研究上市公司对其股价波动的关注程度,一家研究机构对在主板、中小板和创业板
(2)计算上市公司的类型与对股价波动的关注程度两个变量之间的φ系数、Cramer’s V 系数和列联系数,并分析其相关程度。
Ho:假设上市公司的类型与对股价波动的关注程度无关
H1:上市公司的类型与对股价波动的关注程度有关
上市公司的类型关注不关注
主板企业50 70 120
中小板企业 30 15 45
创业板企业 20 5 25
100 90 190
nij Nij nij-N ij nij-Nij 2/Nij
50 63.15789 -13.15789474 2.74122807
30 23.68421 6.315789474 1.684210526
20 13.15789 6.842105263 3.557894737
70 56.84211 13.15789474 3.045808967
15 21.31579 -6.315789474 1.871345029
5 11.84211 -6.842105263 3.953216374
16.8537037 卡方
5.991464547 卡方0.05
所以拒绝原假设,认为有关
2.为分析不同地区的消费者与所购买的汽车价格是否有关,一家汽车企业的销售部门对东部地区、中部地区和西部地区的400个消费者作了抽样调查,得到如下结果:
(2)计算地区与所购买的汽车价格两个变量之间的φ系数、Cramer’s V系数和列联系数,并分析其相关程度。
H0:假设地区与所购买的汽车价格不相关
H1:假设地区与所购买的汽车价格相关
汽车价格东部地区中部地区西部地区
10万元以下20 40 40 100
10万-20万元50 60 50 160
20万-30万元30 20 20 70
30万元以上40 20 10 70
140 140 120 400
nij Nij nij-N ij nij-Nij 2/Nij
20 35 -15 6.428571429
50 56 -6 0.642857143
30 24.5 5.5 1.234693878
40 24.5 15.5 9.806122449
40 35 5 0.714285714
60 56 4 0.285714286
20 24.5 -4.5 0.826530612
20 24.5 -4.5 0.826530612
40 30 10 3.333333333
50 48 2 0.083333333
20 21 -1 0.047619048
10 21 -11 5.761904762
29.9914966 卡方
12.59158724
3.一家牛奶公司有4台机器装填牛奶,每桶的容量为4升。下面是从4台机器中抽取的装填量(单位:升)样本数据:
取显著性水平,检验不同机器对装填量是否有显著影响。
H0:不同机器对装填量是否无影响
H1: 不同机器对装填量有显著影响
机器1 机器2 机器3 机器4
4.05 3.99 3.97 4
4.01 4.02 3.98 4.02
4.02 4.01 3.97 3.99
4.04 3.99 3.95 4.01
4 4
4
方差分析:单因素方差分析
SUMMARY
组观测数求和平均方差
列 1 4 16.12 4.03 0.000333
列 2 6 24.01 4 0.000137
列 3 5 19.87 3.97 0.00033
列 4 4 16.02 4.01 0.000167
方差分析
差异源SS df MS F P-value F crit
组间0.0071 3 0 10.0984 0.000685 3.287382
组内0.0035 15 0
总计0.0106 18
0.000685335 < 0.05
所以拒绝原假设,认为有显著差异
4.一家管理咨询公司为不同的客户进行人力资源管理讲座。每次讲座的内容基本上一样的,但讲座的听课者有时是高级管理者,有时是中级管理者,有时是初级管理者。该咨询公司认为,不同层次的管理者对讲座的满意度是不同的。对听完讲座后随机抽取的不同层次管理者的满意度评分如下(评分标准是从1~10,10 代表非常满意):
取显著性水平,检验管理者的水平不同是否会导致评分的显著差异。
H0: 管理者的水平不同不会导致评分的显著差异
H1:管理者的水平不同会导致评分的显著差异
高级管理者中级管理者初级管理者
7 8 5
7 9 6
8 8 5
7 10 7
9 9 4
10 8
8
方差分析:单因素方差分析
SUMMARY
组观测数求和平均方差
列 1 5 38 7.6 0.8
列 2 7 62 8.86 0.809524
列 3 6 35 5.83 2.166667
方差分析
差异源SS df MS F P-value F crit
组间29.60952381 2 14.8 11.75573 0.000849 3.68232
组内18.89047619 15 1.26
总计48.5 17
0.000848709 < 0.05
所以拒绝原假设,认为有显著差异
5.某家电制造公司准备购进一批5#电池,现有A、B、C三个电池生产企业愿意供货,为比较它们生产的电池质量,从每个企业各随机抽取5只电池,经实验得其寿命(单位:小时)数据如下:
试分析3个企业生产的电池的平均寿命之间有无显著差异()。如果有差异,用LSD方法检验哪些企业之间有差异。
H0:3个企业生产的电池的平均寿命之间无显著差异
H1: 3个企业生产的电池的平均寿命之间有显著差异
方差分析:单因素方差分析
SUMMARY
组观测数求和平均方差
A 5 222 44.4 28.3
B 5 150 30 10
C 5 213 42.6 15.8
方差分析
差异源SS df MS F P-value F crit
组间615.6 2 307.8 17.06839 0.00031 3.885294
组内216.4 12 18.03333
总计832 14
ANOVA
寿命
平方和df 均方 F 显著性
组间525.157 2 262.579 16.300 .001
组内177.200 11 16.109
总数702.357 13
最后一列的显著性p值为0.001<0.05,所以拒绝原假设,有显著差异
方差齐性检验
寿命
Levene 统计量df1 df2 显著性
.310 2 11 .740
如图P=0.740>0.05因而lsd法
多重比较
寿命
LSD
(I) 企业(J) 企业均值差 (I-J) 标准误显著性95% 置信区间
下限上限
dimension2 1 dimension3 2 13.000* 2.692 .001 7.07 18.93
3 .400 2.692 .885 -5.53 6.33
2 dimension
3 1 -13.000* 2.692 .001 -18.93 -7.07
3 -12.600* 2.538 .000 -18.19 -7.01
3 dimension3 1 -.400 2.692 .885 -6.33 5.53
2 12.600* 2.538 .000 7.01 18.19
*. 均值差的显著性水平为 0.05。
两两比较后发现B和C企业之间的差异显著是导致3个企业电池寿命差异显著的主要原因。
6.某企业准备用3种方法组装一种新的产品,为确定哪种方法每小时生产的产品数量最多,随机抽取了30名工人,并指定每个人使用其中的一种方法。通过对每个工人生产的产品数进行方差分析得到下面的结果:
(1)完成上面的方差分析表。
(2)若显著性水平,检验3种方法组装的产品数量之间是否有显著差异。
SS df MS F P-value F crit
组间420 2 210 1.478102 0.245946 3.354131
组内3836 27 142.0741 ———
总计4256 29 ————
由于P值0.245946>0.05。所以不落入拒绝域。无显著性差异
7.有5种不同品种的种子和4种不同的施肥方案,在20块同样面积的土地上,分别采用5种种子和4种施肥方案搭配进行实验,取得的收获量数据如下表:
检验不同品种和施肥方案对收获量的影响是否显著。()
SUMMARY 观测数求和平均方差
行 1 4 41.6 10.4 1.286667
行 2 4 47.2 11.8 2.966667
行 3 4 49.1 12.275 2.0825
行 4 4 52.7 13.175 1.189167
行 5 4 51.5 12.875 1.169167
列 1 5 67.2 13.44 0.913
列 2 5 61.3 12.26 3.563
列 3 5 59.8 11.96 1.133
列 4 5 53.8 10.76 1.133
方差分析
差异源SS df MS F P-value F crit
行19.067 4 4.76675 7.239716 0.003315 3.259167
列18.1815 3 6.0605 9.204658 0.001949 3.490295
误差7.901 12 0.658417
总计45.1495 19
8.城市道路交通管理部门为研究不同的路段和不同的时间段对行车时间的影响,让一名交通警察分别在3个路段和高峰期与非高峰期亲自驾车进行实验,通过实验取得共获得30个行车时间(单位:分钟)的数据。试分析路段、时段以及路段和时段的交互作用对
行车时间的影响。()
H0:无影响
H1:有影响
方差分析:可重复双因素分析
SUMMARY 路段1 路段2 路段3 总计
高峰期
观测数 5 5 5 15
求和181.4 151.8 172.2 505.4
平均36.28 30.36 34.44 33.69333 方差 2.267 2.518 2.723 8.702095
非高峰期
观测数 5 5 5 15
求和150 121 141.4 412.4
平均30 24.2 28.28 27.49333
方差 5.265 6.025 5.797 11.22067
总计
观测数10 10 10
求和331.4 272.8 313.6
平均33.14 27.28 31.36
方差14.30267 14.33733 14.32711
方差分析
差异源SS df MS F P-value F crit
样本288.3 1 288.3 70.33137 1.36E-08 4.259677
列180.5147 2 90.25733 22.01846 3.71E-06 3.402826
交互0.024 2 0.012 0.002927 0.997077 3.402826
内部98.38 24 4.099167
总计567.2187 29
根据P值,路段、时段对其有影响但路段和时段的交互作用的P值0.99>0.05所以无影响
9.为检验广告媒体和广告方案对产品销售量的影响,一家营销公司做了一项实验,考察三种广告方案和两种广告媒体,获得的销售量数据如下:
检验广告方案、广告媒体或其交互作用对销售量的影响是否显著?()
H0:假设无影响
H1:有影响
方差分析:可重复双因素分析
SUMMARY 报纸电视总计
A
观测数 2 2 4
求和20 20 40
平均10 10 10
方差8 8 5.333333
B
观测数 2 2 4
求和36 56 92
平均18 28 23
方差32 8 46.66667
C
观测数 2 2 4
求和28 32 60
平均14 16 15
方差32 8 14.66667
总计
观测数 6 6
求和84 108
平均14 18
方差27.2 72
方差分析
差异源SS df MS F P-value F crit
样本344 2 172 10.75 0.010386 5.143253 列48 1 48 3 0.133975 5.987378
交互56 2 28 1.75 0.251932 5.143253 内部96 6 16
总计544 11
根据P值均大于0.05,不拒绝原假设。所以认为广告方案、广告媒体或其交互作用对销售量无显著影响
四、实验数据记录与分析
(基本要求:1.根据题号顺序记录软件输出结果并分析;2.结果可来自对SPSS或Excel进行操作的输出,二选一即可。)