本次实验采用2005年东部、中部和西部各地区省份城镇居民月平均消费类型划分的数据(课本139页),将东部、中部和西部看作三个不同总体,31个数据分别来自于这三个总体。本人对这三个不同地区的城镇居民月平均消费水平进行比较,并选取人均粮食支出、副食支出、烟酒及饮料支出、其他副食支出、衣着支出、日用杂品支出、水电燃料支出和其他非商品支出八个指标来衡量城镇居民月平均消费情况。
在进行比较分析之前,首先对个数据是否服从多元正态分布进行检验,输出结果为:
表一
Tests of Normality
Kolmogorov-Smirnov a Shapiro-Wilk
Statis
tic df Sig.Statis
tic df Sig.
人均粮食支出(元/
人)
.15631.054.86031.001人均副食支出(元/
人)
.11231.200*.93231.051人均烟、酒、饮料
支出(元/人)
.16331.036.82931.000
如表一,因为该例中样本数n=31<2000,所以此处选用
Shapiro-Wilk统计量。由正态性检验结果的sig.值可以看到,人均粮食支出、烟酒及饮料支出、其他副食支出、水电燃料支出和其他非商品支出均明显不遵从正态分布(Sig.值小于0.05,拒绝服从正态分布的原假设),因此,在下面分析中,只对人均副食支出、衣着支出和日用杂品支出三项指标进行比较,并认为这三个变量组成的向量都遵从正态分布,并对城镇居民月平均消费状况做出近似的度量。另外,
正态性的检验还可以通过Q-Q图来实现,此时应判别数据点是否与已知直线拟合得好。如果数据点均落在直线附近,说明拟合得好,服从正态分布,反之,不服从。具体情况这里不再赘述。
下面进行多因素方差分析:
一、多变量检验
表二
由地区一栏的(即第二栏)所列几个统计量的Sig.值可以看到,无论从那个统计量来看,三个地区的城镇居民月平均消费水平都是有显著差别的(Sig.值小于0.05,拒绝地区取值不同,对Y,即城镇居民月平均消费水平的取值没有显著影响的原假设)。
二、主体间效应检验
表三
Tests of Between-Subjects Effects
Source Dependent
Variable
Type III
Sum of
Squares df
Mean
Square F Sig.
Corrected Model 人均副食支出(元
/人)
11612.395a25806.1988.880.001