文档库

最新最全的文档下载
当前位置:文档库 > spss实验过程

spss实验过程

1、心理学家希望研究恋爱对于抑郁的治疗效果,找到100个尚未恋爱的大学生,对他们进行长期跟踪和测试,得到了长期的检测数据,在此期间,大约有80%的同学谈恋爱了。请构造相关数据,选择合适的统计方法进行统计验证,并对统计结果进行分析和说明。

统计方法:配对样本T检验:一般用于同一研究对象分别给予两种不同处理的效果比较,推断两种效果有无差别。以及同一研究对象处理前后的效果比较,推断某种处理是否有效。数据处理:抑郁用百分制衡量,分数越高,抑郁程度越高。选取在100名中谈恋爱的人员的抑郁分数,与他们之前未恋爱测试的抑郁分数进行配对t检验。

原假设:H0:未恋爱与恋爱后的抑郁分数无显著差异操作方法:

Analyze-Compare Means-Paired-Samples T Test

spss实验过程

结论分析:

第一个表格是数据的基本描述。

成對樣本統計資料

平均數N 標準偏差標準錯誤平均值對組 1 恋爱前抑郁指数75.94 100 10.225 1.022

恋爱后抑郁指数71.44 100 10.839 1.084

第二个是恋爱前和恋爱后抑郁分数的相关系数,原假设:恋爱前和恋爱后的抑郁指数没有相关。Sig= 0.000< 0.05拒绝原假设,恋爱前后抑郁指数有变化,即恋爱对抑郁有治疗效果。

成對樣本相關性

N 相關顯著性

對組 1 恋爱前抑郁指数& 恋爱后抑

100 .946 .000

郁指数

第三个表格是配对样本的t检验,原假设:未恋爱与恋爱后的抑郁分数均值差异为0,Sig=.000<0.05拒绝原假设,表明未恋爱和恋爱后的数据有显著的变化。即通过恋爱对抑郁的治疗有显著效果。

成對樣本檢定

程對差異數

T df 顯著性 (雙尾)

平均數 標準偏差 標準錯誤平

均值

95% 差異數的信賴

區間 下限 上限 對組 1 恋爱前抑郁指数 - 恋

爱后抑郁指数 4.500 3.518

.352 3.802 5.198 12.793 99 .000

2、已知全国的出生率为12.08%,死亡率为7.16%,有专家认为浙江省的人口自然增长率远低于全国平均水平;请构造相关数据,选择合适的统计方法进行统计验证,并对统计结果进行分析和说明。

统计方法:单样本T 检验

问题分析:全国的人口自然增长率为0.0492,选取浙江省60个地区的人口自然增长率,与0.0492作比较做单样本T 检验

H0:浙江省的人口自然增长率与全国平均水平无显著差异。

操作方法:Analyze-Compare Means-One-Sample T Test

spss实验过程

结论分析:

第一个表格:显示分别是样本数、平均值、标准差、均值标准误差。

單一樣本統計資料

N 平均數 標準偏差 標準錯誤平均值 自然增长率 60 2.224000% 4.0066086% 0.5172509%

第二个表格:显示t 统计的观测值、自由度、双侧概率p 值、样本均值与检验值的差、总体均值与原假设差值的95%的置信区间。

單一樣本檢定

檢定值 = 0.0492

T df 顯著性 (雙尾) 平均差異 95% 差異數的信賴區間

下限 上限 自然增长率 4.205 59 .000 2.1748000% 1.139783% 3.209817%

其中T检验的原假设为浙江省的人口自然增长率的均值与全国的平均人口自然增长率0.0492相等。由于Sig=0.000<0.05 所以拒绝原假设,即浙江省人口自然增长率的均值与全国的平均人口自然增长率存在差异,又因为浙江省人口自然增长率均值为0.02224<0.0492,所以浙江省人口自然增长率低于全国平均水平,即专家的观点是正确的。

3、为了研究厄尔尼诺气象是否会显著农作物的价格;请构造相关数据,选择合适的统计方法进行统计验证,并对统计结果进行分析和说明。

统计方法:相关分析

问题分析:用ONI指数来代表厄尔尼诺气象,值越高,厄尔尼诺气象越强。采用相关分析,分析厄尔尼诺气象是否会显著农作物的价格。

H0:厄尔尼诺气象指数与农作物的价格的相关系数为0.

操作方法:Analyze—Correlate—Bivariate Correlations

spss实验过程

表一:

相關

ONI指数农作物价格(元/公

斤)

ONI指数皮爾森(Pearson) 相關 1 .374**

顯著性(雙尾).007

N 50 50 农作物价格(元/公斤)皮爾森(Pearson) 相關.374** 1

顯著性(雙尾).007

N 50 50 **. 相關性在0.01 層上顯著(雙尾)。

可以看出ONI指数与农作物价格相关系数为0.374,原假设为ONI指数与农作物价格相关系数为0,sig值=0.007<0.05,拒绝原假设,(H0:厄尔尼诺气象不会影响农作物价格。)即相关。证明厄尔尼诺气象会显著农作物的价格。

4、各地区电子商务竞争力的指标包括:网络零售额、网络交易额、每百人网商数量、每百人网络消费者数量、网络零售额与社零占比等,由于指标过于复杂导致统计工作难以展开,请从中选出最具有代表性的核心指标。

统计方法:因子分析

操作方法:Analyze-Data Reduction-Factor

H0:各组数据构成单位矩阵。

spss实验过程

spss实验过程

spss实验过程

spss实验过程

spss实验过程

输出分析

相關性矩陣

网络零售额指数网络交易额指数每百人网商数量

指数

每百人网络消费

者数量指数

网络零售额与社

零占比指数

相關网络零售额指数 1.000 .137 .015 .458 -.095 网络交易额指数.137 1.000 .311 .290 -.390 每百人网商数量指数.015 .311 1.000 .019 .013

相关性很不好,0.148、 0.455、 0.235均不显著

全变量的相关性矩阵

选择Descriptives (描述)选择Coefficients 和 KMO and Bartlett ’s test of sphericity (KMO 与Bartlett 的球形度检验,KMO 值越接近1,越适合做因子分析(kmo >0.6))

KMO 與 Bartlett 檢定

Kaiser-Meyer-Olkin 測量取樣適當性。

.553 Bartlett 的球形檢定 大約 卡方

39.389 df

10 顯著性 .000

KMO 值为0.553,小于0.6(数据不够好),Bartlett 球型检验的相伴概率0.000,小于显著性水平0.05,拒绝原假设,达到显著的水平。

(检验结果是否做因子分子需要看kmo 与p 值两个因素)

选择Extraction 勾选Scree plot (碎石图)和Eigenvalues over 1 (特征值大于1) (做主成分分析,确定因子个数(特征值大于1))

說明的變異數總計

元件

起始特徵值

擷取平方和載入 循環平方和載入 總計 變異的 % 累加 % 總計 變異的 % 累加 % 總計 變異的 % 累加 % 1

1.906 38.128 38.128 1.906 38.128 38.128 1.710 34.207 34.207 2

1.172 23.433 61.562 1.172 23.433 61.562 1.368 27.354 61.562 3

.954 19.083 80.644 4

.506 10.117 90.761 5 .462 9.239 100.000 擷取方法:主體元件分析。

可以直观的看到,前两个因子就可以有61.562%的含义。

每百人网络消费者数量指数

.458 .290 .019 1.000 -.350 网络零售额与社零占比指数

-.095 -.390 .013 -.350 1.000 顯

尾) 网络零售额指数 .148 .455 .000 .235 网络交易额指数 .148 .008 .012 .001 每百人网商数量指数 .455 .008 .444 .459 每百人网络消费者数量指数 .000 .012 .444 .003 网络零售额与社零占比指数 .235 .001 .459 .003

spss实验过程

由碎石图可以看出第1个因子后图像趋于平缓,即因子1能解释大部分。

选择Rotation 勾选Varimax (最大方差法);选择scores 勾选显示因子得分系数矩阵

Communalities

起始擷取

网络零售额指数 1.000 .555

网络交易额指数 1.000 .716

每百人网商数量指数 1.000 .659

每百人网络消费者数量指数 1.000 .718

网络零售额与社零占比指数 1.000 .431

擷取方法:主體元件分析。

表示1个因子变量1共解释掉原来的变量多少。如第一行中0.555表示1个因子变量1共解释掉网络零售额方差的55.5%。由于数据选取不是很恰当,失真较大。

元件矩陣a

元件

1 2

网络零售额指数.568 -.482

网络交易额指数.703 .471

每百人网商数量指数.256 .770

每百人网络消费者数量指数.771 -.352

网络零售额与社零占比指数-.656 -.025

擷取方法:主體元件分析。

a. 擷取2 個元件。

根据因子分析初始解计算出的变量共变度。利用主成分分析方法得到5个特征值,他们是因子分析的初始解,可利用这5个初始解和对应的特征向量计算出因子载荷矩阵。由于每个原始变量的所有方差都能被因子变量解释掉,因此每个原始变量的共同度都为1.第三列是根据因子分析最终解计算出的变量共变度。根据最终提取的1个特征值和对应的特征向量计算出因子载荷矩阵。因子分析后因子提取和因子旋转的结果。

5、公司的行政人员认为自己与市场部的人员和研发部的人员差异太大;公司总经理则认为行政人员的综合技能、教育背景与市场部人员和研发部人员也存在明显差异,行政人员如何通过统计方法证实自己的结论?请构造相关数据,选择合适的统计方法进行统计验证,并对统计结果进行分析和说明。

统计方法:单因素方差分析

问题分析:设定类别变量:0=“行政人员”,1=“市场部人员”,2=“研发部人员”。综合技能用以一百分考核,教育背景以1-7教育程度衡量,1=“从未上过小学”,2=“小学”,3=“初中”,4=“高中”,5=“专科”,6=“本科”,7=“研究生”。以此构造数据,做One -Way ANOVA。操作:Analyze-Compare Means-One -Way ANOVA

H0:行政人员与市场部人员和研发部人员无显著差异。

spss实验过程

选择LSD和Tamhane’s T2,再选择Option里的方差齐性检验。

spss实验过程

spss实验过程

表一:方差齐性检验

變異數同質性測試

Levene 統計資

料df1 df2 顯著性

学历背景 1.096 2 57 .341

综合技能指数 4.104 2 57 .022

从表看出:方差齐性检验,原假设:各部门的方差相等。学历背景一行。Sig值=0.341>0.05,即支持原假设,即各部门综合技能的方差相等,同理,看综合技能这行可知,各部门综合技

能的方差不相等。(数据选取问题)

表二:方差分析

變異數分析

平方和df 平均值平方 F 顯著性学历背景群組之間 4.009 2 2.004 1.252 .294 在群組內91.241 57 1.601

總計95.250 59

综合技能指数群組之間 5.616 2 2.808 .829 .442 在群組內192.968 57 3.385

總計198.583 59

综合技能:方差检验sig值=0.442>0.05(数据问题)

学历背景:方差检验的sig值=0.294>0.05,接受原假设,(数据问题)

表三:多重分析

多重比較

因變數(I) 类别(J) 类别平均差異(I-J) 標準錯誤顯著性

95% 信賴區間下限上限

学历背景LSD 0 1 .517 .345.140 -.17 1.21

2 .000 .575 1.000 -1.15 1.15

1 0 -.517 .345 .140 -1.21 .17

2 -.517 .567 .366 -1.65 .62

2 0 .000 .575 1.000 -1.15 1.15

1 .517 .567 .366 -.6

2 1.65

Tamhane 0 1 .517 .347 .370 -.34 1.37

2 .000 .510 1.000 -1.52 1.52

1 0 -.517 .347 .370 -1.37 .34

2 -.517 .511 .712 -2.04 1.00

2 0 .000 .510 1.000 -1.52 1.52

1 .517 .511 .71

2 -1.00 2.04 综合技能指数LSD 0 1 -.499 .502 .324 -1.50 .51

2 .380 .836 .651 -1.29 2.05

1 0 .499 .50

2 .324 -.51 1.50

2 .879 .825 .291 -.77 2.53

2 0 -.380 .836 .651 -2.05 1.29

1 -.879 .825 .291 -2.53 .77

Tamhane 0 1 -.499 .507 .699 -1.76 .76

2 .380 .944 .97

3 -2.49 3.25

1 0 .499 .507 .699 -.76 1.76

2 .879 .894 .740 -2.01 3.77

2 0 -.380 .944 .97

3 -3.25 2.49

1 -.879 .894 .740 -3.77 2.01

综合技能:方差齐性看LSD法多重比较的结果,从结果可看出,行政人员和市场部人,研

发部人员的综合技能不存在显著差异。

学历背景:方差齐性看LSD法多重比较的结果,从结果可看出行政人员和市场部人员、研

发部人员的教育背景不存在显著差异。(数据问题)

6、有专家提出,黄色人种相对于白色人种,更不易被晒伤;请构造相关数据,选择合适的

统计方法进行统计验证,并对统计结果进行分析和说明。

问题分析:用1=“黄色人种”,用2=“白色人种”,晒伤用按1-5的程度衡量,1=“没晒伤”,

2=“有点晒伤但不严重”,3=“晒伤有点严重”,4=“晒伤严重”,5=“晒伤非常严重”。以

此构造数据,进行独立样本t检验。操作步骤:Analyze—Compare Means—Independent-Samples T Test

H0:黄色人种和白色人种的晒伤难易无显著差异。

spss实验过程

结论分析:

表一:显示基本的数据,统计描述量。

群組統計資料

人种N 平均數標準偏差標準錯誤平均值

晒伤程度 1 37 2.00 .782 .129

2 2

3 2.83 1.337 .279

标准误:样本在多大程度上反映总体样本。(数值越小越好,要求N越大越好)表中的数值

都是比较好的。

表二:

先进行F 检验,在进行总体均值T 检验。F 检验原假设:白色人种和黄色人种的晒伤程度方差是相等,F 检验的Sig=0.000小于0.05 ,即拒绝原假设,方差不相等。

因而看第二行,T 检验的原假设是黄色人种和白色人种的晒伤程度均值差为0,T 检验的Sig=0.011<0.05,拒绝原假设,即不为0。又因为,t 值为负,95%的置信区间都小于0,在0的左侧,即黄色人种和和白色人种的晒伤程度均值差小于0,即黄色人种比白色人种不易晒伤。

7、请统计分析全国各个省市的进出口额,与各地区消费品零售总额、地区工业总产值的函数关系,请构造数据,设法论证各变量之间的函数关系。

统计方法:回归分析

操作方法:先做散点图 ,主观判断,选择Graphs —Legacy Dialogs —Scatter/Dot —Simple

Scatter ,在做相关分析,看是否相关,在做回归分析,得出具体函数。

獨立樣本檢定

Levene 的變異數相等測

試 針對平均值是否相等的 t 測試

F 顯著性 T df 顯著性 (雙尾) 平均差異 標準誤差

95% 差異數的信賴區

下限 上限 晒伤程度 採用相等變異數

14.180 .000 -3.026 58 .004 -.826 .273 -1.373 -.280 不採用相等變異

-2.692 31.481 .011 -.826 .307 -1.452 -.201

spss实验过程

spss实验过程

spss实验过程

相关性分析:

spss实验过程

线性回归:方法选逐步。

spss实验过程

Statistics:

spss实验过程

分析结果解读:

spss实验过程

spss实验过程

图中可以很直观的看到进出口额与消费品零售总额和地区工业总产值的情况。相关性分析结果:

相關

消费品零售总额地区工业总产值进出口额消费品零售总额皮爾森(Pearson) 相關 1 .404**.764**

顯著性(雙尾).004 .000

N 50 50 50 地区工业总产值皮爾森(Pearson) 相關.404** 1 .313*

顯著性(雙尾).004 .027

N 50 50 50 进出口额皮爾森(Pearson) 相關.764**.313* 1

顯著性(雙尾).000 .027

N 50 50 50

**. 相關性在0.01 層上顯著(雙尾)。

*. 相關性在0.05 層上顯著(雙尾)。

由上表得出:进出口额和消费品零售总额的相关系数为0.764,双尾检验的显著性概率值为0.000,双星号标记表明0.764的相关系数在0.01的水平上达到显著。这说明进出口额与消费品零售总额相关性很强。同理,进出口额与地区工业总产值也是相关性很强。

變數已輸入/已移除a

模型變數已輸入變數已移除方法

1

消费品零售总额. 逐步(準則:F-to-enter 的機率<= .050,F-to-remove 的機率>= .100)。

a. 應變數: 进出口额

上表给出了进入模型和被删除的变量的信息。在本案例中,只有一个自变量。因此,在已输入的变量中只有“消费品零售总额”,没有删除的变量,使用的方法是“输入”。

模型摘要

模型R R 平方調整後R 平方標準偏斜度錯誤

1 .764a.584 .576 2.119

a. 預測值:(常數),消费品零售总额

上表是回归模型的摘要表,该表列出了模型数量、模型的R(自变量和因变量之间的相关系数)、R方(拟合线性回归的判定系数)、调整后的R方和标准估算的错误值。R方值越大,表示模型与数据的拟合优度越高。可以看出,自变量“消费品零售总额”和因变量“进出口额”之间的相关系数R为0.764,判定系数R 方为0.584,表示该线性模型可以解释因变量58.4%的变异量,调整后的R方为0.576,标准估算的错误值为2.119.

變異數分析a

模型平方和df 平均值平方 F 顯著性

1 迴歸302.791 1 302.791 67.434 .000b

殘差215.529 48 4.490

總計518.320 49

a. 應變數: 进出口额

b. 預測值:(常數),消费品零售总额

上表是该案例的方差分析表,是回归方程显著性检验结果。该表列出了回归平方和302.791,残差平方和215.529,其自由度分别为1和48,回归和残差的均方分别为302.791和4.490,变异量显著性检验的F值为67.434,显著性水平为0.000,

表示回归模型整体解释变异量达到显著水平,也就是说所建立的回归方程有效,自变量和因变量呈线性关系。

係數a

模型非標準化係數標準化係數

T 顯著性B 標準錯誤Beta

1 (常數) 4.011 .726 5.527 .000

消费品零售总额 1.587 .193 .764 8.212 .000

a. 應變數\: 进出口额

上表为案例分析的回归系数的T检验结果。该表列出了非标准化回归系数、标准化回归系数、回归系数的显著性检验t值和限制性水平。可以看出,该模型的非标准化回归系数B的估计值1.587,标准错误为0.193;标准化回归系数为0.764,回归系数的显著性检验T统计量的值为8.212,对应的显著性水平P值为0.000,表明被解释变量和解释变量之间存在显著线性关系。标准化回归系数贝塔取值范围为-1~1,它的绝对值越大,表示自变量对因变量的影响越大,其解释因变量的变异性也越大。

对回归方程的显著性检验和对回归系数的显著性检验都表明该案例的回归方程显著。从表中可知,β0(常量)=4.011,β1=1.587,由一元线性回归方程y=β0

+β1X可以得出本案例的回归方程为y=4.011+1.587x

即进出口额=4.011+1.587*消费品零售总额