文档库 最新最全的文档下载
当前位置:文档库 › 统计分析软件SPSS详细教程.doc

统计分析软件SPSS详细教程.doc

统计分析软件SPSS详细教程.doc
统计分析软件SPSS详细教程.doc

10.11统计分析软件&SPSS建立数据

目录

10.11统计分析软件&SPSS建立数据 (1)

10.25数据加工作图 (1)

11. 08绘图解答&描述性分析: (3)

2.描述性统计分析: (4)

四格表卡方检验:(检验某个连续变量的分布是否与某种理论分布一致,如是否符合正态分布) (7)

第七章非参数检验 (10)

1.单样本的非参数检验 (11)

(1)卡方检验 (11)

(2)二项分布检验 (13)

2.两独立样本的非参数检验 (14)

3.多独立样本的非参数检验 (16)

4.两相关样本的非参数检验 (16)

5.多相关样本的非参数检验 (18)

第五章均值检验与T检验 (21)

1.Means过程(均值检验)( (21)

4. 单样本T检验 (22)

5. 两独立样本T检验 (23)

6.两配对样本T检验 (24)

第六章方差分析 (26)

单因素方差分析: (26)

多因素方差分析: (30)

10.25数据加工作图

1.Excel中随机取值:=randbetween(55,99)

2.SPSS中新建数据,一列40个,正态分布随机数:先在40那里随便输入一个数表示选择40个可用的,然后按一下操作步骤:

3.排序:个案排秩

4.数据选取:数据-选择个案-如果条件满足:

计算新变量:

5.频次分析:分析-统计描述-频率

还原:个案-全部

6.加权:

还原

7.画图:

11. 08绘图解答&描述性分析:1.课后题:长条图

2.描述性统计分析:

(1)频数分析:

(2)描述性分析:

描述性统计分析没有图形功能,也不能生成频数表,但描述性分析可以将原始数据转换成标准化得分,并以变量形式存入数据文件中,以便后续分析时应用。

操作:

分析—描述性分析:然后对结果进行筛选,去掉异常值,就得到标准化的数据:

任何形态的数据经过Z标准化处理之后就会是正态分布的<—错误!标准化是等比例缩放的,不会改变数据的原始分布状态,

(3)探索分析:(检验是否是正态分布:茎叶图、箱图)

实例:

操作:

(4)交叉列联表(探索定类型的变量间的相关性):【纯数值的变量用回归分析,名义变量用交叉分析】操作:

实例:

四格表卡方检验:(检验某个连续变量的分布是否与某种理论分布一致,如是否符合正态分布)

例子:

第1步建立数据文建:

第2步:对数据进行预处理;(给数据加权)

第3步进行卡方检验:

第4步结果分析

P=0.011<0.05,则在5%显著性水平下拒绝原假设,差异有显著性意义,即药物加化疗与单用药物治疗癌症的疗效有显著性差异。

如何选sig值:期望值就是T 是理论频数N是样本数量(合计)

对应:

1)选第一个:

2)选

3)选

配对卡方检验:

第1步建立数据文建:

第2步对数据进行加权处理

第3步进行配对卡方检验

结果分析:

第七章非参数检验

使用情况:在总体分布未知的情况下用非参数检验,分布已知用参数检验。

1.单样本的非参数检验 (1)卡方检验

分析步骤

? 第1 步 提出零假设:卡方检验的零假设H0是“总体服从某种理论分布”,其对立假设H1是“总体不服从某种理论分布”。 ? 第2步 选择检验统计量:卡方分布选择的是Pearson 卡方统计量。已证明,当n 充分大时,它近似地服从自由度为k -1的卡方分布。

? 第3步 计算检验统计量的观测值和概率p 值。 ? 第4步 给出显著性水平,作出决策。 实例:

某公司质检负责人欲了解企业一年内出现的次品数是否均匀分布在一周的五个工作日中,随机抽取了90件次品的原始记录,其结果如下表,问该企业一周内出现的次品数是否均匀分布在一周的五个工作日中?( )

第1步 分析:由于考虑的是次品是否服从均匀分布的问题,考虑用卡方检验。

0.05α=

第2步数据的组织:数据分成两列,一列是工作日,其变量名为“weekday”,另一列是次品数,变量名为“number”,输入数据并保存。

第3步加权设置:将变量“number”定义为权变量。

第4步进行卡方检验:

?第5步主要结果及分析

左表是频数分布情况表,第二列为实际观察值出现次数,第三列为理论上每天应出现的次数,第四列为残差

右表是计算的卡方统计量及对应的相伴概率值,由于Sig.=0.014<0.05。说明应拒绝每个工作日出现的次品率相等的原假设。即次品数出现是不均匀的。

(2)二项分布检验

【例7-2】某地某一时期内出生35名婴儿,其中女性19名(定Sex=0),男性16名(定Sex=1)。问这个地方出生婴儿的性别比例与通常的男女性比例(总体概率约为0.5)是否不同?

第1步分析:由于性别分为男与女两种状态,故应用二项分布检验。第2步数据的组织:数据分成两列,其变量名为“性别”,“频数”。输入数据并保存。进行加权处理。

第3步进行二项分布检验:

第4步主要结果及分析

从上表可知,相伴概率Sig.=0.736>0.05,因此没有理由拒绝零假设。这说明此地新生儿男女比例与通常的男女比例相同。

2.两独立样本的非参数检验

【例7-3】某公司希望了解两种品牌汽油A和B每加仑的行驶里程是否有区别,表7.15是两种品牌汽油每加仑的行驶里程数,在显著性水平=0.05下,判断两个品牌间是否存在显著性差异?

第1步分析:由于是两种品牌的汽油,可以认为是两个独立样本,但行驶里程数根本不知道服从何种分布,可用两独立样本的非参数检验进行分析。

第2步数据组织:由于独立样本的非参数检验所检验的数据只有一列,故应将A,B数据组织成一列,用另一列来区分A和B,作分组变量。

第3步进行独立样本的非参数检验

双尾检验的相伴概率为0.151,大于0.05,说

明两种汽油无显著性差异。

两个相伴概率都大于显著性水平0.05,因此应接受零假设,认为两种汽油之间无显著性差异。

Kolmogorov-Smirnov Z值为0.894,相伴概率值为0.400,大于显著性水平0.05,因此应接受两种汽油之间无显著性差异的原假设;

根据游程检验计算的Z统计量为-1.149,对应在单尾显著性概率为0.128,大于显著性水平,因此应接受两种汽油之间无显著性差异的原假设。

从以上四种检验方法所得到的结果是相同的,即两种汽油之间无显著性差异。

3.多独立样本的非参数检验

4.两相关样本的非参数检验

某企业提出了一项新工艺,为了检验新工艺是否能降低单位成本,随机抽取16个工人分别用新旧工艺生产产品,测得单位成本资料如下表,请在显著性水平0.05下检验是否新工艺降低了成本?

第1步分析:由于是同一批工人和同一批机器,其先后的成本是相

关的,同时也不知数据的分布情况,故应用两相关样本的非参数检验。第2步数据组织:数据分成两列,第一列为新工艺的成本,第二列为旧工艺的成本。

第3步两相关样本的非参数检验:设置如下图

Z统计量为-2.160,相伴概率为0.031,小于显著水平0.05,故应拒绝原假设,即认为两样本不是来自于同一总体,说明有差异,新工艺可省成本。

结果分析:

Z统计量为-2.160,相伴概率为0.031,小于显著水平0.05,故应拒绝原假设,即认为两样本不是来自于同一总体,说明有差异,新工艺可省成本。

其相伴概率为0.021,小于0.05,说明新工艺与旧工艺有显著性差异,这与Wilxocon检验结果是一致的。

5.多相关样本的非参数检验

某文艺晚会有5个节目,共有5个评委参与打分,其数据如下表。问这5个评委的判断标准是否一致。

第1步分析:由于5个评委打分是分别针对同一个节目,所以数据

之间具有相关性,同时不知道数据所服从的分布,可以采用多相关样本的非参数检验。

第2步数据组织:由于是分析的评委之间的评判标准是否一致,故应将每个评委所打的分各分成一列。

第3步多相关样本的非参数检验:

结果分析:

卡方值为9.102,自由度为4,相伴概率为0.059>0.05,故应认为5个评委打分是一致的。

卡方值为9.102,自由度为4,相伴概率为0.059>0.05,也应认为5个评委的打分具有一致性,这与Friedman检验具有一致性。

非参数检验与卡方检验比较:

卡方检验是数据总体是服从什么样的分布(都是频次的方式呈现出来的)

非参数检验是总体分布情况未知

统计分析软件SPSS详细教程

10.11统计分析软件&SPSS建立数据 目录 10.11统计分析软件&SPSS建立数据 (1) 10.25数据加工作图 (1) 11. 08绘图解答&描述性分析: (3) 2.描述性统计分析: (4) 四格表卡方检验:(检验某个连续变量的分布是否与某种理论分布一致,如是否符合正态分布) (7) 第七章非参数检验 (10) 1.单样本的非参数检验 (11) (1)卡方检验 (11) (2)二项分布检验 (12) 2.两独立样本的非参数检验 (13) 3.多独立样本的非参数检验 (16) 4.两相关样本的非参数检验 (16) 5.多相关样本的非参数检验 (18) 第五章均值检验与T检验 (20) 1.Means过程(均值检验)( (20) 4. 单样本T检验 (21) 5. 两独立样本T检验 (22) 6.两配对样本T检验 (23) 第六章方差分析 (25) 单因素方差分析: (25) 多因素方差分析: (29) 10.25数据加工作图 1.Excel中随机取值:=randbetween(55,99) 2.SPSS中新建数据,一列40个,正态分布随机数:先在40那里随便输入一个数表示选择40个可用的,然后按一下操作步骤: 3.排序:个案排秩

4.数据选取:数据-选择个案-如果条件满足: 计算新变量: 5.频次分析:分析-统计描述-频率

还原:个案-全部 6.加权: 还原 7.画图: 11. 08绘图解答&描述性分析:1.课后题:长条图

2.描述性统计分析: (1)频数分析:

(2)描述性分析: 描述性统计分析没有图形功能,也不能生成频数表,但描述性分析可以将原始数据转换成标准化得分,并以变量形式存入数据文件中,以便后续分析时应用。 操作: 分析—描述性分析:然后对结果进行筛选,去掉异常值,就得到标准化的数据: 任何形态的数据经过Z标准化处理之后就会是正态分布的<—错误!标准化是等比例缩放的,不会改变数据的原始分布状态, (3)探索分析:(检验是否是正态分布:茎叶图、箱图) 实例:

SPSS统计分析练习及答案

SPSS 统计分析练习题目 -2012-10-26 学号:________________________ 姓名:___________________________ (注:将本文件以学号+姓名.doc 的形式另存为一个文件,例2008144154葛爽.doc ,然后以附件形式发送至 all689@https://www.wendangku.net/doc/3b2887881.html, ,时间截止到2012年10月31日。没有指明数据文件名称的题目需自行在SPSS 中建立数据文件并录入相应数据,回答问题时应将SPSS 中的主要输出结果粘贴于答案中。) 1.一所国际新闻学校每年从各大高校中招募刚刚毕业的本科生参加培训,进而作为记者参加新闻工作。大多数刚刚毕业的学生以前没有任何做记者的经验,所以在正式成为一名记者之前,必须进行一段时间的学习,作为职业的预备课程。该国际新闻学校于是设计了两种培训方案: 方案A :学生参加为期15周的全天课程听课学习,随后参加预备课程考试; 方案B :学生直接先参加6个月的记者实习,再进行为期15周的全天课程听课学习,最后进行预备课程考试。 为了评估两种方案各自的有效性,学校随机选出了20名学生参加实验。事前还根据他们的文学等相关学科的成绩对这20人进行了分组,20人分成10组,每组中2人的成绩相近,然后随机地将2人分配去参加方案A 和方案B 的培训。 下表是这20人预备课程本学期的成绩单: 1 2 3 4 5 6 7 8 9 10 A 50 68 72 54 42 60 56 72 63 61 B 62 62 58 74 60 66 64 64 78 66 请问上面的数据是否证明了先参加实践对提高平均测试分数的效果显著? Independent Samples Test 1.843.1911.54518.140.60006239921373013731.5455.331.143.6000623993098710987 Equal varia Equal varia assumed X F Sig.vene's Test f ality of Varian t df g. (2-taile Mean ifferenc td. Erro ifferenc Lower Upper 5% Confiden nterval of the Difference t-test for Equality of Means 因p=0.140>0.05,故不能证明先参加实践对提高平均测试分数的效果显著。 2.早在1990年,美国巴维利亚的6个省报道了他们的婴儿死亡率(每1000名活着出生的婴儿的死亡数)以及母乳喂养率(母乳喂养婴儿的比例)的数据如下: 省号码 死亡率(每1000名婴儿中的死亡人数) 母乳喂养率(%) 1 250 60 2 320 30 3 170 90 4 300 60 5 270 40

SPSS多元线性回归分析报告实例操作步骤

SPSS 统计分析 多元线性回归分析方法操作与分析 实验目的: 引入1998~2008年上海市城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率和房屋空置率作为变量,来研究上海房价的变动因素。 实验变量: 以年份、商品房平均售价(元/平方米)、上海市城市人口密度(人/平方公里)、城市居民人均可支配收入(元)、五年以上平均年贷款利率(%)和房屋空置率(%)作为变量。 实验方法:多元线性回归分析法 软件: 操作过程: 第一步:导入Excel数据文件 1.open data document——open data——open;

2. Opening excel data source——OK. 第二步: 1.在最上面菜单里面选中Analyze——Regression——Linear ,Dependent(因变量)选择商品房平均售价,Independents(自变量)选择城市人口密度、城市居民人均可支配收入、五年以上平均年贷款利率、房屋空置率;Method选择Stepwise. 进入如下界面: 2.点击右侧Statistics,勾选Regression Coefficients(回归系数)选项组中的Estimates;勾选Residuals(残差)选项组中的Durbin-Watson、

Casewise diagnostics默认;接着选择Model fit、Collinearity diagnotics;点击Continue. 3.点击右侧Plots,选择*ZPRED(标准化预测值)作为纵轴变量,选择DEPENDNT(因变量)作为横轴变量;勾选选项组中的Standardized Residual Plots(标准化残差图)中的Histogram、Normal probability plot;点击Continue.

SPSS统计分析教程独立样本T检验

独立样本T检验 下面我们要用SPSS来做成组设计两样本均数比较的t检验,选择Analyze==>Compare Means==>Independent-Samples T test,系统弹出两样本t检验对话框如下: 将变量X选入test框内,变量 group选入grouping框内,注意这时 下面的Define Groups按钮变黑,表示 该按钮可用,单击它,系统弹出比较组 定义对话框如右图所示: 该对话框用于定义是哪两组相比,在两 个group框内分别输入1和2,表明是 变量group取值为1和2的两组相比。 然后单击Continue按钮,再单击OK 按钮,系统经过计算后会弹出结果浏览 窗口,首先给出的是两组的基本情况描 述,如样本量、均数等(糟糕,刚才的 半天工夫白费了),然后是t检验的结 果如下: Levene's Test for Equality of Variances t-test for Equality of Means F Sig. t df Sig. (2-tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Lower Upper X Equal variances .032 .860 2.524 22 .019 .4363 .1729 7.777E-02 .7948

差是否齐,这里的戒严结果为F = 0.032,p = 0.860,可见在本例中方差是齐的;第二部分则分别给出两组所在总体方差齐和方差不齐时的t检验结果,由于前面的方差齐性检验结果为方差齐,第二部分就应选用方差齐时的t检验结果,即上面一行列出的t= 2.524,ν=22,p=0.019。从而最终的统计结论为按α=0.05水准,拒绝H0,认为克山病患者与健康人的血磷值不同,从样本均数来看,可认为克山病患者的血磷值较高。

SPSS教程中文完整版

SPSS统计与分析 统计要与大量的数据打交道,涉及繁杂的计算和图表绘制。现代的数据分析工 作如果离开统计软件几乎是无法正常开展。在准确理解和掌握了各种统计方法原理 之后,再来掌握几种统计分析软件的实际操作,是十分必要的。 常见的统计软件有SAS,SPSS,MINITAB,EXCEL 等。这些统计软件的功能和作用大同小异,各自有所侧重。其中的SAS 和SPSS 是目前在大型企业、各类院校以及科研机构中较为流行的两种统计软件。特别是SPSS,其界面友好、功能强大、易学、易用,包含了几乎全部尖端的统计分析方法,具备完善的数据定义、操 作管理和开放的数据接口以及灵活而美观的统计图表制作。SPSS 在各类院校以及科研机构中更为流行。 SPSS(Statistical Product and Service Solutions,意为统计产品与服务解决方案)。自20 世纪60 年代SPSS 诞生以来,为适应各种操作系统平台的要求经历了多次版本更新,各种版本的SPSS for Windows 大同小异,在本试验课程中我们选择PASW Statistics 18.0 作为统计分析应用试验活动的工具。 1.SPSS 的运行模式 SPSS 主要有三种运行模式: (1)批处理模式 这种模式把已编写好的程序(语句程序)存为一个文件,提交给[开始]菜单上[SPSS for Windows]→[Production Mode Facility]程序运行。 (2)完全窗口菜单运行模式 这种模式通过选择窗口菜单和对话框完成各种操作。用户无须学会编程,简单 易用。 (3)程序运行模式 这种模式是在语句(Syntax)窗口中直接运行编写好的程序或者在脚本(script)窗口中运行脚本程序的一种运行方式。这种模式要求掌握SPSS 的语句或 脚本语言。本试验指导手册为初学者提供入门试验教程,采用“完全窗口菜单运行模式”。 2.SPSS 的启动 (1)在windows[开始]→[程序]→[PASW],在它的次级菜单中单击“SPSS 12.0 for Windows”即可启动SPSS 软件,进入SPSS for Windows 对话框,如图1.1, 图 1.2 所示。

SPSS统计分析方法及应用教学大纲

《SPSS统计软件》课程教学大纲 一、说明 (一)课程定义: 本课程是网络与新媒体专业的选修课程。SPSS统计软件应用课程,是以计算机科学为支持,将统计软件为运用工具,用所学习的统计学理论与方法为指导,系统介绍对社会经济现象数据的搜集、整理、分析等综合技能。 开设本门课程,能更好的帮助学生理解和掌握统计学的理论及方法,注重学生的实际操作与应用能力的培养。通过该课程的学习,使学生掌握spss统计软件,为其以后的学习和工作打好基础。 (二)编写依据: 本课程大纲根据武汉体育学院体育科技学院人文社科系网络与新媒体专业人才培养方案(2018版)编写。 (三)目的任务: 通过SPSS软件实验教学,培养学生根据实际问题建立SPSS数据文件、利用SPSS软件提供的各种统计功能进行数据的整理与分析,并结合相关的专业知识对分析结果给出解释,为学生以后的工作打下坚实的基础。要求学生课前做好实验准备,课中积极接受和沟通,课后认真总结并写好实验报告。 (四)学时数与学分数: 本课程教学总学时为36课时,2学分。具体学时分配参照下表。 (五)适用对象: 网络与新媒体专业大三学生。 (六)课程编码: KY1810A01

二、教学内容与学时分配 三、教学内容与知识点 第一章SPSS统计分析软件概述 第一节SPSS使用基础 知识点:SPSS软件的基本窗口、退出。 第二节 SPSS的基本运行方式 知识点:窗口菜单方式、程序运行方式、混合运行方式。第二章SPSS数据文件的建立和管理 第一节 SPSS数据文件 知识点:SPSS数据文件的特点、基本组织方法。 第二节 SPSS数据的结构和定义方法

相关文档
相关文档 最新文档