文档库 最新最全的文档下载
当前位置:文档库 › SPSS复习

SPSS复习

SPSS复习
SPSS复习

【例1-5】欲比较五种防护服对脉搏的影响,安排五个受试者在五个不同日期穿五种不同防护服测量脉搏数(次/分),结果见表1-2,问五种不同防护服对脉搏有否影响?(扬树勤.中国医学百科全书.医学统计学.上海:上海科学技术出版社,1985)

【实验设计与分析】本研究有三个因素,分别是日期、受试者和防护服。根据研究目的,主要研究防护服三个因素的对脉搏的作用,同时考虑日期和受试者对结果的影响。根据专业知识,三个因素间无交互作用,安排五个受试者在五个不同日期穿五种防护服,故研究因素的水平数相等,为拉丁方设计。

表1-2 穿着五种不同防护服的脉搏数(次/分)

试验受试者

日期 1 2 3 4 5

1 D 133.4 B 98.0 A 114.0 E 110.8 C 110.6

2 B 144.4 E 132.8 D 113.2 C 119.2 A 115.2

3 C 143.0 A 123.0 E 115.8 D 118.0 B 103.8

4 A 129.8 D 104.0 C 114.8 B 116.2 E 100.6

5 E 142.8 C 120.0 B 105.8 A 110.

6 D 109.8

【例2-1】在儿童哮喘病治疗中,采用双盲、交叉试验法,将13个病人随机分成两组,分别在两个时期中按次序FS和SF服用两种药物,F(formoterol)和S(salbutamol,舒喘宁),服药后8小时测PEF值(peak expiratory flow),单位为升/分钟(litres/minute),得如表2-1所示数据。对于次序为FS的儿童,第一时期服用F药,第二时期服用S药,而次序为SF 的儿童,第一时期服用S药,第二时期服用F药。研究目的:(1)不考虑时期作用时F与S 两药物作用的比较;(2)校正时期作用后F与S两药物作用的比较;(3)时期作用的检验;(4)延滞作用(或残留效应)检验。(苏炳华主编,新药临床试验统计分析新进展,上海科学技术文献出版社,2000年)

表2-1 儿童哮喘病治疗的2×2交叉设计试验结果

病人Obs

次序时期1 时期2 Sequence Period1 Period2

1 FS 310 270

2 FS 310 260

3 FS 370 300

4 FS 410 390

5 FS 250 210

6 FS 380 350

7 FS 330 365

8 SF 370 385

9 SF 310 400

10 SF 380 410

11 SF 290 320

12 SF 260 340

13 SF 90 220

【例3-1】利血平可以使小鼠中去甲肾上腺素(NE)等递质下降,现考察某种新药MWC是否具有对抗利血平使递质下降的作用,将24只小鼠随机等分为四组,并给予不同处理后,测定脑中NE的含量(ng/g湿组织),数据见表3-1。

问:利血平有降低递质的作用吗?新药MWC有抗递质下降的作用吗?两因素是否有交互作用?(方积乾.卫生统计学.北京:人民卫生出版社,2003)

表3-1 小鼠经不同处理后中NE的含量

蒸馏水组利血平组MWC组利血平组+ MWC组630 181 715 407

760 103 663 397

687 138 638 378

676 141 887 363

892 197 625 438

523 193 648 412

【例4-1】在使用不同诱导药物(因素A,两水平:1为生理盐水,2为戊巴比妥)情况下,正氟醚(因素B,两水平:1为不用,2为用)对细胞色素b5(nmol/mg)影响的研究中,用两种性别(因素C,两水平:1为雄性,2为雌性)的大白鼠进行实验。研究目的:(1)了解正氟醚对细胞色素b5的影响;(2)了解不同诱导药物对正氟醚的毒性作用有无影响;(3)了解不同诱导药物对不同性别大白鼠作用有何不同。采用正交设计方案,实验结果见(表4-1)。(王仁安.医学实验设计与统计分析.北京:北京大学医学出版社,2000)

表4-1 正氟醚对细胞色素b5(nmol/mg)影响的正交设计实验结果

实验号A B A×B C A×C 细胞色

素b5 1 2 3 4 5 6 7

1 1 1 1 1 1 1 1 0.66

2 1 1 1 2 2 2 2 0.23

3 1 2 2 1 1 2 2 0.11

4 1 2 2 2 2 1 1 0.13

5 2 1 2 1 2 1 2 0.64

6 2 1 2 2 1 2 1 0.95

7 2 2 1 1 2 2 1 0.15

8 2 2 1 2 1 1 2 0.12

【例7-1】比较三种猪饲料A1,A2,A3的效果。X为初始重量,Y为增重量,数据见表7-1。

表7-1 三组猪初始体重(kg)X与所增重(kg)Y

实验编号

A1A2A3

X1i Y1i X2i Y2i X3i Y3i

1 15 85 17 97 2

2 89

2 1

3 83 16 90 2

4 91

3 11 65 18 100 20 83

4 12 76 18 9

5 23 95

5 12 80 21 103 25 100

6 16 91 22 106 2

7 102

7 14 84 19 99 30 105

8 17 90 18 94 32 110

spss统计分析期末考试题

《统计分析软件》试(题)卷 班级 xxx班姓名 xxx 学号 xxx 说明:1.本试卷分析结果写在每个题目下面(即所留空白处); 2.考试时间为100分钟; 3.每个试题20分。 一、(20分)已经给出某个班的学生基本情况及其学习成绩的两个SPSS数据文件,学生成绩一.sav;学生成绩二.sav。要求: (1)将所给的两个SPSS数据文件“学生成绩一.sav”与“学生成绩二.sav”合并,并保存为“成绩.sav.” (2)对所建立的数据文件“成绩.sav”进行以下处理: 1)按照性别求出男、女数学成绩的各种统计量(包括平均成绩、标准差等)。 2)计算每个学生的总成绩、并按照总成绩的大小进行排序 3)把数学成绩分成优、良、中三个等级,规则为优(X≥85),良(75≤X ≤84),中(X≤74),并对优良中的人数进行统计。

分析: 描述统计量 性别N极小值极大值均值标准差 男数学477.0085.0082.2500 3.77492有效的 N (列表状态)4 女数学1667.0090.0078.50007.09930有效的 N (列表状态)16

注:成绩优良表示栏位sxcj 优为1 良为2 中为3 由表统计得,成绩为优的同学有4人,占总人数的20%;良的同学有12人,占总人数的60%;中的同学有4人,占总人数的40%。 二、(20分)为了解笔记本电脑的市场情况,针对笔记本电脑的3种品牌,进行了满意度调查,随机访问了30位消费者,让他们选出自己满意的品牌,调查结果见下表,其中变量“职业”的取值中,1表示文秘人员,2表示管理人员,3表示工程师,4表示其他人;3个品牌变量的取值中,1表示选择,0表示未选数据见Excel数据文件“调查.exe”。根据所给数据完成以下问题 (1)将所给数据的Excel文件导入到SPSS中,要求SPSS数据文件写出数据结构(包括变量名,变量类型,变量值标签等)命,并保存为:“调查. Sav”。 (2)试利用多选项分析,利用频数分析来分析消费者对不同品牌电脑的满意度状况;分析不同职业消费者对笔记本品牌满意度状况。 分析:

SPSS期末复习笔记

SPSS四种输出结果:枢轴表/轻量表、文本格式、统计图表、模型 SPSS四种窗口:语法窗口、输出窗口、数据窗口、脚本窗口 SPSS三种运行方式:命令行方式、批程序方式、菜单对话框 SPSS默认文件类型: 数据文件*.sav:此为SPSS软件默认的数据文件格式,双击可由SPSS直接读取。 命令文件*.sps:可在语法编辑程序(syntax)中先编写或贴上欲执行之分析指令,并将其存贮起来,供日后重复使用或检查之用。 输出文件*.spo: 允许直接加以编辑或转贴到其他编辑软件,SPSS 16.0版之后将输出文件的默认格式改为*.spv。 数据文件清洗——多余重复的数据筛选清楚,将确实的数据补充完整,将错误的数据纠正或删除。数据→标识重复个案标识异常个案 问题的答案被称作变量的取值。将答案转变成可用于统计分析的数据,需要经过一个被称作“编码coding”的过程。 数据阵/数据文件:n个案例、m个变量构成的阵列 SPSS对数据的处理是以变量为基础的。 所以,数据录入前一定先定义变量及其属性,包括指定名称、(存储)类型、宽度、小数、标签、值、缺失、列(宽)、对齐、度量标准和角色。这也被称作建立数据框架。 变量名必须以字母、汉字或字符@开头,数字不可以,其他字符可以是任何字母、数字或_、@、#、$等符号。变量名中不能有空白字符或其他特殊字符(如“!”、“?”、“*”等)。变量名最后一个字符不能是英文句号(.)。 在SPSS中不区分大小写。例如,HXH、hxh或Hxh对SPSS而言,均被视为同一个变量。 SPSS的保留字不能作为变量的名称,如ALL、AND、BY、EQ、GE、GT、LT、NE、NOT、OR、TO、WITH等。 SPSS中变量有3种基本类型:数值型、字符型(区分大小写)和日期型。 但根据不同的显示方式,数值型又被区分成:数值、逗号、圆点、科学计数法、美元、(用户)设定货币等6个子类型。不过,只有数值(N)最为常用。 默认状态下,所有变量的类型均为数值型,且宽度是8位、小数位是2位。 对话框界面可修改宽度和小数位,然后“确定”,但宽度必须大于小数位。

spss复习整理讲课教案

一、单项选择题:(本大题小题,1 分/每小题,共分) 1.SPSS 的数据文件后缀名是: (A) .sav 2. 对数据的各种统计处理,SPSS是在下面哪一个选项中进行: (A) 数据编辑窗口; 3. 在SPSS中,下面哪一个不是SPSS的运行方式 (A) 输入运行方式; 4. 下面哪一个选项不属于SPSS的数据分析步骤: (D)数据扩展; 5. 在SPSS中,下面哪一个选项不属于对变量(列)的描述: (B) 变量名称大小; 6. 在SPSS的定义中,下面哪一个变量名的定义是错误的: (D)A_BFG_ ;首字符应以英文字母开头,后面可以跟除了!、?、*之外的字母或数字。下划线、圆点不能为变量名的最后一个字符。SPSS允许用汉字作为变量名。 7. 在SPSS的定义中,下面哪一个变量名的定义是错误的: (A)AND ;SPSS有默认的变量名,以字母"VAR开头,后面补足5位数字,如VAR00001 VAR00012等。变量名不能与SPSS内部特有的具有特定含义的保留字同名,如ALL、BY、AND、NOT、OR等。 8. 在SPSS数据文件中,下面那一项不属于数据的结构: (D)数据值; 9. 在SPSS数据文件中,下面那一项属于数据的内容: (D)数据值; 10. 通常来说,发放了900份问卷,可直接得到的有效问卷有800份,贝U SPSS所建立的相关数据文件中的行数为 (D)800; 11. 下面那一项不属于SPSS的基本变量类型: (D)整数型; 12. 当在SPSS数据文件中输入变量为“职工姓名”,则应选择的变量类型是: (B) 字符串型; 13. 当在SPSS数据文件中输入变量为“职工工资数”,则应选择的变量类型是: (A) 数值型; 13. 当在SPSS数据文件中输入变量为“公司成立日期”,则应选择的变量类型是: (C) 日期型; 14. 在SPSS的数据结构中,下面那一项不是“缺失数据”的定义: (D) 数据不是科学计数法; 15. 统计学依据变量的计量尺度将变量分为三类,以下哪一类不属于这三类: (D)科学计数类型; 16. 在统计学中,变量“身高”属于计量尺度中的: (A) 数值型变量;身高(定距)、优良中差(定序)、性别(定类) 17. 在统计学中,将变量“年龄”分为“老年”、“中年”、“青年”三个取值,分别用1、2、3 表示,则变量“年龄”属于计量尺度中的: (B) 定序型变量; 18. 在统计学中,将变量“性别”分为“男”、“女”、两个取值,分别用1、2表示,则变量 “性别”属于计量尺度中的: (C) 定类型变量; 19. 下面哪一个选项不能被SPSS系统正常打开: (C) 文本文件格式; 20. 下面哪一个选项不能被SPSS系统正常打开: (D) .exe ; 21. 在SPSS数据编辑窗口中,需要定义变量的数据结构,以下哪一项不属于变量的数据结构: (D) 变量值;

spss 期末题库

课程名称:《SPSS分析方法与应用》 课程号: 2007422 一、单项选择题(共112小题) 1、试题编号:1000110,答案:RetEncryption(D)。 SPSS的安装类型有() A. 典型安装 B.压缩安装 C.用户自定义安装 D.以上都是 2、试题编号:1000310,答案:RetEncryption(D)。 数据编辑窗口的主要功能有() A.定义SPSS数据的结构 B.录入编辑和管理待分析的数据 C.结果输出 和B 3、试题编号:1000410,答案:RetEncryption(A)。 ()文件格式是SPSS独有的,一般无法通过Word,Excel等其他软件打开。 4、试题编号:1000510,答案:RetEncryption(D)。 ()是SPSS为用户提供的基本运行方式。 A.完全窗口菜单方式 B.程序运行方式 C.混合运行方式 D.以上都是 5、试题编号:1000810,答案:RetEncryption(D)。 ()是SPSS中有可用的基本数据类型 A.数值型 B.字符型 C.日期型 D.以上都是 6、试题编号:1000910,答案:RetEncryption(D)。 spss数据文件的扩展名是( ) A..htm B..xls C..dat D..sav 7、试题编号:1001010,答案:RetEncryption(B)。 数据编辑窗口中的一行称为一个() A.变量 B.个案 C.属性 D.元组 8、试题编号:1001110,答案:RetEncryption(C)。

变量的起名规则一般:变量名的字符个数不多于() A. 6 B. 7 C. 8 D. 9 9、试题编号:1001210,答案:RetEncryption(A)。 统计学依据数据的计量尺度将数据划分为三大类,它不包括() A. 定值型数据 B.定距型数据 C.定序型数据 D.定类型数据 10、试题编号:1001310,答案:RetEncryption(A)。 在横向合并数据文件时,两个数据文件都必须事先按关键变量值() A.升序排序 B.降序排序 C.不排序 D.可升可降 11、试题编号:1001810,答案:RetEncryption(A)。 SPSS算术表达式中,字符型()应该用引号引起来。 A 常量 B变量 C算术运算符 D函数 12、试题编号:1001910,答案:RetEncryption(A)。 复合条件表达式又称逻辑表达式,在逻辑运算中,下列()运算最优先。 B AND C OR D都不是 13、试题编号:1002010,答案:RetEncryption(A)。 数据选取的方法中,()是按符合条件的数据进行选取。 A 按指定条件选取 B 随即选取 C选取某一区域内样本 D过滤变量选取 14、试题编号:1002110,答案:RetEncryption(B)。 通过()可以达到将数据编辑窗口中的技术数据还原为原始数据的目的。 A 数据转置 B 加权处理 C 数据才分 D以上都是 15、试题编号:1002210,答案:RetEncryption(A)。 SPSS的()就是将数据编辑窗口中数据的行列互换 A 数据转置 B 加权处理 C 数据才分 D以上不都是 16、试题编号:1002310,答案:RetEncryption(B)。 SPSS软件是20世纪60年代末,由()大学的三位研究生最早研制开发的。 A、哈佛大学 B、斯坦福大学 C、波士顿大学 D、剑桥大学 17、试题编号:1002710,答案:RetEncryption(D)。 SPSS中进行参数检验应选择()主窗口菜单。 A、视图 B、编辑 C、文件 D、分析 18、试题编号:1002810,答案:RetEncryption(A)。 SPSS中进行输出结果的保存应选择()主窗口菜单。 A、视图 B、编辑 C、文件 D、分析 19、试题编号:1002910,答案:RetEncryption(C)。 SPSS中进行数据的排序应选择()主窗口菜单。 A、视图 B、编辑 C、数据 D、分析

SPSS期末重点整理

t检验:一般是用于检验两组观测值的均值之间差异是否显著的统计分析方法。 单样本t检验:用于检验样本均值与总体均值或某个已知值之间的差异的显著性。如果总体均值已知,那么样本均值与总体均值之间的差异显著性检验就属于单样本的t检验。 独立样本t检验:独立样本指的是样本之间彼此独立,没有任何关联。两个独立样本的t检验用于检验两个不相关样本在相同变量上的观测值均值之间差异的显著性。要求①正态性,各个样本均来自于正态分布的总体;②方差齐性,各个样本所在的总体的方差相等;③独立性,两组数据之间是相互独立的,不能够相互影响。 配对样本t检验:配对样本(或相关样本)指两个样本的数据之间彼此有关联。配对样本t 检验用于检验两个相关样本的均值或一个样本,两次测量结果的均值之间差异的显著性。 方差分析:是一种通过分析样本数据的各项变异来源,以检验三个或三个以上样本平均 数是否具有显著性差异的一种统计方法。 单因素方差分析:用于检验一个因素变量的不同水平是否给一个(或几个相互独立的)因变量造成了显著的差异或变化。 多重比较:进行了全方差分析之后,当自变量有3个或3个以上水平时,还有要对每两个组之间均值的差异进行比较,这称作事后组间均值的“多重比较”。 多因素方差分析:是检验两个或两个以上因素变量(自变量)的不同水平是否给一个(或几个相互独立的)因变量造成了显著的差异或变化的分析方法。 主效应和“交互作用”效应:主效应考察的是在忽略其他因素的情况下一个自变量对观察变量的影响,即这一个因素变量的不同水平分组下的观测值的均值之间的差异是否显著。当一个自变量的单独效应随另一个自变量的水平的不同而不同时,则这两个自变量对因变量的影响存在交互作用。 协变量方差分析:是在进行方差分析时将那些除了要考察的自变量之外的、很难控制的、且对因变量产生显著影响的无关变量作为“协变量”,在分析自变量对因变量的影响时,消除协变量对因变量的影响,从而使分析的结果更准确。。 多元方差分析:有两个或两个以上的因变量的方差分析(可以是单因素的,也可以是多因素的)称为多元方差分析。 重复测量的方差分析:用于某个测量指标对每个被试在不同的时间内进行多次(3次或3次以上)重复测量的情况。 组间因素:是被试分组的因素,组间因素有几个水平就把被试划分成几个组。 组内因素:又称重复测量因素,就是测试的不同水平或不同次数,是在每个被试内的因素。组内因素的不同水平决定了重复测量的次数。 方差成分分析:是对混合效应模型的分析,如对单变量重复测量和随机区组设计的分析,用于分析混合效应模型中各随机效应对因变量变异贡献的大小。通过对方差的成分进行分析,可以确定如何减小方差。 相关分析:是分析两个变量观测值变化的一致性程度或密切程度的统计方法。 简单相关分析:用于只对两个变量的数据做相关分析,其中包括两个连续变量之间的相关和两个等级变量之间的秩相关。 偏相关分析:是控制第三变量(或其他多个变量)的影响后,两变量间相关程度的统计方法。皮尔逊相关:是对两列变量为连续等间隔(等距、等比)数据,而且数据呈正态分布的相关

spss期末大数据分析报告

SPSS在教育研究中的应用某大学学生对本校的满意度调查 学院:教育学院 专业:课程与教学论 学号:201411000156 姓名:李平 2014年12月13日

目录 一、研究问题的提出 (3) 二、研究内容与方法 (3) (一) 研究内容 (3) (二) 研究方法 (3) 三、调查对象及人数 (4) 四、问卷分析 (5) (一)回收情况 (5) (二)信度分析 (5) 五、数据统计与分析 (6) (一)数据输入 (6) (二)数据分析 (7) 1.描述统计 (7) (1)多选题描述统计 (7) (2)单选题描述统计 (9) 2.推断统计 (12) (1)独立样本T检验 (12) (2)单一样本T检验 (15) (3)单因素方差分析 (17) (4) X2检验 (21) 3.相关分析 (22) (1)变量间相关分析 (22) (2)维度间相关分析 (23) 六、结论 (27) 七、附录 (28)

一、研究问题的提出 学生的学校生活和成长密切相关。我们通过对他们的大学生活满意度的调查结果向有关部门提出建议,并希望能引起学校对这一系列问题的关注,最终希望大学生对其大学的满意度有所提升,大学生是一个庞大的群体,特别是近几年,随着高校的扩招,我国越来越多人能够上大学。上大学是很多人的梦想,他们都憧憬着大学校园的生活,然而当他们进了大学后才发现大学生活并非所想的美好,取而代之的却是对校园生活的不满,大学生是十分宝贵的人才资源,他们对校园生活的体验和感受,与他们的更好的学习。 二、研究内容与方法 (一)研究内容 了解学生对于学校的师资水平、环境、日常管理等各方面的满意度。 (二)研究方法 1.问卷编制 本研究采用自编问卷,问卷共由两部分组成:基本情况部分包括被调查者的性别、年级等,问卷主体部分包括师资水平、学校环境、日常管理三大维度,细分为12个三级指标(见表2-1),问卷采用五点制计分法,即“非常满意”、“满意”、“一般”、“不满意”、“非常不满意”,分别赋值5分、4分、3分、2分、1分。 表2-1 某大学学生对本校的满意度测评指标体系 一 级指标 二级指标(潜在变量)三级指标(观测变量) 对自己师资水平对教师教学方法、对教师工作态 度、对教师人品修养、对师资配备 学校的意学校环境对学习环境、对就餐环境、对居住 环境、对校园绿化环境 满度指数日常管理对专业课时安排、对收费标准、对 奖、助学金制度、对学校治安

研究生SPSS练习题

SPSS上机练习题 一、10名15岁中学生身高体重数据如下: 编号 1 2 3 4 5 6 7 8 9 10 性别男男男男男女女女女女 身高(cm)166.0 169.0 170.0 165.1 172.0 159.4 161.3 158.0 158.6 169.0 体重(kg)57.0 58.5 51.0 58.0 55.0 44.7 45.4 44.3 42.8 51.5 体重指数(BMI)=体重(kg) / 身高(m)2,即体重(kg)除以身高(m)的平方。回答下列问题: (1)男生体重指数的均数为(kg/m2);标准差为:(kg/m2)(2)女生体重指数的均数为(kg/m2);标准差为:(kg/m2) 二、将126例十二指肠球部溃疡病人随机分为两组。甲药组治疗62人,54人有效;乙药组治疗64人,44人有效。问两种药物的治疗效果有无差别? 三、为研究口服二号避孕药对血液凝固的影响,随机抽取服药组10例,对照组10例,分别测定其抗凝血酶活力(u)如下。问服用二号避孕药对抗凝血酶活力是否有影响?(3.sav) 口服二号避孕药对血液凝固的影响 四、为比较两种方法对乳酸饮料中脂肪含量测定结果是否不同,随机抽取了10份乳酸饮料制品,分别用脂肪酸水解法和哥特里-罗紫法测定其结果如表3-5第(1)~(3)栏。问两法测定结果是否不同? 表3-5 两种方法对乳酸饮料中脂肪含量的测定结果(%) 编号(1) 哥特里-罗 紫法 (2) 脂肪酸水解 法 (3) 1 0.840 0.580 2 0.591 0.509 3 0.67 4 0.500

4 0.632 0.316 5 0.687 0.337 6 0.978 0.517 7 0.750 0.454 8 0.730 0.512 9 1.200 0.997 10 0.870 0.506 五、某单位欲研究3种药物对小白鼠肉瘤的抑制作用,将性别相同、体重相近的同一配伍组的3只小白鼠分别用3种药物抑癌,共5个配伍组。实验结果得瘤重(克)如下。试比较3种药物的抑癌作用有无差别? 三种药物的抑癌作用(瘤重:克) 六、某医院用A、B两种配方治疗慢性阑尾炎,治疗结果如下。试分析两种配方治疗慢性阑尾炎的疗效有无差别? 两种配方治疗慢性阑尾炎疗效 七、10名不同年龄妇女(岁)的收缩压测定值(kPa)如下,试进行回归分析。 妇女号 1 2 3 4 5 6 7 7 9 10 年龄X i56427236634755493842 收缩压Y i19.616.721.315.719.817.120.019.315.318.7

SPSS期末考试整理

●一。变量的赋值 1.乘方(**),例如二的三次方:2**3 2.不同规则的赋值:转换→计算变量(如果),每一个规则的赋值都要重新进行此步骤(但注意每一遍的变量名都不变,并且他都会问你要不要替换成新的变量,你选是就行了) 3.不同规则的赋值:(1)转换→重新编码为不同变量:输入变量,输出变量,要点击“变化量”才可保存输出变量→新值和旧值:值(直接选取取值)、范围(最大到最小的范围,包含端点值),点击“添加”成功保存新值和旧值→所有不同取值规则都完成后点击继续、确定,则在变量视图多出一个新变量(2)若不想包含端点值,可以采取小数的方式变换,eg. 899.9(小数位比该变量属性的小数位多一位就行了) (3)这种要先把BMI按照男女分开,然后再分组的,可以在对话框中点击“如果”选项进行设置,并且要分别对男女进行上述操作(一共做两遍)。 二。离散化 1可视离散化:转换→可视分箱,分割点:所以想生成几组,就定义几个分割点;填写第一个分割点的时候就必须填写最小值;一定要选中上端点排除。 三。排序 1.转换→自动重新编码:不分组,从头到尾排序 2.转换→个案排秩(1)多层次数据:基于A变量对B变量进行排序。(例如,基于职称对收入进行排序,就是不同职称各自组内排工资的高低)(2)设置秩1;绑定值 四。时间序列:转换→变动值 五。查找与计数:转换→对个案内的值计数(查找“基本工资800-900女职工”,生成新变量,满足这个条件的标为1,不符合这个标准的标为0,男职工标为缺失。范围:包含上限下限) ●六。数据→个案排序:把变量顺序完全按照你想要的标准排序,所有的变量顺序都会改变 七。拆分文件:要分男女进行数据统计:数据→拆分文件→比较组/按组输出,分组依据。不分男女进行数据统计:数据→拆分文件→分析所有个案 八。选择个案(例如只选择三年级的变量进行分析):数据→选择个案→如果条件满足:如果;随机个案样本;基于时间或个案范围;使用过滤变量(例如要把身高为缺失值和值为0的剔除)→输出:过滤(不符合条件的数据会画上“/”,原始数据并未删除);将选定个案复制到新数据集(形成一个新的SPSS数据文件,原始数据并未删除);删除未选定的个案(删除原始数据,不建议使用)→之后在分析的时候就只会分析三年级的变量。不想只分析三年及,记得重新做这一步。 九。加权个案:数据→加权个案(例。100分的有5人)。不想加权了,记得重新做这一步。 十。分类汇总(1)例如算不同年级的人的身高的均值、方差…(只能计算函数)(2)数据→汇总,分界变量(分类标准变量),变量摘要(计算变量),函数:选择计算变量函数,变量名称与标签:定义新生成变量的名称与标签 ●十一。长宽数据的转换 1.长数据变宽数据:索引变量消失变成score的尾缀 (1)数据→重组(重构)→个案重组为变量,标识变量,索引变量,电脑会自动帮你选出是xx xx要重构(不同疗程值不同的变量)。选完上述这些之后就一直点下一步&完成&立即重构&确定即可 (2)注意:当有多个变量需要重构时要自己决定“新变量组的顺序”。(A1A2B1B2;A1B1A2B2) 2.宽数据变长数据:score的尾缀消失变成索引变量 (1)数据→重组(重构)→变量重组为个案,个案组标识:使用选定变量,固定变量(手动选择,电脑不会自动帮你选出了),要转置的变量即值不固定的要重构的变量(手动选择,电脑不会自动帮你选出了)。选完上述这些之后就一直点击下一步&完成&立即重构数据&确定就行了 (2)当有多个变量需要重构时,这块的操作要特别注意:○1首先在“变量组数目”中选择“多个”○2然后在“选择变量”里要对于不同的“目标变量”分别定义“要转置的变量”(在本题中,即对于kidid目标变量定义一遍要转置的变量;对于age目标变量在定义一遍要转置的变量。其中,这两个要转置的变量必须是完全不同的)。但只需要定义一次“个案组标识”&“固定变量”(固定变量是相对于kidid & age都固定的那些变量;而不是说在对kidid进行转置的时候,age就是固定变量了;因此,固定变量只用定义一次且固定变量可以为空)。并且,你要特别注意,“个案组标识”里选择的变量& n个“要转置的变量”里选择的变量&“固定变量”里选择的变量都必须是完全不相同的。

SPSS数据统计分析(复习)

均值:方差检验 (【单样本T检验】 1.从某厂第一季度生产的电子元件中抽取了部分样品测量他们的电阻(单位:欧姆),数据 资料在“小测1.sav”中。按质量规定,元件的额定电阻为0.140欧姆,假定元件的电阻服从正态分布。判断这批产品的质量是否合格。 从上表单样本数据统计量表中可以得测试电阻值的样品有35个,均值为0.1423,标准差为0.00426,均值标准误为0.00072 从单样本检验表中可以看出:t统计量的值为3.174,自由度为34,均值差值为0.00229,95%的置信区间(0.0008,0.0037),相伴概率为0.003,远小于显著性水平0.05,说明假设成立,也就是说这批产品的质量与0.140欧姆有显著性差异,说明这批产品的质量是不合格的。 【独立样本T检验】 2、甲乙两台测时仪同时测量两靶间子弹飞行的时间,测量结果在“小测2.sav”中,假定两台仪器测量的结果服从正态分布,设显著性水平为0.05,问两台仪器的测量结果有无显著差异Levene检验主要用来检验原假设条件是否成立,(即:假设方差相等和方差不相等两种情况)如果SIG>0.05,证明假设成立,不能够拒绝原假设,如果SIG<0.05,证明假设不成立,拒绝原假设。

在组数据统计表中可以得到第1组有6个样本,均值为12.8883,标准差是0.72256,均值标准误为0.29498;第二组有7个样本,均值是13,标准差是0.5870均值标准误是0.22189; 在独立样本检验表中可以得出F 的统计量的值为1.028,相伴概况为0,332,远大于显著性水平0.05,说明这两组数据的方差之间不存在显著差别,所以适合采用独立样本T检验。t的统计量为-0.772,自由度为11,95%的置信区间,(01.07881,0.51834),相伴概率为0.456,远大于显著性水平0.05,假设成立,不能拒绝原假设,说明这2台仪器的测试结果没有显著性差异。 【配对样本T检验】 3、分别从甲乙两厂生产的同规格的前轮轮胎中随机抽取10只,将它们配对安装在10辆汽车的左右轮上,行驶相同的里程之后,测得各只轮胎磨损的数据在“小测 3.sav”中,试用配对样本T检验过程检验两种轮胎的耐磨性之间的差异。 从上表的成对样本数据统计表中可以看出:左轮胎磨损量的举止为614.2,有10个样本,标准差是119。644,均值的标准误为37.834;右轮胎磨损量均值为568.9,有10个样本,标准差为99.31,均值的标准误为31.405; 成对样本相关系数表看出:x1和x2的相关系数为08.9%,相关性很高 在成对样本检验表中可以发现:t的统计量为 3.343,自由度为9,95%的置信区间(8.82633,45.77367),相伴概率为0.009,远小于显著性水平0.05,说明左右轮胎的耐磨性有显著性差异。

spss统计分析期末考试题

《统计分析软件》试(题)卷 班级xxx班姓名xxx 学号xxx 题号一二三四五六总成绩成绩 说明:1.本试卷分析结果写在每个题目下面(即所留空白处); 2.考试时间为100分钟; 3.每个试题20分。 一、(20分)已经给出某个班的学生基本情况及其学习成绩的两个SPSS数据文件,学生成绩一.sav;学生成绩二.sav。要求: (1)将所给的两个SPSS数据文件“学生成绩一.sav”与“学生成绩二.sav”合并,并保存为“成绩.sav.” (2)对所建立的数据文件“成绩.sav”进行以下处理: 1)按照性别求出男、女数学成绩的各种统计量(包括平均成绩、标准差等)。 2)计算每个学生的总成绩、并按照总成绩的大小进行排序 3)把数学成绩分成优、良、中三个等级,规则为优(X≥85),良(75≤X ≤84),中(X≤74),并对优良中的人数进行统计。

分析: (2) 描述统计量 性别N 极小值极大值均值标准差 男数学 4 77.00 85.00 82.2500 3.77492 有效的N (列表状态) 4 女数学16 67.00 90.00 78.5000 7.09930 有效的N (列表状态)16

注:成绩优良表示栏位sxcj 优为1 良为2 中为3 由表统计得,成绩为优的同学有4人,占总人数的20%;良的同学有12人,占总人数的60%;中的同学有4人,占总人数的40%。 二、(20分)为了解笔记本电脑的市场情况,针对笔记本电脑的3种品牌,进行了满意度调查,随机访问了30位消费者,让他们选出自己满意的品牌,调查结果见下表,其中变量“职业”的取值中,1表示文秘人员,2表示管理人员,3表示工程师,4表示其他人;3个品牌变量的取值中,1表示选择,0表示未选数据见Excel数据文件“调查.exe”。根据所给数据完成以下问题 (1)将所给数据的Excel文件导入到SPSS中,要求SPSS数据文件写出数据结构(包括变量名,变量类型,变量值标签等)命,并保存为:“调查. Sav”。 (2)试利用多选项分析,利用频数分析来分析消费者对不同品牌电脑的满意度状况;分析不同职业消费者对笔记本品牌满意度状况。 分析:

SPSS复习题

SPSS复习题 一、简答题: 1.SPSS的运行方式有几种?分别是什么?各自的特点是什么? 答:SPSS的运行方式有三种,分别是完全窗口菜单运行方式、程序运行方式、混合运行方式。完全窗口菜单运行方式的特点:所有分析操作过程都是通过菜单和按钮及对话框方式进行的.是经常使用的一种运行方式,适用于一般分析和SPSS的初学者。程序运行方式的特点:手工编写SPSS命令程序;一次性提交计算机运行;适用于大规模的分析工作和熟练的SPSS 程序员。混合运行方式的特点:在使用菜单的同时编辑SPSS程序,是完全窗口菜单方式和程序运行方式的综合。 2.SPSS中数据视图所对应的表格与一般的电子处理软件有什么区别? 答:与一般电子表格处理软件相比,SPSS的“Data View”窗口还有以下一些特性: (1)一个列对应一个变量,即每一列代表一个变量(Variable)或一个被观测量的特征;(2)行是观测,即每一行代表一个个体、一个观测、一个样品,在SPSS中称为事件(Case);(3)单元包含值,即每个单元包括一个观测中的单个变量值; (4)数据文件是一张长方形的二维表。 3.SPSS有哪两个主要窗口?它们的功能和特点各是什么? 答:数据编辑窗口,功能:定义SPSS数据的结构、数据文件的录入、编辑、管理等基本操作的窗口;特点:SPSS运行过程中自动打开;SPSS中各统计分析功能都是针对该窗口中的数据进行的;窗口中的数据文件以.sav存于磁盘上;两个视图:数据视图和变量视图。 输出窗口,功能:SPSS统计分析报表及图形的输出的窗口;特点:在进行第一次分析时自动打开,也可手工打开;输出窗口可以关闭,窗口内容以.spv存于磁盘上;两个视图:目录视图和内容视图。 4.SPSS的数据加工和管理功能主要集中在哪些菜单中?统计绘图和分析功能主要集中在哪些菜单中? 答案:SPSS的数据加工和管理功能主要集中在编辑菜单、数据菜单、转换菜单。统计绘图和分析功能主要集中在统计绘图和分析功能主要集中在分析菜单和图形菜单。 5.利用SPSS进行数据分析的一般步骤是什么? 答案:主要集中在以下4个阶段: (1)SPSS数据的准备阶段 在该阶段应按照SPSS的要求,建立SPSS数据文件。其中包括在数据编辑窗口中定义

spss复习资料整理

第一章 1.SPSS是软件英文名称的首字母缩写,其最初为Statistical Package for the Social Sciences的缩写,即“社会科学统计软件包”。 2.SPSS系统运行管理方式(SPSS的几种基本运行方式)有: (1)完全窗口菜单运行方式 (2)程序运行管理方式 (3)混合运行管理方式 3.SPSS的界面提供的五个窗口:数据编辑窗口、结果管理窗口、结果编辑窗口、语法编辑窗口、脚本窗口。 第二章 1.SPSS的文件类型:语法文件(*.sps)、数据文件(*.sav)、结果输出文件(*.spv)。 2.SPSS数据编辑器的每一行数据称为一个个案(Case),每一个数据代表个体的属性,即变量(V ariable)。 3.SPSS变量名的命名规则: 1)必须以英文字母开头,其他部分可以含有字母、数字、下划线(即“-”); 2)变量名尽量避免和SPSS已有的关键字重复,例如sum、compute、anova等; 3)SPSS13及以后版本支持变量名最长为64Byte,即变量名最长为64个英文字符,或者32个中文字符; 4)SPSS变量名不区分大小写,即SPSS认为Name、name、nAme这三个变量名没有区别。 4.变量度量类型:定量(个数、高度、温度等)、定序(“十分重要”、“重要”、“一般”、“不重要”)、定类(名字、地址、电话等)。 5.列和宽度的区别: 变量宽度:对字符型变量,该数值决定了你能输入的字符串的长度; 列:设定该变量数据视图中列的宽度。 7.默认的缺失值类型:数值型类型(.)、字符串类型(空格)。 8.数据文件的合并包括:纵向合并和横向合并(合并个案和合并变量),合并变量包括一对一合并和一对多合并。 9.SPSS用“(*)”表示变量来自于当前活动数据文件中的变量,而用“(+)”表示将要和当前数据文件进行合并的数据文件中的变量。 10.在合并数据文件之前,所有需要合并的数据文件必须预先按照关键变量进行升序排列。否则,合并文件程序将失败。 11.(选择题)一对一合并变量时,两个文件都要提供个案;一对多合并时,活动的和非活动的文件都可以作为关键字。 课后练习题: 6.下列可以作为SPSS变量名的是 A).PRENTS12 B).1Name C).NOT TRUE D).@result 7.SPSS中可以设置工作目录,具体设置可以按照以下菜单: A).【选项】→【设置】 B).【编辑】→【选项】→【设置】 C).【编辑】→【选项】→【文件位置】

spss期末考试上机复习题(含答案)75709

江苏理工学院2017—2018学年第1学期 《spss软件应用》上机操作题库 1.随机抽取100人,按男女不同性别分类,将学生成绩分为中等以上及中等以下两类,结果 如下表。问男女生在学业成绩上有无显著差异? 中等以上中等以下 男 女 性别* 学业成绩交叉制表 计数 学业成绩 中等以上中等以下 合计 性别男23 17 40 女38 22 60 合计61 39 100 根据皮尔逊卡方检验,p=0.558〉0.05 所以男生女生在学业成绩上无显著性差异。 2.为了研究两种教学方法的效果。选择了6对智商、年龄、阅读能力、家庭条件都相同的儿童进行了实验。结果(测试分数)如下。问:能否认为新教学方法优于原教学方法(采用非参数检验)? 序号新教学方法原教学方法 1 83 78

2 3 4 5 6 69 87 93 78 59 65 88 91 72 59 答:由威尔逊非参数检验分析可知p=0.08〉0.05,所以不能认为新教学方法显著优于原教学方法。 3.下面的表格记录了某公司采用新、旧两种培训前后的工作能力评分增加情况,分析目的是比较这两种培训方法的效果有无差异。考虑到加盟公司时间可能也是影响因素,将加盟时间按月进行了记录。 方法加盟时间分数方法加盟时间分数 旧方法 1.5 9 新方法 2 12 旧方法 2.5 10.5 新方法 4.5 14 旧方法 5.5 13 新方法7 16 旧方法 1 8 新方法0.5 9 旧方法 4 11 新方法 4.5 12 旧方法 5 9.5 新方法 4.5 10 旧方法 3.5 10 新方法 2 10 旧方法 4 12 新方法 5 14 旧方法 4.5 12.5 新方法 6 16 (1)分不同的培训方法计算加盟时间、评分增加量的平均数。 (2)分析两种培训方式的效果是否有差异? 答:(1) 描述统计量 N 极小值极大值均值标准差 培训方法 = 1 (FILTER) 9 1 1 1.00 .000 加盟时间9 .50 7.00 4.0000 2.09165 分数增加量9 9.00 16.00 12.5556 2.60342 有效的 N (列表状态)9 所以新方法的加盟时间平均数为4 分数增加量的平均数为12.5556

回归分析SPSS习题复习资料

回归分析习题 1通常用来评价商业中心经营好坏的一个综合指标是单位面积的营业额,它是单位时间内(通常为一年)的营业额与经营面积的比值。对单位面积营业额的影响因素的指标有单位小时车流量、日人流量、居民年平均消费额、消费者对商场的环境、设施及商品的丰富程度的满意度评分。这几个指标中车流量和人流量是通过同时对几个商业中心进行实地观测而得到的。而居民年平均消费额、消费者对商场的环境、设施及商品的丰富程度的满意度评分是通过随机采访顾客而得到的平均值数据。(数据集wyzl4_2中存放了从某市随机抽取的20个商业中心有关指标的数据,利用该数据完成下列工作 (1)研究变量间的相关程度。(其余6个变量与“单位面积年营业额”间的相关程度,其余6个变量之间的相关程度); (2)由(1)的结论建立“单位面积年营业额”与和其线性相关程度最高的变量的一元线性回归方程; (3)采用逐步回归方法建立“单位面积年营业额”的预测公式。 表20个商业中心有关指标的数据 2.我国从1982~2001年间的20年的财政收入(Y)和国内生产总值(X)的数据存放在数据集wyz4_4_7.中。试分别采用指数回归、对数回归、幂函数回归和多项式回归给出回归方程,并选择最佳回归方程。 1.解:(1)变量间的相关性分析 利用SPSS软件构造所有变量的散点图矩阵和相关矩阵,结果见图1和表1 从散点图矩阵直观可以看出Y “单位面积年营业额”与x2“日人流量(万人) ”和x3“居民年消费额(万元) ”线性关系较密切。

x2“日人流量 (万人) ”与x6 “对商场商品丰富程度满意度” 线性关系较密切 从表1得)3,(x y ρ=0.795**,)2,(x y ρ=0.790**,)6,(x y ρ=.0 .697**, 说明 Y “单位面积年营业额”与x3“居民年消费额(万元) ”,x2“日人流量 (万人) ”,x6 “对商场商品丰富程度满意度”及x5 “对商场设施满意度”在0 .01 水平(双侧)上显著相关线性关。可以考虑采用多元线性回归模型来建立“单位面积年营业额”的预测公式。 图1散点图矩阵 单位面积 年营业额 (万元/m2) 每小时机 动车流量 (万辆) 日人流量 (万人) 居民年 消费额 (万元) 对商场 环境 满意度 对商场 设施 满意度 对商场商 品丰富程 度满意度 单位面积 年营业额 (万元/m2) Pearson 相关性 1 .413 .790** .795** .341 .450* .697** 显著性(双侧) .071 .000 .000 .141 .046 .001 N 20 20 20 20 20 20 20 每小时机动车 流量(万辆) Pearson 相关性 .413 1 .751** -.129 .664** .424 .774** 显著性(双侧) .071 .000 .588 .001 .062 .000 N 20 20 20 20 20 20 20 日人流量 (万人) Pearson 相关性 .790** .751** 1 .273 .594** .279 .983**

spss期末考试上机复习题(含标准答案)

spss期末考试上机复习题(含答案)

————————————————————————————————作者:————————————————————————————————日期:

江苏理工学院2017—2018学年第1学期 《spss软件应用》上机操作题库 1.随机抽取100人,按男女不同性别分类,将学生成绩分为中等以上及中等以下两类,结果 如下表。问男女生在学业成绩上有无显著差异? 中等以上中等以下 男23 17 女38 22 性别* 学业成绩交叉制表 计数 学业成绩 合计 中等以上中等以下 性别男23 17 40 女38 22 60 合计61 39 100 卡方检验 值df 渐进 Sig. (双侧) 精确 Sig.(双侧) 精确 Sig.(单侧) Pearson 卡方.343a 1 .558 连续校正b.142 1 .706 似然比.342 1 .558 Fisher 的精确检验.676 .352 线性和线性组合.340 1 .560 有效案例中的 N 100 a. 0 单元格(.0%) 的期望计数少于 5。最小期望计数为 15.60。 b. 仅对 2x2 表计算 根据皮尔逊卡方检验,p=0.558〉0.05 所以男生女生在学业成绩上无显著性差异。 2.为了研究两种教学方法的效果。选择了6对智商、年龄、阅读能力、家庭条件都相同的儿童进行了实验。结果(测试分数)如下。问:能否认为新教学方法优于原教学方法(采用非参数检验)? 序号新教学方法原教学方法 1 2 3 83 69 87 78 65 88

4 5 6 93 78 59 91 72 59 检验统计量b 原教学方法 - 新 教学方法 Z -1.753a 渐近显著性(双侧) .080 a. 基于正秩。 b. Wilcoxon 带符号秩检验 答:由威尔逊非参数检验分析可知p=0.08〉0.05,所以不能认为新教学方法显著优于原教学方法。 3.下面的表格记录了某公司采用新、旧两种培训前后的工作能力评分增加情况,分析目的是比较这两种培训方法的效果有无差异。考虑到加盟公司时间可能也是影响因素,将加盟时间按月进行了记录。 方法加盟时间分数方法加盟时间分数 旧方法 1.5 9 新方法 2 12 旧方法 2.5 10.5 新方法 4.5 14 旧方法 5.5 13 新方法7 16 旧方法 1 8 新方法0.5 9 旧方法 4 11 新方法 4.5 12 旧方法 5 9.5 新方法 4.5 10 旧方法 3.5 10 新方法 2 10 旧方法 4 12 新方法 5 14 旧方法 4.5 12.5 新方法 6 16 (1)分不同的培训方法计算加盟时间、评分增加量的平均数。 (2)分析两种培训方式的效果是否有差异? 答:(1) 描述统计量 N 极小值极大值均值标准差 培训方法 = 1 (FILTER) 9 1 1 1.00 .000 加盟时间9 .50 7.00 4.0000 2.09165 分数增加量9 9.00 16.00 12.5556 2.60342 有效的 N (列表状态)9 所以新方法的加盟时间平均数为4 分数增加量的平均数为12.5556 描述统计量

SPSS实际操作练习题汇总

实习一SPSS基本操作 第1题:请把下面的频数表资料录入到SPSS数据库中,并划出直方图,同时计算均数和标准差。 身高组段频数 110~ 1 112~ 3 114~ 9 116~ 9 118~ 15 120~ 18 122~ 21 124~ 14 126~ 10 128~ 4 130~ 3 132~ 2 134~136 1 解答:1、输入中位数(小数位0):111,113,115,117,....135;和频数1,3,. (1) 2、对频数进行加权:DATA━Weigh Cases━Weigh Cases by━频数━OK 3、Analyze━Descriptive Statistics━Frequences━将组中值加 入Variable框━点击Statistics按钮━选中Mean和 Std.devision━Continue━点击Charts按钮━选中HIstograms ━Continue━OK 第2题某医生收集了81例30-49岁健康男子血清中的总胆固醇值(mg/dL)测定结果如下,试编制频数分布表,并计算这81名男性血清胆 固醇含量的样本均数。 219.7 184.0 130.0 237.0 152.5 137.4 163.2 166.3 181.7 176.0 168.8 208.0 243.1 201.0 278.8 214.0 131.7 201.0 199.9 222.6 184.9 197.8 200.6 197.0 181.4 183.1 135.2 169.0 188.6 241.2 205.5 133.6 178.8 139.4 131.6 171.0 155.7 225.7 137.9 129.2 157.5 188.1 204.8 191.7 109.7 199.1 196.7 226.3 185.0 206.2 163.8 166.9 184.0 245.6 188.5 214.3 97.5 175.7 129.3 188.0 160.9 225.7 199.2 174.6 168.9 166.3 176.7 220.7 252.9 183.6 177.9 160.8 117.9 159.2 251.4 181.1 164.0 153.4 246.4 196.6 155.4 解答:1、输入数据:单列,81行。

相关文档