文档库 最新最全的文档下载
当前位置:文档库 › SPSS统计软件课程作业

SPSS统计软件课程作业

SPSS统计软件课程作业
SPSS统计软件课程作业

《SPSS统计软件》课程作业

信计111 刘晓蕾1. 某单位对100名女生测定血清总蛋白含量,数据如下:

74.3 78.8 68.8 78.0 70.4 80.5 80.5 69.7 71.2 73.5

79.5 75.6 75.0 78.8 72.0 72.0 72.0 74.3 71.2 72.0

75.0 73.5 78.8 74.3 75.8 65.0 74.3 71.2 69.7 68.0

73.5 75.0 72.0 64.3 75.8 80.3 69.7 74.3 73.5 73.5

75.8 75.8 68.8 76.5 70.4 71.2 81.2 75.0 70.4 68.0

70.4 72.0 76.5 74.3 76.5 77.6 67.3 72.0 75.0 74.3

73.5 79.5 73.5 74.7 65.0 76.5 81.6 75.4 72.7 72.7

67.2 76.5 72.7 70.4 77.2 68.8 67.3 67.3 67.3 72.7

75.8 73.5 75.0 73.5 73.5 73.5 72.7 81.6 70.3 74.3

73.5 79.5 70.4 76.5 72.7 77.2 84.3 75.0 76.5 70.4

计算样本均值、中位数、方差、标准差、最大值、最小值、极差、偏度和峰度,并给出均值的置信水平为95%的置信区间。

第1步数据组织:

定义1个变量为:“血清总蛋白含量”,其度量标准为“度量”。

第2步探索分析设置:

选择菜单“分析→描述统计→探索”,打开“探索”对话框,,将“血清总蛋白含量”

字段移入“因变量列表”。

打开“统计量”对话框,选中“描述性”选项;

打开“探索:图”对话框,选中“按因子水平分组”、“茎叶图”、“带检验的正态图”、“直方图”等选项。

打开“探索:选项”,选中“按列表排除个案”选项。

第3步运行结果及分析:

描述

统计量标准误血清总蛋白含量均值73.6680 .39389

均值的 95% 置信区间下限72.8864

上限74.4496

5% 修整均值73.6533

中值73.5000

方差15.515

标准差 3.93892

极小值64.30

极大值84.30

范围20.00

四分位距 4.60

偏度.054 .241

峰度.037 .478

表中显示“血清总蛋白含量”的描述性统计量,左表中只显示的是均值、均值的95%置信区间的上下限、中值、方差、标准差、极大/小值、偏度、峰度等

2. 绘出习题1所给数据的直方图、盒形图和QQ图,并判断该数据是否服从正态分布。

上图为标准Q-Q图,Q-Q图可以用来检验数据是否服从某种分布,在Q-Q图中,检验数据是否较好地服从给定分布的标准有两个:①看标准Q-Q图上的数据点与直线的重合度;②Q-Q趋势图上的点是否关于直线Y=0在较小的范围内上下波动。从上图中可以看出,题目中的数据与直线重合度较好,故很好地服从正态分布,这与前面的正态检验表中的结果是一致的

箱图中显示血清蛋白总含量数据绘制成对应的箱体。每一个箱体上方那条线的取值代表该分组中最大值,下方那条线的取值代表最小值。箱体自身的三条线从上到下分别代表3/4分位点、中位点、1/4分位点的取值。

表中显示了血清总蛋白含量的两种检验方法的正态性检验结果,包括各分组的统计量、自由

度及显著性水平,以K-S方法的分析:其自由度sig.=0.200,明显大于0.05,故应接受原假设,

认为题中数据服从正态分布

3. 正常男子血小板计数均值为9

22510/L ?, 今测得20名男性油漆工作者的血小板计数值(单位:9

10/L )如下:

220 188 162 230 145 160 238 188 247 113 126 245 164 231 256 183 190 158 224 175 问油漆工人的血小板计数与正常成年男子有无异常?

分析:这是一个典型的比较样本均值和总体均值的T 检验问题 ; 第1步 数据组织:

首先建立SPSS 数据文件,只需建立一个变量“血小板计数”,录入相应的数据即可

第2步 单样本T 检验分析设置

选择菜单“分析→比较均值→单样本T 检验(S )”,打开 “单样本T 检验” 对话框,将变量“血小板计数”移入”检验变量”列表框,并输入检验值225;

打开“单样本T 检验:选项”对话框 ,设置置信区间为95%(缺省为95%);

上表给出了单样本T 检验的描述性统计量,包括样本数(N )、均值、标准差、均值的标准误。

本例置信水平为95%,显著性水平为0.05,从上表中可以看出,双尾检测概率P 值为0.003,小于0.05,故原假设不成立,也就是说,男性油漆工作者的血小板与9

22510/L ?有显著性差异,无理由相信油漆工人的血小板计数与正常成年男子无异常。

4. 在某次考试中,随机抽取男女学生的成绩各10名,数据如下:

男:99 79 59 89 79 89 99 82 80 85

女:88 54 56 23 75 65 73 50 80 65

假设总体服从正态分布,比较男女得分是否有显著性差异。

第1步数据组织:

在SPSS数据文件中建立两个变量,分别为“性别”、“成绩”,度量标准分别为“名义”、“度量”,变量“品种”的值标签为:b—男生,g—女生,录入数据。

第2步独立样本T检验设置:

选择菜单“选择→比较均值→独立样本T检验”,打开“独立样本T检验”对话框,将“成绩”作为要进行T检验的变量,将“性别”字段作为分组变量,定义分组变量的两个分组分别为“b”和“g”。

打开“独立样本T检验:选项”对话框,具体选项内容及设置与单样本T检验相同。

组统计量

性别N 均值标准差均值的标准误

成绩男生10 84.0000 11.52774 3.64539

女生10 62.9000 18.45385 5.83562

上表给出了本例独立样本T检验的基本描述统计量,包括两个样本的均值、标准差和均值的标准误。

根据上表“方差方程的Levene 检验”中的sig.为0.221,远大于设定的显著性水平0.05,故本例两组数据方差相等。在方差相等的情况下,独立样本T检验的结果应该看上表中的“假设方差相等”一行,第5列为相应的双尾检测概率(Sig.(双侧))为0.007,在显著性水平为0.05的情况下,T统计量的概率p值小于0.05,故应拒绝零假设,,即认为两样本的均值不是相等的,在本例中,能认为男女得分绩有显著性差异。

5. 设有5种治疗荨麻疹的药,要比较它们的疗效。假设将30个病人分成5组,每组6人,令同组病人使用一种药,并记录病人从使用药物开始到痊愈所需时间,得到下面的记录:

问所有药物的效果是否一样?

第1步分析:

由于考虑的是一个控制变量(药物)对一个观测变量(治愈所需天数)的影响,而且是五种药物,所以不适宜用独立样本T检验(仅适用两组数据),应采用单因素方差分析。

第2步数据的组织:

数据分成两列,一列是治愈所需天数,变量名为“治愈所需天数”,另一变量是药物种类(变量值分别为1,2,3,4,5),变量名为“药物种类”,输入数据并保存。

第3步方差相等的齐性检验:

由于方差分析的前提是各个水平下(这里是不同的药物种类影响下的治愈所需天数)的总体服从方差相等的正态分布,且各组方差具有齐性。其中正态分布的要求并不是很严格,但对于方差相等的要求是比较严格的,因此必须对方差相等的前提进行检验。

方差齐性检验的H0假设是:方差相等。从上表可看出相伴根据Sig.=0.699>(0.05)说明应该接受H0假设(即方差相等)。故下面就用方差相等的检验方法。

上表是几种饲料方差分析的结果,组间(Between Groups)平方和(Sum of Squares)为36.467,自由度(df)为4,均方为9.117;组内(Within Groups)平方和为58.500,自由度为25,均方为2.340;F统计量为3.896。由于组间比较的相伴概率Sig.(p值)=0.014<0.05,故应拒绝H0假设(四种饲料喂猪效果无显著差异),说明五种药物对治愈所需天数有显著性差异。

第4步多重比较分析:

通过上面的步骤,只能判断4种饲料喂猪效果是否有显著差异。如果想进一步了解究竟是哪种药物与其他组有显著性的均值差别(即哪种药物更好)等细节问题,就需要在多个样本均值间进行两两比较。由于第3步检验出来方差具有齐性,故选择一种方差相等的方法,这里选LSD方法;显著性水平默认取0.05;

从整个表反映出来五种药物相互之间均存在显著性差异,从效果来看是第3种最好,其次是第2种,第1种最差。

上图为几种药物均值的折线图,可以看出均值分布比较陡峭,均值差异也较大。

6. 某公司在各地区销售一种特殊化妆品。该公司观测了15 个城市在某月内对该化妆品的销售量Y及各地区适合使用该化妆品的人数X1和人均收入X2,得到数据如下:

(1) 画出这三个变量的两两散点图,并计算出两两之间的相关系数。

(2)试建立Y与X1,X2之间的线性回归方程,并研究相应的统计推断问题,同时预测适合购买此化妆品的人数为220千人,人均收入为2500元的某城市对该化妆品的销量。

第1步分析:

这是一个因变量和两个自变量之间的问题,故应该考虑用二元线性回归解决。

第2步数据组织:

定义三个变量,分别为“z”(销售量)、“x”(人数)、“y”(人均收入)。

第3步一元线性回归分析设置:

选择菜单“分析→回归→线性”,打开“线性回归”对话框,将变量“销售量”作为因变量,“人数”和“人均收入”作为自变量。

打开“统计量”对话框,选上“估计”和“模型拟合度”。

单击“绘制(T)…”按钮,打开“线性回归:图”对话框,选用DEPENDENT作为y轴,*ZPRED为x轴作图。并且选择“直方图”和“正态概率图”

作相应的保存选项设置,如预测值、残差和距离等。

输入/移去的变量

模型输入的变量移去的变量方法

1 人均收入, 人数a. 输入

a. 已输入所有请求的变量。

表中显示回归模型编号、进入模型的变量、移出模型的变量和变量的筛选方法。可以看出,进入模型的自变量为“销售量”

R=0.999,说明自变量与因变量之间的相关性很强。R方(R2) =0.999,说明自变量“销售量”可以解释因变量“人数”和“人均收入”的99.9%的差异性。

Anova b

模型平方和df 均方 F Sig.

1 回归53844.716

2 26922.358 5679.466 .000a

残差56.884 12 4.740

总计53901.600 14

a. 预测变量: (常量), 人均收入, 人数。

b. 因变量: 销售量

表中显示因变量的方差来源、方差平方和、自由度、均方、F检验统计量的观测值和显著性水平。方差来源有回归、残差。从表中可以看出,F统计量的观测值为5679.466,显著性概率为0.000,即检验假设“H0:回归系数B = 0”成立的概率为0.000,从而应拒绝原假设,说明因变量和自变量的线性关系是非常显著的,可建立线性模型。

表中显示回归模型的常数项、非标准化的回归系数B值及其标准误差、标准化的回归系数值、统计量t值以及显著性水平(Sig.)。从表中可看出,回归模型的常数项为3.453,自变量“人数”的回归系数为0.496,“人均收入”的回归系数为0.009.因此,可以得出回归方程:销售量=3.453+ 0.496 ×人数+0.009×人均收入。

回归系数的显著性水平为0.000,明显小于0.05,故应拒绝T检验的原假设,这也说明了回归系数的显著性,说明建立线性模型是恰当的。

当购买此化妆品的人数为220千人,人均收入为2500元时,该城市该化妆品的销量为:

销售量=220×0.496+0.009×2500+3.453=135.073箱

7. 研究青春发育阶段的年龄和远视率的变化关系,测得数据如下

请对年龄与远视率的关系进行曲线估计。

第1步分析:

先用散点图的形式进行分析,看究竟是否具有一元线性关系,如果具有一元线性关系,则用一元线性回归分析,否则采用曲线估计求解。

第2步数据组织:

定义为两个变量,分别是“x”(年龄)、“y”(远视率),输入数据并保存。

第3步作散点图初步判定变量的分布趋势:

第4步进行曲线估计:

依次选择菜单“分析→回归→曲线估计”,将所有模型全部选上,看哪种模型拟合效果更好(主要看决定系数R2),其所有模型的拟合优度R2如下表所示。

从决定系数(R方即R2)来看,三次曲线效果最好(因为其R2值最大),并且方差分析的显著性水平(Sig.)为0。故重新进行上面的过程,只选“三次曲线(Cubic)”一种模型。

复相关系数R = 0.978,R2 = 0.956,经校正后的R平方值为0.937。故可判断远视率与年龄之

间有较显著的三次曲线关系

相伴概率Sig.=0.000说明模型具有显著的统计学意义。

从表中可知因变量与自变量的三次回归模型为:

y=271.869-48.735x+2.804x2-0.050x3

从图形上看出其拟合效果非常好。

8. 谈谈你对数理统计和统计软件课程的学习心得和想法,有何收获,有何建议等。

首先,能开统计软件这门课我感到十分的开心,因为这个软件的用途非常广泛,尤其是应用于数模竞赛。相比较于SAS和Stata,SPSS比较容易使用,上手也相对较快些,自然也比较适合我们这类新手来学习。关于数理统计,我想仅仅一个“难”字是无法来形容这门课的复杂多变,相对于上学期的概率论,这学期学的数理统计不仅需要扎实的概率论基础,而且要记得住各种类型的分析。。。着实把我唬到了!关于收获,用句简单的话来概括:学以致用,快乐无敌!至于建议嘛,希望老师能形象的讲授数理统计知识,因为真的不是那么好理解。统计软件嘛,只能靠多练练手来提高自己的能力了,毕竟师傅领进门,修行在个人。

教育统计学与SPSS课后作业答案祥解题目

教育统计学课后作业 一、P118 1 题目:10位大一学生平均每周所花的学习时间与他们的期末考试成绩见表6-17.试问: (1)学习时间与考试成绩之间是否相关? (2)比较两组数据谁的差异程度大一些? (3)比较学生2与学生9的期末考试测验成绩。 表6-17 学习时间与期末考试成绩 1 2 3 4 5 6 7 8 9 10 学习时间考试成绩40 58 43 73 18 56 10 47 25 58 33 54 27 45 17 32 30 68 47 69 解题步骤: (1)第一步:定义变量:“xuexishijian”、“xuexichengji”后,输入数据.如下图: 1

第二步:单击选择“分析(Analyze)”中的“相关(Correlate)”中的“双变量(Bivariate Correlations)”, 将上图中的“xuexishijian”和“xuexichengji”添加到右边变量框中,如下图: 第三步:点击“确定“后,输出结果如下图: 第四步:分析结果

3 由上图可知:学习时间与学习成绩之间的pearson 相关系数为0.714,p (双侧)为0.20。自由度 df=10-2=8时,查“皮尔逊积差相关系数显著临界值表”知:r 0.05= 0.623 ; r 0.01=0.765。 因为0.765 > 0.714 >0.623,所以在0.05水平上学习时间和学习成绩是相关显著的。 (2)SPSS 软件分析结果如下图: 由上图可知:学习时间标准差和平均值为:S 1=12.037 ?X 1= 29.00 ;学习时间标准差和平均值为:S 2=12.437?X 2=56.00 根据差异系数公式可知: 学习时间差异系数为:%100?=X S CV S =12.037/29.00×100%=41.51% 学习成绩差异系数为:%100?= X S CV S =12.437/56.00×100%=22.27% 有上述结果可知学习时间差异程度大于学习成绩差异程度。 (4) 把学生2和学生9的期末考试成绩转化成标准分数: Z 2=(X -?X) /S= (73—56)/12.437=1.367 Z 9=(X-?X)/S=(68—56)/12.437=0.965 由上计算可知:学生2期末考试测验成绩优于学生9的期末考试测验成绩。 二、P119 2 题目:某班数学的平均成绩为90,标准差10;化学的平均分为85,标准差为8;物理的平均分为79,标准差为15.某生这三科成绩分别为95,80,80.试问 (1) 该生在哪一学科上突出一些? (2) 该班三科成绩的差异度如何?有无学习分化现象? (3) 该生的学期分数是多少? (4) 三科的总平均和总标准差是多少? 解题步骤:

统计分析软件SPSS详细教程

10.11统计分析软件&SPSS建立数据 目录 10.11统计分析软件&SPSS建立数据 (1) 10.25数据加工作图 (1) 11. 08绘图解答&描述性分析: (3) 2.描述性统计分析: (4) 四格表卡方检验:(检验某个连续变量的分布是否与某种理论分布一致,如是否符合正态分布) (7) 第七章非参数检验 (10) 1.单样本的非参数检验 (11) (1)卡方检验 (11) (2)二项分布检验 (12) 2.两独立样本的非参数检验 (13) 3.多独立样本的非参数检验 (16) 4.两相关样本的非参数检验 (16) 5.多相关样本的非参数检验 (18) 第五章均值检验与T检验 (20) 1.Means过程(均值检验)( (20) 4. 单样本T检验 (21) 5. 两独立样本T检验 (22) 6.两配对样本T检验 (23) 第六章方差分析 (25) 单因素方差分析: (25) 多因素方差分析: (29) 10.25数据加工作图 1.Excel中随机取值:=randbetween(55,99) 2.SPSS中新建数据,一列40个,正态分布随机数:先在40那里随便输入一个数表示选择40个可用的,然后按一下操作步骤: 3.排序:个案排秩

4.数据选取:数据-选择个案-如果条件满足: 计算新变量: 5.频次分析:分析-统计描述-频率

还原:个案-全部 6.加权: 还原 7.画图: 11. 08绘图解答&描述性分析:1.课后题:长条图

2.描述性统计分析: (1)频数分析:

(2)描述性分析: 描述性统计分析没有图形功能,也不能生成频数表,但描述性分析可以将原始数据转换成标准化得分,并以变量形式存入数据文件中,以便后续分析时应用。 操作: 分析—描述性分析:然后对结果进行筛选,去掉异常值,就得到标准化的数据: 任何形态的数据经过Z标准化处理之后就会是正态分布的<—错误!标准化是等比例缩放的,不会改变数据的原始分布状态, (3)探索分析:(检验是否是正态分布:茎叶图、箱图) 实例:

SPSS大作业-环境保护

当代大学生对全球气候变化 认知程度的研究 摘要:随着我国经济建设的飞速发展,人们向大自然排放的有害物质与日俱增,环境问题日益严重。环境污染问题不仅影响我国人民的生存环境和生存质量,也危害人民的身体健康,在环境污染中城市环境污染已经成为制约社会发展的重要问题。本研究采样方式为匿名方式随机投放网络问卷以及纸质问卷,采用SPSS statistics软件分析采样数据,得到频率表以及考虑性别的交叉表。本文考虑性别、城乡等差异,分别从基本的环保知识到主动投身环保事业等各方面加以分析,研究当代大学生对环境污染问题认知程度的差异。 关键字:性别;气候变化;差异;SPSS 一、研究背景 我国改革开放30多年的经济发展迅速,主要是以粗放式发展为主要模式。由此而带来的就是高增长、高能耗、高排放的三高企业,我国是发展中国家,在经济发展的过程中,政府对环境破坏的监管不力,睁一眼闭一眼,所以我国改革开放30年快速发展以牺牲能源、破坏环境为代价的,尤其我国的经济发展又极不平衡,主要是以城市主力军,这样城市的环境恶化就很严重。同样,农村人口环境保护意识淡薄,农村环境恶化也不可小觑,我国高速发展的近几十年来,环境的恶化程度逐年增加,应该引起政府环保部门的重视。 环境污染对人们的生活影响越来越严重,我们现在出门看到的最打眼的一景就是戴口罩的人越来越多,人们越来越感受到空气污染对

自己身心健康的威胁,据统计,世界儿童死亡80%是由于空气污染导致的,这个数字让人触目惊心。 环境污染很大因素是由于企业恣意排放污染物,但在日常生活中,民众的环保意识与环保行为对生活污染——尤其是随处可见的污染——有较大的影响。性别、年龄等不同,对气候变化认知程度也会存在差异。本文考虑到男女性别的差异、城乡区别,分别从基本的环保知识到主动投身环保事业等各方面加以分析,研究不同性别对环境污染问题认知程度的差异。 二、研究方法及样本描述 (一)研究方法 本研究采样方式为匿名方式随机投放网络问卷以及纸质问卷调查的方法,与2014年5月在西安交通大学进行问卷调查。调查面向西安交大本科生以及研究生,最终获得有效问卷431份。 (二)样本特征描述 431位被访者中,女性209位,占48.5%;男性222位,占51.5%。如图1所示,样本主要来自大一、大二以及大三群体,总共381位,占88.4%;大四毕业生以及研究生占11.6%。被访者所读专业性质也有较大差别,文科生178位,占41.3%;工科生人数122位,占28.3%;理科生108位,占比25.1%,如表1所示。

教育统计学与SPSS名解总结

第一章导论(阅览前必读:书上每个章节后的名解我全都列出来了,黑色字体的都是书上原文,量多,但有些不重要的名解没必要背,你挑着背不要被吓到。绿色是章节题目,红色的就是我的一些说明、补充、吐槽,一个人打字很无聊啊有木有!一直自言自语啊有木有!并非书上的名词解释,看看就好,可删。这段紫色的也删了哈。接下来……正文,走你!) 统计学(statistics):即研究统计原理与方法的科学。 教育统计学(educational statistics):是专门研究如何搜集、整理、分析在心理和教育方面有实验或调查所获得的数字资料,如何根据这些资料所传递的信息,进行数学推论,找出客观规律的一门学科。简言之,教育统计学是运用统计学的一般原理和方法研究教育科学领域数量关系的一门科学。 描述统计(descriptiive statistics):是实验或调查所获得的数据加以整理(如制表、绘图),并计算其各种代表量数(如集中量数、差异量数、相关量数等),其基本思想是平均。 Or:是研究如何整理心理与教育科学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性质的一种统计方法。 推断统计(inferencial statistics):又称抽样统计,它是根据对部分个体进行观测所得到的信息,通过概括性的分析、论证,在一定可靠程度上去推测相应的团体。 Or:是研究如何通过局部数据所提供的信息,运用概率的理论进行分析论证,在一定可靠程度上推论总体或全局情形的统计方法。这是统计学中的主要内容。 实验设计(experimental statistics):是研究如何更加合理、有效的获得观测资料,如何更正确、更经济、更有效的达到实验目的,以揭示实验中各种变量关系的实验计划。 Or:实验者为了揭示实验中自变量与因变量的关系,在实验之前所制定的实验计划,称为实验设计。他是研究如何科学地、经济地以及更有效地进行实验。 统计常态法则:从总体中随机抽取一部分个体所组成的样本,差不多可以保持总体的特征。 小数永存法则:从总体中抽取的第一个样本中所表现的特性,在其他样本中也会存在。 大量惰性原则:某一事物的某一性质或状态,在反复观察或试验中是保持不变的。 有效数字:是指能影响测量准确性的数字。 随机变量(random variable):在统计学中把在取值之前不能预料到取什么值的量称为变量(随机变量)。 数据(data):如果一旦某个数值被取定了,成这个数值为随机变量的一个观察值,即数据。 总体(population):指客观存在的,并在同一性质的基础上结合起来的许多个别单位的整体,即具有某一特性的一类事物的全体,又叫母体或全域。 个体(individual): 构成总体的基本单位或单元,又称元素或个案。 样本(sample):从总体中抽取的一部分个体。 参数(parameter):表示总体特征的量数。 统计量(statistic):是直接从样本计算出的量数,代表样本的特征。

spss期末作业

吉林财经大学 《SPSS统计软件分析》作业(2010——2011学年第一学期) 学院信息学院 专业班级电子商务0806班 学生姓名王瑞霞 学号1403080616

1、对未分组资料频数分析 从中国统计局中获得从11月21日至30日国内50个城市主要食品平均价格变动情况,以该数据为例为例,进行频数分析。 首先输入数据: 选择Analyze中Descriptive Statistics——Frequencies,打开Frequencies对话框;将需处理的变量键入变量框中

单击Statistics…按钮统计量子对话框12指标,选中所需要计算的指标: 单击Charts …按钮,选择需绘制的统计图: 单击OK按钮开始运行,运行结果为:

从上图中可以看出数据中缺失值为0,花生油的平均价格104.84是最高的,而巴氏牛奶的平均价格1.81最低,全部食品平均价格的平均数为16.5327,标准差为22.4668,各种食品的平均价格差距较大。

条形图、饼形图以及直方图是用不同的图形表示方法来说明数据的指标,其实质是一样的,从图中可以看出平均价格在0—22元之间的食品是最多的,20—40元之间的食品数次之,接下来是40—60元之间的食品,不存在平均价格在60—100之间的食品。 2、以食品平均价格为依据对数据进行分组并对分组后的数据进行频数分析: Transform —Recode—Into same V ariables ,将要分组的变量放入Numeric 栏中,单击Old and new V alues分组:

分组结果如下图所示: 回到数据编辑窗,定义变量的V alue labels : 再对食品平均价格进行频数分析,分析结果如下截图所示

《spss统计软件》练习题库及答案

华中师范大学网络教育学院 《SPSS统计软件》练习题库及答案(本科) 一、选择题(选择类) (A)1、在数据中插入变量的操作要用到的菜单是: A Insert Variable; B Insert Case; C Go to Case; D Weight Cases (C)2、在原有变量上通过一定的计算产生新变量的操作所用到的菜单是: A Sort Cases; B Select Cases; C Compute; D Categorize Variables — (C)3、Transpose菜单的功能是: A 对数据进行分类汇总; B 对数据进行加权处理; C 对数据进行行列转置; D 按某变量分割数据 (A)4、用One-Way ANOVA进行大、中、小城市16岁男性青年平均身高的比较,结果给出sig.=,说明: A. 按照显著性水平,拒绝H0,说明三种城市的平均身高有差别; B. 三种城市身高没有差别的可能性是; C. 三种城市身高有差别的可能性是; 、 D. 说明城市不是身高的一个影响因素 (B)5、下面的例子可以用Paired-Samples T Test过程进行分析的是:A 家庭主妇和女大学生对同种商品喜好的差异; B 服用某种药物前后病情的改变情况; C 服用药物和没有服用药物的病人身体状况的差异; D性别和年龄对雇员薪水的影响 二、填空题(填空类) 6、Merge Files菜单用于合并数据库有两种情况:如果两数据库变量相同,是_观测对象__的合并;如果不同,则是_变量__的合并。 7、用于对计数资料和有序分类资料进行统计描述和简单的统计推断,在分析时可以产生二维或多维列联表,在统计推断时能进行卡方检验的菜单是_ Crosstabs __。 % 8、One-Samples T Test过程用于进行样本所在总体均数___与__已知总体均数_的比较。 三、名词解释(问答类) 9、Repeated Measures:重复测量的方差分析,指的是一个因变量被重复测量好几次,从而同一个个体的几次观察结果间存在相关,这样就不满足普通分析的要求,需要用重复测量的方差分析模型来解决。 10、Chi-Square test:卡方检验,它是非参数检验的一种方法,来检验变量的几个取值所占百分比是否和我们期望的比例没有统计学差异。比如我们在人群中抽取了一个样本,可以用该方法来分析四种血型所占的比例是否相同(都是25%),或者是否符合我们所给出的一个比例(如分别为10%、30%、40%和20%)。 四、简答题(问答类) 11、用SPSS对数据进行分析的基本流程是什么 答:(1)、将数据输入SPSS,并保存; { (2)、进行必要的预分析(分布图、均数标准差等的描述等),以确定应采用的检验方法; (3)、按题目要求进行统计分析; (4)、保存和导出分析结果。 12、对数据进行方差分析时,Univariate菜单和Multivariate菜单最大的区别是什么 答:当因变量只有一个时,使用Univariate菜单,当因变量不止一个时,使用Multivariate菜单。 13、简述SPSS打开其它格式数据的几种方法 答:(1)、直接打开:选择菜单File==>Open==>Data或直接单击快捷工具栏上的打开按钮; (2)、使用数据库查询打开:选择菜单File==>Open Database==>New Query,根据向导打开数据; (3)、使用文本向导读入文本文件:选择菜单File==>Read Text Data ) 14、指定数据按某个变量进行排序需要用到哪个菜单

《统计分析与SPSS的应用(第五版)》课后练习标准答案(第2章)

《统计分析与SPSS的应用(第五版)》(薛薇) 课后练习答案 第2章SPSS数据文件的建立和管理 1、SPSS中有哪两种基本的数据组织形式?各自的特点和应用场合是什么? SPSS中两个基本的数据组织方式:原始数据的组织方式和计数数据的组织方式。 ●原始数据的组织方式:待分析的数据是一些原始的调查问卷数据,或是一些基本的 统计指标。 ●计数数据的组织方式:所采集的数据不是原始的调查问卷数据,而是经过分组汇总 后的数据。 2、什么是SPSS的个案?什么SPSS的变量? 个案:在原始数据的组织方式中,数据编辑器窗口中的一行称为一个个案或观测。 变量:数据编辑器窗口中的一列。 3、在定义SPSS数据结构时,默认的变量名和变量类型是什么?如果希望增强SPSS统计分析结果的易读性,还需要对数据结构的哪些方面进行必要说明? 默认的变量名:VAR------;默认的变量类型:数值型。 变量名标签和变量值标签可增强统计分析结果的可读性。 4、收集到以下关于两种减肥产品试用情况的调查数据,请问在SPSS中应如何组织该份资料? 产品类型体重变化情况 明显减轻无明显变化 第一种产品2719 第二种产品20 33 问:在SPSS中应如何组织该数据? 数据文件如图所示: 5、什么是SPSS的用户缺失值?为什么要对用户缺失值进行定义?如何在SPSS中指定用户缺失值? 缺失值分为用户缺失值(User Missing Value)和系统缺失值(System Missing

Value)。用户缺失值指在问卷调查中,将无回答的一些数据以及明显失真的数据当作缺失值来处理。用户缺失值的编码一般用研究者自己能够识别的数字来表示,如“0”、“9”、“99”等。系统缺失值主要指计算机默认的缺失方式,如果在输入数据时空缺了某些数据或输入了非法的字符,计算机就把其界定为缺失值,这时的数据标记为一个圆点“?”。在变量视图中定义。 6、从计量尺度角度看,变量包括哪三种主要类型?请各举出一个相应的实际数据。如何在SPSS中指定变量的计算尺度? 变量类型包括:数值型(身高)、定序型(受教育程度)以及定类型(性别)。在变量视图中定义。 7、有一份关于居民储蓄调查的模拟数据存储在Excel中,文件名为“居民储蓄调查数据.xls”。该数据的第一行是变量名,格式如下图所示。请将该份数据转换成SPSS数据文件,并在SPSS中指定其变量名标签和变量值标签。(该份数据的具体含义见Excel文件的后半部分) 【文件(F)】→【打开(O)】→【数据(A)】→文件类型选“Excel(*.xls,…)”,文件名选“居民储蓄调查数据.xls”→【打开】→选中“从第一行数据读取变量名”,在“范围” 中输入“A1:Q283”→【确定】→在“变量视图”窗口,调整A1变量的宽度,输入变量名标签和变量值标签→在主菜单窗口选定【文件(F)】→【保存】→选择保存路径,保存类型为“sav”,文件名为“居民储蓄调查数据”→【保存】. 8、现有股民投资状况调查的文本数据,文件名为“股民投资数据.txt”。其中各变量的含义和编码见文件“股民投资数据.xls”。请将该文本数据读入SPSS,并定义变量名标签和变量值标签。其中各变量取值为9的均为用户缺失值,请加以定义说明。(注:本调查问卷中涉及多选项问题,以及多选项问题的编码等,可先忽略。) 【文件(F)】→【打开文本数据(D)】→【数据(A)】→文件类型选“Text(*.txt,…)”,文件名选“股民投资数据.txt”,【打开】→在“您的文本文件与预定义的格式匹配吗?”中选“否”,【下一步】→在“变量名称是否包括在文件的顶部”中选“是”,【下一步】→在“第一个数据个案从哪个行号开始”中输入“2”,其他默认,【下一步】→【下一步】→在“数据格式”中输入“字符串”,接着在弹出的窗口输入“4”,【下一步】→默认各选项,【完成】→在主菜单窗口选定【文件(F)】→【保存】→选择保存路径,保存类型为“sav”,文件名为“股民投资数据”→【保存】.

spss课后作业答案

SPSS课后作业 第一章 1-1、spss的运行方式有几种?分别是什么? 答:SPSS的运行方式有三种,分别是批处理方式、完全窗口菜单运行方式、程序运行方式。1-2、SPSS中“DataView”所对应的表格与一般的电子处理软件有什么区别? 答:与一般电子表格处理软件相比,SPSS的“Data View”窗口还有以下一些特性:(1)一个列对应一个变量,即每一列代表一个变量(Variable)或一个被观测量的特征;(2)行是观测,即每一行代表一个个体、一个观测、一个样品,在SPSS中称为事件(Case);(3)单元包含值,即每个单元包括一个观测中的单个变量值;(4)数据文件是一张长方形的二维表。 第二章 2-1、在SPSS中可以使用那些方法输入数据? 答:SPSS中输入数据一般有以下三种方式:(1)通过手工录入数据;(2)可以将其他电子表格软件中的数据整列(行)的复制,然后粘贴到SPSS中;(3)通过读入其他格式文件数据的方式输入数据。 2-2、对于缺失值,如何利用SPSS进行科学替代? 答:选择“Transform”菜单的Replace Missing Values命令,弹出Replace Missing Values 对话框。先在变量名列中选择1个或多个存在缺失值的变量,使之添加到“New Variable(s)”框中,这时系统自动产生用于替代缺失值的新变量。最后选择合适的替代方式即可。 2-3、在计算数据的加权平均数时,如何对变量进行加权? 答:选择“Data”菜单中的Weight Cases命令,出现如图2-22所示的Weight Cases对话框。其中, Do not weight cases项表示不做加权,这可用于取消加权;Weight cases by 项表示选择1个变量做加权。 2-4、如何对变量进行自动赋值? 答:变量的自动赋值可以将字符型、数字型数值转变成连续的整数,并将结果保存在一个新的变量中。具体操作的过程如下:选择“Transform”菜单中的Automatic Recode命令,在出现的对话框中,从左边的变量列表中选择需要自动赋值的变量,将它添加到Variable -> New Name框中,然后在下面New Name右边的文本框中输入新的变量名称,单击New Name 按钮,将新的变量名添加到上面的框中。从Recode Starting from框中有两个选项中选择一个,然后单击OK按钮,即可完成自动赋值运算。 3-1、一组数据的分布特征可以从哪几个方面进行测度? 答:一组数据的分布特征可以从平均数、中位数、众数、方差、百分位、频数、峰度、偏度等方面描述。 3-2、简述众数、中位数和均值的特点及应用场合。 答:均值是总体各单位某一数量标志的平均数。平均数可应用于任何场合,比如在简单时序预测中可用一定观察期内预测目标的时间序列的均值作为下一期的预测值。中位数是指将数据按大小顺序排列起来,形成一个数列,居于数列中间位置的那个数据。中位数的作用与算术平均数相近,也是作为所研究数据的代表值。在一个等差数列或一个正态分布数列中,中位数就等于算术平均数。在数列中出现了极端变量值的情况下,用中位数作为代表值要比用算术平均数更好,因为中位数不受极端变量值的影响。众数是指一组数据中出现次数最多的那个数据。它主要用于定类(品质标志)数据的集中趋势,当然也适用于作为定序(品质标志)数据以及定距和定比(数量标志)数据集中趋势的测度值。 3-3、

统计学 SPSS作业

频率 统计量 XB性别MRC月消费金额 N 有效126 126 缺失0 0 频率表 XB性别 频率百分比有效百分比累积百分比 有效 A.男65 51.6 51.6 51.6 A.女61 48.4 48.4 100.0 合计126 100.0 100.0 MRC月消费金额 频率百分比有效百分比累积百分比 有效 A.300元-400元 1 .8 .8 .8 B.401元-600元9 7.1 7.1 7.9 C.601元-1000元77 61.1 61.1 69.0 D.1000元以上39 31.0 31.0 100.0 合计126 100.0 100.0

通过以上交叉表可知,男性日常用品花费在41-60元和61-100元这两个区间所占比 游程检验 2 XB性别NL年龄 检验值a 1.48 19.59 案例 < 检验值65 70 案例 >= 检验值61 56 案例总数126 126 Runs 数8 35 Z -10.017 -5.112 渐近显著性(双侧) .000 .000 a. 均值 从上图中可以知道图中显示性别的分割点分别为1和1.48,,SPSS计算出游程数分别共有1和8,表格中年龄所使用的分割点为均数19和19.59,而不是原先的中位数20,导致游程增加到46和35.

可见在年龄为21时样本的信心指数均值为1.8556,低于基线水平100.样本均数抽样误差为0.13216 由上面的检验结果t=-742.635 p=0 由于p值小于检验水准0.05。因此拒绝H0,所以样本所在的均值与假设的在总体均值相同。

分析结果的第一部分为Levene’s方差齐性检验,用于判别两总体方差是否为齐性方差,这里的检测结果为F=10.975,P=0.006,因此拒绝Ho,认为本例中两个样本所在总体的方差是不齐的。 相关性 控制变量NL年龄YY MRC月消费金额NL年龄相关性 1.000 . 显著性(双侧). . df 0 15 YY 相关性. 1.000 显著性(双侧). . df 15 0 在控制了月消费金额之后计算出的年龄和总指数的偏相关矩阵,可见两者的偏相关系数为1。 G图

SPSS调查报告期末作业

S P S S调查报告期末作业 Document serial number【LGGKGB-LGG98YT-LGGT8CB-LGUT-

---------------------------------------------装--------------------------------- --------- 订 ---------------------------------------- -线----------------------------------- -- - --

上表表明,5中不同年级形式下共有80个样本,大一的均值最高,大二的均值次之,接着,大四的均值排第三,而大三的均值是最低的。由于在录入数据当中,选择调查问卷中选项A“是”,身边有请人带过课的同学,则录为1:;选择调查问卷中选项B“否”,身边没有请人带过课的同学,则录为2。所以,均值的结果表明,数值越大,则身边出现代课同学越少,数值越小,则表明身边出现的代课同学越多。因此,大三中的代课同学是最多的,大四次之,大二次之,大一最少。 上表表明,不同年级下代课情况的方差齐性检验值为,概率为,。如果显着性水平为,由于概率值大于显着性水平,不应拒绝零假设,认为不同年级下代课情况的总体方差无显着差异,满足方差分析的前提要求。 上表分别显示了两两不同年级下代课情况均值检验的结果。通过两两比较,最终可以得出,大一的均值>大二的均值>大三的均值,大四的均值大小情况不能确定,基本上得出的结论与实际情况相符。 五、建议 在以上对数据的分析过程当中,我们提到了逃课现象严重,收费代课行为愈发普遍的原因,这里稍微再做一下总结。原因如下: a.一些专业课程,教学内容循规蹈矩,考试题目照本宣科,无法引起学生兴趣; b.学校管理有较大漏洞,上课学生中“替身”大量潜伏而不知; c.学生自身自制力不够,容易受到外界的影响,不能静心学习; d.社会就业压力大,导致学生青睐于早点实习; 针对以上这些导致收费代课产生的原因,我想提出几点建议: (一)学校在专业设置、教师的互动性教学、知识的创新性和灵活体现、教学管理体系建设等诸多方面,都应反思,并采取一定的措施。高校则应该实行自主办学措施,在课程设置、专业方向设置上应当有自我特色。与其大张旗鼓地对“收费代课”现象进行大力批判,还不如放开手来,从根本上指导学生如何学会自主学习,如何利用有限的学习时间。倘若不加以反思,做出课程设置、教师互动性教学的改进,而是纯粹地一味加强考勤管理,必然会扼杀一部分学生的学习积极性,“人在心不在”的上课状态恐怕也难以培养出符合时代需求的大学生。 (二)学生应该分清楚学习和工作的不同意义,学习是一种能力的提高过程。大学生应当学会对自己的现在以及未来负责。大学四年,是相当宝贵的青春年华。我们年轻,我们活动,但是这些都不应该成为我们虚度时间,不学习的理由。调查结果中显示,大三的收费代课现象是最为严重的,这样的结果确实应该引起学生的重视了。我们都知道,大三是专业学习的主要一年,很多的专业课都在大三进行安排。可是大三的同学的不认真学习专业课,选择请人代课,这不是明显浪费了学习专业课的机会吗所以,这里,我想提醒本部的同学们,要合理地定位自己的身份与任务,不要在该学习的阶段去实习或娱乐。另外,也要明确自己上大学的初衷,不要因为大学生活的闲适,而慢慢丢失了自己的理想。 (三)政府要给大学生提供公平的就业环境,打击不规范的就业行为,消除掉大学生的就业焦虑。为大学生就业,提供更加全面完整的服务系统,让大学生在大学期间安心学

教育统计学 SPSS练习题

1.某学校初中一年级80名学生的数学考试成绩如下,制作频数分布表和图形并作频数分布分析。 某校初一年级80名学生的数学考试成绩 88,89,90,72,89,88,84,83,92,86 90,86,76,87,91,90,90,74,85,84 90,85,89,76,77,85,93,91,81,84 91,83,80,85,87,86,87,84,89,91 84,89,88,84,83,95,85,89,89,89 80,95,83,91,86,87,92,93,89,73 95,82,87,89,80,70,85,85,68,83 82,89,88,85,90,89,80,90,77,72 2.将第1题中的80名学生的数学考试成绩分成0-60,60-70,70-80,80-90,90-100五段,进行分段频数统计,并绘制频数分布条形图 3.某班学生政治面貌分布情况为:党员21人,团员35人,群众43人,请绘制统计图。 4.某班学生政治面貌分布情况为:党员21人(其中男生11人,女生10人),团员35人(其中男生15人,女生20人),群众43人(其中男生23人,女生20人),请绘制统计图。 5.某职业技术学院2000年对其240名学生家长的职业调查结果如下:公务员58人,医生26人,军人15人,工人90人,个体工商业主45人,教师6人,请据此绘制一个圆形图。 6.对15名初三学生用一套初中数学水平测验试卷进行测试,其测验得分如下,另以这些学生的校内数学期末考试成绩为效标,试计算初中数学水平测验的效标关联效度系数。 学生序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 水平测验得分56 73 65 78 64 77 90 61 54 75 45 72 88 95 61 期末成绩63 65 70 74 68 85 92 64 59 70 50 79 90 91 65 7.某大学一年级12名学生的英语阅读理解能力测验成绩与其平时阅读作业成绩如下表所列,试计算阅读理解能力测验的效标关联效度系数。 学生序号 1 2 3 4 5 6 7 8 9 10 11 12 测验得分32 33 34 34 36 37 38 39 40 41 43 45 作业成绩(等级)6 4 2 7 5 9 1 3 11 12 10 8 8. 从某班学生中随机抽取15名,测得他们的数学成绩如下: 65,77,80,78,89,90,74,73,89,95,83,56,68,92,82 (1)试对该班学生的数学平均成绩和成绩的离散程度作出估计。 (2)试求该班成绩均值的95%和99%的置信区间。 9.已知某年级学生的语文成绩服从正态分布,其中总体平均数为76.9,标准差未知。现从该年级某班随机抽取16名学生的语文成绩,数据如下: 75,88,73,93,85,76,68,90,61,58,78,89,95,77,60,74,问该班学生的平均语文成绩是否也是76.9?(α=0.01)

SPSS调查报告 - 期末作业

---------------------------------------------装--------------------------------- --------- 订 -----------------------------------------线---------------------------------------- 班级 姓名 学号 - 广 东 财 经 大 学 答 题 纸(格式二) 课程 数据处理技术与SPSS 20 15 -20 16 学年第 1 学期 成绩 评阅人 评语: ========================================== (题目)关于本部学生对收费代课现象支持度的调查报告 (正文) 一、调查背景 如今,大学生逃课现象屡见不鲜,随之衍生了“收费代课”的现象。据了解,在全国近百所高校中,存在“收费代课”现象的高校居然有一半之多。当“收费代课”现象衍变成了一种行业,成为有领导、有组织、有规模、有纪律的机构,不仅仅应当引起社会的关注,更应引起校方对教育方式的深刻反思。“有偿代课”作为一种不正常的校园现象,有其存在的社会土壤,其原因有多方面,值得让人对当前大学教育深思。在“收费代课”现象蔚然成风之时,我们学校的学生们也加入了这支大队伍。对于这样的一种收费代课的行为,同学们褒贬不一,每个人都有自己的看法。然而,这种行为经常在我们的身边发生着,无疑应该引起我们的关注,并引发我们的深思,形成一定的判别能力与认知能力。

二、调查目的 我们希望通过本次调查了解广东财经大学本部学生选择收费代课的原因,以及对本专业学习、实习实践的认知程度,是否支持放弃学习去实习或者做自己的事情,是否支持收费代课。同时,我们也希望通过这份调查报告揭露出的一些情况,一方面,帮助学生更好地权衡学习与实习的利弊,更加理性地对待收费代课的行为,做出对自己正确合适的选择;另一方面,引起学校对这种收费代课现象的重视,给学校提一些建议,希望学校采取一些措施改善这种不良校风。 三、调查方法 从可行性角度出发,本次调查采用非概率随机抽样的街头拦截法,集中对象为本部大三大四的同学,以自愿形式对本部同学分发调查问卷,总共发出80份问卷,回收80份,有效问卷80份。收集问卷之后,利用spss软件进行数据整理与分析,最后把结论整理成调查报告。调查报告中采用的数据分析方法主要有:频数分析、多选项分析、交叉列联表行列变量间关系的分析、单因素方差分析等。 四、描述统计 1、对样本性别作频数分析 从上表可以看出,这次填写问卷的女生较多,占了样本的66.3%,这与我们学校男女比例不均衡有很大的关系,样本的男女比例不相等,也可以较好地接近学校的实际情况,有利于我们得到更为准确的结论。 2、对样本年级作频数分析 从上表可知,参加问卷调查的大三大四学生比例明显比较高,这与一开始我们预期相符,样本中大三大四学生所占比例较多,有利于我们得到更为有针对性的结论。

统计分析与SPSS的应用(第五版)课后练习答案(第6章)

《统计分析与SPSS的应用(第五版)》(薛薇) 课后练习答案 第6章SPSS的方差分析 1、入户推销有五种方法。某大公司想比较这五种方法有无显著的效果差异,设计了一项实验。从应聘人员中尚无推销经验的人员中随机挑选一部分人,并随机地将他们分为五个组,每组用一种推销方法培训。一段时期后得到他们在一个月内的推销额,如下表所示: 1)请利用单因素方差分析方法分析这五种推销方式是否存在显著差异。 2)绘制各组的均值对比图,并利用LSD方法进行多重比较检验。 (1)分析→比较均值→单因素ANOV A→因变量:销售额;因子:组别→确定。 ANOVA 销售额 平方和df 均方 F 显著性 组之间405.534 4 101.384 11.276 .000 组内269.737 30 8.991 总计675.271 34 概率P-值接近于0,应拒绝原假设,认为5种推销方法有显著差异。

可知,1和2、1和5、2和3,2和4,2和5,3和5,4和5有显著差异。 2、从两个总体中分别抽取n 1 =7 和和n 2 =6 的两个独立随机样本,经计算得到下面的方差分析表。请补充表中单元格的两个独立随机样本,经计算得到下面的方差分析表。请补充表中单元格“A”和单元格“B”内的计算结果。 答:已知组内均方=组内偏差平方和/自由度,所以A=26.4/11=2.4 F 统计量=组间均方/组内均方所以B=7.5/2.4=3.125 3、为研究某种降血压药的适用特点,在五类具有不同临床特征的高血压患者中随机挑选了若干志愿者进行对比试验,并获得了服用该降压药后的血压变化数据。现对该数据进行单因素方差分析,所得部分分析结果如下表所示。 1)请根据表格数据说明以上分析是否满足方差分析的前提要求,为什么? 2)请填写表中空缺部分的数据结果,并说明该降压药对不同组患者的降压效果是否存在显著差异。 3)如果该降压药对不同组患者的降压效果存在显著差异,那么该降压药更适合哪组患者?(1)因F检验的概率P值小于显著性水平(0.05),拒绝原假设,方差不齐,不满足方差分析的前提假设。 (2)4*276.032=1104.128;1104.128+1524.990=2629.118;4+63=67;1524.990/63=24.206 (3)各组均值存在显著差异。更适合第三组 4、 1)选择恰当的数据组织方式建立关于上述数据的SPSS数据文件

SPSS调查报告期末作业

广东财经大学答题纸(格式二) 课程数据处理技术与SPSS 20 15 —20 16学年第1学期 成绩评阅人 评语: (题目)关于本部学生对收费代课现象支持度的调查报告 (正文) 一、调查背景 如今,大学生逃课现象屡见不鲜,随之衍生了“收费代课”的现象。据了解,在全国近百所高校中,存在“收费代课”现象的高校居然有一半之多。当“收费代课” 现象衍变成了一种行业,成为有领导、有组织、有规模、有纪律的机构,不仅仅应当引起社会的关注,更应引起校方对教育方式的深刻反思。“有偿代课”作为一种不正常的校园现象,有其存在的社会土壤,其原因有多方面,值得让人对当前大学教育深思。在“收费代课”现象蔚然成风之时,我们学校的学生们也加入了这支大队伍。对于这样的一种收费代课的行为,同学们褒贬不一,每个人都有自己的看法。然而,这种行为经常在我们的身边发生着,无疑应该引起我们的关注,并引发我们的深思,形成一定的判别能力与认知能力。

二、调查目的 我们希望通过本次调查了解广东财经大学本部学生选择收费代课的原因,以及对本专业学习、实习实践的认知程度,是否支持放弃学习去实习或者做自己的事情,是否支持收费代课。同时,我们也希望通过这份调查报告揭露出的一些情况,一方面, 帮助学生更好地权衡学习与实习的利弊,更加理性地对待收费代课的行为,做出对自己正确合适的选择;另一方面,引起学校对这种收费代课现象的重视,给学校提一些建议,希望学校采取一些措施改善这种不良校风。 三、调查方法 从可行性角度出发,本次调查采用非概率随机抽样的街头拦截法,集中对象为本部大三大四的同学,以自愿形式对本部同学分发调查问卷,总共发出80份问卷, 回收80份,有效问卷80份。收集问卷之后,利用spss软件进行数据整理与分析,最后把结论整理成调查报告。调查报告中采用的数据分析方法主要有:频数分析、多选项分析、交叉列联表行列变量间关系的分析、单因素方差分析等。 四、描述统计 1、对样本性别作频数分析 从上表可以看出,这次填写问卷的女生较多,占了样本的66.3%,这与我们学校男女比例不均衡有很大的关系,样本的男女比例不相等,也可以较好地接近学校的实际情况,有利于我们得到更为准确的结论。 2、对样本年级作频数分析 从上表可知,参加问卷调查的大三大四学生比例明显比较高,这与一开始我们预期相符,样本中大三大四学生所占比例较多,有利于我们得到更为有针对性的结论。

统计学模拟实验spss 实验报告

(此文档为word格式,下载后您可任意编辑修改!) 目录 第一章数据介绍 (3) 1.1研究问题的提出 (3) 1.2数据的来源 (3) 第二章基本统计分析 (4) 2.1 基本统计分析 (4) 2.1.1 全部变量的频数分析 (4) 2.1.3变量的交差分析 (9) 2.1.5 异常值的检验 (12) 2.2 参数检验 (13) 2.2.1 单样本T检验 (13) 2.2.2 两独立样本T检验 (14) 2.3 相关分析 (14) 2.4 多元线性回归分析 (15) 第三章总结和建议 (21) 3.1 存在的问题 (21) 3.2 如何改进这些不足 (21) 附录A22 附录B22

摘要 当前的消费市场中,大学生作为一个特殊的消费群体正受到越来越大的关注。由于大学生年纪较轻,群体较特别,有着不同于社会其他消费群体的消费心理和行为。一方面,他们有着旺盛的消费需求,另一方面,他们尚未获得经济上的独立,消费受到很大的制约。消费观念的超前和消费实力的滞后,都对他们的消费有很大影响。社会大众对大学生的消费存在种种争议,认为他们出手阔绰。本文从我校大学生消费状况,消费的行为、消费结构、消费倾向和消费观念等方面来分析大学生的消费特征以及怎样提高他们的消费观念和理财能力,引导在校大学生树立正确的消费观。 关键词:大学生消费观;理性;问题;改进;数据分析

第一章数据介绍 1.1研究问题的提出 大学生消费问题日渐成为一个社会广为关注的问题,大学生作为一个特殊的群体,处于校园与社会交界处,脱离了父母,开始经济独立,独自生活。大学是一个精彩的世界,社会生活又是充满诱惑的,对大学生的消费都存在着很大的影响。同时也不免回存在一些非理性的消费问题,导致社会群众对大学生消费状况的批评。为了弄清大学生的消费问题的真实问题本小组成员进行了该项调查主要想弄清楚大学生们平时把钱花在哪里,花多少,影响他们消费的因素有哪些,以及他们在消费中有那些问题,应该怎样的去改造这些问题。 1.2数据的来源 本次分析的数据来源于我校90名不同专业和年级的同学消费情况调查。Spss数据中共包含十一变量,分别是:性别,户口状况,家庭年总收入,月生活费,伙食费占生活费的比例,娱乐占生活费的比列,生活费的来源,消费习惯,消费倾向,消费商品是注重,生活费盈余的处理,消费状况是否满意。通过运用spss统计软件,对变量进行基本统计分析、参数检验、相关分析、回归分析,以了解我校同学在上述方面的综合状况,并分析个变量的分布特点及相互间的关系。 第二章基本统计分析 2.1 基本统计分析 2.1.1 全部变量的频数分析 户口情况频数分析(表一) 频率百分比有效百分比累积百分比 有效城镇17 18.9 18.9 18.9 农村73 81.1 81.1 100.0 合计90 100.0 100.0 从表一中可知被调查的同学中有73人来自农村占总人数的81%,只有17个同学来自城镇占总人数的19%。说明我校学生户口大多数分布在农村,生活水平较低。 性别状况的频数分析(表二) 频率百分比有效百分比累积百分比

相关文档
相关文档 最新文档