文档库 最新最全的文档下载
当前位置:文档库 › SPSS高级第4部分

SPSS高级第4部分

第四章 SPSS基本统计分析

第四章 SPSS基本统计分析 ——描述性统计分析 描述性统计分析是统计分析的第一步,做好这第一步是下面进行正确统计推断的先决条件。SPSS的许多模块均可完成描述性分析,但专门为该目的而设计的几个模块则集中在Descriptive Statistics菜单中,包括: ●Frequencies:频数分析过程,特色是产生频数表(主要针对分类变量) ●Descriptives:数据描述过程,进行一般性的统计描述(主要针对数值型变量) ●Explore:数据探察过程,用于对数据概况不清时的探索性分析 ●Crosstabs:多维频数分布交叉表分析(列联表分析) ●Ratio statistics:比率分析 4.1 频数分析 4.1.1 频数分析的目的和基本任务 1、目的 基本统计分析往往从频数分析开始。通过频数分析能够了解变量取值的状况,对把握数据的分布特征是非常有用的。 2、基本任务 (1)频数分析的第一个基本任务是编制频数分布表。 ●频数(Frequency):即变量值落在某个区间(或某个类别)中的次数 ●百分比(Percent):即各频数占总样本数的百分比 ●有效百分比(Valid Percent):即各频数占有效样本数的百分比,这里有效样本数 =总样本-缺失样本数 ●累计百分比(Cumulative Percent):即各百分比逐级累加起来的结果。最终取值 为100。 (2)频数分析的第二个任务是绘制统计图 ●条形图(Bar Chart):用宽度相同的条形的高度或长短来表示频数分布变化的图形, 适用于定序和定类变量的分析。 ●饼图(Pie Chart):用圆形及圆内扇形的面积来表示频数百分比变化的图形,以利 于研究事物内在结构组成等问题。 ●直方图(Histograms):用矩形的面积来表示频数分布变化的图形,适用于定距型 变量的分析。 注:变量的计量尺度: a 定类(Category Scale):只能计次 b 定序(Ordinal Scale):计次、排序 c 定距(Interval Scale):计次、排序、加减 d 定比(Ratio Scale):计次、排序、加减、乘除 4.1.2 频数分析的基本操作 ●(1)选择菜单Analyze—Descriptive Statistics—Frequencies。 ●(2)将若干频数分析变量选择到Variable(s)框中。 ●(3)单击Chart按钮选择绘制统计图形,在Chart Values框中选择条形图中纵坐标(或 饼图中扇形面积)的含义,其中Frequencies表示频数;Percentages表示百分比。

《统计分析与SPSS的应用(第五版)》课后练习答案(第4章)

《统计分析与SPSS的应用(第五版)》(薛薇) 课后练习答案 第4章SPSS基本统计分析 1、利用第2章第7题数据采用SPSS频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。分析一一描述统计一一频率,选择“常住地”,“职业”和“年龄”到变量中,然后,图表一一条形图一一 图表值(频率)一一继续,勾选显示频率表格,点击确定。

种果菜专业 户10 3.5 3.568.4 工商运专业户3412.112.180.5退役人员17 6.0 6.086.5金融机构3512.412.498.9现役军人3 1.1 1.1100.0 Total282100.0100.0 Freque ncy Perce nt Valid Perce nt Cumulative Perce nt 20岁以下4 1.4 1.4 1.4 20~35 岁14651.851.853.2 Valid 35~50 岁9132.332.385.5 50岁以上4114.514.5100.0 Total282100.0100.0 户口所在曲 C- 中3川毗吨 户口

分析:本次调查的有效样本为282份。常住地的分布状况是:在中心城市的人最多,有 200人,而在边远郊区只有82人;职业的分布状况是:在商业服务业的人最多,其次是一般农户和金融机构;年龄方面:在35-50岁的人最多。由于变量中无缺失数据,因此频数分 布表中的百分比相同。 2、利用第2章第7题数据,从数据的集中趋势、离散程度以及分布形状等角度,分析被调查者本次存款金额的基本特征,并与标准正态分布曲线进行对比。进一步,对不同常住地储户存款金额的基本特征进行对比分析。 分析一一描述统计一一描述,选择存款金额到变量中。点击选项,勾选均值、标准差、方差、最小值、最大值、范围、偏度、峰度、按变量列表,点击继续一一确定。 分析:由表中可以看出,有效样本为282份,存(取)款金额的均值是4738.09,标准差为10945.09,峰度系数为33.656,偏度系数为5.234。与标准正态分布曲线进行对比,由峰度系数可以看出,此表的存款金额的数据分布比标准正态分布更陡峭;由偏度系数可以看出,此表的存款金额的数据为右偏分布,表明此表的存款金额均值对平均水平的测度偏大。

第4章 SPSS基本统计分析(课后练习参考)

第三章 1、利用习题二第6题数据,采用SPSS数据筛选功能将数据分成两份文件。其中,第一份数据文件存储常住地是“沿海或中心繁华城市”且本次存款金额在1000至5000之间的调查数据;第二份数据文件是按照简单随机抽样所选取的70%的样本数据。 第一份文件:选取数据数据——选择个案——如果条件满足——存款>=1000&存款<5000&常住地=沿海或中心繁华城市。 第二份文件:选取数据数据——选择个案——随机个案样本——输入70。 2、利用习题二第6题数据,将其按常住地(升序)、收入水平(升序)、存款金额(降序)进行多重排序。 排序数据——排序个案——把常住地、收入水平、存款金额作为排序依据分别设置排列顺序。 3、利用习题二第4题的完整数据,对每个学生计算得优课程数和得良课程数,并按得优课程数的降序排序。 计算转换——对个案内的值计数输入目标变量及目标标签,把所有课程选取到数字变量,定义值——设分数的区间,之后再排序。 4、利用习题二第4题的完整数据,计算每个学生课程的平均分以及标准差。同时,计算男生和女生各科成绩的平均分。 方法一:利用描述性统计,数据——转置学号放在名称变量,全部课程放在变量框中,确定后,完成转置。分析——描述统计——描述,将所有学生变量全选到变量框中,点击选项——勾选均值、标准差。先拆分数据——拆分文件按性别拆分,分析——描述统计——描述,全部课程放在变量框中,选项——均值。方法二:利用变量计算,转换——计算变量分别输入目标变量名称及标签——均值用函数mean完成平均分的计算,标准差用函数SD完成标准差的计算。数据——分类汇总——性别作为分组变量、全部课程作为变量摘要、(创建只包含汇总变量的新数据集并命名)——确定 5、利用习题二第6题数据,大致浏览存款金额的数据分布状况,并选择恰当的组限和组距进行组距分组。 根据存款金额排序,观察其最大值与最小值,算出组数和组距。转换——重新编码为其他变量——将存款金额作为输出变量——定义输出变量的名称及标签——设定旧值和新值. 6、在习题二第6题数据中,如果认为调查中“今年的收入比去年增加”且“预计未来一两年收入仍会增加”的人是对自己收入比较满意和乐观的人,请利用SPSS的计数和数据筛选功能找到这些人。 转换——对个案的值计数——设定目标变量及标签——将“今年的收入比去年增加”和“预计未来一两年收入仍会增加”两个变量选中——定义值。 7、对习题二第5题数据,选择恰当的加权变量进行加权处理进而还原为原始数据为后续分析做准备。 数据——加权个案——点击加权个案——将人数作为频率变量——确定。 第四章

spss教程第四章---时间序列分析

第四章时间序列分析 由于反映社会经济现象的大多数数据是按照时间顺序记录的,所以时间序列分析是研究社会经济现象的指标随时间变化的统计规律性的统计方法。.为了研究事物在不同时间的发展状况,就要分析其随时间的推移的发展趋势,预测事物在未来时间的数量变化。因此学习时间序列分析方法是非常必要的。 本章主要内容: 1. 时间序列的线图,自相关图和偏自关系图; 2. SPSS 软件的时间序列的分析方法?季节变动分析。 §4.1 实验准备工作 §4.1.1 根据时间数据定义时间序列 对于一组示定义时间的时间序列数据,可以通过数据窗口的Date菜单操作,得到相应时间的时间序列。定义时间序列的具体操作方法是: 将数据按时间顺序排列,然后单击Date →Define Dates打开Define Dates对话框,如图4.1所示。从左框中选择合适的时间表示方法,并且在右边时间框内定义起始点后点击OK,可以在数据库中增加时间数列。 图4.1 产生时间序列对话框 §4.1.2 绘制时间序列线图和自相关图 一、线图 线图用来反映时间序列随时间的推移的变化趋势和变化规律。下面通过例题说明线图的制作。 例题4.1:表4.1中显示的是某地1979至1982年度的汗衫背心的零售量数据。

试根据这些的数据对汗衫背心零售量进行季节分析。(参考文献[2]) 表4.1 某地背心汗衫零售量一览表单位:万件 1979 1980 1981 1982 1 23 30 18 22 2 3 3 37 20 32 3 69 59 92 102 4 91 120 139 155 5 192 311 324 372 6 348 334 343 324 7 254 270 271 290 8 122 122 193 153 9 95 70 62 77 10 34 33 27 17 11 19 23 17 37 12 27 16 13 46 解:根据表4.1的数据,建立数据文件SY-11(零售量),并对数据定义相应的时间值,使数据成为时间序列。为了分析时间序列,需要先绘制线图直观地反映时间序列的变化趋势和变化规律。具体操作如下: 1. 在数据编辑窗口单击Graphs Line,打开Line Charts对话框如图4. 2.。从中选择Simple单线图,从Date in Chart Are 栏中选择Values of individual cases,即输出的线图中横坐标显示变量中按照时间顺序排列的个体序列号,纵坐标显示时间序列的变量数据。 图4.2 Line Charts对话框 2. 单击Define,打开对话框如图 4.4所示。选择分析变量进入Line Represents,,在Category Labels 类别标签(横坐标)中选择Case number数据个年 度 月 份

SPSS第四章 方差分析

方差分析是用于两个及两个以上样本均数差别的显著性检验。由于各种因素的影响,研究所得的数据呈现波动状,造成波动的原因可分成两类,一是不可控的随机因素,另一是研究中施加的对结果形成影响的可控因素。方差分析的基本思想是:通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小。 方差分析主要用途:①均数差别的显著性检验,②分离各有关因素并估计其对总变异的作用,③分析因素间的交互作用,④方差齐性检验。 在科学实验中常常要探讨不同实验条件或处理方法对实验结果的影响。通常是比较不同实验条件下样本均值间的差异。例如医学界研究几种药物对某种疾病的疗效;农业研究土壤、肥料、日照时间等因素对某种农作物产量的影响;不同化学药剂对作物害虫的杀虫效果等,都可以使用方差分析方法去解决。 方差分析原理 方差分析的基本原理是认为不同处理组的均数间的差别基本来源有两个: (1) 随机误差,如测量误差造成的差异或个体间的差异,称为组内差异,用变量在各组的均值与该组内变量值之偏差平方和的总和表示,记作SS w,组内自由度df w。 (2) 实验条件,实验条件,即不同的处理造成的差异,称为组间差异。用变量在各组的均值与总均值之偏差平方和表示,记作SS b,组间自由度df b。 总偏差平方和 SS t = SS b + SS w。 组内SS t、组间SS w除以各自的自由度(组内dfw =n-m,组间dfb=m-1,其中n为样本总数,m为组数),得到其均方MS w和MS b,一种情况是处理没有作用,即各组样本均来自同一总体,MS b/MS w≈1。另一种情况是处理确实有作用,组间均方是由于误差与不同处理共同导致的结果,即各样本来自不同总体。那么,MS b>>MS w(远远大于)。 MS b/MS w比值构成F分布。用F值与其临界值比较,推断各样本是否来自相同的总体。 方差分析的假设检验

相关文档
相关文档 最新文档