文档库 最新最全的文档下载
当前位置:文档库 › spss课程设计客运量预测

spss课程设计客运量预测

spss课程设计客运量预测
spss课程设计客运量预测

设计题目:上海公路客运量需求预测与分析

课程名称:运输统计与分析

学院:交通运输工程学院

专业:交通运输

班级:

学生姓名:

学号:

指导教师:

==== 2011 /2012学年第二学期====

1

课程设计(学年论文)任务书

课程名称:运输统计与分析

适用对象:交通运输工程

一、课程设计(论文)目的

《运输统计与分析》课程设计作为独立的教学环节,是交通运输本科专业的必修课。其目的是,通过本课程设计实践,培养学生理论联系实际思想,加深统计分析基本理论与基本知识的理解,学会收集或调查行业统计数据,切实掌握各种统计分析方法,并能灵活运用统计软件在计算机上实现,正确解释和分析运行结果,培养运用各种统计分析方法解决交通运输领域内实际问题的能力。

二、课程设计(论文)题目与内容

本课程设计(论文)主要任务为:针对交通运输领域内某一主题,设计调查表调查或查询相关统计数据,根据本课程讲授内容选择一种或多种合适的统计分析方法,运用SPSS建立模型分析问题。题目自拟,但题名一般要包含主题与统计方法。且必须与交通运输相关,选题主题主要包括:

1.运输市场定位研究

2.运输需求分析与预测

3.政策或技术方法实施效果评价

4.交通行为选择

5.影响因素分析

6.聚类分析

7.服务质量评价

8. 自选

三、课程设计(论文)基本要求

2

报告内容原则上不少于8000字,其正文至少包括如下几个方面的内容:

1.问题背景(问题的提出、必要性与意义,该问题目前常用的分析手段与

方法,本设计采用的方法)

2.数据采集

(含数据采集方式、描述性分析、统计图表)

说明:调查分析则必须包含调查方案,其它数据原则上必须说明出处。

3.统计模型与分析

(包含模型原理、SPSS操作步骤、输出结果及分析)

4.总结

5.附录数据清单

四、课程设计(论文)时间及进度安排

1.时间:两周:2011-2012学年第二学期第十九、二十周

2.进度安排:

确定主题;调查、收集数据:2天

数据分析与预处理、描述性统计分析:2天

分析方法原理及选择:3天

SPSS操作及结果分析:4天

解决实际问题或建议:2天

撰写报告、总结:1天

(此部分同学们可以按照自己设计具体内容,详细安排)

3.成果提交:

要求独立完成,每人需提交1份打印的设计报告(A4)、word电子文档、数据文件(sav格式)。电子文档文件名为:学号后四位+姓名+题目,先发电子文档给指导老师,经许可后方可打印。最终成果(打印稿1份、电子文档1份)统一交班长汇总并转交指导老师;最终成果提交截止时间为第20周周五。

五、成绩评定

3

平时考勤20%,报告撰写规范20%,内容(选题合理、方案可行、分析正确、有创新)60%。

成绩评定实行优秀、良好、中等、及格和不及格五个等级。优秀者人数一般不得超过总人数的20%。

六、报告格式

课程设计报告装订顺序依次为:封面、课程设计(学年论文)任务书、目录、正文、参考文献、成绩评定表。报告中所有图表应按“章号-图表序号-图表名”(例:图1-1-***频数图)进行编号。具体格式参看实验报告样本。

七、主要参考资料

1.罗应婷等主编.SPSS统计分析从基础到实践.北京:电子工业出版社,2007年6月;

2.章文波陈红艳编著.《实用数据统计分析及SPSS12.0应用》.人民出版社,2006年;

3.张文彤.SPSS.11.0统计分析教程.(高级篇).北京希望电子出版社.2002年6月;

4.郝黎仁等.SPSS实用统计分析.中国水利水电出版社.2003年1月。

4

目录

1概述 (1)

1.1 研究背景 (1)

1.2 常用分析方法 (2)

1.3 本设计采用的分析方法 (3)

2 数据采集 (4)

2.1 数据来源 (4)

2.2 数据处理 (4)

2.3 现状分析 (7)

3统计模型与分析 (9)

3.1 一元线性回归预测 (9)

3.2 多元线性回归预测 (14)

3.3 时间序列法: (17)

3.4 曲线拟合 (19)

4总结 (23)

4.1 本设计的主要工作 (23)

4.2 存在的不足 (23)

4.3 下阶段研究需解决的问题 (24)

4.4 个人感悟 (24)

附录数据清单 (25)

5

1 概述

1.1研究背景

随着社会经济的发展,人民生活水平日渐提高,公路基础设施建设取得了跨越式发展,公路客运日益增加。对于经济相当发达的上海市,公路交通是其居民出行的重要交通方式。改革开放以来,特别是进入“八五”以来,随着我国公路状况的不断改善,公路客运以其快速、灵活、方便的优势快速发展。据统计,“八五”期间全国客运量比“七五”增长51.8%,年均递增9.8%,同期公路客运年均递增率达11.1%。自1991年以来,在全国新增旅客运量中,公路客运量占99%。公路客运除在运量上大大高于铁路等其他运输方式外,自1995年起,其旅客周转量占全国旅客周转量的比重也已超过50%。

导致公路客运量持续增长的主要原因:一是公路对铁路继续保持在中、短途客运上的分流优势;二是公路客运因高速公路和其他高等级公路的发展而在中、长途客运上逐步获得了市场竞争优势;三是场站及车辆等服务设施和装备水平不断提高;四是公路客运的整体服务质量与水平在逐步改善,使公路客运对旅客的吸引力在提高。

研究公路交通客运的需求有重大意义。一个高效运行的客运系统有利于交通的通畅,方便人们出行,减少环境污染。分析公路客运量的发展变化规律,研究公路客运量的预测技术,并应用于公路客运管理工作中,对提高公路交通的管理水平和公路营运效率具有非常重要的实际意义,从而促进公路交通事业的持续发展,缓解交通压力。

预测未来若干年后上海市公路客运量及其发展趋势,可以为投资、规划、优化配置资源及其相关问题的科学决策提供可靠依据,同时提高公路客运的经济效益和社会效益,也对公路管理水平和建立高效公路客运交通系统具有重要作用。

1

在预先掌握公路线路客运量发展变化的情况下,公路客运企业才能科学的制定调度计划,合理地调配人、车资源。从而改变以往车辆管理调度中缺乏实用的分析预测手段,大多依靠经验和直觉来判断客运量变化的传统方式。因此,上海市公路客运量预测为上海市的公共交通规划提供有力的支持。

1.2常用分析方法

研究公路客运量需求预测这类问题涉及到统计学、运筹学、交通经济学等学科,常用的预测方法有回归分析法、灰色模型、组合预测法。

1.2.1回归分析法:

回归分析法是指根据预测的相关性原则,找出影响预测目标的各因素,并用数学方法找出这些因素与预测目标之间的函数关系的近似表达,再利用样本数据对其模型估计参数及对模型进行误差检验,一旦模型确定,就可利用模型,根据因素的变化值进行预测。

回归分析预测法的步骤:

a.根据预测目标,确定自变量和因变量;

b.建立回归预测模型;

c.进行相关分析;

d.检验回归预测模型,计算预测误差;

c.计算并确定预测值。

1.2.2灰色模型预测:

灰色预测模型是通过少量的、不完全的信息,建立数学模型并做出预测的一种预测方法。

灰色系统的特点:

a.用灰色数学处理不确定量,使之量化;

2

b.充分利用已知信息寻求系统的运动规律;

c.灰色系统理论能处理贫信息系统.

1.2.3组合预测:

组合预测方法是对同一个问题,采用两种以上不同预测方法的预测。它既可是几种定量方法的组合,也可是几种定性的方法的组合,但实践中更多的则是利用定性方法与定量方法的组合。组合的主要目的是综合利用各种方法所提供的信息,尽可能地提高预测精度。

1.2.4时间序列法:

时间序列回归模型,是考虑事物发展的变化规律,以时间为自变量建立的一种相关模型,它既考虑了事物发展的延续性,又充分考虑到事物的发展受偶然因素的作用而产生的随机变化。

1.2.5多元回归方法:

多元回归分析预测法是通过对两个或两个以上的自变量与一个因变量的相关分析,建立预测模型进行预测的方法。它是研究一个随机变量与两个或两个以上一般变量之间相依关系的统计分析方法。

1.3本设计采用的分析方法

本课程设计将采用一元线性回归预测法、多元回归预测方法,时间序列法,S曲线分析进行分析与预测。

3

2数据采集

2.1数据来源

本设计所需的数据,(总人口、生产总值、旅客周转率等经济指标的)来源是2011年中国统计年鉴(https://www.wendangku.net/doc/986200413.html,/tjsj/ndsj/2011/indexch.htm)。:

表2-1:上海市2006-2010年统计年鉴

年度

公路客运量

(万人)总人口(万人)

生产总值

(亿元)

旅客周转量

(亿人公里)

2006 2784181510572.2486.8

2007 2872185812494.0194.0

2008 2934188814069.8694.1

2009 2995192115046.4599.6

2010 3634230217165.98115.4

2.2数据处理

本课程设计选取上海市总人口数量、生产总值、旅客周转量作为主要指标。

a.总人口数量。针对此模型中被解释变量为公路客运量,其主要消费者为上海市民,总人口数量是一个重要的影响因素。

b.生产总值。交通运输的发展离不开国家宏观经济的密切影响,因此选取地区生产总值(GDP)作为解释变量之一,分析其对公路客运量的影响。

c.旅客周转量。反映交通部门一定时期内旅客运输工作量的指标。指旅客人数与运送距离的乘积,旅客周转量是制订运输计划和考核运输任务完成情况的主要依据之一。因此旅客周转量也是一个重要的影响因素。

2.2.1数据描述性分析

4

处理过程:打开spss软件,在菜单栏中找到“分析—描述统计—频率”,单击出现一个对话框,在对话框中输入变量和数据,点击确定,即可得到最终数据。

表2—1:各指标描述性统计表

图2—1:公路客运量与总人口茎叶图

5

6

图2—2:公路客运量与生产总值茎叶图

图2—3:公路客运量与旅客周转量茎叶图

表2—3:各指标相互相关性

相关性

公路客运量(万人)总人口(万人)生产总值(亿

元)

旅客周转量

(亿人公里)

公路客运量(万人)Pearson 相关性 1 .999**.872 .975**显著性(双侧).000 .054 .005 N 5 5 5 5

总人口(万人)Pearson 相关性.999** 1 .855 .969**显著性(双侧).000 .065 .007 N 5 5 5 5

生产总值(亿元)Pearson 相关性.872 .855 1 .938*显著性(双侧).054 .065 .018 N 5 5 5 5

旅客周转量(亿人公里)Pearson 相关性.975**.969**.938* 1 显著性(双侧).005 .007 .018

N 5 5 5 5

**. 在 .01 水平(双侧)上显著相关。

*. 在 0.05 水平(双侧)上显著相关。

2.3现状分析

经过对以上图表的数据分析可以得出:

①根据公路客运量与其他各指标的茎叶图,可以看出公路客运量的数量随着各指标的增长而增长,呈正相关关系。

②根据各指标相互相关性表,可以看出公路客运量与总人口、旅客周转量的pearson相关性较强;总人口与公路客运量、旅客周转量的pearson相关性较强;生产总值与旅客周转量的pearson相关性较强;旅客周转量与总人口、公路客运量和生产总值的pearson相关性较强。

③根据各指标相互相关性表,可以看出公路客运量与总人口、旅客周转量显

7

著相关;总人口与公路客运量显著相关;生产总值与各指标不显著相关;旅客周转量与共路客运量显著相关。

8

3统计模型与分析

3.1一元线性回归预测

3.1.1一元线性回归预测原理

一元线性回归预测法是分析一个因变量与一个自变量之间的线性关系的预测方法。设y 为因变量,为自变量,并且自变量与因变量之间为线性关系时,则一元线性回归预测的基本思想:确定直线的方法是最小二乘法。最小二乘法的基本思想:最有代表性的直线应该是直线到各点的距离最近。然后用这条直线进行预测。

3.1.2操作步骤及结果分析

影响上海市公路客运量的3个因素:总人口,生产总值,旅客周转量。以年度为自变量,各因素为因变量建立模型预测结果如下。

(1)以年度为自变量,总人口为因变量建立预测模型

A.SPSS操作步骤如下:

①按分析—回归—线性,打开对话框;

②将自变量输入年度,因变量输入总人口,单击确定。如图所示。

9

10

图3-1-1 :spss 操作步骤截图

B.输出结果:

表3-1-1:总人口为因变量时的输出结果

C.结果分析:

①依据上述表格得到模型的拟合优度R^2=0.694,说明拟合程度较好;

②得到回归方程:Y=-206272.800+103.700X1.(Y:总人口,X1:年度)

表3-1-1:2011—2015年上海总人口的预测结果(单位:万人)

(2)以年度为自变量,生产总值为因变量建立预测模型

A.SPSS操作步骤: 如上所述(略)

B. 输出结果:

表3-1-2 :生产总值为因变量时的输出结果

11

C.结果分析:

①依据上述表格得到模型的拟合优度R^2=0.989,所以拟合程度很好;

②得到回归方程:Y=-3146706.228+1573.992X1。(Y:生产总值,X1:年度)

表3-1-3上海2011-2015年生产总值预测结果(单位:亿元)

12

(3)以年度为自变量,旅客周转量为因变量建立预测模型

A.SPSS操作步骤: 如上所述(略)

B. 输出结果:

表3-1-4:旅客周转量为因变量时的输出结果

系数a

13

C.结果分析:

①依据上述表格得到模型的拟合优度R^2=0.854,所以拟合程度很好;

②得到回归方程 Y=-12512.260+6.280X1。(Y:旅客周转量,X1:年度)

表3-1-5:上海2011-2015年旅客周转量预测结果(单位:亿人公里)

3.2多元线性回归预测

3.2.1多元线性回归预测原理

多元回归分析是研究多个变量之间关系的回归分析方法, 按因变量和自变量的数量对应关系可划分为一个因变量对多个自变量的回归分析(简称为“一对多”回归分析)及多个因变量对多个自变量的回归分析(简称为“多对多”回归分析), 按回归模型类型可划分为线性回归分析和非线性回归分析。

利用二元线性回归方程,以旅客周转量,GDP,总人口为自变量,公路客运量为因变量,建立模型预测分析,结果如下:

3.2.2 SPSS操作步骤:

①按分析—回归—线性,打开对话框;

14

教育统计学与SPSS课后作业答案祥解题目

教育统计学课后作业 一、P118 1 题目:10位大一学生平均每周所花的学习时间与他们的期末考试成绩见表6-17.试问: (1)学习时间与考试成绩之间是否相关? (2)比较两组数据谁的差异程度大一些? (3)比较学生2与学生9的期末考试测验成绩。 表6-17 学习时间与期末考试成绩 1 2 3 4 5 6 7 8 9 10 学习时间考试成绩40 58 43 73 18 56 10 47 25 58 33 54 27 45 17 32 30 68 47 69 解题步骤: (1)第一步:定义变量:“xuexishijian”、“xuexichengji”后,输入数据.如下图: 1

第二步:单击选择“分析(Analyze)”中的“相关(Correlate)”中的“双变量(Bivariate Correlations)”, 将上图中的“xuexishijian”和“xuexichengji”添加到右边变量框中,如下图: 第三步:点击“确定“后,输出结果如下图: 第四步:分析结果

3 由上图可知:学习时间与学习成绩之间的pearson 相关系数为0.714,p (双侧)为0.20。自由度 df=10-2=8时,查“皮尔逊积差相关系数显著临界值表”知:r 0.05= 0.623 ; r 0.01=0.765。 因为0.765 > 0.714 >0.623,所以在0.05水平上学习时间和学习成绩是相关显著的。 (2)SPSS 软件分析结果如下图: 由上图可知:学习时间标准差和平均值为:S 1=12.037 ?X 1= 29.00 ;学习时间标准差和平均值为:S 2=12.437?X 2=56.00 根据差异系数公式可知: 学习时间差异系数为:%100?=X S CV S =12.037/29.00×100%=41.51% 学习成绩差异系数为:%100?= X S CV S =12.437/56.00×100%=22.27% 有上述结果可知学习时间差异程度大于学习成绩差异程度。 (4) 把学生2和学生9的期末考试成绩转化成标准分数: Z 2=(X -?X) /S= (73—56)/12.437=1.367 Z 9=(X-?X)/S=(68—56)/12.437=0.965 由上计算可知:学生2期末考试测验成绩优于学生9的期末考试测验成绩。 二、P119 2 题目:某班数学的平均成绩为90,标准差10;化学的平均分为85,标准差为8;物理的平均分为79,标准差为15.某生这三科成绩分别为95,80,80.试问 (1) 该生在哪一学科上突出一些? (2) 该班三科成绩的差异度如何?有无学习分化现象? (3) 该生的学期分数是多少? (4) 三科的总平均和总标准差是多少? 解题步骤:

SPSS实验报告

SPSS实验报告要求 1、为减小文字工作量,提升实验报告要求,每次上课只需要选择一个实验写报告即可,最终上交的实验报告统一命名为实验一、二……六。每个实验下面有超过二个小实验的,只需选择二个定实验报告。 2、实验报告统一使用WORD文档,建议使用宋体五号字,统一装订后,第十八周周五上午交。 3、实验报告参照以下模板

SPSS统计分析与应用 实验报告 班级:社会工作13 学号: 姓名: 学期:2015-2016学年第二学期

实验一建立与编辑数据文件 实验时间:2016-5-26 地点:实验楼2栋4楼 一、实验目的 1、理解数据文件的原理和方法; 2、 3、 二、实验内容 **************************************************************************** ******************************************************************************* ******* 三、实验步骤 1、建立数据文件 简要描述即可 ******************************************************************************* ******************************************************************************* **** 2、选择个案 简要描述即可 ******************************************************************************* ******************************************************************************* **** 四、实验结果 1、建立数据文件 **************************************************************************** ******************************************************************************* ******* 2、选择个案 ****************************************************************************

教育统计学与SPSS名解总结

第一章导论(阅览前必读:书上每个章节后的名解我全都列出来了,黑色字体的都是书上原文,量多,但有些不重要的名解没必要背,你挑着背不要被吓到。绿色是章节题目,红色的就是我的一些说明、补充、吐槽,一个人打字很无聊啊有木有!一直自言自语啊有木有!并非书上的名词解释,看看就好,可删。这段紫色的也删了哈。接下来……正文,走你!) 统计学(statistics):即研究统计原理与方法的科学。 教育统计学(educational statistics):是专门研究如何搜集、整理、分析在心理和教育方面有实验或调查所获得的数字资料,如何根据这些资料所传递的信息,进行数学推论,找出客观规律的一门学科。简言之,教育统计学是运用统计学的一般原理和方法研究教育科学领域数量关系的一门科学。 描述统计(descriptiive statistics):是实验或调查所获得的数据加以整理(如制表、绘图),并计算其各种代表量数(如集中量数、差异量数、相关量数等),其基本思想是平均。 Or:是研究如何整理心理与教育科学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性质的一种统计方法。 推断统计(inferencial statistics):又称抽样统计,它是根据对部分个体进行观测所得到的信息,通过概括性的分析、论证,在一定可靠程度上去推测相应的团体。 Or:是研究如何通过局部数据所提供的信息,运用概率的理论进行分析论证,在一定可靠程度上推论总体或全局情形的统计方法。这是统计学中的主要内容。 实验设计(experimental statistics):是研究如何更加合理、有效的获得观测资料,如何更正确、更经济、更有效的达到实验目的,以揭示实验中各种变量关系的实验计划。 Or:实验者为了揭示实验中自变量与因变量的关系,在实验之前所制定的实验计划,称为实验设计。他是研究如何科学地、经济地以及更有效地进行实验。 统计常态法则:从总体中随机抽取一部分个体所组成的样本,差不多可以保持总体的特征。 小数永存法则:从总体中抽取的第一个样本中所表现的特性,在其他样本中也会存在。 大量惰性原则:某一事物的某一性质或状态,在反复观察或试验中是保持不变的。 有效数字:是指能影响测量准确性的数字。 随机变量(random variable):在统计学中把在取值之前不能预料到取什么值的量称为变量(随机变量)。 数据(data):如果一旦某个数值被取定了,成这个数值为随机变量的一个观察值,即数据。 总体(population):指客观存在的,并在同一性质的基础上结合起来的许多个别单位的整体,即具有某一特性的一类事物的全体,又叫母体或全域。 个体(individual): 构成总体的基本单位或单元,又称元素或个案。 样本(sample):从总体中抽取的一部分个体。 参数(parameter):表示总体特征的量数。 统计量(statistic):是直接从样本计算出的量数,代表样本的特征。

spss实验心得体会.doc

spss实验心得体会 篇一:SPSS学习报告总结心得 应用统计分析学习报告 本科的时候有概率统计和数理分析的基础,但是从来没有接触过应用统计分析的东西,SPSspss实验心得体会)S也只是听说过,从来没有学过。一直以为这一块儿会比较难,这学期最初学的时候,因为没有认真看老师给的英文教材,课下也没有认真搜集相关资料,所以学起来有些吃力,总感觉听起来一头雾水。老师说最后的考核是通过提交学习报告,然后我从图书馆里借了些教材查了些资料,发现很多问题都弄清楚了。结合软件和书上的例子,实战一下,发现SPSS的功能相当强大。最后总结出这篇报告,以巩固所学。 SPSS,全称是StatisticalProductandServiceSolutions,即“统计产品与服务解决方案”软件,是Ibm公司推出的一系列用于统计学分析运算、数据挖掘、预测分析和决策支持任务的软件产品及相关服务的总称,也是世界上公认的三大数据分析软件之一。SPSS具有统计分析功能强大、操作界面友好、与其他软件交互性好等特点,被广泛应用于经济管理、医疗卫生、自然科学等各个领域。具体到管理方面,SPSS也是一个进行数据分析和预测的强大工具。这门课中也会用到AmoS软件。关于SPSS的书,很多都是首先介绍软件的。这个软件易于安装,我装的是19.0的,虽然20.0有一些改变和优化,但是主体都是一样的,而且都是可视化界面,用起来很方面且容易上手。所以,我学习的重点是卡方检验和T检验、方差分析、相关分析、回归分析、因子分析、

结构方程模型等方法的适用范围、应用价值、计算方式、结果的解释和表述。 首先是T检验这一部分。由于参数检验的基础不牢固,这部分也是最初开始接触应用统计的东西,学起来很多东西拿不准,比如说原假设默认的是什么。结果出来后依然分不清楚是接受原假设还是拒绝原假设。不过现在弄懂了。这部分很有用的是T检验。T检验应用于当样本数较小时,且样本取自正态总体同时做两样本均数比较时,还要求两样本的总体方差相等时,已知一个总体均数u,可得到一个样本均数及该样本标准差,样本来自正态或近似正态总体。T检验分为单样本T检验、独立样本T检验、配对样本T检验。其中,单样本T检验是样本均数与总体均数的比较的T检验,用于推断样本所代表的未知总体 均数μ与已知的总体均数uo有无差别;独立样本T检验主要用于检验两个样本是否来自具有相同均值的总体,即比较两个样本的均值是否相同,要求两个样本是相互独立的;配对样本T检验中,要正确理解“配对”的含义,主要用于检验两个有联系的正态总体的均值是否有显著差异,跟独立检验的区别就是样本是否是配对样本。这几个方法用软件操作起来都是相对简单的,关键是分清楚什么时候用这个什么时候用那个。 然后是方差分析。方差分析就是将索要处理的观测值作为一个整体,按照变异的不同来源把观测值总变异的平方和以及自由度分解为两个或多个部分,获得不同变异来源的均值与误差均方,通过比较不同变异来源的均方与误差均方,判断各样本所属总体方差是否相等。方差

《统计分析与SPSS的应用(第五版)》课后练习标准答案(第2章)

《统计分析与SPSS的应用(第五版)》(薛薇) 课后练习答案 第2章SPSS数据文件的建立和管理 1、SPSS中有哪两种基本的数据组织形式?各自的特点和应用场合是什么? SPSS中两个基本的数据组织方式:原始数据的组织方式和计数数据的组织方式。 ●原始数据的组织方式:待分析的数据是一些原始的调查问卷数据,或是一些基本的 统计指标。 ●计数数据的组织方式:所采集的数据不是原始的调查问卷数据,而是经过分组汇总 后的数据。 2、什么是SPSS的个案?什么SPSS的变量? 个案:在原始数据的组织方式中,数据编辑器窗口中的一行称为一个个案或观测。 变量:数据编辑器窗口中的一列。 3、在定义SPSS数据结构时,默认的变量名和变量类型是什么?如果希望增强SPSS统计分析结果的易读性,还需要对数据结构的哪些方面进行必要说明? 默认的变量名:VAR------;默认的变量类型:数值型。 变量名标签和变量值标签可增强统计分析结果的可读性。 4、收集到以下关于两种减肥产品试用情况的调查数据,请问在SPSS中应如何组织该份资料? 产品类型体重变化情况 明显减轻无明显变化 第一种产品2719 第二种产品20 33 问:在SPSS中应如何组织该数据? 数据文件如图所示: 5、什么是SPSS的用户缺失值?为什么要对用户缺失值进行定义?如何在SPSS中指定用户缺失值? 缺失值分为用户缺失值(User Missing Value)和系统缺失值(System Missing

Value)。用户缺失值指在问卷调查中,将无回答的一些数据以及明显失真的数据当作缺失值来处理。用户缺失值的编码一般用研究者自己能够识别的数字来表示,如“0”、“9”、“99”等。系统缺失值主要指计算机默认的缺失方式,如果在输入数据时空缺了某些数据或输入了非法的字符,计算机就把其界定为缺失值,这时的数据标记为一个圆点“?”。在变量视图中定义。 6、从计量尺度角度看,变量包括哪三种主要类型?请各举出一个相应的实际数据。如何在SPSS中指定变量的计算尺度? 变量类型包括:数值型(身高)、定序型(受教育程度)以及定类型(性别)。在变量视图中定义。 7、有一份关于居民储蓄调查的模拟数据存储在Excel中,文件名为“居民储蓄调查数据.xls”。该数据的第一行是变量名,格式如下图所示。请将该份数据转换成SPSS数据文件,并在SPSS中指定其变量名标签和变量值标签。(该份数据的具体含义见Excel文件的后半部分) 【文件(F)】→【打开(O)】→【数据(A)】→文件类型选“Excel(*.xls,…)”,文件名选“居民储蓄调查数据.xls”→【打开】→选中“从第一行数据读取变量名”,在“范围” 中输入“A1:Q283”→【确定】→在“变量视图”窗口,调整A1变量的宽度,输入变量名标签和变量值标签→在主菜单窗口选定【文件(F)】→【保存】→选择保存路径,保存类型为“sav”,文件名为“居民储蓄调查数据”→【保存】. 8、现有股民投资状况调查的文本数据,文件名为“股民投资数据.txt”。其中各变量的含义和编码见文件“股民投资数据.xls”。请将该文本数据读入SPSS,并定义变量名标签和变量值标签。其中各变量取值为9的均为用户缺失值,请加以定义说明。(注:本调查问卷中涉及多选项问题,以及多选项问题的编码等,可先忽略。) 【文件(F)】→【打开文本数据(D)】→【数据(A)】→文件类型选“Text(*.txt,…)”,文件名选“股民投资数据.txt”,【打开】→在“您的文本文件与预定义的格式匹配吗?”中选“否”,【下一步】→在“变量名称是否包括在文件的顶部”中选“是”,【下一步】→在“第一个数据个案从哪个行号开始”中输入“2”,其他默认,【下一步】→【下一步】→在“数据格式”中输入“字符串”,接着在弹出的窗口输入“4”,【下一步】→默认各选项,【完成】→在主菜单窗口选定【文件(F)】→【保存】→选择保存路径,保存类型为“sav”,文件名为“股民投资数据”→【保存】.

spss课程设计报告毕业用资料

课程设计 设计题目:上海公路客运量需求预测与分析课程名称:运输统计与分析 学院:交通运输工程学院 专业:交通运输 班级: 学生姓名: 学号: 指导教师:

课程设计(学年论文)任务书 课程名称:运输统计与分析 适用对象:交通运输工程 一、课程设计(论文)目的 《运输统计与分析》课程设计作为独立的教学环节,是交通运输本科专业的必修课。其目的是,通过本课程设计实践,培养学生理论联系实际思想,加深统计分析基本理论与基本知识的理解,学会收集或调查行业统计数据,切实掌握各种统计分析方法,并能灵活运用统计软件在计算机上实现,正确解释和分析运行结果,培养运用各种统计分析方法解决交通运输领域内实际问题的能力。 二、课程设计(论文)题目与内容 本课程设计(论文)主要任务为:针对交通运输领域内某一主题,设计调查表调查或查询相关统计数据,根据本课程讲授内容选择一种或多种合适的统计分析方法,运用SPSS建立模型分析问题。题目自拟,但题名一般要包含主题与统计方法。且必须与交通运输相关,选题主题主要包括: 1.运输市场定位研究 2.运输需求分析与预测 3.政策或技术方法实施效果评价 4.交通行为选择 5.影响因素分析 6.聚类分析 7.服务质量评价

8. 自选 三、课程设计(论文)基本要求 报告内容原则上不少于8000字,其正文至少包括如下几个方面的内容: 1.问题背景(问题的提出、必要性与意义,该问题目前常用的分 析手段与方法,本设计采用的方法) 2.数据采集 (含数据采集方式、描述性分析、统计图表) 说明:调查分析则必须包含调查方案,其它数据原则上必须说明出处。 3.统计模型与分析 (包含模型原理、SPSS操作步骤、输出结果及分析) 4.总结 5.附录数据清单 四、课程设计(论文)时间及进度安排 1.时间:两周:2011-2012学年第二学期第十九、二十周 2.进度安排: 确定主题;调查、收集数据:2天 数据分析与预处理、描述性统计分析:2天 分析方法原理及选择:3天 SPSS操作及结果分析:4天 解决实际问题或建议:2天 撰写报告、总结:1天 (此部分同学们可以按照自己设计具体内容,详细安排)

统计学 SPSS作业

频率 统计量 XB性别MRC月消费金额 N 有效126 126 缺失0 0 频率表 XB性别 频率百分比有效百分比累积百分比 有效 A.男65 51.6 51.6 51.6 A.女61 48.4 48.4 100.0 合计126 100.0 100.0 MRC月消费金额 频率百分比有效百分比累积百分比 有效 A.300元-400元 1 .8 .8 .8 B.401元-600元9 7.1 7.1 7.9 C.601元-1000元77 61.1 61.1 69.0 D.1000元以上39 31.0 31.0 100.0 合计126 100.0 100.0

通过以上交叉表可知,男性日常用品花费在41-60元和61-100元这两个区间所占比 游程检验 2 XB性别NL年龄 检验值a 1.48 19.59 案例 < 检验值65 70 案例 >= 检验值61 56 案例总数126 126 Runs 数8 35 Z -10.017 -5.112 渐近显著性(双侧) .000 .000 a. 均值 从上图中可以知道图中显示性别的分割点分别为1和1.48,,SPSS计算出游程数分别共有1和8,表格中年龄所使用的分割点为均数19和19.59,而不是原先的中位数20,导致游程增加到46和35.

可见在年龄为21时样本的信心指数均值为1.8556,低于基线水平100.样本均数抽样误差为0.13216 由上面的检验结果t=-742.635 p=0 由于p值小于检验水准0.05。因此拒绝H0,所以样本所在的均值与假设的在总体均值相同。

分析结果的第一部分为Levene’s方差齐性检验,用于判别两总体方差是否为齐性方差,这里的检测结果为F=10.975,P=0.006,因此拒绝Ho,认为本例中两个样本所在总体的方差是不齐的。 相关性 控制变量NL年龄YY MRC月消费金额NL年龄相关性 1.000 . 显著性(双侧). . df 0 15 YY 相关性. 1.000 显著性(双侧). . df 15 0 在控制了月消费金额之后计算出的年龄和总指数的偏相关矩阵,可见两者的偏相关系数为1。 G图

spss课程设计

课程设计 分析探索变量salary随其他背景资料的变化规律 一、项目背景 在分类变量的统计描述与参数估计中对员工的各个属性进行了初步的统计分析,得出了一些结论,比如:男性员工较女性员工收高,非少数名族较少数民族高,受教育程度相同的人群中非少数民族占的比例更高,并且工资在20000~30000之间的比例最大等等。 在前面第八章对Employee data.sav数据进行了分析计算,但前面的分析并不完善,而且Educational Level (years)中不同的等级之间salary的关系、不同职务之间salary关系值得深入研究等等。这仅仅是意味着数据分析和报告撰写的所需数据的原料准备好了,而随后的工作是对其进行分析,将结果呈现为数据报告和分析报告。 二、分析思路 在后续的分析中,将用到前面已经获得的数据,并利用SPSS进行数据分析,计算出报告所需的汇总统计量/汇总结果,绘制所需要的统计表(图);图形和统计表都可以用于数据描述,图形可以提供更为直观的数据信息,但操作比较复杂,二统计表阅读起来不方便,但操作简单,因此,二者要适当配合,初步分析用统计表,后续工作用统计图来直观刻画,虽然数据描述往往以单一因素分析为主,但也要考虑不同因素之间的分析可能会重复,比如工资和男女性别之间的关系与少数民族男女之间的关系可能会重复,所以使用探索描述。 三、具体操作 1.Gender和Minority Classification对Salary的影响分析 首先用均值对其进行简单的描述分析。 (1)选择“分析”→“比较均值”→“均值”菜单。 (2)在打开对话框中将“Gender”“Minority Classification”选入“自变量”列表框,将“Current Salary”选入“因变量”列表框。 (3)单击“选项”按钮,打开选项子对话框,在单元格统计量框组中选入“均值”“极大值”“全距”“极小值”,单击确定。 得到如下信息。 均值

教育统计学 SPSS练习题

1.某学校初中一年级80名学生的数学考试成绩如下,制作频数分布表和图形并作频数分布分析。 某校初一年级80名学生的数学考试成绩 88,89,90,72,89,88,84,83,92,86 90,86,76,87,91,90,90,74,85,84 90,85,89,76,77,85,93,91,81,84 91,83,80,85,87,86,87,84,89,91 84,89,88,84,83,95,85,89,89,89 80,95,83,91,86,87,92,93,89,73 95,82,87,89,80,70,85,85,68,83 82,89,88,85,90,89,80,90,77,72 2.将第1题中的80名学生的数学考试成绩分成0-60,60-70,70-80,80-90,90-100五段,进行分段频数统计,并绘制频数分布条形图 3.某班学生政治面貌分布情况为:党员21人,团员35人,群众43人,请绘制统计图。 4.某班学生政治面貌分布情况为:党员21人(其中男生11人,女生10人),团员35人(其中男生15人,女生20人),群众43人(其中男生23人,女生20人),请绘制统计图。 5.某职业技术学院2000年对其240名学生家长的职业调查结果如下:公务员58人,医生26人,军人15人,工人90人,个体工商业主45人,教师6人,请据此绘制一个圆形图。 6.对15名初三学生用一套初中数学水平测验试卷进行测试,其测验得分如下,另以这些学生的校内数学期末考试成绩为效标,试计算初中数学水平测验的效标关联效度系数。 学生序号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 水平测验得分56 73 65 78 64 77 90 61 54 75 45 72 88 95 61 期末成绩63 65 70 74 68 85 92 64 59 70 50 79 90 91 65 7.某大学一年级12名学生的英语阅读理解能力测验成绩与其平时阅读作业成绩如下表所列,试计算阅读理解能力测验的效标关联效度系数。 学生序号 1 2 3 4 5 6 7 8 9 10 11 12 测验得分32 33 34 34 36 37 38 39 40 41 43 45 作业成绩(等级)6 4 2 7 5 9 1 3 11 12 10 8 8. 从某班学生中随机抽取15名,测得他们的数学成绩如下: 65,77,80,78,89,90,74,73,89,95,83,56,68,92,82 (1)试对该班学生的数学平均成绩和成绩的离散程度作出估计。 (2)试求该班成绩均值的95%和99%的置信区间。 9.已知某年级学生的语文成绩服从正态分布,其中总体平均数为76.9,标准差未知。现从该年级某班随机抽取16名学生的语文成绩,数据如下: 75,88,73,93,85,76,68,90,61,58,78,89,95,77,60,74,问该班学生的平均语文成绩是否也是76.9?(α=0.01)

spss课程设计报告

数理统计与数据分析课程设计报告课程设计题目:大学生购买知识付费课程影响因素的分析学生姓名(学号): *** 学生姓名(学号): *** 学生姓名(学号): *** 课程设计报告评价: 最终成绩: 任课教师: *** 评阅日期:

目录 摘要 (1) 一、背景分析 (2) 二、问卷设计 (3) 三、数据分析 (3) 1、描述性分析 (3) 2、交叉表卡方检验 (4) 2.1、性别与是否会购买付费课程 (4) 2.2、学习阶段与是否会购买付费课程 (6) 3、回归分析 (7) 3.1、生活费水平与是否会购买付费课程 (7) 3.2、一星期使用学习软件的频次与是否会购买付费课程8 4、差异分析 (9) 4.1、是否了解过付费软件与是否会购买付费软件 (9) 4.2、学习阶段与一星期使用付费软件的频次 (10) 四、总结 (13) 参考文献 (14) 附录 (15)

摘要 随着移动互联网的快速发展,传统的线下学习模式已不能满足当下大学生的需要,应运而生的便是线上知识平台,随着需求的大量增加,线上知识课程平台亦在向付费类知识类课程转变。新媒体时代,网络技术的快速发展让共享经济从理论变成了现实,包括出行、房屋,人们生活的方方面面都在践行共享经济的模式。共享经济的发展潜移默化的改变了人们的生活习惯和思维方式,知识付费平台正是在知识共享的大环境下应运而生。2016 年被称为知识付费的元年,随着喜马拉雅、得到、知乎、分答的相继走红,知识付费的概念被反复讨论,电子商务的服务内容由实物发展到知识层面。知识付费作为一个新概念的推出,其带来的巨大商业潜力受到互联网行业的广泛关注。 因此,借助当下知识付费类课程的广泛上线,对某校学生对知识付费类课程用户的购买意愿及影响购买意愿的各种因素进行统计调查。 本研究主要着点为调查使用知识付费类课程的用户以及尚未使用或接触的用户对付费类课程的购买意愿,借助前人的理论基础进行假设,设计了多个影响因素,通过实际问卷调查,结合 SPSS、EXCEL、问卷星等整合数据去分析关于购买意愿的各类影响因素以及通过数据分析得出关于知识付费类课程的实质性建议。本次问卷调查,除去无效问卷,最终以150份大众数据来进行最终研究分析,以此得出影响知识付费类课程用户的购买意愿的影响因素,并与调查之前所做出的假设进行对比,结合实际情况给出最终的建议,为知识付费类课程的更加良好运行及发展提供理论支撑。 关键字:知识付费平台;影响因素;数据分析

统计分析与SPSS的应用(第五版)课后练习答案(第6章)

《统计分析与SPSS的应用(第五版)》(薛薇) 课后练习答案 第6章SPSS的方差分析 1、入户推销有五种方法。某大公司想比较这五种方法有无显著的效果差异,设计了一项实验。从应聘人员中尚无推销经验的人员中随机挑选一部分人,并随机地将他们分为五个组,每组用一种推销方法培训。一段时期后得到他们在一个月内的推销额,如下表所示: 1)请利用单因素方差分析方法分析这五种推销方式是否存在显著差异。 2)绘制各组的均值对比图,并利用LSD方法进行多重比较检验。 (1)分析→比较均值→单因素ANOV A→因变量:销售额;因子:组别→确定。 ANOVA 销售额 平方和df 均方 F 显著性 组之间405.534 4 101.384 11.276 .000 组内269.737 30 8.991 总计675.271 34 概率P-值接近于0,应拒绝原假设,认为5种推销方法有显著差异。

可知,1和2、1和5、2和3,2和4,2和5,3和5,4和5有显著差异。 2、从两个总体中分别抽取n 1 =7 和和n 2 =6 的两个独立随机样本,经计算得到下面的方差分析表。请补充表中单元格的两个独立随机样本,经计算得到下面的方差分析表。请补充表中单元格“A”和单元格“B”内的计算结果。 答:已知组内均方=组内偏差平方和/自由度,所以A=26.4/11=2.4 F 统计量=组间均方/组内均方所以B=7.5/2.4=3.125 3、为研究某种降血压药的适用特点,在五类具有不同临床特征的高血压患者中随机挑选了若干志愿者进行对比试验,并获得了服用该降压药后的血压变化数据。现对该数据进行单因素方差分析,所得部分分析结果如下表所示。 1)请根据表格数据说明以上分析是否满足方差分析的前提要求,为什么? 2)请填写表中空缺部分的数据结果,并说明该降压药对不同组患者的降压效果是否存在显著差异。 3)如果该降压药对不同组患者的降压效果存在显著差异,那么该降压药更适合哪组患者?(1)因F检验的概率P值小于显著性水平(0.05),拒绝原假设,方差不齐,不满足方差分析的前提假设。 (2)4*276.032=1104.128;1104.128+1524.990=2629.118;4+63=67;1524.990/63=24.206 (3)各组均值存在显著差异。更适合第三组 4、 1)选择恰当的数据组织方式建立关于上述数据的SPSS数据文件

SPSS实验报告

描述性统计分析 一、实验目得 1.进一步了解掌握SPSS专业统计分析软件,能更好地使用其进行数据统计分析。 2.学习描述性统计分析及其在SPSS中得实现,内容具体包括基本描述性统计量得定义及 计算﹑频率分析﹑描述性分析﹑探索性分析﹑交叉表分析等。 3.复习权重等前章得知识。 二﹑实验内容 题目一 打开数据文件“data4-5、sav”,完成以下统计分析: (1)计算各科成绩得描述统计量:平均成绩、中位数、众数、标准差、方差、极差、最大值与最小值; (2)使用“Recode”命令生成一个新变量“成绩段”,其值为各科成绩得分段:90~100为1,80~89为2,70~79为3,60~69为4,60分以下为5,其值标签设为:1-优,2-良,3-中,4-及格,5-不及格。分段以后进行频数分析,统计各分数段得人数,最后生成条形图与饼图。1.解决问题得原理 因为问题涉及各科成绩,用描述性分析,第二问要先进行数据分段,其后利用频数分析描述统计量并可以生成条形图等。 2、实验步骤 针对第一问 第1步打开数据 菜单选择:“文件→打开→数据”,将“data4-8、sav”导入。 第2步文件拆分 菜单选择:“数据→拆分文件”,打开“分割文件”对话框,点击比较组按钮,将“科目”加入到“分组方式”列表框中,并确定。

第3步描述分析设置: (1)选择菜单:“分析→描述统计→描述”, 打开“描述性”对话框,将“成绩””加入到“变量”列表框中。 打开“选项”对话框,选中如下图中得各项。 点击“继续”按钮。 (4)回到“描述性”对话框,点击确定。 针对第二问 第1步频率分析设置: (1)选择菜单:“分析→描述统计→频率”, (2)打开“频率(F)”对话框,点击“合计”。再点击“继续”按钮、

统计学模拟实验spss 实验报告

(此文档为word格式,下载后您可任意编辑修改!) 目录 第一章数据介绍 (3) 1.1研究问题的提出 (3) 1.2数据的来源 (3) 第二章基本统计分析 (4) 2.1 基本统计分析 (4) 2.1.1 全部变量的频数分析 (4) 2.1.3变量的交差分析 (9) 2.1.5 异常值的检验 (12) 2.2 参数检验 (13) 2.2.1 单样本T检验 (13) 2.2.2 两独立样本T检验 (14) 2.3 相关分析 (14) 2.4 多元线性回归分析 (15) 第三章总结和建议 (21) 3.1 存在的问题 (21) 3.2 如何改进这些不足 (21) 附录A22 附录B22

摘要 当前的消费市场中,大学生作为一个特殊的消费群体正受到越来越大的关注。由于大学生年纪较轻,群体较特别,有着不同于社会其他消费群体的消费心理和行为。一方面,他们有着旺盛的消费需求,另一方面,他们尚未获得经济上的独立,消费受到很大的制约。消费观念的超前和消费实力的滞后,都对他们的消费有很大影响。社会大众对大学生的消费存在种种争议,认为他们出手阔绰。本文从我校大学生消费状况,消费的行为、消费结构、消费倾向和消费观念等方面来分析大学生的消费特征以及怎样提高他们的消费观念和理财能力,引导在校大学生树立正确的消费观。 关键词:大学生消费观;理性;问题;改进;数据分析

第一章数据介绍 1.1研究问题的提出 大学生消费问题日渐成为一个社会广为关注的问题,大学生作为一个特殊的群体,处于校园与社会交界处,脱离了父母,开始经济独立,独自生活。大学是一个精彩的世界,社会生活又是充满诱惑的,对大学生的消费都存在着很大的影响。同时也不免回存在一些非理性的消费问题,导致社会群众对大学生消费状况的批评。为了弄清大学生的消费问题的真实问题本小组成员进行了该项调查主要想弄清楚大学生们平时把钱花在哪里,花多少,影响他们消费的因素有哪些,以及他们在消费中有那些问题,应该怎样的去改造这些问题。 1.2数据的来源 本次分析的数据来源于我校90名不同专业和年级的同学消费情况调查。Spss数据中共包含十一变量,分别是:性别,户口状况,家庭年总收入,月生活费,伙食费占生活费的比例,娱乐占生活费的比列,生活费的来源,消费习惯,消费倾向,消费商品是注重,生活费盈余的处理,消费状况是否满意。通过运用spss统计软件,对变量进行基本统计分析、参数检验、相关分析、回归分析,以了解我校同学在上述方面的综合状况,并分析个变量的分布特点及相互间的关系。 第二章基本统计分析 2.1 基本统计分析 2.1.1 全部变量的频数分析 户口情况频数分析(表一) 频率百分比有效百分比累积百分比 有效城镇17 18.9 18.9 18.9 农村73 81.1 81.1 100.0 合计90 100.0 100.0 从表一中可知被调查的同学中有73人来自农村占总人数的81%,只有17个同学来自城镇占总人数的19%。说明我校学生户口大多数分布在农村,生活水平较低。 性别状况的频数分析(表二) 频率百分比有效百分比累积百分比

统计分析与SPSS应用_期末作业

统计分析与SPSS的应用 摘要:为对统计分析与spss应用分析所学知识进行巩固和检验,特运用所学知识进行简单的统计分析应用,下文以某校学生学期成绩进行模拟分析。 一:原始数据:10级市场营销2班成绩 分析一:综测成绩四分位数 上表表明:综测成绩的最小值为68.61分,最大值为89.15分。其中25%的学生综测成绩为74.4100分,50%的学生综测成绩为80.3740分,75%的学生综测成绩为85.2200分。四分位数差从侧面证实了学生综测成绩呈一定左偏分布。

分析二:综测成绩直方图 上图表明:该班学生的综测成绩均分为80.07分,标准差为5.62。从图中可以看出,综测成绩呈左偏性分布,在85分左右的学生人数最多,70分左右的学生人数最少。 分析三:综测成绩的基本统计量分析 上表表明:综测成绩的极差为20.55分,意味着数据相对较分散。另外,综测成绩的最小值和最大值分别为68.61分和89.15分,平均分为80.0734分,标准差为5.61963。从偏度系数可以看出,系数小于0,偏度标准误差为0.421,因而该班综测成绩呈左偏分布,。从峰度系数可以看出,峰度值小于0,峰度标准误差为0.821,因而数据的分布比标准正态分布更加平缓,称

为平峰分布。 分析四:各科成绩的统计量分析比较 各科成绩统计量结果分析表 由上表可知:宏观经济学的全距最大,而生产与运作管理的全距最小,表明宏观经济学的成绩离散程度最高,而生产与运作管理的成绩离散程度最低;同时,对于标准差而言,也是宏观经济学的标准差最大而生产与运作管理的标准差最小。各科成绩平均分最高的为体育成绩,平均分最低的为英语成绩。各科成绩中只有人力资源管理的成绩是呈右偏分布,其他各科成绩均呈左偏分布。另外,各科成绩中,只有宏观经济学的成绩呈尖峰分布,其他各科呈平峰分布。

spss实验报告

专业统计软件应用 实验报告 实验课程专业统计软件应用 上课时间2013 学年上半学期14 周(2013 年5 月27 日—31 日) 学生姓名杨守玲学号2011211432 班级0361102 所在学院经管上课地点金融实验指导教师唐兴艳

第五章思考与练习 3.表5.20 是某班级学生的高考数学成绩,试分析该班的数学成绩与全国的平均成绩70 分之间是否有显著性差异(数据文件:data5-16.sav)。 解:解决问题的原理:独立T样本检验 提出原假设和备择假设: Ho:p<0.05,该班的数学成绩与全国的平均成绩70 分之间不存在显著相关性;H1:p>0.05,该班的数学成绩与全国的平均成绩70 分之间存在显著相关性。 第1步单样本T 检验分析设置 (1)选择菜单:“分析”→“比较均值”→“单样本T 检验(S)”,打开“单样本T 检验主对话框”,确定要进行T 检验的变量并输入检验值,按如图所示进行设置。将“成绩”选入“检验变量”中,输入待检验的值“70”,用来检验产生的样本均值与检验值有无显著性差异。 第2步“选项”对话框设置:指定置信水平和缺失值的处理方法。

第3步主要结果及分析 完成以上的操作步骤后,点击“确定”按钮,运行结果如下所示,具体分析如下:下表给出了单样本T 检验的描述性统计量,包括样本数(N)、均值、标准差、均值的标准误差。 当置信水平为95%时,显著性水平为0.05,从表5.2 中可以看出,双尾检测概率P 值为0.002,小于0.05,故接受原假设,也就是说该班的数学成绩与全国的平均成绩70 分之间不存在显著相关性,即班的数学成绩与全国的平均成绩70 分之间存在显著性差异。 4. 在某次测试中,随机抽取男女同学的成绩各10 名,数据如下: 男:99 79 59 89 79 89 99 82 80 85 女:88 54 56 23 75 65 73 50 80 65 假设样本总体服从正态分布,比较置信度为95%的情况下男女得分是否有显著性差异(数据文件:data5-17.sav)。

SPSS课程设计 (2)

<> 课程设计报告

SPSS在经济中的应用分析 摘要 经济发展,就是整个人类社会追求的目标之一。在宏观经济理论中,经济的发展主要受到消费,投资,政府购买的影响。在经济理论中,我们通常用GDP来描述经济的发展,同时GDP也会受到价格水平的影响。衡量价格水平,我们一般用居民消费价格指数,商品零售价格指数来描述;投资一般用固定资产投资与工业总产值来衡量。本文通过我国近20年的国内生产总值与影响国内生产总值的一些重要指标,如居民消费水平,财政支出,工业总产值,商品零售价格指数,居民消费价格指数,城镇居民收入,农村居民收入,能源消费总量等数据,利用SPSS软件提供的对各个影响因素的描述性统计分析,各个影响因素之间的相关性分析,回归分析,因子分析等方法对数据进行了深入的分析,并就分析结果所反映的问题给出了一些针对性的建议。 【关键词】经济发展描述统计相关性分析回归分析因子分析 引言 中国作为世界上的发展中国家,其经济实力及综合国力水平在近几十年的时间里都得到了长足的发展。经济实力的不断攀升,以及经济增长速度的持续加速,令中国经济已成为世界各国所关注的焦点。我国经济持续高速增长带来了社会财富的迅速增加,目前人均国内生产总值(GDP)迈过3000美元大关,已步入中等收入国家的行列。那么影响GDP快速增长的原因有哪些?我国经济的迅速发展中就是否还存在一些问题呢?就是我们需要进一步探讨与研究的。随着我国改革开放的实践与经济理论的发展,实证方法与数据分析成为了经济研究中的重要方面。大量经验证据的分析与运用对于经济理论的发展与决策的支持都具有重要的意义。而经济实证研究离不开现代统计分析方法的运用,SPSS作为统计分析工具,理论严谨、内容丰富,具有数据管理、统计分析、趋势研究、制表绘图、文字处理等功能。为经济管理研究提供了有力的工具。而因子分析,回归分析等方法就

统计分析与SPSS应用 期末作业

统计分析与SPSS的应用 原始数据:10级市场营销2班成绩 分析一:综测成绩四分位数 上表表明:综测成绩的最小值为68.61分,最大值为89.15分。其中25%的学生综测成绩为74.4100分,50%的学生综测成绩为80.3740分,75%的学生综测成绩为85.2200分。四分位数差从侧面证实了学生综测成绩呈一定左偏分布。

分析二:综测成绩直方图 上图表明:该班学生的综测成绩均分为80.07分,标准差为5.62。从图中可以看出,综测成绩呈左偏性分布,在85分左右的学生人数最多,70分左右的学生人数最少。 分析三:综测成绩的基本统计量分析 上表表明:综测成绩的极差为20.55分,意味着数据相对较分散。另外,综测成绩的最小值和最大值分别为68.61分和89.15分,平均分为80.0734分,标准差为5.61963。从偏度系数可以看出,系数小于0,偏度标准误差为0.421,因而该班综测成绩呈左偏分布,。从峰度系数可以看出,峰度值小于0,峰度标准误差为0.821,因而数据的分布比标准正态分布更加平缓,称

为平峰分布。 分析四:各科成绩的统计量分析比较 各科成绩统计量结果分析表 由上表可知:宏观经济学的全距最大,而生产与运作管理的全距最小,表明宏观经济学的成绩离散程度最高,而生产与运作管理的成绩离散程度最低;同时,对于标准差而言,也是宏观经济学的标准差最大而生产与运作管理的标准差最小。各科成绩平均分最高的为体育成绩,平均分最低的为英语成绩。各科成绩中只有人力资源管理的成绩是呈右偏分布,其他各科成绩均呈左偏分布。另外,各科成绩中,只有宏观经济学的成绩呈尖峰分布,其他各科呈平峰分布。

SPSS课程设计报告书

理工大学 课程名称:SPSS统计分析 设计题目:大学生生活费收支状况的分析与设计 :墨霖学号: 0000000000 系别:经济与管理系专业班级:物流1302班 开始日期:2015年 9 月 7日完成日期:2015年 12月 1 日 指导教师:王辉成绩评定等级(分数)

理工大学 课程设计任务书 班级:13物流2班:墨霖学号:00000000 本表附在课程设计说明书的目录之后。

理工大学 课程设计成绩评定表班级:13物流2班:墨霖学号:00000000 本表附在课程设计任务书之后。

用SPSS对大学生生活费收支状况的分析与设计 摘要 步入大学的校门,就意味着我们不仅要在学习上学会独立,日常生活的各个方面也要学会独立,而日常生活离不开资金的开支,怎么样合理地安排父母给予我们有限费用的主力消费和消费的引导。大学生目前的消费情况和消费观念,不仅会影响自己日后的生活工作,而且对未来社会消费文化的构造也会产生重要的影响。大学生的生活费,这是需要我们在大学的生活中慢慢探讨并学会理财的。作为大学生,我们是社会的消费者中的一个特殊的群体,有着自己独特的消费意识和特点,同时也是未来消费者。采用spss软件对大学生生活费收支状况进行分析将会极方便读者了解到大学生的消费情况。在以下数据中,分别对大学生性别、来自哪里、每个月的生活费来源、每个月出去逛街或玩的情况及每个月的生活费等进行了分析,可以看出生活费与很多方面都有着影响。 关键词:大学生;消费观;生活费

目录 第一章原始数据的整理与录入如下 (1) 第二章统计图的制作与编辑 (3) 2.1条形图 (3) 2.2直方图 (4) 2.3饼状图 (5) 第三章基础统计分析 (6) 3.1对性别进行频数分析,并作出条形图 (6) 3.2求每月和朋友出去玩逛街的均值、最大值、最小值、标准差 (7) 3.3求大学生每月生活费的均值、标准差、众数,并结合正态曲线的直方图进行分析.. 7 3.4分性别求和朋友出去玩逛街次数最大值、最小值、平均值和标准差 (8) 3.5求生活费来源的峰度、偏度,对照带正态曲线的直方图理解结果 (9) 第四章均值比较与T检验 (11) 4.1均值分析 (11) 4.2单一样本T检验 (11) 4.3独立样本T检验 (12) 4.4配对样本T检验 (13) 4.5单因素方差分析 (14) 第五章相关分析 (15) 5.1两变量相关分析 (15) 5.2偏相关分析 (16) 第六章一元线性回归分析 (17) 参考文献 (18) 附录 (20)

相关文档