文档库 最新最全的文档下载
当前位置:文档库 › 应用统计学课程设计-运用SPSS对城市空气质量的统计分析

应用统计学课程设计-运用SPSS对城市空气质量的统计分析

应用统计学课程设计-运用SPSS对城市空气质量的统计分析
应用统计学课程设计-运用SPSS对城市空气质量的统计分析

学号

(应用统计学课程设计)

设计说明书运用SPSS对城市空气质量的统计分析起止日期:2013年7 月1 日至2013年7 月5 日

学生姓名

班级

成绩

指导教师(签字)

经济与管理学院

2013年7月5日

应用统计学课程设计

课程设计分工及成绩评定表

成绩评定表

目录

1确定假设 (4)

2分析思路 (4)

3选用的分析方法 (4)

4 描述性分析 (4)

4.1空气质量达到二级以上的天数占全年的比例的描述性统计 (4)

4.2城市空气质量因素的描述性统计 (5)

5统计图 (6)

5.1立体柱状图对两年各类的空气质量描述 (6)

5.2折线图对降水量对空气质量的影响描述 (7)

6统计报表 (7)

7均值比较 (8)

8相关分析 (10)

9一元线性回归分析 (11)

9.1可吸入颗粒和空气质量达到二级以上的天数的一元线性回归分析 (11)

9.2降水量和空气质量达到二级以上的天数的一元线性回归分析 (12)

10多元线性回归分析 (13)

11总结 (14)

12 统计调查方案 (15)

12.1问题提出 (15)

12.2确定调查对象和调查单位 (16)

12.3确定调查内容 (16)

12.4调查方式和方法 (16)

12.5调查期限 (16)

12.6确定假设 (16)

附原始数据 (17)

1确定假设

1.假设忽略空气中可能影响空气质量的其他污染物;

2.假设在较近一段时间内,不发生重大工业事故;

3.假设在未来一段时间内,城市自然环境稳定,不发生一些较大的自然灾害,例如:地震、洪灾、海啸等;

4.假设未来一段时间内,政府没有出台关于大规模工业的迁入迁出城市的政策。

2分析思路

此次课程设计,我针对中国主要城市在2010年及2011年的空气质量,利用SPSS软件进行统计分析。先是对全国各主要城市的空气质量进行横向比较,分析我国的空气质量的总体情况和地区差异,然后对代表性空气质量影响因素进行分析。

分析思路总结大致是:首先利用SPSS软件中的描述性统计分析的方法对主要城市空气质量进行横向比较,利用统计图判断在全国范围内是否存在影响空气质量的共同因素及两年的变化,然后利用报表统计城市空气质量在2010年及2011年的分布状况是否具有一致性,随后利用均值比较、相关性分析、回归分析对各个因素影响效果进行分析。

3选用的分析方法

根据分析思路知在本次统计分析中主要运用的分析方法有:描述性分析、统计图、统计报表、均值比较、相关分析、一元线性回归分析、多元线性回归分析。

4 描述性分析

4.1空气质量达到二级以上的天数占全年的比例的描述性统计

本设计选择2011年中国统计年鉴中2010年全国主要城市的空气质量统计数据及2012年中国统计年鉴中2011年全国主要城市的空气质量统计数据作为统计研究对象,对城市空气质量达到二级以上的天数占全年的比例进行分类,并进行频数分析,分析结果如表4.1及4.1.2 所示。

表4.1 空气质量达到二级以上的天数占全年的比例(已离散化)

频率百分比有效百分比累积百分比

有效< 70.0 2 3.2 3.2 3.2

70.0 - 79.9 5 8.1 8.1 11.3

80.0 - 89.9 26 41.9 41.9 53.2

90.0+ 29 46.8 46.8 100.0

合计62 100.0 100.0

从表4.1及表4.1.2对比可以看出,2010年及2011年空气质量达到二级以上的天数占全年的比例小于70%的各1个省市,占两年的3.2%;70% 到80% 元之间2010年有3个省市,2011年有2个省市,占两年的8.1%;80% 到90% 之间2010年有14个省市,2011年有13个省市,占两年的41.9%;大于90%,2010年有13个省市,2011年有15个省市,占两年的46.8%;

从上面分析可以看出2011年较2010年的空气质量有所好转,但一半以上的省市空气质量达到二级以上的天数占全年的比例仍小于90%,说明城市空气质量还有提升的空间。 4.2城市空气质量因素的描述性统计

本设计对城市空气质量的可吸入颗粒、二氧化硫、二氧化氮、空气质量达到二级以上的天数、年平均温度及年平均降水量六项影响空气质量的因素做描述性统计分析,包括频数、最小值、最大值、平均值、标准差五个项目,见表4.2。

从表4.2可以看出,在影响空气质量的因素中,可吸入颗粒的最小值为0.04毫克/立方米,最大值为0.155毫克/立方米,平均值为0.09334毫克/立方米,标准差为0.023294;二氧化硫的最小值为0.007毫克/立方米,最大值为0.089毫克/立方米,平均值为0.03998毫克/立方米,标准差为0.016621;二氧化氮的最小值0.015毫克/立方米,最大值为0.068毫克/立方米,平均值为0.04019毫克/立方米,

表4.1.2按空气质量达到二级以上的天数分组* 空气质量数据的年份 交叉制表

计数

空气质量数据的年份 合计

2010 2011 按空气质量达到二级以上的天数分组 <=244 1 1 2 <=286 3 2 5 <=329 14 13 27

<=365 13 15 28 合计 31 31 62 表4.2 描述统计量

N

极小值

极大值

均值 标准差 可吸入颗粒 62 .040 .155 .09334 .023294 二氧化硫 62 .007 .089 .03998 .016621 二氧化氮

62 .015 .068 .04019 .012125 空气质量达到二级以上的天数

62

223

365

324.00

29.019

年平均降水量 62 166.2 2445.1 882.923 543.3003 年平均温度

62 4.5

24.6

13.984

5.0910

有效的 N (列表状态)

62

标准差为29.019;空气质量达到二级以上的天数的最小值为223天,最大值为365天,平均值为324,标准差为29.019;年平均降水量的最小值为166.2毫米,最大值为2445.1毫米,平均值为882.923毫米,标准差为543.3003;年平均温度的最小值为4.5摄氏度,最大值为24.6摄氏度,平均值为13.984摄氏度,标准差为5.0910;

5统计图

5.1 立体柱状图对两年各类的空气质量描述

按照4.1 的分类对2010年及2011年四类空气质量在可吸入颗粒、二氧化硫、二氧化氮三个方面用立体柱状图展示,如图5.1 所示:

图5.1

从图5.1得知可吸入颗粒物为影响我国城市空气质量的主要因素,2011年较2010年在空气质量达到二级以上的天数占全年的比例小于70%的城市中可吸入颗粒的含量得到有效控制,其他分组的可吸入颗粒含量没有明显变化。

5.2 折线图对降水量对空气质量的影响描述

按照4.1 的分类对四类空气质量在年平均降水量方面用折线图展示(温度受地区、纬度及降水量的影响在这不做分析),如图5.2所示:

图5.2

从图5.2得知降水量对空气质量有影响,这个影响表现在降水量的增多会使空气质量有所好转,可视为降水量对空气质量的影响成正相关,但此影响是否显著还有待检验。

6统计报表

对2011年及2010年四类空气质量的可吸入颗粒、二氧化硫、二氧化氮进行统计报表。统计报表如报表6.1所示:

报表6.1

空气质量空气质量达到二级以上的天可吸入颗粒二氧化硫二氧化氮

数据年份数占全年的比例(已离散化) 合计合计合计

_________ _________________________ _____________ ____________ ____________

2010 < 70.0 .155 .057 .048

70.0 - 79.9 .362 .162 .181

80.0 - 89.9 1.395 .570 .520

90.0+ 1.046 .478 .501

2011 < 70.0 .138 .048 .042

70.0 - 79.9 .245 .107 .124

80.0 - 89.9 1.308 .550 .510

90.0+ 1.138 .507 .566

总计 5.787 2.479 2.492

从统计报表中可以看出,2011年较2010年影响空气质量的因素(可吸入颗粒、二氧化硫、二氧化氮)的含量都有所下降,进一步证实了表4.1及表4.1.2和图5.1所说明的问题。

7均值比较

对影响空气质量的六个因素进行均值比较,分析出影响空气质量的主要因素,并对这些因素的均值情况进行描述,分析结果如表7.1及表7.1.2所示:

从表7.1.2可以看出四类空气质量,可吸入颗粒的均值分别为0.14650、0.12140、0.10385、0.07439表明不同类别空气质量在可吸入颗粒的含量上有很大的差异,可吸入颗粒含量越高,城市空气质量越差,这和实际相符合;二氧化硫的均值分别为0.05250、0.05380、0.04363、0.03311表明不同类别空气质量在二氧化硫的含量上无明显差异,甚至有些空气质量好的反而比空气质量差的二氧化硫含量高;二氧化氮的均值分别为.0.4500、0.06100、0.03944、0.03686表明不同类别空气质量在二氧化氮的含量上无明显差异,甚至有些空气质量好的反而比空气质量差的二氧化氮含量高;年平均降水量的均值分别为186.5、641.58、776.563、1078.325表明不同类别空气质量在降水量的对少上有很大的差异,降水量越大,城市空气质量越好;年平均温度的均值分别为7.8、11.46、13.34、15.496表明不同类别空气质量在温度上有差异,但这个差异明显不明显不能下结论,因为受到地理位置的影响。

8相关分析

对影响空气质量的六个因素进行相关性分析,分析出影响空气质量的因素之间的相关性大小,分析结果如表8.2所示:

从表8.2可以得知,空气质量达到二级以上的天数分组与可吸入颗粒、二氧化硫、二氧化氮在0.01置信度条件下呈高度负相关,其中可吸入颗粒与空气质量达到二级以上天数的分组的相关性大于二氧化硫及二氧化氮与空气质量达到二级以上的天数的分组的相关性;空气质量达到二级以上的天数分组与年平均降水量、年平均温度在0.01置信度条件下呈高度正相关,其中降水量与空气质量达到二级以上的分组相关性大于温度与空气质量达到二级以上的天数分组的相关性。这与表7.1.2所分析的结果一致。

9一元线性回归分析

由均值分析和相关性分析可知影响空气质量的主要因素是可吸入颗粒和降水量,可吸入颗粒与空气质量成负相关,而降水量与空气质量成正相关,下面分别对两个因素与质量达到二级以上天数进行一元线性回归分析,看二者之间是否存在线性关系。

9.1可吸入颗粒和空气质量达到二级以上的天数的一元线性回归分析

可吸入颗粒和空气质量达到二级以上的天数的一元线性回归分析结果如表9.1及表9.1.2及表9.1.3所示:

由表9.1所示,本次回归分析得到的相关系数R=0.902,调整的决定系数R方为0.811,模型拟合效果很理想。从表9.1.2可以看出,离差平方和为51370,残差平方和为9550.484,回归平方和为41819.516,显著性检验统计量F为262.727,对应的置信水平为0.000,远比常用的置信水平0.05 要小,认定方程是显著的。从表9.1.3可以看出回归方程为y(空气质量达到二级以上的天数)=-1124.06(可吸入颗粒)+428.918,可知每减少3000毫克的可吸入颗粒,空气质量达到二级以上的天数便增加一天。回归系数检验统计量t=-16.209,相伴概率值为0.000<0.001,认为两个变量线性关系极为显著,所以建立的回归方程是有效的。

9.2降水量和空气质量达到二级以上的天数的一元线性回归分析

降水量和空气质量达到二级以上的天数的一元线性回归分析结果如表9.2及表9.2.3及表9.2.4所示:

由表9.2所示,本次回归分析得到的相关系数R=0.425,调整的决定系数R方为0.167,模型拟合效果不是很理想。从表9.2.3可以看出,离差平方和为51370,残差平方和为42087.697,回归平方和为9282.303,显著性检验统计量F为13.233,对应的置信水平为0.001,远比常用的置信水平0.05 要小,认定方程是显著的。从表9.2.4可以看出回归方程为y(空气质量达到二级以上的天数)=0.023(降水量)+303.953,可知每增加0.023毫米的降水量,空气质量达到二级以上的天数便增加一天。回归系数检验统计量t=-3.638,相伴概率值为0.001=0.001,认为两个变量线性关系不显著,所以建立的回归方程是无效的。

10多元线性回归分析

因为降水量和空气质量达到二级以上的天数的一元线性回归分析结果为不显著,但在前面的分析结果中显示降水量对空气质量有一定的影响,且此影响为正相关。所以可能降水量对影响空气质量的因素有所影响,但具体是那个因素就不得而知,所以需要进行多元线性回归分析,我把可吸入颗粒、二氧化硫、二氧化氮、温度、降水量作为自变量,空气质量达到二级以上的天数作为因变量,做多元线性回归分析,分析结果如表10.1及表10.1.2及表10.1.3

由表10.1所示,本次回归分析得到的相关系数R=0.903,调整的决定系数R方为0.800,模型的解释能力很强。从表10.1.2可以看出,离差平方和为51370,残差平方和,9452.128,,回归平方和为41917.872,显著性检验统计量F为49.669,对应的置信水平为0.000,远比常用的置信水平0.05要小认定方程整体很显著。从表10.1.3可以看出回归方程为:空气质量达到二级以上的天数=-1097.808可吸入颗粒+-16.095二氧化硫+4.58二氧化氮+0.003降水量+-0.1008温度+425.714

11总结

综上所统计的结果,总结如下:可以将我国31个城市的空气类型分为四类:污染、轻微污染、良、优。第一类型的城市属于污染型城市,这些城市人口密集,交通拥挤,工业发达。第二类型的城市属于轻微污染型,这些城市的工业类型多以轻工业为主,对大气的污染较轻。第三类型的城市空气质量良好,不会影响人体的健康。第四类型的城市空气质量优,尤其是拉萨,作为我国独具特色的一个旅游城市,在发展经济的同时,特别需要将环境保护的重要性提上日程,不可再走先污染后治理的道路。

从以上的统计中发现,影响空气质量的主要因素为空气中可吸入颗粒的含量,其主要影响人体的呼吸道,因此各地区治理环境的关键是减少可吸入颗粒的含量及排放,结合实际不难发现可吸入颗粒的主要排放来自于工厂及汽车,所以控制工厂的废气排放及控制车辆的上升对空气质量的好转有一定的帮助

从2011年较2010年的城市空气质量数据来看,空气质量有所好转,但此好转的幅度不大,并且虽然总体表现好转,但仍存在个别的城市由好变坏,这就给我们一个警示不能先污染后治理。

12 统计调查方案

12.1问题提出

12.1.1问题背景

1997年,国务院决定对我国的重点城市进行空气质量周报,空气质量周报的内容包括对几种主要污染物(可吸入颗粒,二氧化硫,二氧化氮)的检测状况和结果,以空气污染指数的形式报告。空气污染指数反映了一个城市的污染情况和污染的变动规律,对环保工作的开展具有重要的指导意义。

空气污染指数(Air PollutionIndex,简称API)是评估空气质量状况的一组数字,它关注的是人在吸入受到污染的空气以后几小时或几天内人体健康可能受到的影响。空气污染指数划分为0-50、51-100、101-150、151-200、201-250、251-300和大于300七档,对应于空气质量的七个级别。指数越大,级别越高,说明污染越严重,对人体健康的影响也越明显。

级别一:空气污染指数为0-50,此时对应的空气质量级别为I级,空气质量状况属于优。此时不存在空气污染问题,即对公众的健康没有任何危害.

级别二:空气污染指数为51-100,此时对应的空气质量级别为II级,空气质量状况属于良。此时空气质量被认为是可以接受的,除极少数对某种污染物特别敏感的人以外,对公众健康没有危害。

级别三:空气污染指数为101-150,此时对应的空气质量级别为III(1)级,空气质量状况属于轻微污染。此时,对污染物比较敏感的人群,例如儿童和老年人、呼吸道疾病或心脏病患者,以及喜爱户外活动的人,他们的健康状况会受到影响,但对健康人群基本没有影响。空气污染指数为151-200,此时对应的空气质量级别为III(2)级,空气质量状况属于轻度污染。此时,几乎每个人的健康都会受到影响,对敏感人群的不利影响尤为明显。

级别四:空气污染指数为201-300,此时对应的空气质量级别为IV(1)级和IV(2)级,空气质量状况属于中度和中度重污染。此时,每个人的健康都会受到比较严重的影响。

级别五:空气污染指数大于300,空气质量级别为V级,空气质量状况属于重度污染。此时,所有人的健康都会受到严重影响。

12.1.2问题提出

此次课程设计,我想针对中国主要城市在2010年及2011年的空气质量,利用SPSS软件进行统计分析。先是对全国各主要城市的空气质量进行横向比较,分析我国的空气质量的总体情况和地区差异,然后对代表性空气质量影响因素进行分析。

根据构想,设计主要解决问题:城市空气质量相似的城市分类,各类的频数统计,影响城市空气质量的因素的描述性统计(这是为后面的分析做铺垫);2011年相对于2010年,城市空气质量总体变化如何,各个参数又变化如何;各个影响参数对空气质量的影响程度如何;影响程度大的参数与城市空气质量的关系如何(影响程度分好坏),各个参数之间的关系如何。

12.2确定调查对象和调查单位

12.2.1确定调查对象

根据问题的背景及提出的问题不难发现,本设计所要调查的对象即调查的总体是全国主要城市的空气质量,总体指标包括:可吸入颗粒的含量、二氧化硫的含量、二氧化氮的含量、空气质量达到二级以上的天数、年平均温度、年平均降水量六项并且调查对象的指标数据要求准确、可靠、合理。

12.2.2确定调查单位

根据总体的确定,不难发现调查单位是每一个城市的空气质量,单位的标志包括:可吸入颗粒的含量、二氧化硫的含量、二氧化氮的含量、空气质量达到二级以上的天数、年平均温度、年平均降水量六项并且调查单位的标志数据要求准确、可靠、合理。

12.3确定调查内容

根据1.2中调查对象的指标及调查单位的标志可以确定调查内容,需要说明的是影响空气质量好坏的因素有很多,如:湿度、人口密度等。为此我只选取了可以找到数据的六个指标,分别是可吸入颗粒物(PM10),二氧化硫(SO2),二氧化氮(NO2),空气质量达到二级以上的天数(days),年平均温度(wendu),年平均降水量(water)。这六个指标反映了两个影响方面:呼吸健康影响(前三个)和热舒适度(温度和降水量)。

12.4调查方式和方法

本设计的调查方式和方法是选择2011年的中国统计年鉴中的2010年全国主要城市的空气质量指标统计数据及2012年的中国统计年鉴中的2011年全国主要城市的空气质量指标统计数据作为统计研究对象,这就保证了数据的来源可靠真实。调查方法与方式中中2010年全国主要城市空气质量的数据出处网址为:;2011年的全国主要城市空气质量的数据出处为:;(在报告说明书结尾另附原始数据。)

12.5调查期限

本设计的统计调查期限为两年,分别是2010年的全国主要城市空气质量指标数据和2011年的全国主要城市的空气质量指标数据。

12.6确定假设

统计都是在一定的假设基础上的,所以除了所研究调查的因素可变外,假定其他的影响因素不变,尤其是可能会引起统计结果变化的因素,根据我所研究的问题,确定假设如下:

1.假设忽略空气中可能影响空气质量的其他污染物;

2.假设在较近一段时间内,不发生重大工业事故;

3.假设在未来一段时间内,城市自然环境稳定,不发生一些较大的自然灾害,例如:地震、洪灾、海啸等;

4.假设未来一段时间内,政府没有出台关于大规模工业的迁入迁出城市的政策。

数据来源:《中国统计年鉴》。

应用统计spss分析报告

应用统计spss分析报告

学生姓名:肖浩鑫学号:31407371 一、实验项目名称:实验报告(三) 二、实验目的和要求 (一)变量间关系的度量:包括绘制散点图,相关系数计算及显著性检验; (二)一元线性回归:包括一元线性回归模型及参数的最小二乘估计,回归方程的评价及显著性检验,利用回归方程进行估计和预测; (三)多元线性回归:包括多元线性回归模型及参数的最小二乘估计,回归方程的评价及显著性检验等,多重共线性问题与自变量选择,哑变量回归; 三、实验内容 1. 从某一行业中随机抽取12家企业,所得产量与生产费用的数据如下: 企业编号产量(台)生产费用(万元)企业编号产量(台)生产费用(万元) 1 40 130 7 84 165 2 42 150 8 100 170 3 50 155 9 116 167 4 5 5 140 10 125 180 5 65 150 11 130 175 6 78 154 12 140 185 (1)绘制产量与生产费用的散点图,判断二者之间的关系形态。 (2)计算产量与生产费用之间的线性相关系数,并对相关系数的显著性进行检验(),并说明二者之间的关系强度。

2. 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数据: 地区人均GDP(元)人均消费水平(元) 北京22460 7326 辽宁11226 4490 上海34547 11546 江西4851 2396 河南5444 2208 贵州2662 1608 陕西4549 2035 (1)绘制散点图,并计算相关系数,说明二者之间的关系。 (2)人均GDP作自变量,人均消费水平作因变量,利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。 (3)计算判定系数和估计标准误差,并解释其意义。(4)检验回归方程线性关系的显著性()(5)如果某地区的人均GDP为5000元,预测其人均消费水平。 (6)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。 3. 随机抽取10家航空公司,对其最近一年的航班正点率和顾客投诉次数进行调查,数据如下:

应用统计spss分析报告

学生姓名:肖浩鑫学号:31407371 一、实验项目名称:实验报告(三) 二、实验目的和要求 (一)变量间关系的度量:包括绘制散点图,相关系数计算及显著性检验; (二)一元线性回归:包括一元线性回归模型及参数的最小二乘估计,回归方程的评价及显著性检验,利用回归方程进行估计和预测; (三)多元线性回归:包括多元线性回归模型及参数的最小二乘估计,回归方程的评价及显著性检验等,多重共线性问题与自变量选择,哑变量回归; 三、实验内容 企业编号产量(台)生产费用(万元)企业编号产量(台)生产费用(万元) 1 40 130 7 84 165 2 42 150 8 100 170 3 50 155 9 116 167 4 5 5 140 10 125 180 5 65 150 11 130 175 6 78 154 12 140 185 (1)绘制产量与生产费用的散点图,判断二者之间的关系形态。 (2)计算产量与生产费用之间的线性相关系数,并对相关系数的显著性进行检验(),并说明二者之间的关系强度。 地区人均GDP(元)人均消费水平(元) 北京22460 7326 辽宁11226 4490 上海34547 11546 江西4851 2396 河南5444 2208 贵州2662 1608 陕西4549 2035

(1)绘制散点图,并计算相关系数,说明二者之间的关系。 (2)人均GDP作自变量,人均消费水平作因变量,利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。 (3)计算判定系数和估计标准误差,并解释其意义。 (4)检验回归方程线性关系的显著性() (5)如果某地区的人均GDP为5000元,预测其人均消费水平。 (6)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。 航空公司编号航班正点率(%)投诉次数(次) 1 81.8 21 2 76.6 58 3 76.6 85 4 75.7 68 5 73.8 74 6 72.2 93 7 71.2 72 8 70.8 122 9 91.4 18 10 68.5 125 (1)用航班正点率作自变量,顾客投诉次数作因变量,估计回归方程,并解释回归系数的意义。(2)检验回归系数的显著性()。 (3)如果航班正点率为80%,估计顾客的投诉次数。 4. 某汽车生产商欲了解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。通过计算得到下面的有关结果: 方差分析表 变差来源df SS MS F Significance F 回归 2.17E-09 残差40158.07 —— 总计11 1642866.67 ——— 参数估计表 Coefficients 标准误差t Stat P-value Intercept 363.6891 62.45529 5.823191 0.000168 X Variable 1 1.420211 0.071091 19.97749 2.17E-09 (1)完成上面的方差分析表。 (2)汽车销售量的变差中有多少是由于广告费用的变动引起的?

spss 统计分析报告

Spss统计分析实验报告 一.实验目的: 通过统计分析检验贫血患儿在接受新药物与常规药物 之后血红蛋白增加量的情况,得出两者疗效是否存在差异, 并且可以判断那种药物疗效好。 二.实验步骤 例题:某医院用某种新药与常规药物治疗婴幼儿贫血,将20 名贫血患儿随机等分为2 组,分别接受两种药物治疗,测得 血红蛋白增加量(g/L)如下,问新药与常规药物的疗效有别 差别? 新药 24 36 25 14 26 34 23 20 15 19 组 常规 14 18 20 15 22 24 21 25 27 23 药物 组 解题: 1)根据题意,我们采用独立样本T检验的方法进行统计分析。提出:无效假设H0:新药物与常规药物的疗效没 有差别。 备择假设HA:新药物与常规药物的疗效有差别。

2)在spss中的“变量视图”中定义变量“药组”,“血红蛋白增加量”,之后在数据视图中输入数据,其中新药组定义为组1,常规药物组定义为组 2. 保存数据 。 3)在spss软件上操作分析过程如下:分析——比较变量——独立样本T检验——将“血红蛋白增加量变量”导入“检验变量”,

——将“药组变量”导入“分组变量”——定义组1为 新药组,组2为常规药物组——单击选项将置信度区间 设为95%,输出分析数据如下: 表1: 组统计量 药组N 均值标准差均值的标准误 血红蛋白增加量新药组10 23.6000 7.22957 2.28619 常规药组10 20.9000 4.22821 1.33708 表2: 独立样本检验 方差方程的 Levene 检验均值方程的 t 检验 F Sig. t df Sig.(双侧) 均值差值标准误血红蛋白增加量假设方差相等 1.697 .209 1.019 18 .321 2.70000 2. 假设方差不相等 1.019 14.512 .325 2.70000 2. 4)输出结果分析 由上述输出表格分析知:接受新药物组和常规药物组的

SPSS实验报告(一)

SPSS实验报告(一)

湖南涉外经济学院 实验报告 课程名称:应用统计软件分析(SPSS) 专业班级: 姓名 学号: 指导教师: 职称:副研究员 实验日期: 2016.4.19 成绩评定指导教 师 签字 签字 日期

学生实验报告实验序号 一、实验目的及要求 实验目的 通过本次实验,使学生熟练掌握转换菜单和数据菜单的具体功能及操作,熟练应用两个菜单中的计算变量、重新编码、选择个案、个案排序、分类汇总等几个主要过程 实验要求 能够根据相关要求选用正确的过程对变量或者文件进行管理和操作,得到结果,并能对得出的结果进行解释。 二、实验描述及实验过程 实验描述一、下载数据(以下情况选一种): (一)分地区(31个省市区)环境污染治理投资数据(2014年) 环境污染治理投资总额(亿元),城市环境基础设施建设投资额(亿元) ,城市燃气建设投资额(亿元) ,城市集中供热建设投资额(亿元),城市排水建设投资额(亿元),城市园林绿化建设投资额(亿元),城市市容环境卫生建设投资额(亿元)

工业污染源治理投资(万元) 建设项目“三同时”环保投资额(亿元) (二)分地区(31个省市区)经济发展总体数据(2014年) 国民总收入,国内生产总值,第一产业增加值,第二产业增加值,第三产业增加值,人均国内生产总值,人口总量,城镇失业率,基尼系数等 (三)各省市房地产开发2014年相关数据 投资额,房地产开发企业个数,从业人员数,收入,税金,利润,资产,负债,平均销售价格,等等。 (四)各省市科技2014年相关数据 包括GDP,研发投入,研发投入强度(研发投入/GDP),R&D研发人员,专利授权数,发明专利授权量。 (五)查找相关行业(钢铁行业、水泥行业、医药制造、工程机械、汽车制造业、旅游酒店行业、航空、电子商务企业等)上市公司2015年度数据。包括销售收入、利润、固定资产净值、总资产利润率、营业利润率、销售净利率、净资产收益率、流动比率、资产负债率、主营业务收入增长率、营收账款周转率、存货周转

spss的数据分析报告

Gender Educational Level (years)N Valid 474474Missing 00关于某公司474名职工综合状况的统计分析报告 1、 数据介绍: 本次分析的数据为某公司474名职工状况统计表,其中共包含十一变量,分别是:id (职工编号),gender(性别),bdate(出生日期),edcu (受教育水平程度),jobcat (职务等级),salbegin (起始工 资),salary (现工资),jobtime(本单位工作经历<月>),prevexp(以前工作经历<月>),minority(民族类型),age(年龄)。通过运用spss 统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析、。。。以了解该公司职工上述方面的综合状况,并分析个变量的分布特点及相互间的关系。2、 数据分析 1、 频数分析。基本的统计分析往往从频数分析开始。通过频数分析 能够了解变量的取值状况,对把握数据的分布特征非常有用。此次分析利用了某公司474名职工基本状况的统计数据表,在gender(性别)、edcu (受教育水平程度)、不同的状况下的频数分析,从而了解该公司职工的男女职工数量、受教育状况的基本分布。 Statistics 首先,对该公司的男女 性别分布进行频数分析,结果如下: Gender FrequencyPercent Valid Percent Cumulative Percent Valid Female 21645.645.645.6 Male 258 54.4 54.4 100.0 Total 474100.0100.0 上表说明,在该公司的474名职工中,有216名女性,258名男性,男女比例分别为45.6%和54.4%,该公司职工男女数量差距不大,男性略多于女性。 其次对原有数据中的受教育程度进行频数分析,结果如下表 : Educational Level (years) Valid Cumulative

SPSS期末统计分析报告(可打印修改)

大学生参加校园比赛活动积极性调查 统计分析报告

目录 一.研究背景 (3) 1.调查背景及目的 (3) 2.研究分析方法 (3) 二.数据分析过程 (3) 1.频数分析 (3) 2.交叉分组下的频数分析 (4) 3.两独立样本非参数检验 (5) 4.相关分析 (6) 5.回归分析 (6) 三.结论 (7) 四.建议 (7) 五.小组成员及分工 (7) 六.调查问卷 (8)

一.研究背景 1.调查背景及目的 随着时代的发展,大学生在校学习已经不仅仅局限于书本知识的掌握,现代教育更需要的是大学生书本知识的运用与实践。每学期学校都会组织了大量丰富多彩的比赛,这些比赛极大地丰富了大学生的校园文化生活。不过一些比赛活动并不能得到大学生的积极参与或支持,比赛活动该怎样做才能让大学生满意,提高大学生参加学校活动的积极性。本组进行关于“大学生参加校园比赛活动积极性调查”的问卷调查,为了使活动更有针对性,使更多的同学积极参加到学校的各项活动,丰富同学们的课余文化生活,营造良好的学习氛围。 2.研究分析方法 报告分析方法包括:SPSS的基本统计分析、SPSS的非参数检验、SPSS的相关分析、SPSS的线性回归分析 二.数据分析过程 1.频数分析

由上述表格可得,本次调查的总人数为101人,其中男生44人,女生57人。年级分布情况是:人数最多的是大三,其次是大一,人数较少的是大二和大四,人数大致相当。在被调查的同学中,对参加比赛的态度情况是:“偶尔会考虑参加”占比例最多,其次是“是自己课余活动的一部分”和“很排斥”,比例最少的是“可有可无”,该特征从饼图中表现得更直观。 2.交叉分组下的频数分析

多元统计学SPSS实验报告一

华东理工大学2016–2017学年第二学期 《多元统计学》实验报告 实验名 称实验1数据整理与描述统计分析

教师批阅:实验成绩: 教师签名: 日期: 实验报告正文: 实验数据整理 (一)对“employee”进行数据整理 1.观察量排序 ( based on current salary) 2.变量值排序(based on current salary : rsalary) 3.计算新的变量(incremental salary=current salary - beginning salary)

4.拆分数据文件(based on gender) 结论:There are 215 female employees and 259 male employees. 5.分类汇总 (break variable: gender ; function: mean ) 结论:The average current salary of female is . The average current salary of male is . (二)分别给出三种工作类别的薪水的描述统计量 实验描述统计分析 1)样本均值矩阵 结论:总共分析六组变量,每组含有十个样本。 每股收益(X1)的均值为;净资产收益率(X2)的均值为;总资产报酬率(X3)的均值为;销售净

利率(X4)的均值为;主营业务增长率(X5)的均值为;净利润增长率(X6)的均值为. 2)协方差阵 结论:矩阵共六行六列,显示了每股收益(X1)、净资产收益率(X2)、总资产报酬率(X3)、销售净利率(X4)、主营业务增长率(X5)和净利润增长率(X6)的协方差。 3)相关系数 结论:矩阵共六行六列,显示了每股收益 (X1)、净资产收益率(X2)、总资产报酬 率(X3)、销售净利率(X4)、主营业务增 长率(X5)和净利润增长率(X6)之间的 相关系数。 每格中三行分别显示了相关系数、显著性 检验与样本个数。 4)矩阵散点图

spss统计分析报告

计算机与信息技术学院专业实习报告 学校:商丘师范学院 专业:信息管理与信息系统年级:2012 姓名:亚慧 学号:121112015 时间:2015.09

《统计分析与SPSS的应用》 实习报告 专业实习题目:数据处理与分析 一.实习目的 1.初步了解探索数据分析的基本方法和思路 2.掌握问题的研究思路及方法 3.掌握统计分析软件实现这些方法的步骤和原理 4.熟悉SPSS操作系统,掌握数据管理界面的简单的操作; 5.熟悉SPSS结果窗口的常用操作方法,掌握输出结果在文字处理软件中的使用方法。 6.掌握常用统计图(线图、条形图、饼图、散点、直方图等)的绘制方法;熟悉描述性统计图的绘制方法; 7.熟悉描述性统计图的一般编辑方法。掌握相关分析的操作,对显著性水平的基本简单判断。二.实习要求 1.遵守学校实习纪律和学校的各项规章制度 2.服从领导和指导老师的实习安排、虚心接受指导老师的安排 3.不得冒名顶替,否则严肃处理 4.按时上下课,不得缺席 5.掌握SPSS软件的基本操作、数据分析的基本功能和基本步骤 6.掌握对SPSS所分析的各项数据的理解、数据分析的基本方法和思路 7.掌握工作中如何进行数据的收集、整理以及统计分析报告的撰写的方法。 8.掌握相关关系的含义,并准确应用,熟练掌握绘制散点图的具体操作 9.掌握线性回归分析的主要目标、及具体操作。 三.实习任务 (一)下列表为数据处理所有表格和数据 信管12-1成绩表 学号性别计算机 网络 管理信 息系统 统计 学 市场营 销学 现代管 理学 运筹学 信息资 源管理 英语上 学期 英语 下学 期 大三 综合 成绩 121112001 女82.00 90.00 79.00 82.00 84.00 85.30 81.00 74 75 89.5

spss统计分析报告期末考精彩试题

《统计分析软件》试(题)卷 班级xxx班xxx 学号xxx 说明:1.本试卷分析结果写在每个题目下面(即所留空白处); 2.考试时间为100分钟; 3.每个试题20分。 一、(20分)已经给出某个班的学生基本情况及其学习成绩的两个SPSS数据文件,学生成绩一.sav;学生成绩二.sav。要求: (1)将所给的两个SPSS数据文件“学生成绩一.sav”与“学生成绩二.sav”合并,并保存为“成绩.sav.” (2)对所建立的数据文件“成绩.sav”进行以下处理: 1)按照性别求出男、女数学成绩的各种统计量(包括平均成绩、标准差等)。 2)计算每个学生的总成绩、并按照总成绩的大小进行排序 3)把数学成绩分成优、良、中三个等级,规则为优(X≥85),良(75≤X≤84),中(X≤74),并对优良中的人数进行统计。

分析: (2) 描述统计量 性别N 极小值极大值均值标准差 男数学 4 77.00 85.00 82.2500 3.77492 有效的N (列表状态) 4 女数学16 67.00 90.00 78.5000 7.09930 有效的N (列表状态)16

注:成绩优良表示栏位sxcj 优为1 良为2 中为3 由表统计得,成绩为优的同学有4人,占总人数的20%;良的同学有12人,占总人数的60%;中的同学有4人,占总人数的40%。 二、(20分)为了解笔记本电脑的市场情况,针对笔记本电脑的3种品牌,进行了满意度调查,随机访问了30位消费者,让他们选出自己满意的品牌,调查结果见下表,其中变量“职业”的取值中,1表示文秘人员,2表示管理人员,3表示工程师,4表示其他人;3个品牌变量的取值中,1表示选择,0表示未选数据见Excel 数据文件“调查.exe”。根据所给数据完成以下问题 (1)将所给数据的Excel文件导入到SPSS中,要求SPSS数据文件写出数据结构(包括变量名,变量类型,变量值标签等)命,并保存为:“调查. Sav”。 (2)试利用多选项分析,利用频数分析来分析消费者对不同品牌电脑的满意度状况;分析不同职业消费者对笔记本品牌满意度状况。

统计学原理SPSS实验报告

实验一:用SPSS绘制统计图 实验目的:掌握基本的统计学理论,使用SPSS实现基本统计功能(绘制统计图) 对SPSS的理解:它是一款社会科学统计软件包,同时也广泛应用于经济,金融,商业等各个领域,基本功能包括数据管理,统计分析,图表分析,输出管理等。 实验算法:掌握SPSS的基本输入输出方法,并用SPSS绘制相应的统计图(例如:直方图,曲线图,散点图,饼形图等) 操作过程: 步骤1:启动SPSS。单击Windows 的[开始]按钮(如图1-1所示),在[程序]菜单项[SPSS for Windows]中找到[SPSS 13.0 for Windows]并单击,得到如图1-2所示选择数据源界面。 图1-1 启动SPSS

图1-2 选择数据源界面 步骤2 :打开一个空白的SPSS数据文件,如图1-3。启动SPSS 后,出现SPSS 主界面(数据编辑器)。同大多数Windows 程序一样,SPSS 是以菜单驱动的。多数功能通过从菜单中选择完成。

图1-3 空白的SPSS数据文件 步骤3:数据的输入。打开SPSS以后,直接进入变量视图窗口。SPSS的变量视图窗口分为data view和variable view两个。先在variable view中定义变量,然后在data view里面直接输入自定义数据。命名为mydata并保存在桌面。如图1-4所示。 图1-4 数据的输入 步骤4:调用Graphs菜单的Bar过程,绘制直条图。直条图用直条的长短来表示非连续性资料(该资料可以是绝对数,也可以是相对数)的数量大小。选择的数据源见表1。 步骤5:数据准备。激活数据管理窗口,定义变量名:年龄标化发生率为RATE,冠心病临床型为DISEASE,血压状态为BP。RATE按原数据输入,DISEASE按冠状动脉机能不全=1、猝死=2、心绞痛=3、心肌梗塞=4输入,BP按正常=1、临界=2、异常=3输入。

应用统计spss分析报告

应用统计s p s s分析报 告 TYYGROUP system office room 【TYYUA16H-TYY-TYYYUA8Q8-

学生姓名:肖浩鑫学号: 一、实验项目名称:实验报告(三) 二、实验目的和要求 (一)变量间关系的度量:包括绘制散点图,相关系数计算及显着性检验; (二)一元线性回归:包括一元线性回归模型及参数的最小二乘估计,回归方程的评价及显着性检验,利用回归方程进行估计和预测; (三)多元线性回归:包括多元线性回归模型及参数的最小二乘估计,回归方程的评价及显着性检验等,多重共线性问题与自变量选择,哑变量回归; 三、实验内容 企业编号产量(台)生产费用(万 元)企业编号产量(台)生产费用(万 元) 1 40 130 7 84 165 2 42 150 8 100 170 3 50 155 9 116 167 4 5 5 140 10 125 180 5 65 150 11 130 175 6 78 154 12 140 185 (2)计算产量与生产费用之间的线性相关系数,并对相关系数的显着性进行检验(),并说明二者之间的关系强度。 2. 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数 地区人均GDP(元)人均消费水平(元) 北京22460 7326 辽宁11226 4490 上海34547 11546 江西4851 2396 河南5444 2208 贵州2662 1608 陕西4549 2035 (2)人均GDP作自变量,人均消费水平作因变量,利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。

(3)计算判定系数和估计标准误差,并解释其意义。 (4)检验回归方程线性关系的显着性() (5)如果某地区的人均GDP为5000元,预测其人均消费水平。 (6)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。 3. 随机抽取10家航空公司,对其最近一年的航班正点率和顾客投诉次数进行调查, 航空公司编号航班正点率(%)投诉次数(次) 1 21 2 58 3 85 4 68 5 74 6 93 7 72 8 122 9 18 10 125 系数的意义。 (2)检验回归系数的显着性()。 (3)如果航班正点率为80%,估计顾客的投诉次数。 4. 某汽车生产商欲了解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。通过计算得到下面的有关结果: 变差来源df SS MS F Significance F 回归 残差—— 总计11——— Coefficients标准误差t Stat P-value Intercept X Variable 1 (2)汽车销售量的变差中有多少是由于广告费用的变动引起的? (3)销售量与广告费用之间的相关系数是多少? (4)写出估计的回归方程并解释回归系数的实际意义。 (5)检验线性关系的显着性(a=)。 5. 随机抽取7家超市,得到其广告费支出和销售额数据如下

spss统计分析期末考试题

《统计分析软件》试(题)卷 班级 xxx班姓名 xxx 学号 xxx 说明:1.本试卷分析结果写在每个题目下面(即所留空白处); 2.考试时间为100分钟; 3.每个试题20分。 一、(20分)已经给出某个班的学生基本情况及其学习成绩的两个SPSS数据文件,学生成绩一.sav;学生成绩二.sav。要求: (1)将所给的两个SPSS数据文件“学生成绩一.sav”与“学生成绩二.sav”合并,并保存为“成绩.sav.” (2)对所建立的数据文件“成绩.sav”进行以下处理: 1)按照性别求出男、女数学成绩的各种统计量(包括平均成绩、标准差等)。 2)计算每个学生的总成绩、并按照总成绩的大小进行排序 3)把数学成绩分成优、良、中三个等级,规则为优(X≥85),良(75≤X ≤84),中(X≤74),并对优良中的人数进行统计。

分析: 描述统计量 性别N极小值极大值均值标准差 男数学477.0085.0082.2500 3.77492有效的 N (列表状态)4 女数学1667.0090.0078.50007.09930有效的 N (列表状态)16

注:成绩优良表示栏位sxcj 优为1 良为2 中为3 由表统计得,成绩为优的同学有4人,占总人数的20%;良的同学有12人,占总人数的60%;中的同学有4人,占总人数的40%。 二、(20分)为了解笔记本电脑的市场情况,针对笔记本电脑的3种品牌,进行了满意度调查,随机访问了30位消费者,让他们选出自己满意的品牌,调查结果见下表,其中变量“职业”的取值中,1表示文秘人员,2表示管理人员,3表示工程师,4表示其他人;3个品牌变量的取值中,1表示选择,0表示未选数据见Excel数据文件“调查.exe”。根据所给数据完成以下问题 (1)将所给数据的Excel文件导入到SPSS中,要求SPSS数据文件写出数据结构(包括变量名,变量类型,变量值标签等)命,并保存为:“调查. Sav”。 (2)试利用多选项分析,利用频数分析来分析消费者对不同品牌电脑的满意度状况;分析不同职业消费者对笔记本品牌满意度状况。 分析:

spss统计分析报告

目录 一、研究背景及其意义 (3) 二、研究方案 (3) 研究目标 (3) 研究内容 (4) 研究方法 (4) 三、科学技术与经济发展的关系分析 (4) 科技投入 (4) 科技产出 (5) 经济发展 (7) 小结 (7) 四、科学技术与经济发展的模型分析 (8) 模型假设 (8) 符号说明 (8) 信度与相关性分析 (8) 因子分析 (9)

回归分析 (10) 五、结论 (13) 附录: (14) 科学技术与经济发展的关系 一、研究背景及其意义 十九大报告指出:创新是引领发展的第一动力,是建设现代化经济体系的战略支撑。要瞄准世界科技前沿,强化基础研究,实现前瞻性基础研究、引领性原创成果重大突破。加强应用基础研究,拓展实施国家重大科技项目,突出关键共性技术、前沿引领技术、现代工程技术、颠覆性技术创新,为建设科技强国、质量强国、航天强国、网络强国、交通强国、数字中国、智慧社会提供有力支撑。加强国家创新体系建设,强化战略科技力量。深化科技体制改革,建立以企业为主体、市场为导向、产学研深度融合的技术创新体系,加强对中小企业创新的支持,促进科技成果转化。倡导创新文化,强化知识产权创造、保护、运用。培养造就一大批具有国际水平的战略科技人才、科技领军人才、青年科技人才和高水平创新团队。 而科技作为创新的重要引领者和实践者,对于建设创新型国家起着重要作用。科技进步是经济发展与社会发展的强大推动力。邓小平同志曾指出;"科学技术是第一生产力";江泽民同志也曾指出:"科学技术是第一生产力,而且是先进生产力的集中体现和主要标志。科学技术的突飞猛进,给世界生产力和人类经济发展带来了极大的推动,未来的科学发展还将产生新的重大飞跃"。在当今这个信息化和全球化加速的时代,科技进步对经济社会发展的促进作用越来越显着,科技进步成为生产力水平的首要决定因素,是国家或区域竞争力的重要源泉。近年来,随着我国经济增长方式的转变,科技支撑和引领经济社会发展的作用越来越强,无论是国家还是区域都需要通过依靠科技进步来促进经济社会发展。科技进步考核有效地促进了科教兴国、可持续发展和人才强国战略的落实,使科技促进经济杜会发展的能力逐步提升。

spss期末大数据分析报告

SPSS在教育研究中的应用某大学学生对本校的满意度调查 学院:教育学院 专业:课程与教学论 学号:201411000156 姓名:李平 2014年12月13日

目录 一、研究问题的提出 (3) 二、研究内容与方法 (3) (一) 研究内容 (3) (二) 研究方法 (3) 三、调查对象及人数 (4) 四、问卷分析 (5) (一)回收情况 (5) (二)信度分析 (5) 五、数据统计与分析 (6) (一)数据输入 (6) (二)数据分析 (7) 1.描述统计 (7) (1)多选题描述统计 (7) (2)单选题描述统计 (9) 2.推断统计 (12) (1)独立样本T检验 (12) (2)单一样本T检验 (15) (3)单因素方差分析 (17) (4) X2检验 (21) 3.相关分析 (22) (1)变量间相关分析 (22) (2)维度间相关分析 (23) 六、结论 (27) 七、附录 (28)

一、研究问题的提出 学生的学校生活和成长密切相关。我们通过对他们的大学生活满意度的调查结果向有关部门提出建议,并希望能引起学校对这一系列问题的关注,最终希望大学生对其大学的满意度有所提升,大学生是一个庞大的群体,特别是近几年,随着高校的扩招,我国越来越多人能够上大学。上大学是很多人的梦想,他们都憧憬着大学校园的生活,然而当他们进了大学后才发现大学生活并非所想的美好,取而代之的却是对校园生活的不满,大学生是十分宝贵的人才资源,他们对校园生活的体验和感受,与他们的更好的学习。 二、研究内容与方法 (一)研究内容 了解学生对于学校的师资水平、环境、日常管理等各方面的满意度。 (二)研究方法 1.问卷编制 本研究采用自编问卷,问卷共由两部分组成:基本情况部分包括被调查者的性别、年级等,问卷主体部分包括师资水平、学校环境、日常管理三大维度,细分为12个三级指标(见表2-1),问卷采用五点制计分法,即“非常满意”、“满意”、“一般”、“不满意”、“非常不满意”,分别赋值5分、4分、3分、2分、1分。 表2-1 某大学学生对本校的满意度测评指标体系 一 级指标 二级指标(潜在变量)三级指标(观测变量) 对自己师资水平对教师教学方法、对教师工作态 度、对教师人品修养、对师资配备 学校的意学校环境对学习环境、对就餐环境、对居住 环境、对校园绿化环境 满度指数日常管理对专业课时安排、对收费标准、对 奖、助学金制度、对学校治安

spss实验报告最终版本

实验课程专业统计软件应用 上课时间2012 学年 1 学期15 周(2012 年12 月18日—28 日) 学生姓名李艳学号2010211587 班级0331002 所在学院经济管 上课地点经管3 楼指导教师胡大权理学院

实验内容写作 第六章 一实验目的 1、理解方差分析的基本概念 2、学会常用的方差分析方法 二实验内容 实验原理:方差分析的基本原理是认为不同处理组的均值间的差别基本来源有两个:随机误差,如测 量误差造成的差异或个体间的差异,称为组内差异 根据老师的讲解和课本的习题完成思考与练习的5、6、7、8题。 第5题:为了寻求适应某地区的高产油菜品种,今选5个品种进行试验,每一种在4块条件完全相同的试验田上试种,其他施肥等田间管理措施完全一样。表 6.20所示为每一品种下每一块田的亩产量,根 据这些数据分析不同品种油菜的平均产量在显著水平0.05下有无显著性差异。 第一步分析 由于考虑的是控制变量对另一个观测变量的影响,而且是5个品种,所以不宜采用独立样本T检验,应该采用单因素方差分析。 第二步数据的组织 从实验材料中直接导入数据 第三步方差相等的齐性检验 由于方差分析的前提是各水平下的总体服从方差相等的正态分布,而且各组的方差具有齐性,其中正 态分布的要求并不是非常严格,但是对于方差相等的要求还是比较严格的,因此必须对方差相等的前提进 行检验。

第四步多重比较分析 通过上面的步骤,只能判断不同的施肥等田间操作效果是否有显著性差异,如果要想进一步了解究竟那 个品种与其他的有显著性均值差别等细节问题,就需要单击上图中的两两比较按钮。 第五步运行结果及分析 多重比较结果表:从该表可以看出分别对几个不同的品种进行的两两比较。最后我们可以得出结论第4品种是最好的。其他的次之。 第6题:某公司希望检测四种类型类型轮胎A,B,C,D的寿命,如表 6.21所示。其中每种轮胎应用在随选择的6种汽车上,在显著性水平0.05下判断不同类型轮胎的寿命间是否存在显著性差异。 第一步分析 由于考虑的是一个控制变量对另一个控制变量的影响,而且是4种轮胎,所以不宜采用独立样本T 检验,应该采用单因素方差分析。 第二步数据的组织 从实验材料中直接导入数据。 第三步方差相等的齐性检验 由于方差分析的前提是各水平下的总体服从方差相等的正态分布,而且各组的方差具有齐性,其中正态分 布的要求并不是非常严格,但是对于方差相等的要求还是比较严格的,因此必须对方差相等的前提进行检 验。选择菜单“分析”—均值比较—单因素ANOVA。

SPSS统计分析分析案例

SPSS统计分析案例 一、我国城镇居民现状 近年来,我国宏观经济形势发生了重大变化,经济发展速度加快,居民收入稳定增加,在国家连续出台住房、教育、医疗等各项改革措施和实施“刺激消费、扩大内需、拉动经济增长”经济政策的影响下,全国居民的消费支出也强劲增长,消费结构发生了显著变化,消费结构不合理现象得到了一定程度的改善。本文通过相关数据分析总结出了我国城镇居民消费呈现富裕型、娱乐教育文化服务类消费攀升的趋势特点。 二、我国居民消费结构的横向分析 第一,食品消费支出比重随收入增加呈现出明显的下降趋势,这与恩格尔定律的表述一致。但最低收入户与最高收入恩格尔系数相差太过悬殊,城镇最低收入户刚刚解决了温饱问题,而最高收入户的生活水平按照恩格尔系数的评价标准早已达到了富裕型,甚至接近最富裕型。第二,衣着消费支出比重随收入增加缓慢上升,到高收入户又有所下降,但各收入组支出比重相差不大。衣着支出比重没有更多的递增且最高收入户的支出比重有所下降,这些都符合恩格尔定律关于衣着消费的引申。随着收入的增加,衣着支出比重呈现先上升后下降的走势。事实上,在当前的价格水平和服装业的发展水平下,城镇居民的穿着是有一定限度的,而且居民对衣着的需求也不是无限膨胀的,即使收入水平继续提高,也不需要将更大的比例用于购买服饰用品了。第三,家庭设备用品及服务、交通通讯、娱乐教育文化服务和杂项商品与服务的支出比重呈逐组上升趋势,说明居民的生活水平随收入的增加而不断提高和改善。第四,医疗保健支出比重随收入水平提高呈现一种两端高、中间低的走势。这是因为医疗保健支出作为生活必须支出,不论居民生活水平高低,都要将一定比例的收入用于维持自身健康,而且由于医疗制度改革,加重了个人负担的同时,也减小了旧制度可能造成的不同行业、不同体制下居民医疗保健支出的差别,因而不同收入等级的居民在医疗保健支出比重上差别不大。第五,居住支出比重基本上呈先上升后下降的趋势,这与我国居民消费能级不断提升,住宅商品正在越来越成为城镇居民关注的热点是相吻合的,同时与恩格尔定律的引申也是一致的。可以看出,城镇居民的消费状况虽然受价格水平、消费习惯、消费环境、消费心理预期等诸多因素的影响,但归根结底仍取决于居民的收入水平,要提高城镇居民的消费支出,必须增加居民收入。因此,采取切实有效的措施增加城镇居民的可支配收入,不仅可以提高全国城镇居民的总体消费水平,促进消费结构向着更加健康、合理的方向发展,而且在启动内需,促进我国的经济发展方面有着重大的现实意义。 三、我国居民消费结构的纵向分析 进入21世纪以来,随着经济体制改革的深入,国民经济的迅速发展,我国城乡居民的消费水平显著提高,居民的各项支出显著增加。随着消费水平的提高,我国城乡居民消费从注重量的满足到追求质的提高,从以衣食消费为主的生存型到追求生活质量的享受型、发展型,消费

spss统计分析期末考试题

《统计分析软件》试(题)卷 班级xxx班姓名xxx 学号xxx 题号一二三四五六总成绩成绩 说明:1.本试卷分析结果写在每个题目下面(即所留空白处); 2.考试时间为100分钟; 3.每个试题20分。 一、(20分)已经给出某个班的学生基本情况及其学习成绩的两个SPSS数据文件,学生成绩一.sav;学生成绩二.sav。要求: (1)将所给的两个SPSS数据文件“学生成绩一.sav”与“学生成绩二.sav”合并,并保存为“成绩.sav.” (2)对所建立的数据文件“成绩.sav”进行以下处理: 1)按照性别求出男、女数学成绩的各种统计量(包括平均成绩、标准差等)。 2)计算每个学生的总成绩、并按照总成绩的大小进行排序 3)把数学成绩分成优、良、中三个等级,规则为优(X≥85),良(75≤X ≤84),中(X≤74),并对优良中的人数进行统计。

分析: (2) 描述统计量 性别N 极小值极大值均值标准差 男数学 4 77.00 85.00 82.2500 3.77492 有效的N (列表状态) 4 女数学16 67.00 90.00 78.5000 7.09930 有效的N (列表状态)16

注:成绩优良表示栏位sxcj 优为1 良为2 中为3 由表统计得,成绩为优的同学有4人,占总人数的20%;良的同学有12人,占总人数的60%;中的同学有4人,占总人数的40%。 二、(20分)为了解笔记本电脑的市场情况,针对笔记本电脑的3种品牌,进行了满意度调查,随机访问了30位消费者,让他们选出自己满意的品牌,调查结果见下表,其中变量“职业”的取值中,1表示文秘人员,2表示管理人员,3表示工程师,4表示其他人;3个品牌变量的取值中,1表示选择,0表示未选数据见Excel数据文件“调查.exe”。根据所给数据完成以下问题 (1)将所给数据的Excel文件导入到SPSS中,要求SPSS数据文件写出数据结构(包括变量名,变量类型,变量值标签等)命,并保存为:“调查. Sav”。 (2)试利用多选项分析,利用频数分析来分析消费者对不同品牌电脑的满意度状况;分析不同职业消费者对笔记本品牌满意度状况。 分析:

spss实验报告线性回归曲线估计

《数据分析实务与案例实验报告》 曲线估计 学号: 204 班级: 2013 应用统计 姓名: 日期: 2 0 1 4 – 12 – 7 数学与统计学学院

一、实验目的 1. 准确理解曲线回归分析的方法原理。 2. 了解如何将本质线性关系模型转化为线性关系模型进行回归分析。 3. 熟练掌握曲线估计的SPSS 操作。 4. 掌握建立合适曲线模型的判断依据。 5. 掌握如何利用曲线回归方程进行预测。 6. 培养运用多曲线估计解决身边实际问题的能力。 二、准备知识 1. 非线性模型的基本内容 变量之间的非线性关系可以划分为 本质线性关系和本质非线性关系。所谓本质线性关系是指变量关系形式上虽然呈非线性关系,但可以通过变量转化为线性关系,并可最终进行线性回归分析,建立线性模型。本质非线性关系是指变量之间不仅形式上呈现非线性关系,而且也无法通过变量转化为线性关系,最终无法进行线性回归分析,建立线性模型。本实验针对本质线性模型进行。 下面介绍本次实验涉及到的可线性化的非线性模型,所用的变换既有自变量的变换,也有因变量的变换。 乘法模型: 123y x x x βγδαε= 其中α,β,γ,δ 都是未知参数,ε是乘积随机误差。对上式两边取自然对数得到 123ln ln ln ln ln ln y x x x αβγδε=++++ 上式具有一般线性回归方程的形式,因而用多元线性回归的方法来处理。然而,必须强调指出的是,在求置信区间和做有关试验时,必须是2ln (0,)n N I εδ: , 而不是2n N I εδ:(0,) ,因此检验之前,要先检验ln ε 是否满足这个假设。 三、实验内容 已有很多学者验证了能源消费与经济增长的因果关系,证明了能源消费是促进经济增长的原因之一。也有众多学者利用C-D 生产函数验证了劳动和资本对经

SPSS简单数据分析报告

精选范文、公文、论文、和其他应用文档,希望能帮助到你们! SPSS简单数据分析报告

目录 一、数据样本描述 (4) 二、要解决的问题描述 (4) 1 数据管理与软件入门部分 (4) 1.1 分类汇总 (4) 1.2 个案排秩 (5) 1.3 连续变量变分组变量 (5) 2 统计描述与统计图表部分 (5) 2.1 频数分析 (5) 2.2 描述统计分析 (5) 3 假设检验方法部分 (5)

3.1 分布类型检验 (5) 3.1.1 正态分布 (5) 3.1.2 二项分布 (6) 3.1.3 游程检验 (6) 3.2 单因素方差分析 (6) 3.3 卡方检验 (6) 3.4 相关与线性回归的分析方法 (6) 3.4.1 相关分析(双变量相关分析&偏相关分析) (6) 3.4.2 线性回归模型 (6) 4 高级阶段方法部分 (6) 三、具体步骤描述 (7) 1 数据管理与软件入门部分 (7) 1.1 分类汇总 (7) 1.2 个案排秩 (8) 1.3 连续变量变分组变量 (10) 2 统计描述与统计图表部分 (11) 2.1 频数分析 (11) 2.2 描述统计分析 (14) 3 假设检验方法部分 (16) 3.1 分布类型检验 (16) 3.1.1 正态分布 (16) 3.1.2 二项分布 (17)

3.1.3 游程检验 (18) 3.2 单因素方差分析 (22) 3.3 卡方检验 (24) 3.4 相关与线性回归的分析方法 (26) 3.4.1 相关分析 (26) 3.4.2 线性回归模型 (28) 4 高级阶段方法部分 (32) 4.1 信度 (32) 一、数据样本描述 本次分析的数据为某公司474名职工状况统计表,其中共包含11个变量,分别是:id(职工编号),gender(性别),bdate(出生日期),edcu(受教育水平程度),jobcat(职务等级),salbegin(起始工资),salary(现工资),jobtime(本单位工作经历<月>),prevexp(以前工作经历<月>),minority(民族类型),age(年龄)。通过运用SPSS统计软件,对变量进行统计分析,以了解该公司职工总体状况,并分析职工受教育程度、起始工资、现工资的分布特点及相互间的关系。 二、要解决的问题描述 1 数据管理与软件入门部分 1.1 分类汇总 以受教育水平程度为分组依据,对职工的起始工资和现工资进行数据

相关文档
相关文档 最新文档