文档库 最新最全的文档下载
当前位置:文档库 › SPSS统计软件练习作业

SPSS统计软件练习作业

SPSS统计软件练习作业
SPSS统计软件练习作业

统计软件练习作业

请参考数据文件“data1.sav”,完成以下作业。

1、请比较四组病人在年龄、性别、细胞体积、细胞宽度…以及吸烟率等指标有无差异。

(要求:请列出统计表格、检验统计量、概率P以及标明两两比较结果。并在统计表下注明用什么统计方法)

参考答案:

计量资料分析结果见表1;计数资料(本例为性别和吸烟)见表2.

基本要求:

①表格要规范——三线表。

②要能将SPSS分析的结果借助Excel等工具迅速转化为论文中需要的表格;

③统计专用符号,如表示样本量的n,概率P(大写)应斜体;检验统计量(如t检验的t值,方差分析的F值,两样本秩和检验的Z值,多样本秩和检验的H值)均应斜体;卡方检验的符号2χ,以及均数±标准差(s

x±)应在公式编辑器中输入(可从网上下载或在word自带的公式编辑器中输入)。

④两两比较的结果要会在描述的结果上用不同的符号表示(本例见血小板及表格下的注释)。

表1 各指标比较(s

x±)

指标组别n s

x± F P 两两比较

年龄0 107 61.31±9.02

1.602 0.189

——

1 59 60.02±9.18

2 67 62.78±8.62

3 70 62.97±8.33

血小板0 107 169.53±55.68

4.005 0.008

0-1(0.031);

0-2(0.008);

1-3(0.028);

2-3(0.008)

1 59 150.26±46.89a

2 67 146.71±52.46a

3 70 171.59±61.47bc

细胞体积0 107 91.30±4.39

0.273 0.845

——

1 59 91.46±4.52

2 67 91.65±4.36

3 70 90.95±5.65

细胞宽度0 107 13.52±0.74

3.295 0.021

0-3(0.004)

1-3(0.015)

1 59 13.53±0.96

2 67 13.73±0.94

3 70 13.93±1.17

白细胞0 107 6.43±1.63

2.286 0.079

2-3(0.013)1 59 6.42±1.50

2 67 6.23±1.38

3 70 6.90±1.69

心厚度1 0 107 1.32±0.20

1.924 0.126

1-3(0.042)

2-3(0.047)

1 59 1.27±0.22

2 67 1.28±0.21

3 70 1.51±1.35

心厚度2 0 107 1.31±0.18

2.899 0.035

0-1(0.008)

1 59 1.23±0.17

2 67 1.26±0.19

3 70 1.30±0.19

心功能0 107 66.77±7.55

3.772 0.011

0-1(0.001)

1 59 62.44±8.45

2 67 65.23±8.22

3 70 64.63±8.27

心直径1 0 107 3.40±0.48

3.330 0.02

0-1(0.003)

0-2(0.038)

1 59 3.64±0.45

2 67 3.57±0.61

3 70 3.54±0.48

心直径2 0 107 4.67±0.69

5.174 0.002

0-1(<0.001)

0-2(0.011)

0-3(0.015)

1 59 5.07±0.69

2 67 4.94±0.64

3 70 4.93±0.756

血糖0 107 5.25±0.92

3.731 0.012

0-1(0.001)

1-2(0.021)

1-3(0.031)

1 59 5.73±0.85

2 67 5.36±0.93

3 70 5.38±0.87

总胆固醇0 107 4.60±0.93

1.068 0.363

——

1 59 4.08±1.00

2 67 4.61±3.63

3 70 4.46±1.40

低密度脂

蛋白0 107 2.62±0.69

2.960 0.033

0-1(0.011)

1-3(0.029)

1 59 2.30±0.68

2 67 2.40±0.76

3 70 2.60±0.93

高密度脂

蛋白0 107 1.19±0.23

2.138 0.096

0-3(0.028)

1 59 1.08±0.24

2 67 1.12±0.52

3 70 1.08±0.33

注:与第0组比较,a P<0.05;与第1组比较,b P<0.05;与第2组比较,c P<0.05;

统计方法:组间比较采用单因素方差分析(或完全随机设计方差分析);组间两两比较采用LSD-t 法;

表2 四组性别分布和吸烟率的比较

组别

性别吸烟

合计男女不吸烟吸烟

0 49(70.3)58(36.7)82(63.6)25(43.4)107

1 45(38.7)14(20.3)33(35.0) 26(24.0) 59

2 55(44.0)12(23.0)32(39.8) 35(27.2) 67

3 50(46.0)20(24.0)33(41.6) 37(28.4) 70

2

χ30.735 21.599

P <0.001 <0.001

注:2

χ检验

2、请完成细胞宽度与心厚度1、心厚度2、心直径1、心直径2间的相关分析。

(要求:列出统计表格、写出相关系数、概率P以及在表格下注明用何种统计方法)表2 细胞宽度与心厚度1、心厚度2、心直径1、心直径2的相关分析(r(P))

组别n 心厚度1 心厚度2 心直径1 心直径2

0 107 0.06(0.527)0.10(0.297)0.13(0.195)0.07(0.471)

1 59 -0.06(0.659)0.04(0.769)-0.14(0.280)-0.17(0.199)

2 67 0.04(0.742)0.17(0.173)0.17(0.168)0.10(0.402)

3 70 -0.10(0.418)0.14(0.257)0.06(0.602)-0.01(0.929)注: pearson线性相关分析;

3、方差分析应用的重要条件之一就是要求数据要满足正态分布,请以血糖为例,用经验法和正态性检验两种方法来分别判断血糖是否满足正态分布。经验法:均数均大于2倍以上的标准差,可认为满足正态分布;

正态性检验结果如下(具体操作步骤参考课件):

由以上结果看出,根据正态性检验结果并不满足正态分布。

此时,一般应以经验法为主,也就是说认为满足正态分布,采用单因素方差分析(本参考答案用的此法);当然,也可以采用多个独立样本秩和检验(方法肯定是正确的。如果认为不满足正态分布的话)。

导致矛盾的结论只能说明研究对象比较特殊。

4、将组别变量中的“0”看做对照组,1、2、3分别表示患病的严重程度,请问患病的严重程度与细胞宽度之间有无关系

(要求:写出统计方法及关键指标)

表4 细胞宽度与严重程度的相关分析(r(P))

严重程度

细胞宽度0.169(0.018)

注:spearman线性相关分析

数据分析spss作业

数据分析方法及软件应用 (作业) 题目:4、8、13、16题 指导教师: 学院:交通运输学院 姓名: 学号:

4、在某化工生产中为了提高收率,选了三种不同浓度,四种不同温度做试验。在同一浓度与温度组合下各做两次试验,其收率数据如下面计算表所列。试在α=0.05显著性水平下分析 (1)给出SPSS数据集的格式(列举前3个样本即可); (2)分析浓度对收率有无显著影响; (3)分析浓度、温度以及它们间的交互作用对收率有无显著影响。 解答:(1)分别定义分组变量浓度、温度、收率,在变量视图与数据视图中输入表格数据,具体如下图。 (2)思路:本问是研究一个控制变量即浓度的不同水平是否对观测变量收率产生了显著影响,因而应用单因素方差分析。假设:浓度对收率无显著影响。 步骤:【分析-比较均值-单因素】,将收率选入到因变量列表中,将浓度选入到因子框中,确定。 输出: 變異數分析 收率 平方和df 平均值平方 F 顯著性 群組之間39.083 2 19.542 5.074 .016 在群組內80.875 21 3.851 總計119.958 23 显著性水平α为0.05,由于概率p值小于显著性水平α,则应拒绝原假设,认为浓度对收率有显著影响。

(3)思路:本问首先是研究两个控制变量浓度及温度的不同水平对观测变量收率的独立影响,然后分析两个这控制变量的交互作用能否对收率产生显著影响,因而应该采用多因素方差分析。假设,H01:浓度对收率无显著影响;H02:温度对收率无显著影响;H03:浓度与温度的交互作用对收率无显著影响。 步骤:【分析-一般线性模型-单变量】,把收率制定到因变量中,把浓度与温度制定到固定因子框中,确定。 输出: 主旨間效果檢定 因變數: 收率 來源第 III 類平方 和df 平均值平方 F 顯著性 修正的模型70.458a11 6.405 1.553 .230 截距2667.042 1 2667.042 646.556 .000 浓度39.083 2 19.542 4.737 .030 温度13.792 3 4.597 1.114 .382 浓度 * 温度17.583 6 2.931 .710 .648 錯誤49.500 12 4.125 總計2787.000 24 校正後總數119.958 23 a. R 平方 = .587(調整的 R 平方 = .209) 第一列是对观测变量总变差分解的说明;第二列是观测变量变差分解的结果;第三列是自由度;第四列是均方;第五列是F检验统计量的观测值;第六列是检验统计量的概率p值。可以看到观测变量收率的总变差为119.958,由浓度不同引起的变差是39.083,由温度不同引起的变差为13.792,由浓度和温度的交互作用引起的变差为17.583,由随机因素引起的变差为49.500。浓度,温度和浓度*温度的概率p值分别为0.030,0.382和0.648。 浓度:显著性<0.05说明拒绝原假设(浓度对收率无显著影响),证明浓度对收率有显著影响;温度:显著性>0.05说明不拒绝原假设(温度对收率无显著影响),证明温度对收率无显著影响;浓度与温度: 显著性>0.05说明不拒绝原假设(浓度与温度的交互作用对收率无显著影响),证明温浓度与温度的交互作用对收率无显著影响。 8、以高校科研研究数据为例:以课题总数X5为被解释变量,解释变量为投入人年数X2、投入科研事业费X4、专著数X6、获奖数X8;建立多元线性回归模型,

SPSS软件及应用实验报告

SPSS软件及应用实验报告

关于男性裤子尺寸影响因素的研究 本报告主要是通过搜集了影响男性裤子尺寸的9个因素,分别是腰围、腹围、直档1、直档2、全浪、大腿根围、膝盖围、臀围、裤长,一共测量了250组数据。旨在通过因子分析,利用降维思想,把多指标转化为少数几个综合指标,并分析得到的主因子的含义。 本报告主要研究的问题如下: (1)对数据进行描述性统计,并按照尺寸换算将厘米换算成尺寸,对数据按照腰围这一指标进行分组,编制频数分布表,并绘制频数 分布的直方图; (2)使用单样本K-S检验对腰围换算成尺寸后的数据进行非参数检验,验证是否服从正态分布; (3)对数据进行因子分析,并对因子的含义进行分析。 问题1: 根据腰围对所有的样本进行分组,分组结果见附录。所搜集的腰围数据范围是[62.5,107],根据一尺约为33.3厘米,换算成尺寸范围是一尺九——三尺二,不足的四舍五入。得到结果如下: 尺寸 频率百分比有效百分比累积百分比 有效 1.9 2 .8 .8 .8 2.0 13 5.2 5.2 6.0 2.1 27 10.8 10.8 16.8 2.2 43 17.2 17.2 34.0 2.3 52 20.8 20.8 54.8 2.4 34 1 3.6 13.6 68.4 2.5 26 10.4 10.4 78.8 2.6 27 10.8 10.8 89.6 2.7 6 2.4 2.4 92.0 2.8 7 2.8 2.8 94.8 2.9 10 4.0 4.0 98.8 3.0 1 .4 .4 99.2 3.1 1 .4 .4 99.6 3.2 1 .4 .4 100.0 总计250 100.0 100.0 表1 尺寸频数分布表

SPSS统计基础 数据分析

《SPSS统计基础》课程数据分析报告 (2016— 2017学年度第二学期) 题目:关于381名大学生学习适应情况的分析报告 班级:14小教2班 学号: 姓名: 2017年6月

381名大学生学习适应性调查数据分析报告 姓名:学号:班级: 一、数据分析目的及内容 (一)数据分析的目的 通过对师范学院学生学习适应现状及其影响因素的调查研究,了解我院学生对自己所学专业在适应学习动机、适应教学模式、使用学习能力、适应学习态度、适应环境因素、适应总分六个维度的基本情况。本文拟在以往研究的基础上对大学生学习适应状况进行调查,并探讨影响大学生学习适应的因素,从而让大学生能更快更好地适应大学生活。 (二)数据分析的内容 1. 381名大学生在适应学习动机、适应教学模式、使用学习能力、适应学习态度、适应 环境因素五个维度的得分及适应总分. 2.对年级、专业、生源地变量的容量等数据分布指标的描述,了解数据分布的全貌。 3.对适应学习动机、适应教学模式、使用学习能力、适应学习态度、适应环境因素五个 维度的极大值、极小值、均值和标准差的统计。 4.学习适应各因子之间的相关分析。 5.学习适应五因子及适应总分的相关性分析。 二、数据库介绍 (一)数据来源: 1被试分布:总容量为381、年级(大一156人、大二136人、大三89人)、专业(小学教育140人、学前教育本科113人、学前教育专科128人)、生源地(城镇145人、农村236人)等方面的人数分布; 2、调查工具:《大学生学习适应量表》由冯廷勇等人编制,共29 个题目,量表采 用Likert5 点计分法,即完全不符合计 1 分,比较不符合计 2 分,不确定计 3 分,较符合计4 分,完全符合计 5 分。各维度和总量表分数越高,表明适应状况越好。总分低于58分,表明学习适应状态较差需要做较大调整;总分在59到87分之间,表明学习适应状态中等,需要做适当的调整;总分在88到116分之间,表明学习适应状态良好;总分在117到145分之间,表明学习适应状态良好。量表的效度为0.85,信度为0.87。该量表由五个维度构成: (1)学习动机(8题):1、6、7、8、9、13、17、23 (2)教学模式(7题):2、3、10、14、18、22、24 (3)学习能力(6题):4、11、15、21、25、26 (4)学习态度(4题):5、12、20、27 (5)环境因素(4题):16、19、28、29 (二)变量介绍: 1、本次问卷调查有三个变量; 2、变量名称为:专业,年级,生源地; 3、变量名称的取值为:专业:1=“小学教育”,2=“学前教育本科”,3=“学前教育专 科”;年级:1=“大一”,2=“大二”,3=“大三”,4=“大四”;生源地:1=“城镇”,2=“农村”。 三、数据统计与分析

SPSS实验报告

SPSS实验报告要求 1、为减小文字工作量,提升实验报告要求,每次上课只需要选择一个实验写报告即可,最终上交的实验报告统一命名为实验一、二……六。每个实验下面有超过二个小实验的,只需选择二个定实验报告。 2、实验报告统一使用WORD文档,建议使用宋体五号字,统一装订后,第十八周周五上午交。 3、实验报告参照以下模板

SPSS统计分析与应用 实验报告 班级:社会工作13 学号: 姓名: 学期:2015-2016学年第二学期

实验一建立与编辑数据文件 实验时间:2016-5-26 地点:实验楼2栋4楼 一、实验目的 1、理解数据文件的原理和方法; 2、 3、 二、实验内容 **************************************************************************** ******************************************************************************* ******* 三、实验步骤 1、建立数据文件 简要描述即可 ******************************************************************************* ******************************************************************************* **** 2、选择个案 简要描述即可 ******************************************************************************* ******************************************************************************* **** 四、实验结果 1、建立数据文件 **************************************************************************** ******************************************************************************* ******* 2、选择个案 ****************************************************************************

SPSS大作业-环境保护

当代大学生对全球气候变化 认知程度的研究 摘要:随着我国经济建设的飞速发展,人们向大自然排放的有害物质与日俱增,环境问题日益严重。环境污染问题不仅影响我国人民的生存环境和生存质量,也危害人民的身体健康,在环境污染中城市环境污染已经成为制约社会发展的重要问题。本研究采样方式为匿名方式随机投放网络问卷以及纸质问卷,采用SPSS statistics软件分析采样数据,得到频率表以及考虑性别的交叉表。本文考虑性别、城乡等差异,分别从基本的环保知识到主动投身环保事业等各方面加以分析,研究当代大学生对环境污染问题认知程度的差异。 关键字:性别;气候变化;差异;SPSS 一、研究背景 我国改革开放30多年的经济发展迅速,主要是以粗放式发展为主要模式。由此而带来的就是高增长、高能耗、高排放的三高企业,我国是发展中国家,在经济发展的过程中,政府对环境破坏的监管不力,睁一眼闭一眼,所以我国改革开放30年快速发展以牺牲能源、破坏环境为代价的,尤其我国的经济发展又极不平衡,主要是以城市主力军,这样城市的环境恶化就很严重。同样,农村人口环境保护意识淡薄,农村环境恶化也不可小觑,我国高速发展的近几十年来,环境的恶化程度逐年增加,应该引起政府环保部门的重视。 环境污染对人们的生活影响越来越严重,我们现在出门看到的最打眼的一景就是戴口罩的人越来越多,人们越来越感受到空气污染对

自己身心健康的威胁,据统计,世界儿童死亡80%是由于空气污染导致的,这个数字让人触目惊心。 环境污染很大因素是由于企业恣意排放污染物,但在日常生活中,民众的环保意识与环保行为对生活污染——尤其是随处可见的污染——有较大的影响。性别、年龄等不同,对气候变化认知程度也会存在差异。本文考虑到男女性别的差异、城乡区别,分别从基本的环保知识到主动投身环保事业等各方面加以分析,研究不同性别对环境污染问题认知程度的差异。 二、研究方法及样本描述 (一)研究方法 本研究采样方式为匿名方式随机投放网络问卷以及纸质问卷调查的方法,与2014年5月在西安交通大学进行问卷调查。调查面向西安交大本科生以及研究生,最终获得有效问卷431份。 (二)样本特征描述 431位被访者中,女性209位,占48.5%;男性222位,占51.5%。如图1所示,样本主要来自大一、大二以及大三群体,总共381位,占88.4%;大四毕业生以及研究生占11.6%。被访者所读专业性质也有较大差别,文科生178位,占41.3%;工科生人数122位,占28.3%;理科生108位,占比25.1%,如表1所示。

SPSS实验报告(一)

SPSS实验报告(一)

湖南涉外经济学院 实验报告 课程名称:应用统计软件分析(SPSS) 专业班级: 姓名 学号: 指导教师: 职称:副研究员 实验日期: 2016.4.19 成绩评定指导教 师 签字 签字 日期

学生实验报告实验序号 一、实验目的及要求 实验目的 通过本次实验,使学生熟练掌握转换菜单和数据菜单的具体功能及操作,熟练应用两个菜单中的计算变量、重新编码、选择个案、个案排序、分类汇总等几个主要过程 实验要求 能够根据相关要求选用正确的过程对变量或者文件进行管理和操作,得到结果,并能对得出的结果进行解释。 二、实验描述及实验过程 实验描述一、下载数据(以下情况选一种): (一)分地区(31个省市区)环境污染治理投资数据(2014年) 环境污染治理投资总额(亿元),城市环境基础设施建设投资额(亿元) ,城市燃气建设投资额(亿元) ,城市集中供热建设投资额(亿元),城市排水建设投资额(亿元),城市园林绿化建设投资额(亿元),城市市容环境卫生建设投资额(亿元)

工业污染源治理投资(万元) 建设项目“三同时”环保投资额(亿元) (二)分地区(31个省市区)经济发展总体数据(2014年) 国民总收入,国内生产总值,第一产业增加值,第二产业增加值,第三产业增加值,人均国内生产总值,人口总量,城镇失业率,基尼系数等 (三)各省市房地产开发2014年相关数据 投资额,房地产开发企业个数,从业人员数,收入,税金,利润,资产,负债,平均销售价格,等等。 (四)各省市科技2014年相关数据 包括GDP,研发投入,研发投入强度(研发投入/GDP),R&D研发人员,专利授权数,发明专利授权量。 (五)查找相关行业(钢铁行业、水泥行业、医药制造、工程机械、汽车制造业、旅游酒店行业、航空、电子商务企业等)上市公司2015年度数据。包括销售收入、利润、固定资产净值、总资产利润率、营业利润率、销售净利率、净资产收益率、流动比率、资产负债率、主营业务收入增长率、营收账款周转率、存货周转

spss期末作业

吉林财经大学 《SPSS统计软件分析》作业(2010——2011学年第一学期) 学院信息学院 专业班级电子商务0806班 学生姓名王瑞霞 学号1403080616

1、对未分组资料频数分析 从中国统计局中获得从11月21日至30日国内50个城市主要食品平均价格变动情况,以该数据为例为例,进行频数分析。 首先输入数据: 选择Analyze中Descriptive Statistics——Frequencies,打开Frequencies对话框;将需处理的变量键入变量框中

单击Statistics…按钮统计量子对话框12指标,选中所需要计算的指标: 单击Charts …按钮,选择需绘制的统计图: 单击OK按钮开始运行,运行结果为:

从上图中可以看出数据中缺失值为0,花生油的平均价格104.84是最高的,而巴氏牛奶的平均价格1.81最低,全部食品平均价格的平均数为16.5327,标准差为22.4668,各种食品的平均价格差距较大。

条形图、饼形图以及直方图是用不同的图形表示方法来说明数据的指标,其实质是一样的,从图中可以看出平均价格在0—22元之间的食品是最多的,20—40元之间的食品数次之,接下来是40—60元之间的食品,不存在平均价格在60—100之间的食品。 2、以食品平均价格为依据对数据进行分组并对分组后的数据进行频数分析: Transform —Recode—Into same V ariables ,将要分组的变量放入Numeric 栏中,单击Old and new V alues分组:

分组结果如下图所示: 回到数据编辑窗,定义变量的V alue labels : 再对食品平均价格进行频数分析,分析结果如下截图所示

管理统计spss数据管理-实验报告

数据管理 一、实验目的与要求 1.掌握计算新变量、变量取值重编码的基本操作。 2.掌握记录排序、拆分、筛选、加权以及数据汇总的操作。 3.了解数据字典的定义和使用、数据文件的重新排列、转置、合并的操作。 二、实验内容提要 1.自行练习完成课本中涉及的对CCSS案例数据的数据管理操作 2.针对SPSS自带数据Employee data.sav进行以下练习。 (1)根据变量bdate生成一个新变量“年龄” (2)根据jobcat分组计算salary的秩次 (3)根据雇员的性别变量对salary的平均值进行汇总 (4)生成新变量grade,当salary<20000时取值为d,在20000~50000范围内时取值为c,在50000~100000范围内取值为b,大于等于100000时取值为a 三、实验步骤 1. 数据管理操作 (1)年龄变量s3的分组 (2)重新编码到其他变量

(3)可视化封装

(4)排序个案 (5)选择个案

2.(1)根据变量bdate生成一个新变量“年龄” (2)根据jobcat分组计算salary的秩次

(3)根据雇员的性别变量对salary的平均值进行汇总 c,在50000~100000范围内取值为b,大于等于100000时取值为a

四、实验结果与结论 通过本次实验,使我了解了很多,在SPSS中,数据文件的管理功能基本上刚都集中在“转换”“数据”俩个菜单中,其中前者主要实现变量级别的数据管理,如计算新变量,变量取值重编码,而后者的功能主要是实现文件级别的数据管理,如变量排序,文件合并等, 还有转换菜单中的个案排序等,这些在SPSS中都不可或缺。

SPSS调查报告 - 期末作业

---------------------------------------------装--------------------------------- --------- 订 -----------------------------------------线---------------------------------------- 班级 姓名 学号 - 广 东 财 经 大 学 答 题 纸(格式二) 课程 数据处理技术与SPSS 20 15 -20 16 学年第 1 学期 成绩 评阅人 评语: ========================================== (题目)关于本部学生对收费代课现象支持度的调查报告 (正文) 一、调查背景 如今,大学生逃课现象屡见不鲜,随之衍生了“收费代课”的现象。据了解,在全国近百所高校中,存在“收费代课”现象的高校居然有一半之多。当“收费代课”现象衍变成了一种行业,成为有领导、有组织、有规模、有纪律的机构,不仅仅应当引起社会的关注,更应引起校方对教育方式的深刻反思。“有偿代课”作为一种不正常的校园现象,有其存在的社会土壤,其原因有多方面,值得让人对当前大学教育深思。在“收费代课”现象蔚然成风之时,我们学校的学生们也加入了这支大队伍。对于这样的一种收费代课的行为,同学们褒贬不一,每个人都有自己的看法。然而,这种行为经常在我们的身边发生着,无疑应该引起我们的关注,并引发我们的深思,形成一定的判别能力与认知能力。

二、调查目的 我们希望通过本次调查了解广东财经大学本部学生选择收费代课的原因,以及对本专业学习、实习实践的认知程度,是否支持放弃学习去实习或者做自己的事情,是否支持收费代课。同时,我们也希望通过这份调查报告揭露出的一些情况,一方面,帮助学生更好地权衡学习与实习的利弊,更加理性地对待收费代课的行为,做出对自己正确合适的选择;另一方面,引起学校对这种收费代课现象的重视,给学校提一些建议,希望学校采取一些措施改善这种不良校风。 三、调查方法 从可行性角度出发,本次调查采用非概率随机抽样的街头拦截法,集中对象为本部大三大四的同学,以自愿形式对本部同学分发调查问卷,总共发出80份问卷,回收80份,有效问卷80份。收集问卷之后,利用spss软件进行数据整理与分析,最后把结论整理成调查报告。调查报告中采用的数据分析方法主要有:频数分析、多选项分析、交叉列联表行列变量间关系的分析、单因素方差分析等。 四、描述统计 1、对样本性别作频数分析 从上表可以看出,这次填写问卷的女生较多,占了样本的66.3%,这与我们学校男女比例不均衡有很大的关系,样本的男女比例不相等,也可以较好地接近学校的实际情况,有利于我们得到更为准确的结论。 2、对样本年级作频数分析 从上表可知,参加问卷调查的大三大四学生比例明显比较高,这与一开始我们预期相符,样本中大三大四学生所占比例较多,有利于我们得到更为有针对性的结论。

SPSS实验报告.pdf

专业班级:金融106姓名:周吉利1222朱宁宁1224杨程琤1212周孟杰1207实验日期:2012.3.27 浙江万里学院实验报告 课程名称:2011/2012学年第二学期统计实验 实验名称:备择实验专业班级:金融105-106姓名:叶美君1219胡志晖1206黄世杰1208崔 迦楠1175 实验日期:2012.3.29 成绩: 教师:

专业班级:金融106姓名:周吉利1222朱宁宁1224杨程琤1212周孟杰1207实验日期:2012.3.27 一、实验目的:统计分析的目的在于研究总体特征。但是,由于各种各样的原因,我们能够得到的往往只能是从总体中随机抽取的一部分观察对象,他们构成了样本,只有通过对样本的研究,我们才能对总体的实际情况作出可能的推断。因此描述性统计分析是统计分析的第一步,做好这一步是进行正确统计推断的先决条件。通过描述性统计分析可以大致了解数据的分布类型和特点、数据分布的集中趋势和离散程度,或对数据进行初步的探索性分析(包括检查数据是否有错误,对数据分布特征和规律进行初步观察)。 本试验旨在于:引到学生利用正确的统计方法对数据进行适当的整理和显示, 描述并探索出数据内在的数量规律性,掌握统计思想,培养学生学习统计学的兴趣,为继续学习推断统计方法及应用各种统计方法解决实际问题打下必要而坚实的基础。 二、实验内容: 1.表 2.7为某班级16位学生的身高数据,对其进行频数分析,并对实验报告作出说明。 表2.7 某班16位学生的身高数据 学号性别身高(cm )学号性别身高(cm ) 1 M 170 9 M 150 2 F 17 3 10 M 157 3 F 169 11 F 177 4 M 15 5 12 M 160 5 F 174 13 F 169 6 F 178 14 M 154 7 M 156 15 F 172 8 F 171 16 F 180 三、实验过程: 1、输入某班级16位学生的身高数据。 2、然后选择分析,描述统计,频率,并选择统计量。

spss课后作业答案

SPSS课后作业 第一章 1-1、spss的运行方式有几种?分别是什么? 答:SPSS的运行方式有三种,分别是批处理方式、完全窗口菜单运行方式、程序运行方式。1-2、SPSS中“DataView”所对应的表格与一般的电子处理软件有什么区别? 答:与一般电子表格处理软件相比,SPSS的“Data View”窗口还有以下一些特性:(1)一个列对应一个变量,即每一列代表一个变量(Variable)或一个被观测量的特征;(2)行是观测,即每一行代表一个个体、一个观测、一个样品,在SPSS中称为事件(Case);(3)单元包含值,即每个单元包括一个观测中的单个变量值;(4)数据文件是一张长方形的二维表。 第二章 2-1、在SPSS中可以使用那些方法输入数据? 答:SPSS中输入数据一般有以下三种方式:(1)通过手工录入数据;(2)可以将其他电子表格软件中的数据整列(行)的复制,然后粘贴到SPSS中;(3)通过读入其他格式文件数据的方式输入数据。 2-2、对于缺失值,如何利用SPSS进行科学替代? 答:选择“Transform”菜单的Replace Missing Values命令,弹出Replace Missing Values 对话框。先在变量名列中选择1个或多个存在缺失值的变量,使之添加到“New Variable(s)”框中,这时系统自动产生用于替代缺失值的新变量。最后选择合适的替代方式即可。 2-3、在计算数据的加权平均数时,如何对变量进行加权? 答:选择“Data”菜单中的Weight Cases命令,出现如图2-22所示的Weight Cases对话框。其中, Do not weight cases项表示不做加权,这可用于取消加权;Weight cases by 项表示选择1个变量做加权。 2-4、如何对变量进行自动赋值? 答:变量的自动赋值可以将字符型、数字型数值转变成连续的整数,并将结果保存在一个新的变量中。具体操作的过程如下:选择“Transform”菜单中的Automatic Recode命令,在出现的对话框中,从左边的变量列表中选择需要自动赋值的变量,将它添加到Variable -> New Name框中,然后在下面New Name右边的文本框中输入新的变量名称,单击New Name 按钮,将新的变量名添加到上面的框中。从Recode Starting from框中有两个选项中选择一个,然后单击OK按钮,即可完成自动赋值运算。 3-1、一组数据的分布特征可以从哪几个方面进行测度? 答:一组数据的分布特征可以从平均数、中位数、众数、方差、百分位、频数、峰度、偏度等方面描述。 3-2、简述众数、中位数和均值的特点及应用场合。 答:均值是总体各单位某一数量标志的平均数。平均数可应用于任何场合,比如在简单时序预测中可用一定观察期内预测目标的时间序列的均值作为下一期的预测值。中位数是指将数据按大小顺序排列起来,形成一个数列,居于数列中间位置的那个数据。中位数的作用与算术平均数相近,也是作为所研究数据的代表值。在一个等差数列或一个正态分布数列中,中位数就等于算术平均数。在数列中出现了极端变量值的情况下,用中位数作为代表值要比用算术平均数更好,因为中位数不受极端变量值的影响。众数是指一组数据中出现次数最多的那个数据。它主要用于定类(品质标志)数据的集中趋势,当然也适用于作为定序(品质标志)数据以及定距和定比(数量标志)数据集中趋势的测度值。 3-3、

SPSS调查报告期末作业

S P S S调查报告期末作业 Document serial number【LGGKGB-LGG98YT-LGGT8CB-LGUT-

---------------------------------------------装--------------------------------- --------- 订 ---------------------------------------- -线----------------------------------- -- - --

上表表明,5中不同年级形式下共有80个样本,大一的均值最高,大二的均值次之,接着,大四的均值排第三,而大三的均值是最低的。由于在录入数据当中,选择调查问卷中选项A“是”,身边有请人带过课的同学,则录为1:;选择调查问卷中选项B“否”,身边没有请人带过课的同学,则录为2。所以,均值的结果表明,数值越大,则身边出现代课同学越少,数值越小,则表明身边出现的代课同学越多。因此,大三中的代课同学是最多的,大四次之,大二次之,大一最少。 上表表明,不同年级下代课情况的方差齐性检验值为,概率为,。如果显着性水平为,由于概率值大于显着性水平,不应拒绝零假设,认为不同年级下代课情况的总体方差无显着差异,满足方差分析的前提要求。 上表分别显示了两两不同年级下代课情况均值检验的结果。通过两两比较,最终可以得出,大一的均值>大二的均值>大三的均值,大四的均值大小情况不能确定,基本上得出的结论与实际情况相符。 五、建议 在以上对数据的分析过程当中,我们提到了逃课现象严重,收费代课行为愈发普遍的原因,这里稍微再做一下总结。原因如下: a.一些专业课程,教学内容循规蹈矩,考试题目照本宣科,无法引起学生兴趣; b.学校管理有较大漏洞,上课学生中“替身”大量潜伏而不知; c.学生自身自制力不够,容易受到外界的影响,不能静心学习; d.社会就业压力大,导致学生青睐于早点实习; 针对以上这些导致收费代课产生的原因,我想提出几点建议: (一)学校在专业设置、教师的互动性教学、知识的创新性和灵活体现、教学管理体系建设等诸多方面,都应反思,并采取一定的措施。高校则应该实行自主办学措施,在课程设置、专业方向设置上应当有自我特色。与其大张旗鼓地对“收费代课”现象进行大力批判,还不如放开手来,从根本上指导学生如何学会自主学习,如何利用有限的学习时间。倘若不加以反思,做出课程设置、教师互动性教学的改进,而是纯粹地一味加强考勤管理,必然会扼杀一部分学生的学习积极性,“人在心不在”的上课状态恐怕也难以培养出符合时代需求的大学生。 (二)学生应该分清楚学习和工作的不同意义,学习是一种能力的提高过程。大学生应当学会对自己的现在以及未来负责。大学四年,是相当宝贵的青春年华。我们年轻,我们活动,但是这些都不应该成为我们虚度时间,不学习的理由。调查结果中显示,大三的收费代课现象是最为严重的,这样的结果确实应该引起学生的重视了。我们都知道,大三是专业学习的主要一年,很多的专业课都在大三进行安排。可是大三的同学的不认真学习专业课,选择请人代课,这不是明显浪费了学习专业课的机会吗所以,这里,我想提醒本部的同学们,要合理地定位自己的身份与任务,不要在该学习的阶段去实习或娱乐。另外,也要明确自己上大学的初衷,不要因为大学生活的闲适,而慢慢丢失了自己的理想。 (三)政府要给大学生提供公平的就业环境,打击不规范的就业行为,消除掉大学生的就业焦虑。为大学生就业,提供更加全面完整的服务系统,让大学生在大学期间安心学

SPSS统计软件实训报告

一、实训目的 SPSS统计软件实训课是在我们在学习《统计学》理论课程之后所开设的一门实践课。其目的在于,通过此次实训,使学生在掌握了理论知识的基础上,能具体的运用所学的统计方法进行统计分析并解决实际问题,做到理论联系实际并掌握统计软件SPSS的使用方法。, 二、实训时间与地点: 时间:2012年1月9日至2012年1月13日 地点:唐山学院北校区A座502机房 三、实训要求: 这次实训内容为上机实训,主要学习SPSS软件的操作技能,以及关于此软件的一些理论和它在统计工作中的重要作用。对我们的主要要求为,运用SPSS 软件功能及相关资料来完成SPSS操作,选择有现实意义的课题进行计算和分析,最后递交统计分析报告,加深学生对课程内容的理解的。我们小组的研究课题是社会消费品零售总额的分析。 四、实训的主要内容与过程: 此次实训,我大概明白了SPSS软件的基本操作流程,也掌握了如何排序、分组、计算、合并、增加、删除以及录入数据;学会了如何计算定基发展速度、环比发展速度等动态数列的计算;明白了如何进行频数分析、描述分析、探索分析以及作图分析;最大的收获是学会了如何运用SPSS软件对变量进行相关分析、回归分析和计算平均值、T检验和假设性检验。通过这次试训,我基本上掌握了SPSS软件的主要操作过程,也学会了运用SPSS软件进行各种数据分析。这些内容,也就是我们SPSS统计软件实训的主要内容。 四、实训结果与体会 五天的SPSS软件实训终于结束了,虽然实训过程充满了酸甜苦辣,但实训结果却是甜的。看着小组的课题报告,心里有种说不出来的感触。高老师在对统计理论及SPSS软件功能模块的讲解的同时更侧重于统计分析在各项工作中的 实际应用,使我们不仅掌握SPSS软件及技术原理而且学会运用统计方法解决工作和学习中的实际问题这个实训。我真真正正学到了不少知识,另外,也提高了自己分析问题解决问题的能力。

SPSS期末大作业-完整版

第1题:基本统计分析1 分析:本题要求随机选取80%的样本,因而需要选用随机抽样的方法,在此选择随机抽样中的近似抽样方法进行抽样。其基本操作步骤如下:数据→选择个案→随机个案样本→大约(A)80 所有个案的%。 1、基本思路: (1)由于存款金额为定距型变量,直接采用频数分析不利于对其分布形态的把握,因而采用数据分组,先对数据进行分组再编制频数分布表。此处分为少于500元,500~2000元,2000~3500元,3500~5000元,5000元以上五组。分组后进行频数分析并绘制带正态曲线的直方图。 (2)进行数据拆分,并分别计算不同年龄段储户的一次存取款金额的四分位数,并通过四分位数比较其分布上的差异。 操作步骤: (1)数据分组:【转换→重新编码为不同变量】,然后选择存取款金额到【数字变量→输出变量(V)】框中。在【名称(N)】中输入“存取款金额1”,单击【更改(H)】按钮;单击【旧值和新值】按钮进行分组区间定义。 存取款金额1 频率百分比有效百分比累积百分比 有效1.00 82 34.6 34.6 34.6 2.00 76 32.1 32.1 66.7 3.00 10 4.2 4.2 70.9 4.00 22 9.3 9.3 80.2 5.00 47 19.8 19.8 100.0 合计237 100.0 100.0 (2)【分析→描述统计→频率】;选择“存款金额分组”变量到【变量(V)】框中;单击【图标(C)】按钮,选择【直方图】和【在直方图上显示正态曲线】;选中【显示频率表格】,确定。

(3)【数据→拆分文件】,选择“年龄”变量到【分组方式】框中,选中【比较组】和【按分组变量排序文件】,确定;【分析→描述统计→频率】,选择“存款金额”到【变量】框中,单击【统计量】按钮,选择【四分位数】→继续→确定。 统计量 存(取)款金额 20岁以下 N 有效 1 缺失 0 百分位数 25 50.00 50 50.00 75 50.00 20~35岁 N 有效 131 缺失 0 百分位数 25 500.00 50 1000.00 75 5000.00 35~50岁 N 有效 73 缺失 0 百分位数 25 500.00 50 1000.00 75 4500.00 50岁以上 N 有效 32 缺失 0 百分位数 25 525.00 50 1000.00 75 2000.00 结果及结果描述: 频数分布表表明,有一半以上的人的一次存取款金额少于2000元,且有34.6%的人的存取款金额少于500元,19.8%的人的存取款金额多于5000元,下图为相应的带正态曲线的直方图。

spss实习报告

SPSS统计分析软件 实验报告 石河子大学经济与管理学院 经济与贸易系国际经济与贸易专业 2009级1班 雍荣 2009165106

实验一SPSS基本操作 一、实验目的 1.熟悉SPSS的菜单和窗口界面,熟悉SPSS各种参数的设置; 2.掌握SPSS的数据管理功能。 二、实验内容及步骤 (一)数据的输入和保存 1. SPSS界面 当打开SPSS后,展现在我们面前的界面如下: 请注意窗口顶部显示为“SPSS for Windows Data Editor”,表明现在所看到的是SPSS的数据管理窗口。这是一个典型的Windows软件界面,有菜单栏、工具栏。该界面和EXCEL极为相似,很多操作也与EXCEL类似,同学们可以自己试试。 2.定义变量 选择菜单Data==>Define Variable。系统弹出定义变量对话框如下:

对话框最上方为变量名,现在显示为“VAR00001”,这是系统的默认变量名;往下是变量情况描述,可以看到系统默认该变量为数值型,长度为8,有两位小数位,尚无缺失值,显示对齐方式为右对齐;第三部分为四个设置更改按钮,分别可以设定变量类型、标签、缺失值和列显示格式;第四部分实际上是用来定义变量属于数值变量、有序分类变量还是无序分类变量,现在系统默认新变量为数值变量;最下方则依次是确定、取消和帮助按钮。 假如有两组数据如下: GROUP 1: 0.84 1.05 1.20 1.20 1.39 1.53 1.67 1.80 1.87 2.07 2.11 GROUP 2: 0.54 0.64 0.64 0.75 0.76 0.81 1.16 1.20 1.34 1.35 1.48 1.56 1.87 先来建立分组变量GROUP。请将变量名改为GROUP,然后单击OK按钮。 现在SPSS的数据管理窗口如下所示: 第一列的名称已经改为了“group”,这就是我们所定义的新变量“group”。

SPSS相关分析实验报告

SPSS相关分析实验报告 篇一:spss对数据进行相关性分析实验报告 实验一 一.实验目的 掌握用spss软件对数据进行相关性分析,熟悉其操作过程,并能分析其结果。 二.实验原理 相关性分析是考察两个变量之间线性关系的一种统计分析方法。更精确地说,当一个变量发生变化时,另一个变量如何变化,此时就需要通过计算相关系数来做深入的定量考察。P值是针对原假设H0:假设两变量无线性相关而言的。一般假设检验的显著性水平为0.05,你只需要拿p值和0.05进行比较:如果p值小于0.05,就拒绝原假设H0,说明两变量有线性相关的关系,他们无线性相关的可能性小于0.05;如果大于0.05,则一般认为无线性相关关系,至于相关的程度则要看相关系数R值,r越大,说明越相关。越小,则相关程度越低。而偏相关分析是指当两个变量同时与第三个变量相关时,将第三个变量的影响剔除,只分析另外两个变量之间相关程度的过程,其检验过程与相关分析相似。 三、实验内容 掌握使用spss软件对数据进行相关性分析,从变量之间的相关关系,寻求与人均食品支出密切相关的因素。 (1)检验人均食品支出与粮价和人均收入之间的相关关系。

a.打开spss软件,输入“回归人均食品支出”数据。 b.在spssd的菜单栏中选择点击,弹出一个对话窗口。 C.在对话窗口中点击ok,系统输出结果,如下表。 从表中可以看出,人均食品支出与人均收入之间的相关系数为0.921,t检验的显著性概率为0.0000.01,拒绝零假设,表明两个变量之间显著相关。人均食品支出与粮食平均单价之间的相关系数为0.730,t检验的显著性概率为0.0000.01,拒绝零假设,表明两个变量之间也显著相关。 (2)研究人均食品支出与人均收入之间的偏相关关系。 读入数据后: A.点击系统弹出一个对话窗口。 B.点击OK,系统输出结果,如下表。 从表中可以看出,人均食品支出与人均收入的偏相关系数为0.8665,显著性概率p=0.0000.01,说明在剔除了粮食单价的影响后,人均食品支出与人均收入依然有显著性关系,并且0.86650.921,说明它们之间的显著性关系稍有减弱。通过相关关系与偏相关关系的比较可以得知:在粮价的影响下,人均收入对人均食品支出的影响更大。 三、实验总结 1、熟悉了用spss软件对数据进行相关性分析,熟悉其操作过程。 2、通过spss软件输出的数据结果并能够分析其相互之间的关系,并且解决实际问题。 3、充分理解了相关性分析的应用原理。

spss的数据分析报告范例

关于某地区361个人旅游情况统计分析报告 一、数据介绍: 本次分析的数据为某地区361个人旅游情况状况统计表,其中共包含七变量,分别是:年龄,为三类变量;性别,为二类变量(0代表女,1代表男);收入,为一类变量;旅游花费,为一类变量;通道,为二类变量(0代表没走通道,1代表走通道);旅游的积极性,为三类变量(0代表积极性差,1代表积极性一般,2代表积极性比较好,3代表积极性好 4代表积极性非常好);额外收入,一类变量。通过运用spss统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析,以了解该地区上述方面的综合状况,并分析个变量的分布特点及相互间的关系。 二、数据分析 1、频数分析。基本的统计分析往往从频数分析开始。通过频数分地区359个人旅游基本 状况的统计数据表,在性别、旅游的积极性不同的状况下的频数分析,从而了解该地区的男女职工数量、不同积极性情况的基本分布。 统计量 积极性性别 N 有效359 359 缺失0 0 首先,对该地区的男女性别分布进行频数分析,结果如下

性别 频率百分比有效百分 比 累积百分 比 有效女198 男161 合计359 表说明,在该地区被调查的359个人中,有198名女性,161名男性,男女比例分别为%和%,该公司职工男女数量差距不大,女性略多于男性。 其次对原有数据中的旅游的积极性进行频数分析,结果如下表: 积极性 频率百分比有效百分 比 累积百分 比 有效差171 一般79 比较 好 79 好24 非常 好 6 合计359 其次对原有数据中的积极性进行频数分析,结果如下表: 其次对原有数据中的是否进通道进行频数分析,结果如下表:

SPSS实验报告

第四章描述性统计分析 一、实验目的 通过计算诸如样本均值、中位数、样本方差等重要基本统计量,并辅助于SPSS提供的图形功能,能够使分析者把握数据的基本特征和数据的整体分布形态,对进一步的统计推断和数据建模工作起到重要作用。并且,通过例子学习描述性统计分析及其在SPSS中的实现,包括统计量的定义及计算、频率分析、描述性分析、探索性分析、交叉表分析和多重响应分析,能够使分析者更好的掌握基本的统计分析,即单变量频数分布的编制、基本统计量的计算以及数据的探索性分析等。 二、实验内容 1.打开数据文件data4-8.sav,完成以下统计分析。 (1)计算各科成绩的描述统计量:平均成绩、中位数、众数、标准差、方差、极差、最大值和最小值; ①解决问题的原理:描述性分析 ②实验步骤:通过“分析-描述统计-描述”,打开“描述性”对话框,根据题目所需要的统计量进行设置。 ③结果及分析: 表中分析变量“成绩”的个案数、所有个案中的极大值、极小值、均值、标准差及方差。 (2)使用Recode命令生成一个新变量“成绩段”,其值为各科成绩的分段:90~100为1,80~89为2,70~79为3,60~69为4,60分以下为5,其值标签:1—优,2—良,3—中,4—及格,5—不及格。分段以后进行频数分析,统计各分数段的人数,最后生成条形图和饼图。 ①解决问题的原理:频率分析。 ②实验步骤:通过“分析-描述统计-频率”,打开“频率”对话框,根据题目所需要的统计量进行设置。 ③结果及分析: 成绩 频率百分比有效百分比累积百分比 有效15 1 2.2 2.2 2.2 19 1 2.2 2.2 4.4 24 1 2.2 2.2 6.7 28 1 2.2 2.2 8.9 30 1 2.2 2.2 11.1 32 2 4.4 4.4 15.6 33 1 2.2 2.2 17.8 34 1 2.2 2.2 20.0 36 1 2.2 2.2 22.2 37 2 4.4 4.4 26.7 43 1 2.2 2.2 28.9 49 1 2.2 2.2 31.1 50 1 2.2 2.2 33.3 55 1 2.2 2.2 35.6

相关文档
相关文档 最新文档