文档库 最新最全的文档下载
当前位置:文档库 › SPSS分析期末考试及答案

SPSS分析期末考试及答案

SPSS分析期末考试及答案
SPSS分析期末考试及答案

《经济数据分析与SPSS软件应用》期末综合作业

学号:姓名:专业:班级:

注意事项:

1、请在规定的位置书写学号、姓名、专业、班级信息。

2、结合SPSS软件,呈现计量软件操作关键结果,写出必要的操作步骤,每题答案写在相应题目后面,规范回答问题。

3、规范格式:宋体五号字;(软件结果为默认即可);单倍行间距;排版整齐,不留空行。

综合作业题目(一、二题每题20分,三、四题每题30分,共100分)

一、某医药研究所考察一种药品对男性和女性的治疗效果是否有显著差异,调查了10名男性服用者及7名女性服用者,对他们服药后的各项指标进行综合评分,服用的效果越好,分值就越高,每人所得的总分见“1(综合效果).sav”,试根据表中的数据检验这种药品对男性和女性的治疗效果是否存在显著差异。

答:

群組統計資料

性别N 平均數標準偏差標準錯誤平均值

综合得分男10 105.40 34.394 10.876

女7 109.57 23.143 8.747

从检验结果看,两样本数据的方差没有显著差异,假设检验的P值大于显著性水平0.05,所以说这种药品对男性和女性的治疗效果并无显著差异。

二、为了考察火柴销售量的影响因素,选择煤气户数、卷烟销量、蚊香销量、打火石销量作为影响因素,得数据“2(多元回归).sav”。试求:(1)火柴销售量与煤气户数的偏相关系数;(2)考察火柴销售量与各影响因素之间的相关关系,建立火柴销售量对于相关因素煤气户数、卷烟销量、蚊香销量、打火石销量的线性回归模型,通过对模型的分析,找出合适的线性回归方程。

答:

从上表结果分析,排除显著性大于0.05的蚊香销量,对剩下的煤气户数、卷烟销量、打火石销量进行逐步分析。

打火石销量(百万粒)-.243 .017 -.465 -14.689 .000 .999 1.001

3 (常數)17.420 .39

4 44.243 .000

卷烟销量(万箱).254 .019 .698 13.228 .000 .185 5.417

打火石销量(百万粒)-.243 .012 -.465 -20.526 .000 .999 1.001

煤气户数(万户).049 .014 .185 3.516 .005 .185 5.415

a. 應變數\: 火柴销量(万件)

由逐步分析得到上表,可以建立

y=17.420+0.254X1+0.049X2?0.243X4的线性回归方程。

三、根据山东餐饮市场统计资料,试采用系统聚类的方法将山东17地市餐饮市场分三类,并对三类市场进行解释。资料见“3(山东餐饮).sav”。答:

Agglomeration Schedule

Sta ge Cluster Combined

Coefficien

ts

Stage Cluster First

Appears

Next

Stage Cluster

1

Cluster

2Cluster 1Cluster 2

1416.007004 2914.024003 3915.109209 4411.341108 5510.6490012 6813 1.055007 778 1.7030613 8412 2.5164012 9917 3.6723014 1012 5.2060015 11367.0140013 12459.8378514 133714.85711715 144919.88712916 151338.403101316 161496.00015140

由上述柱形图可知,分为三类如下,济南市和青岛市为一类;临沂市、济宁市、潍坊市、烟台市、淄博市为第二类;枣庄市、滨州市等剩余的是第三类。

四、某公司有20个工厂,现在要对每个工厂的经济效益分析。从所取得的生产成果同所消耗的人力、物力、财力的比例等指标中选出5个指标进行分析。

5个指标如下:x1:固定资产的产值率;x2:净产值的劳动生产率;x3:百元产值的流动资金占用率;x4:百元产值的利润率;x5:百元资金的利润率。

先对这20个工厂同时按照这5项指标收集数据,然后用主成分分析法对他们的经济效益进行分析。数据文件见“4(经济效益).sav”.

答:均值、标准差和分析数如下表:

描述性統計資料

平均數標準偏差分析 N

固定资产的产值率385.700000 139.5395719 20

净产值的劳动生产率11525.810500 4990.3768116 20

百元产值的流动资金占用率 6.017000 3.3840619 20

百元产值的利润率19.976500 7.1939201 20

百元资金的利润率104.829500 53.4524877 20

由上表可以看出,固定资产的净值率与净产值的劳动生产率相关性,百元资金的利润率与固定资产的产值率,百元资金的利润率与净产值的劳动生产率,这三组的相关性高些。

由上表可以看出,第一组解释程度达到52%,第二组的解释程度为30%,前两组的侧方根均大于1,而第3、4、5组解释程度不高,因此我们选取前两个指标进行分析。

成分矩阵a

组件

1 2

固定资产的产值率.924 -.188

净产值的劳动生产率.738 .174

百元产值的流动资金占用

-.838 .296

百元产值的利润率-.167 .969

百元资金的利润率.699 .652

提取方法:主成份分析。

a. 已提取 2 个成分。

成分得分系数矩阵

组件

1 2

固定资产的产值率

.353 -.124

净产值的劳动生产率

.282 .114

百元产值的流动资金占用率

-.320 .195

百元产值的利润率

-.064 .639

百元资金的利润率

.267 .430

提取方法:主成份分析。

组件评分。

所以表达式为:Y1=0.353X1+0.282X2?0.320X3?0.064X4+0.267X5Y2=?0.124X1+0.114X2+0.195X3+0.639X4+0.430X5

spss统计分析期末考试题

《统计分析软件》试(题)卷 班级 xxx班姓名 xxx 学号 xxx 说明:1.本试卷分析结果写在每个题目下面(即所留空白处); 2.考试时间为100分钟; 3.每个试题20分。 一、(20分)已经给出某个班的学生基本情况及其学习成绩的两个SPSS数据文件,学生成绩一.sav;学生成绩二.sav。要求: (1)将所给的两个SPSS数据文件“学生成绩一.sav”与“学生成绩二.sav”合并,并保存为“成绩.sav.” (2)对所建立的数据文件“成绩.sav”进行以下处理: 1)按照性别求出男、女数学成绩的各种统计量(包括平均成绩、标准差等)。 2)计算每个学生的总成绩、并按照总成绩的大小进行排序 3)把数学成绩分成优、良、中三个等级,规则为优(X≥85),良(75≤X ≤84),中(X≤74),并对优良中的人数进行统计。

分析: 描述统计量 性别N极小值极大值均值标准差 男数学477.0085.0082.2500 3.77492有效的 N (列表状态)4 女数学1667.0090.0078.50007.09930有效的 N (列表状态)16

注:成绩优良表示栏位sxcj 优为1 良为2 中为3 由表统计得,成绩为优的同学有4人,占总人数的20%;良的同学有12人,占总人数的60%;中的同学有4人,占总人数的40%。 二、(20分)为了解笔记本电脑的市场情况,针对笔记本电脑的3种品牌,进行了满意度调查,随机访问了30位消费者,让他们选出自己满意的品牌,调查结果见下表,其中变量“职业”的取值中,1表示文秘人员,2表示管理人员,3表示工程师,4表示其他人;3个品牌变量的取值中,1表示选择,0表示未选数据见Excel数据文件“调查.exe”。根据所给数据完成以下问题 (1)将所给数据的Excel文件导入到SPSS中,要求SPSS数据文件写出数据结构(包括变量名,变量类型,变量值标签等)命,并保存为:“调查. Sav”。 (2)试利用多选项分析,利用频数分析来分析消费者对不同品牌电脑的满意度状况;分析不同职业消费者对笔记本品牌满意度状况。 分析:

《统计分析及SPSS的应用(第五版)》课后练习答案解析(第4章)

《统计分析与SPSS的应用(第五版)》(薛薇) 课后练习答案 第4章SPSS基本统计分析 1、利用第2章第7题数据采用SPSS频数分析,分析被调查者的常住地、职业和年龄分布特征,并绘制条形图。 分析——描述统计——频率,选择“常住地”,“职业”和“年龄”到变量中,然后,图表——条形图——图表值(频率)——继续,勾选显示频率表格,点击确定。 Statistics 户口所在 地职业 , 年龄 N Valid282282282 Missing00~ 户口所在地 Frequency Percent Valid Percent Cumulative Percent Valid 中心城市] 200 边远郊区82 Total282 职业 ( Frequency Percent Valid Percent Cumulative Percent Valid 国家机关24 商业服务业54 文教卫生18】公交建筑业15 经营性公司】 18 学校15

一般农户 35 种粮棉专业 户 4(种果菜专业 户 10 工商运专业户 ~ 34 退役人员17 金融机构35 现役军人3: Total282 、 年龄 Frequency Percent Valid Percent Cumulative Percent Valid 20岁以下4/ 20~35岁146 35~50岁: 91 50岁以上41 Total282

《 分析:本次调查的有效样本为282份。常住地的分布状况是:在中心城市的人最多,有200人,而在边远郊区只有82人;职业的分布状况是:在商业服务业的人最多,其次是一般农户和金融机构;年龄方面:在35-50岁的人最多。由于变量中无缺失数据,因此频数分布表中的百分比相同。 2、利用第2章第7题数据,从数据的集中趋势、离散程度以及分布形状等角度,分析被调查者本次存款金额的基本特征,并与标准正态分布曲线进行对比。进一步,对不同常住地储户存款金额的基本特征进行对比分析。 分析——描述统计——描述,选择存款金额到变量中。点击选项,勾选均值、标准差、方差、最小值、最大值、范围、偏度、峰度、按变量列表,点击继续——确定。 分析:由表中可以看出,有效样本为282份,存(取)款金额的均值是,标准差为,峰度系数为,偏度系数为。与标准正态分布曲线进行对比,由峰度系数可以看出,此表的存款金额的数据分布比标准正态分布更陡峭;由偏度系数可以看出,此表的存款金额的数据为右偏分布,表明此表的存款金额均值对平均水平的测度偏大。

应用统计spss分析报告

学生姓名:肖浩鑫学号:31407371 一、实验项目名称:实验报告(三) 二、实验目的和要求 (一)变量间关系的度量:包括绘制散点图,相关系数计算及显著性检验; (二)一元线性回归:包括一元线性回归模型及参数的最小二乘估计,回归方程的评价及显著性检验,利用回归方程进行估计和预测; (三)多元线性回归:包括多元线性回归模型及参数的最小二乘估计,回归方程的评价及显著性检验等,多重共线性问题与自变量选择,哑变量回归; 三、实验内容 企业编号产量(台)生产费用(万元)企业编号产量(台)生产费用(万元) 1 40 130 7 84 165 2 42 150 8 100 170 3 50 155 9 116 167 4 5 5 140 10 125 180 5 65 150 11 130 175 6 78 154 12 140 185 (1)绘制产量与生产费用的散点图,判断二者之间的关系形态。 (2)计算产量与生产费用之间的线性相关系数,并对相关系数的显著性进行检验(),并说明二者之间的关系强度。 地区人均GDP(元)人均消费水平(元) 北京22460 7326 辽宁11226 4490 上海34547 11546 江西4851 2396 河南5444 2208 贵州2662 1608 陕西4549 2035

(1)绘制散点图,并计算相关系数,说明二者之间的关系。 (2)人均GDP作自变量,人均消费水平作因变量,利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。 (3)计算判定系数和估计标准误差,并解释其意义。 (4)检验回归方程线性关系的显著性() (5)如果某地区的人均GDP为5000元,预测其人均消费水平。 (6)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。 航空公司编号航班正点率(%)投诉次数(次) 1 81.8 21 2 76.6 58 3 76.6 85 4 75.7 68 5 73.8 74 6 72.2 93 7 71.2 72 8 70.8 122 9 91.4 18 10 68.5 125 (1)用航班正点率作自变量,顾客投诉次数作因变量,估计回归方程,并解释回归系数的意义。(2)检验回归系数的显著性()。 (3)如果航班正点率为80%,估计顾客的投诉次数。 4. 某汽车生产商欲了解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。通过计算得到下面的有关结果: 方差分析表 变差来源df SS MS F Significance F 回归 2.17E-09 残差40158.07 —— 总计11 1642866.67 ——— 参数估计表 Coefficients 标准误差t Stat P-value Intercept 363.6891 62.45529 5.823191 0.000168 X Variable 1 1.420211 0.071091 19.97749 2.17E-09 (1)完成上面的方差分析表。 (2)汽车销售量的变差中有多少是由于广告费用的变动引起的?

spss实践题分析及答案

SPSS实践题 习题1 分析此班级不同性别的学生的物理和数学成绩的均值、最高分和最低分。

Std. Deviation Minimum Maximum 结论:男生数学成绩最高分: 95 最低分: 72 平均分: 物理成绩最高分: 87 最低分: 69 平均分: 女生数学成绩最高分: 99 最低分: 70 平均分: 物理成绩最高分: 91 最低分: 65 平均分: 习题2 分析此班级的数学成绩是否和全国平均成绩85存在显著差异。 One-Sample Statistics N Mean Std. Deviation Std. Error Mean 数学26 结论:由分析可知相伴概率为,小于显著性水平,因此拒绝零假设,即此班级数学成绩和全国平均水平85分有显著性差异 习题3 分析兰州市2月份的平均气温在90年代前后有无明显变化。

Group Statistics 分组N Mean Std. Deviation Std. Error Mean 二月份气温011.3628400 118.3065729 结论:由分析可知, 方差相同检验相伴概率为,大于显著性水平,因此接受零假设,90年代前后2月份温度方差相同。双侧检验相伴概率为, 小于显著性水平,拒绝零假设,即2月份平均气温在90年代前后有显著性差异 习题4 分析15个居民进行体育锻炼3个月后的体质变化。 Paired Samples Statistics Mean N Std. Deviation Std. Error Mean

Paired Samples Correlations N Correlation Sig. Pair 1锻炼前 & 锻炼后15.277 结论:由分析可知,锻炼前后差值与零比较,相伴概率小于显著性水平, 拒绝零假设,即锻炼前后有显著性差异 习题5 为了农民增收,某地区推广豌豆番茄青菜的套种生产方式。为了寻找该 种方式下最优豌豆品种,进行如下试验:选取5种不同的豌豆品种,每 一品种在4块条件完全相同的田地上试种,其它施肥等田间管理措施完 全一样。根据表中数据分析不同豌豆品种对平均亩产的影响是否显著。 ANOVA 产量 Sum of Squares df Mean Square F Sig.

spss统计分析期末考试题

《统计分析软件》试(题)卷 班级XXX 班姓名XXX 学号XXX ____________ 1. 2. 考试时间为100分钟; 3. 每个试题20分。 一、(20分)已经给出某个班的学生基本情况及其学习成绩的两个SPSS数据文件,学生成绩一.sav ;学生成绩二.sav。要求: (1)将所给的两个SPSS数据文件“学生成绩一.sav ”与“学生成绩二.sav ”合并,并保存为“成绩.sav. ” (2)对所建立的数据文件“成绩.sav ”进行以下处理: 1)按照性别求出男、女数学成绩的各种统计量(包括平均成绩、标准差等)。 2)计算每个学生的总成绩、并按照总成绩的大小进行排序 3)把数学成绩分成优、良、中三个等级,规则为优(X > 85),良(75 < X < 84),中(X < 74),并对优良中的人数进行统计

分析: (2) 描述统计量

性别:rj sxcj 11391.0090.0061.00242.0D 1.00 r 214女91.0090.0061 Q0242,00 1.D0 31女95.0079.0065.00239.03200匸4Q女95.0079.0065 00239.00 2.D0 53立92.00B4.0062.00230.00200 S 4 女92.0084.0062 00238.00 2.00 79女眨00S2.0062.00236.00200 310女92.0002.0062 0023G.OO 2 DO 95男39.00S5.0D69 00233.03 1.00 10E男39.0085.0059 00233.00 1.00 1111立9U.OO SO.OO60.00230.0J200「1212女90.0080.0060 00230.00 2.00 1319立眨0075.0062.00229.03200 20女92.0076.00G2 00229.00 2 DO 1 1516男SB.00B2.0053.00220.03200 15男38.0077.0068 00223.00200 1 1717女91.0071.00 61 00223.00 3.00 女91.0071.0061 00223.03 3.00 1016 1 19 1女89.0067.0059 00215.00 3.00 202女39.0067.0069 00215.0J 3. DO 注:成绩优良表示栏位sxcj 优为1良为2中为3 由表统计得,成绩为优的同学有4人,占总人数的20%良的同学有12人,占总人数的60%中的同学有4人,占总人数的40% 二、(20分)为了解笔记本电脑的市场情况,针对笔记本电脑的3种品牌,进 行了满意度调查,随机访问了30位消费者,让他们选出自己满意的品牌,调查结果见下表,其中变量“职业”的取值中,1表示文秘人员,2表示管理人员,3表示工程师,4表示其他人;3个品牌变量的取值中,1表示选择,0表示未选数据见Excel数据文件“调 查.exe ”。根据所给数据完成以下问题 (1)将所给数据的Excel文件导入到SPSS中,要求SPSS数据文件写出数据结构(包括变量名,变量类型,变量值标签等)命,并保存为:“调查.Sav ”。 (2)试利用多选项分析,利用频数分析来分析消费者对不同品牌电脑的满意度状况;分析不同职业消费者对笔记本品牌满意度状况。 分析:

数据分析课后答案spss教学提纲

数据分析课后答案 s p s s

习题1.3 統計資料 全国居民 N 有效 22 遺漏 0 平均數 1117.00 中位數 727.50 標準偏差 1015.717 變異數 1031680.286 偏斜度 1.025 偏斜度標準誤 .491 峰度 -.457 峰度標準誤 .953 百分位數 25 304.25 50 727.50 75 1893.50 (1).由表可知,全国居民的均值、方差、标准差、偏度、峰度分别为1117.00、1031680.286、1015.717、1.025、-0.457。 变异系数有公式计算得90.9325。 (2)中位数为727.50,上四分位数304.35,下四分位数为1893.50。 四分位极差由公式 得到1579.15 三均值由公式 得到913.1857。 (3)直方图 (%) *100cv _x s =1 31Q Q R -=3 141 2141Q M Q M ++=∧

(4)茎叶图 全国居民 Stem-and-Leaf Plot Frequency Stem & Leaf 9.00 0 . 122223344 5.00 0 . 56788 2.00 1 . 03 1.00 1 . 7 1.00 2 . 3 3.00 2 . 689 1.00 3 . 1 Stem width: 1000 Each leaf: 1 case(s)

(5) 由箱图可以看出并不异常点。 統計資料 农村居民 N 有效22 遺漏0 平均數747.86 中位數530.50 標準偏差632.198 變異數399673.838 偏斜度 1.013 偏斜度標準誤.491 峰度-.451 峰度標準誤.953 百分位數25 239.75 50 530.50 75 1197.00

spss的数据分析报告

Gender Educational Level (years)N Valid 474474Missing 00关于某公司474名职工综合状况的统计分析报告 1、 数据介绍: 本次分析的数据为某公司474名职工状况统计表,其中共包含十一变量,分别是:id (职工编号),gender(性别),bdate(出生日期),edcu (受教育水平程度),jobcat (职务等级),salbegin (起始工 资),salary (现工资),jobtime(本单位工作经历<月>),prevexp(以前工作经历<月>),minority(民族类型),age(年龄)。通过运用spss 统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析、。。。以了解该公司职工上述方面的综合状况,并分析个变量的分布特点及相互间的关系。2、 数据分析 1、 频数分析。基本的统计分析往往从频数分析开始。通过频数分析 能够了解变量的取值状况,对把握数据的分布特征非常有用。此次分析利用了某公司474名职工基本状况的统计数据表,在gender(性别)、edcu (受教育水平程度)、不同的状况下的频数分析,从而了解该公司职工的男女职工数量、受教育状况的基本分布。 Statistics 首先,对该公司的男女 性别分布进行频数分析,结果如下: Gender FrequencyPercent Valid Percent Cumulative Percent Valid Female 21645.645.645.6 Male 258 54.4 54.4 100.0 Total 474100.0100.0 上表说明,在该公司的474名职工中,有216名女性,258名男性,男女比例分别为45.6%和54.4%,该公司职工男女数量差距不大,男性略多于女性。 其次对原有数据中的受教育程度进行频数分析,结果如下表 : Educational Level (years) Valid Cumulative

spss期末大数据分析报告

SPSS在教育研究中的应用某大学学生对本校的满意度调查 学院:教育学院 专业:课程与教学论 学号:201411000156 姓名:李平 2014年12月13日

目录 一、研究问题的提出 (3) 二、研究内容与方法 (3) (一) 研究内容 (3) (二) 研究方法 (3) 三、调查对象及人数 (4) 四、问卷分析 (5) (一)回收情况 (5) (二)信度分析 (5) 五、数据统计与分析 (6) (一)数据输入 (6) (二)数据分析 (7) 1.描述统计 (7) (1)多选题描述统计 (7) (2)单选题描述统计 (9) 2.推断统计 (12) (1)独立样本T检验 (12) (2)单一样本T检验 (15) (3)单因素方差分析 (17) (4) X2检验 (21) 3.相关分析 (22) (1)变量间相关分析 (22) (2)维度间相关分析 (23) 六、结论 (27) 七、附录 (28)

一、研究问题的提出 学生的学校生活和成长密切相关。我们通过对他们的大学生活满意度的调查结果向有关部门提出建议,并希望能引起学校对这一系列问题的关注,最终希望大学生对其大学的满意度有所提升,大学生是一个庞大的群体,特别是近几年,随着高校的扩招,我国越来越多人能够上大学。上大学是很多人的梦想,他们都憧憬着大学校园的生活,然而当他们进了大学后才发现大学生活并非所想的美好,取而代之的却是对校园生活的不满,大学生是十分宝贵的人才资源,他们对校园生活的体验和感受,与他们的更好的学习。 二、研究内容与方法 (一)研究内容 了解学生对于学校的师资水平、环境、日常管理等各方面的满意度。 (二)研究方法 1.问卷编制 本研究采用自编问卷,问卷共由两部分组成:基本情况部分包括被调查者的性别、年级等,问卷主体部分包括师资水平、学校环境、日常管理三大维度,细分为12个三级指标(见表2-1),问卷采用五点制计分法,即“非常满意”、“满意”、“一般”、“不满意”、“非常不满意”,分别赋值5分、4分、3分、2分、1分。 表2-1 某大学学生对本校的满意度测评指标体系 一 级指标 二级指标(潜在变量)三级指标(观测变量) 对自己师资水平对教师教学方法、对教师工作态 度、对教师人品修养、对师资配备 学校的意学校环境对学习环境、对就餐环境、对居住 环境、对校园绿化环境 满度指数日常管理对专业课时安排、对收费标准、对 奖、助学金制度、对学校治安

spss统计分析报告

计算机与信息技术学院专业实习报告 学校:商丘师范学院 专业:信息管理与信息系统年级:2012 姓名:亚慧 学号:121112015 时间:2015.09

《统计分析与SPSS的应用》 实习报告 专业实习题目:数据处理与分析 一.实习目的 1.初步了解探索数据分析的基本方法和思路 2.掌握问题的研究思路及方法 3.掌握统计分析软件实现这些方法的步骤和原理 4.熟悉SPSS操作系统,掌握数据管理界面的简单的操作; 5.熟悉SPSS结果窗口的常用操作方法,掌握输出结果在文字处理软件中的使用方法。 6.掌握常用统计图(线图、条形图、饼图、散点、直方图等)的绘制方法;熟悉描述性统计图的绘制方法; 7.熟悉描述性统计图的一般编辑方法。掌握相关分析的操作,对显著性水平的基本简单判断。二.实习要求 1.遵守学校实习纪律和学校的各项规章制度 2.服从领导和指导老师的实习安排、虚心接受指导老师的安排 3.不得冒名顶替,否则严肃处理 4.按时上下课,不得缺席 5.掌握SPSS软件的基本操作、数据分析的基本功能和基本步骤 6.掌握对SPSS所分析的各项数据的理解、数据分析的基本方法和思路 7.掌握工作中如何进行数据的收集、整理以及统计分析报告的撰写的方法。 8.掌握相关关系的含义,并准确应用,熟练掌握绘制散点图的具体操作 9.掌握线性回归分析的主要目标、及具体操作。 三.实习任务 (一)下列表为数据处理所有表格和数据 信管12-1成绩表 学号性别计算机 网络 管理信 息系统 统计 学 市场营 销学 现代管 理学 运筹学 信息资 源管理 英语上 学期 英语 下学 期 大三 综合 成绩 121112001 女82.00 90.00 79.00 82.00 84.00 85.30 81.00 74 75 89.5

spss统计分析期末考试题

《统计分析软件》试(题)卷 班级xxx班姓名xxx 学号xxx 说明:1.本试卷分析结果写在每个题目下面(即所留空白处); 2.考试时间为100分钟; 3.每个试题20分。 一、(20分)已经给出某个班的学生基本情况及其学习成绩的两个SPSS数据文件,学生成绩一.sav;学生成绩二.sav。要求: (1)将所给的两个SPSS数据文件“学生成绩一.sav”与“学生成绩二.sav”合并,并保存为“成绩.sav.” (2)对所建立的数据文件“成绩.sav”进行以下处理: 1)按照性别求出男、女数学成绩的各种统计量(包括平均成绩、标准差等)。 2)计算每个学生的总成绩、并按照总成绩的大小进行排序 3)把数学成绩分成优、良、中三个等级,规则为优(X≥85),良(75≤X ≤84),中(X≤74),并对优良中的人数进行统计。

分析: (2) 描述统计量 性别N 极小值极大值均值标准差 男数学 4 77.00 85.00 82.2500 3.77492 有效的N (列表状态) 4 女数学16 67.00 90.00 78.5000 7.09930 有效的N (列表状态)16

注:成绩优良表示栏位sxcj 优为1 良为2 中为3 由表统计得,成绩为优的同学有4人,占总人数的20%;良的同学有12人,占总人数的60%;中的同学有4人,占总人数的40%。 二、(20分)为了解笔记本电脑的市场情况,针对笔记本电脑的3种品牌,进行了满意度调查,随机访问了30位消费者,让他们选出自己满意的品牌,调查结果见下表,其中变量“职业”的取值中,1表示文秘人员,2表示管理人员,3表示工程师,4表示其他人;3个品牌变量的取值中,1表示选择,0表示未选数据见Excel数据文件“调查.exe”。根据所给数据完成以下问题 (1)将所给数据的Excel文件导入到SPSS中,要求SPSS数据文件写出数据结构(包括变量名,变量类型,变量值标签等)命,并保存为:“调查. Sav”。 (2)试利用多选项分析,利用频数分析来分析消费者对不同品牌电脑的满意度状况;分析不同职业消费者对笔记本品牌满意度状况。 分析:

SPSS期末考试整理

●一。变量的赋值 1.乘方(**),例如二的三次方:2**3 2.不同规则的赋值:转换→计算变量(如果),每一个规则的赋值都要重新进行此步骤(但注意每一遍的变量名都不变,并且他都会问你要不要替换成新的变量,你选是就行了) 3.不同规则的赋值:(1)转换→重新编码为不同变量:输入变量,输出变量,要点击“变化量”才可保存输出变量→新值和旧值:值(直接选取取值)、范围(最大到最小的范围,包含端点值),点击“添加”成功保存新值和旧值→所有不同取值规则都完成后点击继续、确定,则在变量视图多出一个新变量(2)若不想包含端点值,可以采取小数的方式变换,eg. 899.9(小数位比该变量属性的小数位多一位就行了) (3)这种要先把BMI按照男女分开,然后再分组的,可以在对话框中点击“如果”选项进行设置,并且要分别对男女进行上述操作(一共做两遍)。 二。离散化 1可视离散化:转换→可视分箱,分割点:所以想生成几组,就定义几个分割点;填写第一个分割点的时候就必须填写最小值;一定要选中上端点排除。 三。排序 1.转换→自动重新编码:不分组,从头到尾排序 2.转换→个案排秩(1)多层次数据:基于A变量对B变量进行排序。(例如,基于职称对收入进行排序,就是不同职称各自组内排工资的高低)(2)设置秩1;绑定值 四。时间序列:转换→变动值 五。查找与计数:转换→对个案内的值计数(查找“基本工资800-900女职工”,生成新变量,满足这个条件的标为1,不符合这个标准的标为0,男职工标为缺失。范围:包含上限下限) ●六。数据→个案排序:把变量顺序完全按照你想要的标准排序,所有的变量顺序都会改变 七。拆分文件:要分男女进行数据统计:数据→拆分文件→比较组/按组输出,分组依据。不分男女进行数据统计:数据→拆分文件→分析所有个案 八。选择个案(例如只选择三年级的变量进行分析):数据→选择个案→如果条件满足:如果;随机个案样本;基于时间或个案范围;使用过滤变量(例如要把身高为缺失值和值为0的剔除)→输出:过滤(不符合条件的数据会画上“/”,原始数据并未删除);将选定个案复制到新数据集(形成一个新的SPSS数据文件,原始数据并未删除);删除未选定的个案(删除原始数据,不建议使用)→之后在分析的时候就只会分析三年级的变量。不想只分析三年及,记得重新做这一步。 九。加权个案:数据→加权个案(例。100分的有5人)。不想加权了,记得重新做这一步。 十。分类汇总(1)例如算不同年级的人的身高的均值、方差…(只能计算函数)(2)数据→汇总,分界变量(分类标准变量),变量摘要(计算变量),函数:选择计算变量函数,变量名称与标签:定义新生成变量的名称与标签 ●十一。长宽数据的转换 1.长数据变宽数据:索引变量消失变成score的尾缀 (1)数据→重组(重构)→个案重组为变量,标识变量,索引变量,电脑会自动帮你选出是xx xx要重构(不同疗程值不同的变量)。选完上述这些之后就一直点下一步&完成&立即重构&确定即可 (2)注意:当有多个变量需要重构时要自己决定“新变量组的顺序”。(A1A2B1B2;A1B1A2B2) 2.宽数据变长数据:score的尾缀消失变成索引变量 (1)数据→重组(重构)→变量重组为个案,个案组标识:使用选定变量,固定变量(手动选择,电脑不会自动帮你选出了),要转置的变量即值不固定的要重构的变量(手动选择,电脑不会自动帮你选出了)。选完上述这些之后就一直点击下一步&完成&立即重构数据&确定就行了 (2)当有多个变量需要重构时,这块的操作要特别注意:○1首先在“变量组数目”中选择“多个”○2然后在“选择变量”里要对于不同的“目标变量”分别定义“要转置的变量”(在本题中,即对于kidid目标变量定义一遍要转置的变量;对于age目标变量在定义一遍要转置的变量。其中,这两个要转置的变量必须是完全不同的)。但只需要定义一次“个案组标识”&“固定变量”(固定变量是相对于kidid & age都固定的那些变量;而不是说在对kidid进行转置的时候,age就是固定变量了;因此,固定变量只用定义一次且固定变量可以为空)。并且,你要特别注意,“个案组标识”里选择的变量& n个“要转置的变量”里选择的变量&“固定变量”里选择的变量都必须是完全不相同的。

应用统计spss分析报告

应用统计s p s s分析报 告 TYYGROUP system office room 【TYYUA16H-TYY-TYYYUA8Q8-

学生姓名:肖浩鑫学号: 一、实验项目名称:实验报告(三) 二、实验目的和要求 (一)变量间关系的度量:包括绘制散点图,相关系数计算及显着性检验; (二)一元线性回归:包括一元线性回归模型及参数的最小二乘估计,回归方程的评价及显着性检验,利用回归方程进行估计和预测; (三)多元线性回归:包括多元线性回归模型及参数的最小二乘估计,回归方程的评价及显着性检验等,多重共线性问题与自变量选择,哑变量回归; 三、实验内容 企业编号产量(台)生产费用(万 元)企业编号产量(台)生产费用(万 元) 1 40 130 7 84 165 2 42 150 8 100 170 3 50 155 9 116 167 4 5 5 140 10 125 180 5 65 150 11 130 175 6 78 154 12 140 185 (2)计算产量与生产费用之间的线性相关系数,并对相关系数的显着性进行检验(),并说明二者之间的关系强度。 2. 下面是7个地区2000年的人均国内生产总值(GDP)和人均消费水平的统计数 地区人均GDP(元)人均消费水平(元) 北京22460 7326 辽宁11226 4490 上海34547 11546 江西4851 2396 河南5444 2208 贵州2662 1608 陕西4549 2035 (2)人均GDP作自变量,人均消费水平作因变量,利用最小二乘法求出估计的回归方程,并解释回归系数的实际意义。

(3)计算判定系数和估计标准误差,并解释其意义。 (4)检验回归方程线性关系的显着性() (5)如果某地区的人均GDP为5000元,预测其人均消费水平。 (6)求人均GDP为5000元时,人均消费水平95%的置信区间和预测区间。 3. 随机抽取10家航空公司,对其最近一年的航班正点率和顾客投诉次数进行调查, 航空公司编号航班正点率(%)投诉次数(次) 1 21 2 58 3 85 4 68 5 74 6 93 7 72 8 122 9 18 10 125 系数的意义。 (2)检验回归系数的显着性()。 (3)如果航班正点率为80%,估计顾客的投诉次数。 4. 某汽车生产商欲了解广告费用(x)对销售量(y)的影响,收集了过去12年的有关数据。通过计算得到下面的有关结果: 变差来源df SS MS F Significance F 回归 残差—— 总计11——— Coefficients标准误差t Stat P-value Intercept X Variable 1 (2)汽车销售量的变差中有多少是由于广告费用的变动引起的? (3)销售量与广告费用之间的相关系数是多少? (4)写出估计的回归方程并解释回归系数的实际意义。 (5)检验线性关系的显着性(a=)。 5. 随机抽取7家超市,得到其广告费支出和销售额数据如下

spss实践题分析及答案(二)

期末实践考查 一、一家消费者调查有限公司,它为许多企业提供消费者态度和消费者行为的调查。在一项研究中,客户要求调查消费者的消费特征,此特征可以用来预测用户使用信用卡的支付金额。研究人员收集了50位消费者的年收入、家庭人口和每年使用信用卡支付的金额数据。试按照客户要求进行分析,给出分析报告(数据见附表)。 Descriptive Statistics Mean Std. Deviation N 消费金额(元)3964.06933.49450 年收入(元)43480.0014550.74250 家庭人口(人) 3.42 1.73950 Correlations 消费金额(元)年收入(元)家庭人口(人)Pearson Correlation消费金额(元) 1.000.631.753 年收入(元).631 1.000.173 家庭人口(人).753.173 1.000 Sig. (1-tailed)消费金额(元)..000.000 年收入(元).000..115 家庭人口(人).000.115. N消费金额(元)505050 年收入(元)505050 家庭人口(人)505050 Model Summary b Model R R Square Adjusted R Square Std. Error of the Estimate

1 .909a .826 .818 398.091 ANOVA b Model Sum of Squares df Mean Square F Sig. 1 Regression 35250755.672 2 17625377.836 111.218 .000a Residual 7448393.148 47 158476.450 Total 42699148.820 49 Coefficients a Model Unstandardized Coefficients Standardized Coefficients t Sig. B Std. Error Beta 1 (Constant) 1304.905 197.655 6.602 .000 年收入(元) .033 .004 .516 8.350 .000 家庭人口(人) 356.296 33.201 .664 10.732 .000 结果分析:由题目可知客户要求,是根据消费者年收入、家庭人口来预测其每年使用信用卡支付的金额数据,属于多元线性回归问题,其中年收入和家庭人口 看作两个自变量,每年信用卡支付金额看作因变量。 由分析得: 121304.9050.033356.296y x x =++ y :信用卡支付金额 1x :年收入 2x :家庭人口

《统计分析与SPSS的应用(第五版)》课后练习标准答案(第8章)

《统计分析与SPSS的应用(第五版)》课后练习答案(第8章)

————————————————————————————————作者:————————————————————————————————日期:

《统计分析与SPSS的应用(第五版)》(薛薇) 课后练习答案 第8章SPSS的相关分析 1、对15家商业企业进行客户满意度调查,同时聘请相关专家对这15家企业的综合竞争力进行评分,结果如下表。 编号客户满意度得分综合竞争力得分编号客户满意度得分综合竞争力得分 1 90 70 9 10 60 2 100 80 10 20 30 3 150 150 11 80 100 4 130 140 12 70 110 5 120 90 13 30 10 6 110 120 14 50 40 7 40 20 15 60 50 8 140 130 请问,这些数据能否说明企业的客户满意度与其综合竞争力存在较强的正相关,为什么? 能。步骤:(1)图形→旧对话框→散点/点状→简单分布→进行相应设置→确定;(2)再双击图形→元素→总计拟合线→拟合线→线性→确定

(3)分析→相关→双变量→进行相关项设置→确定 相关性 客户满意度得分综合竞争力得分客户满意度得分Pearson 相关性 1 .864** 显著性(双尾).000 N 16 15 综合竞争力得分Pearson 相关性.864** 1 显著性(双尾).000 N 15 15 **. 在置信度(双测)为 0.01 时,相关性是显著的。 两者的简单相关系数为0.864,说明存在正的强相关性。

2、为研究香烟消耗量与肺癌死亡率的关系,收集下表数据。(说明:1930年左右几乎极少的妇女吸烟;采用1950年的肺癌死亡率是考虑到吸烟的效果需要一段时间才可显现)。 国家1930年人均香烟消耗量1950年每百万男子中死于肺癌的人数 澳大利亚480 180 加拿大500 150 丹麦380 170 芬兰1100 350 英国1100 460 荷兰490 240 冰岛230 60 挪威250 90 瑞典300 110 瑞士510 250 美国1300 200 绘制上述数据的散点图,并计算相关系数,说明香烟消耗量与肺癌死亡率之间是否存在显著的相关关系。 香烟消耗量与肺癌死亡率的散点图(操作方法与第1题相同) 相关性 人均香烟消耗死于肺癌人数 人均香烟消耗Pearson 相关性 1 .737** 显著性(双尾).010 N 11 11 死于肺癌人数Pearson 相关性.737** 1

spss统计分析报告

目录 一、研究背景及其意义 (3) 二、研究方案 (3) 研究目标 (3) 研究内容 (4) 研究方法 (4) 三、科学技术与经济发展的关系分析 (4) 科技投入 (4) 科技产出 (5) 经济发展 (7) 小结 (7) 四、科学技术与经济发展的模型分析 (8) 模型假设 (8) 符号说明 (8) 信度与相关性分析 (8) 因子分析 (9)

回归分析 (10) 五、结论 (13) 附录: (14) 科学技术与经济发展的关系 一、研究背景及其意义 十九大报告指出:创新是引领发展的第一动力,是建设现代化经济体系的战略支撑。要瞄准世界科技前沿,强化基础研究,实现前瞻性基础研究、引领性原创成果重大突破。加强应用基础研究,拓展实施国家重大科技项目,突出关键共性技术、前沿引领技术、现代工程技术、颠覆性技术创新,为建设科技强国、质量强国、航天强国、网络强国、交通强国、数字中国、智慧社会提供有力支撑。加强国家创新体系建设,强化战略科技力量。深化科技体制改革,建立以企业为主体、市场为导向、产学研深度融合的技术创新体系,加强对中小企业创新的支持,促进科技成果转化。倡导创新文化,强化知识产权创造、保护、运用。培养造就一大批具有国际水平的战略科技人才、科技领军人才、青年科技人才和高水平创新团队。 而科技作为创新的重要引领者和实践者,对于建设创新型国家起着重要作用。科技进步是经济发展与社会发展的强大推动力。邓小平同志曾指出;"科学技术是第一生产力";江泽民同志也曾指出:"科学技术是第一生产力,而且是先进生产力的集中体现和主要标志。科学技术的突飞猛进,给世界生产力和人类经济发展带来了极大的推动,未来的科学发展还将产生新的重大飞跃"。在当今这个信息化和全球化加速的时代,科技进步对经济社会发展的促进作用越来越显着,科技进步成为生产力水平的首要决定因素,是国家或区域竞争力的重要源泉。近年来,随着我国经济增长方式的转变,科技支撑和引领经济社会发展的作用越来越强,无论是国家还是区域都需要通过依靠科技进步来促进经济社会发展。科技进步考核有效地促进了科教兴国、可持续发展和人才强国战略的落实,使科技促进经济杜会发展的能力逐步提升。

spss期末考试上机复习题(含答案)75709

江苏理工学院2017—2018学年第1学期 《spss软件应用》上机操作题库 1.随机抽取100人,按男女不同性别分类,将学生成绩分为中等以上及中等以下两类,结果 如下表。问男女生在学业成绩上有无显著差异? 中等以上中等以下 男 女 性别* 学业成绩交叉制表 计数 学业成绩 中等以上中等以下 合计 性别男23 17 40 女38 22 60 合计61 39 100 根据皮尔逊卡方检验,p=0.558〉0.05 所以男生女生在学业成绩上无显著性差异。 2.为了研究两种教学方法的效果。选择了6对智商、年龄、阅读能力、家庭条件都相同的儿童进行了实验。结果(测试分数)如下。问:能否认为新教学方法优于原教学方法(采用非参数检验)? 序号新教学方法原教学方法 1 83 78

2 3 4 5 6 69 87 93 78 59 65 88 91 72 59 答:由威尔逊非参数检验分析可知p=0.08〉0.05,所以不能认为新教学方法显著优于原教学方法。 3.下面的表格记录了某公司采用新、旧两种培训前后的工作能力评分增加情况,分析目的是比较这两种培训方法的效果有无差异。考虑到加盟公司时间可能也是影响因素,将加盟时间按月进行了记录。 方法加盟时间分数方法加盟时间分数 旧方法 1.5 9 新方法 2 12 旧方法 2.5 10.5 新方法 4.5 14 旧方法 5.5 13 新方法7 16 旧方法 1 8 新方法0.5 9 旧方法 4 11 新方法 4.5 12 旧方法 5 9.5 新方法 4.5 10 旧方法 3.5 10 新方法 2 10 旧方法 4 12 新方法 5 14 旧方法 4.5 12.5 新方法 6 16 (1)分不同的培训方法计算加盟时间、评分增加量的平均数。 (2)分析两种培训方式的效果是否有差异? 答:(1) 描述统计量 N 极小值极大值均值标准差 培训方法 = 1 (FILTER) 9 1 1 1.00 .000 加盟时间9 .50 7.00 4.0000 2.09165 分数增加量9 9.00 16.00 12.5556 2.60342 有效的 N (列表状态)9 所以新方法的加盟时间平均数为4 分数增加量的平均数为12.5556

《统计分析与SPSS的应用(第五版)》课后练习答案.doc (1)

《统计分析与SPSS的应用(第五版)》课后练习答案 第一章练习题答案 1、SPSS的中文全名是:社会科学统计软件包(后改名为:统计产品与服务解决方案) 英文全名是:Statistical Package for the Social Science.(Statistical Product and Service Solutions) 2、SPSS的两个主要窗口是数据编辑器窗口和结果查看器窗口。 ●数据编辑器窗口的主要功能是定义SPSS数据的结构、录入编辑和管理待分析的数据; ●结果查看器窗口的主要功能是现实管理SPSS统计分析结果、报表及图形。 3、SPSS的数据集: ●SPSS运行时可同时打开多个数据编辑器窗口。每个数据编辑器窗口分别显示不同 的数据集合(简称数据集)。 ●活动数据集:其中只有一个数据集为当前数据集。SPSS只对某时刻的当前数据集 中的数据进行分析。 4、SPSS的三种基本运行方式: ●完全窗口菜单方式、程序运行方式、混合运行方式。 ●完全窗口菜单方式:是指在使用SPSS的过程中,所有的分析操作都通过菜单、按 钮、输入对话框等方式来完成,是一种最常见和最普遍的使用方式,最大优点是简 洁和直观。 ●程序运行方式:是指在使用SPSS的过程中,统计分析人员根据自己的需要,手工 编写SPSS命令程序,然后将编写好的程序一次性提交给计算机执行。该方式适用 于大规模的统计分析工作。 ●混合运行方式:是前两者的综合。 5、.sav是数据编辑器窗口中的SPSS数据文件的扩展名 .spv是结果查看器窗口中的SPSS分析结果文件的扩展名 .sps是语法窗口中的SPSS程序 6、SPSS的数据加工和管理功能主要集中在编辑、数据等菜单中;统计分析和绘图功能主要集中在分析、图形等菜单中。 7、概率抽样(probability sampling):也称随机抽样,是指按一定的概率以随机原则抽取样本,抽取样本时每个单位都有一定的机会被抽中,每个单位被抽中的概率是已知的,或是可以计算出来的。概率抽样包括简单随机抽样、系统抽样(等距抽样)、分层抽样(类型抽样)、整群抽样、多阶段抽样等。 ●简单随机抽样(simple random sampling):从包括总体N个单位的抽样框中随机地 抽取n个单位作为样本,每个单位抽入样本的概率是相等的。是最基本的抽样方法,是其它抽样方法的基础。优点:简单、直观,在抽样框完整时,可直接从中抽取样 本,用样本统计量对总体参数进行估计比较方便。局限性:当N很大时,不易构造 抽样框,抽出的单位很分散,给实施调查增加了困难。 ●分层抽样(stratified sampling):将抽样单位按某种特征或某种规则划分为不同 的层,然后从不同的层中独立、随机地抽取样本。优点:保证样本的结构与总体的 结构比较相近,从而提高估计的精度,组织实施调查方便(当层是以行业或行政区 划分时),既可以对总体参数进行估计,也可以对各层的参数进行估计。 ●整群抽样(cluster sampling):将总体中若干个单位合并为组(群),抽样时直接抽 取群,然后对选中群中的所有单位全部实施调查。优点:抽样时只需群的抽样框, 可简化工作量;调查的地点相对集中,节省调查费用,方便调查的实施。缺点:估

相关文档