利用Excel和SPSS进行统计分组和绘图(第三章统计整理上机部分教案)本章需要掌握的内容:(1)利用Excel和SPSS进行统计分组和绘图;
(2)掌握函数Frequency(data_array,bins_array),掌握“插入图表”法和“直方图”统计工具绘制图形的具体操作步骤。
(3)掌握SPSS“分析”→“频率”→点击“图表”按钮和“图形”菜单绘制图形的方法。掌握SPSS的频次分布表的计算方法。
(4)通过实际例子的操作,了解spss中数据的转化,值标签的设置等基本操作知识。
函数介绍:函数Frequency(data_array,bins_array)
的功能是以一列垂直数组返回某个区域中数据的频率分布。其中data_array为一个数组或对一组数值的引用,用来计算频率。bins_array为间隔的数组或对间隔的引用,该间隔用于对data_array中的数值进行分组。
以下是上机练习部分:
说明:以下各个上机练习,都要求做到:能够利用软件输出频次分布表和相应的图。
练习1:住户用水量的频率分布
任务:利用Excel和SPSS对住户用水量进行统计分组和绘图
原始文件:\第三章统计整理\使用直方图分析数据频率分布(住户用水量)\住户用水量记录.xlsx
\第三章统计整理\使用直方图分析数据频率分布(住户用水量)\住户用水量的频率分布(数据).sav
最终文件:\第三章统计整理\使用直方图分析数据频率分布(住户用水量)\使用直方图分析用水量频率分布情况.xlsx
\第三章统计整理\使用直方图分析数据频率分布(住户用水量)\住户用水量的频率分布(数据).spv
第一种方法:先利用FREQUENCY计算频率,在利用“插入”→“图表”绘图。
一些关键步骤:
01:打开住户用水量记录.xlsx文
件。选中G2:G6单元格,“插入”→“函
数”→“FREQUENCY”。
02:打开“FREQUENCY函数参数对话
框“,进行有关设置。
data_array: C2:C49
bins_array :F2:F6
如右图所示。
03:同时按下Ctrl+Shift+Enter
04: “插入”→“图表”→“柱形图(第一个样式)”,进入“图表4步骤之2图表源数据”对话框。进行相关设置。
数据区域:=Sheet3!$G$2:$G$6
点一下“系列”,在分类(X)轴标志(T)设置为“=Sheet3!$F$2:$F$6”
05:“下一步”,进入有关标题设置对话框。
图表标题:“使用直方图说明用水量频数分布情况”
分类X轴:用水量阶段上限值
数值Y轴:用水量频率
06:“下一步”→“完成”。
07:右击直方图所在图表区域,选择“图表选项”进行相关设置和美化图表。:第二种方法:直接运用“直方图”分析工具进行操作
知识点:使用“直方图”分析工具计算数据的频率分布
主要步骤:
Step1:打开第三章统计整理\使用直方图分析数据频率分布\住户用水量记录.xlsx 文件。然后在“工具”选项卡中单击“数据分析”按钮。打开“数据分析”对话框。
Step2:数据分析”对话框中的“分析工具”一栏中选中“直方图”选项,按“确定”按钮。从而打开“直方图”对话框。
Step3:在“直方图”对话框设置如下:
“输入区域”:$C$2:$C$49。即原始数据所在区域。
“接收区域”:$F$2:$F$16。即分段值所在区域。
勾选“累积百分率”和“图表输出”复选框。
Step4:单击“确定”按钮。
Step5:右击直方图所在图表区域,选择“图表选项”进行相关设置和美化图表。
问题:为什么X轴的分段值不是“0-4.99,3-9.99,10-14.99…..”,怎样解决?
解决方案:右击直方图所在图表区域,选择“源数据”,在分类(X)轴标志(T)上设置为“$E$26:$E$30”。
第三种方法:利用SPSS进行统计分组和绘图
一些关键步骤:
01:打开住“户用水量记录.sav”文件。
02:“转化”→“X-Y重新编码为不同变量”,进入“重新编码为其他变量”对话框。把“用水量”通过右向箭头选到对话框右侧,在“输出变量名称”中输入“用水量分组”,单击更改按钮。
03:单击“旧值和新值”按钮,进入“重
新编码到其他变量:旧值和新值”对话框。然
后进行如右图所示设置。(其实就是设置各组的
组限)按“继续”按钮→“确定”。可以发现
在“数据编辑器”中多出了一列名为“用水量
分组”的变量。
04:点击右下角的“变量视图”,在“值”一列中进行值标签的设置。具体见下图。
05:回到“数据视图”,点击“分析”→
“频率”→进入“频率”对话框。
点击“图表”按钮,选择“条形图”。按“继续”→“确定”。统计的频次分布表和分布图都会在“查看器中显示。
06:回到“数据视图”后,也可以点击“图形”→“旧对话框”→“条形图”,进入“条形图“对话框。
将“用水量分组”变量右向到“分类轴(X)”中。如下图。按“确定”。
练习2:某商场家电柜组售后服务质量分布表、条形图
原始文件:第三章统计整理\练习2某商场家电柜组售后服务质量(定性(顺序数据))\某商场家电柜组售后服务质量(原始数据).xls
第三章统计整理\练习2某商场家电柜组售后服务质量(定性(顺序数据))\某商场家电柜组售后服务质量(原始数据).sav
最终文件:第三章统计整理\练习2某商场家电柜组售后服务质量(定性(顺序数据))\某商场家电柜组售后服务质量(结果).spv
题目:
某商场为了评价家电柜组的售后服务质量,随机抽取了100个家庭构成的一个样本,服务质量的等级分布表示为:A:好;B:较好;C:一般;D:差;E:较差。
问题:
(1)指出上面的数据属于什么类型?
(2)制作一张频数分布表。
(3)绘制一张条形图,反映服务质量的分布。
问题(1)答案:该数据为离散数据
问题(2)和问题(3)实际操作过程如下:
(一)某商场家电柜组售后服务质量分布表
第一步,制作频数分布表
表某商场家电柜组售后服务质量频数分布表
第二步,登记频数。登记的符号有“正”或者是“”。
表某商场家电柜组售后服务质量频数分布表
总结:频数分布表是对杂乱无序的数据进行整理的重要手段。通过频数分布表可以直观地看出各种数据出现的次数,以及分布的状态,数据集中的趋势和差异情况。
(二)某商场家电柜组售后服务质量条形图
第一步,作横轴。首先以“表某商场家电柜组售后服务质量频数分布表”第(1)列的ABCDE
置于横轴。作图时,须在横轴的两端至少各空出一个组距的位置。
第二步,作纵轴。标明尺度及其单位,尺度从0标至最大一组频数。
第三步,在纵轴上定出各组频数高度,并在各组频数高度处划一横线与各组上、下限上的两条纵线相交,形成一个矩形。注意,由于横轴上各组组距是连续的,故各矩形之间不能留空隙。最终结果如下图:
第二种方法、利用Excel (上机)
(一)利用Excel 统计函数FREQUENCY 生成频数分表 第一步,整理数据。如下图。
第二步,在数据右列建立一个“表某商场家电柜组售后服务质量频数分布表”。如下图。
第三步,利用Excel统计函数FREQUENCY生成频数分布表。
备注:(1)首先运用查找替换命令将ABCDE替换为12345。
(2)运用FRE函数建立频数分布表。
(3)注意:按Shift+Ctrl+Enter组合键,将频数记入指定的单元格中。(回车键无效)
(二)利用“频数分布表”绘制条形图
本部分操作需要Excel数据分析工具的安装。或者用插入→图表→柱形图→第二个样式。(因为条形图没有这个样例)
第一步: 插入→图表→柱形图→第二个样式。
第二步:图标选项
第三步:对图标进行修饰,美化。
第四步:最终效果
第三种方法、利用SPSS(上机)
方法1:分析→描述统计→123(F)
第一步,分析→描述统计→频数(F)→条形图
第二(1)步,在结果输出查看器中美化条形图。打开图表编辑器。见下图。
第二(2)步,鼠标不点击任何位置和图形的情况下,点击“显示数据标签”按钮。如下图。
第二(3)步,在数据值标签中进行编辑。
备注:“显示数据标签”按钮的点击可以决定图形中是否显示数据标签。
最终结果如下图:
备注:有关数据标签:在条形图中直条的顶端和下端不要注写数字,即不显示数据标签。在SPSS 结果输出中,默认的也是不显示。但现实工作中,好多人又要求看到,所以要根据实际情况来定到底显示不显示。
方法2:图形→条形图
练习3:销量排名和分段统计
原始文件:统计方法应用各章教案\第三章统计整理\练习3销量排名和分段统计1\销量排名和分段统计1.xlsl
统计方法应用各章教案\第三章统计整理\练习3销量排名和分段统计1\销量排名和分段统计.sav
练习4 见文件夹具体操作步骤略
练习5 见文件夹具体操作步骤略
练习6 见文件夹具体操作步骤略
利用Excel和SPSS进行统计分组和绘图(第三章统计整理上机部分教案)
在完成本节上机操作过程中,除需要掌握的统计理论知识外,还需要掌握以下几个基本知识点才能在操作中游刃有余。
知识点1:5个EXCEL统计函数
?函数名称:MAX
主要功能:求出一组数中的最大值。
使用格式:MAX(number1,number2……)
参数说明:number1,number2……代表需要求最大值的数值或引用单元格(区域)。
应用举例:输入公式:=MAX(E44:J44,7,8,9,10),确认后即可显示出E44至J44单元和区域和数值7,8,9,10中的最大值。
特别提醒:如果参数中有文本或逻辑值,则忽略。
?函数名称:LARGE
主要功能:返回数据组中第K个最大值。
使用格式:Large(array,K)
?函数名称:MIN
主要功能:求出一组数中的最小值。
使用格式:MIN(number1,number2……)
参数说明:number1,number2……代表需要求最小值的数值或引用单元格(区域)。
应用举例:输入公式:=MIN(E44:J44,7,8,9,10),确认后即可显示出E44至J44单元和区域和数值7,8,9,10中的最小值。
特别提醒:如果参数中有文本或逻辑值,则忽略。
?函数名称:SMALL
主要功能:返回数据组中第K个最小值。
使用格式:Amall(array,K)
?函数名称:SUM
主要功能:计算所有参数数值的和。
使用格式:SUM(Number1?Number2……)
参数说明:Number1、Number2……代表需要计算的值,可以是具体的数值、引用的
单元格(区域)、逻辑值等。
知识点2:如何在一个图表中同时绘制直方图和累积频次图???
利用“销量排名和分段统计”文件进行讲解:
原始文件件见在:\统计方法应用\统计方法应用各章教案\第三章统计整理\练习3销量排名和分段统计1
第一步: 插入→图表→柱形图→第一个样式。
第二步:数据区域:“=分段统计结果!$D$8:$D$16,分段统计结果!$G$8:$G$16”,即选择次数和向上累积频率两列数据。
第三步:分类(X)轴标志“=分段统计结果!$B$8:$B$16”。
第四步:“完成”
第五步:点中图形中的系列2,右击,图表类型,选择“折线图”,确定。
第六步:双击图形中的折线,出现“数据系列格式”对话框,坐标轴:次坐标轴。