文档库 最新最全的文档下载
当前位置:文档库 › 体育统计与SPSS读书笔记

体育统计与SPSS读书笔记

体育统计与SPSS读书笔记
体育统计与SPSS读书笔记

体育统计与SPSS读书笔记(一)——几个基本概念的简单理解

在学习体育统计和SPSS前我们先来了解统计学上的几个基本概念:

1. 总体和样本。

总体:简单来说就是研究对象的全体数据。

样本:从总体里抽取的部分研究对象。

一般在实验中,总体数据很难获取或总体数据太大,不好做实验,所以抽取样本来做实验,并用样本资料推断总体的特征。

2.算术平均数

这个概念应该大家都很清楚。

3.标准差

标准差有总体标准差和样本标准差,这里只说样本标准差。

样本标准差可以理解为样本数据与平均数的离散程度,用s表示根据定义,标准差的公式应该为

∑(x- ),也就是每个样本数据与平均数相减,然后再求和,不过这样算的结果不难发现离差和始终为0。于是提出了∑|x-|;也就是相减后取绝对值,但这样运算很不方便,于是便有了∑(x-)。对

于不同组别样本含量相同时用该公式能正确反映组别的离散程度,但对于样本含量不同的组别来说,这个公式又不对了,于是又有了:

不过统计学中已证明了用n做分母所得到的样本标准差s在估计总体标准

差时,有偏估计量,并且又证明了用n-1做分母才是无偏估计量,所以样本标准差的公式为

其中n-1称为自由度。

举个简单的例子来说说标准差:

现有2名标枪运动员在竞赛内10次专项成绩如下:

甲:40.50,41.26,40.44,39.62,40.12,42.10,39.84,40.18,38.70,39.54

乙:40.48,42.88,40.50,39.50,38.00,43.32,38.72,41.82,36.84,40.24

请判定他们的成绩稳定性。

通过计算得到X平均甲=40.23m,s甲=0.945mX平均乙=40.23m,s乙=2.07ms乙>s甲

说明甲运动员的稳定性高于乙运动员

体育统计与SPSS读书笔记(二)——正态分布

正态分布也叫常态分布,在我们后面说的很多东西都需要数据呈正态分布。下面的图就是正态分布曲线,中间隆起,对称向两边下降。

下面我们来看一组数据,并检验“期初平均分”数据是否成正太分布(此数据已在SPSS里输入好)

在SPSS里执行“分析—>描述统计—>频数统计表”(菜单见下图,英文版的可以找到相应位置),然后弹出左边的对话框,变量选择左边的“期初平均分”,再点下面的“图表”按钮,弹出图中右边的对话框,选择“直方图”,并选中“包括正态曲线”

设置完后点“确定”,就后会出来一系列结果,包括2个表格和一个图,我们先来看看最下面的图,见下图,

上图中横坐标为期初平均分,纵坐标为分数出现的频数。从图中可以看出根据直方图绘出的曲线是很像正态分布曲线。如何证明这些数据符合正态分布呢,光看曲线还不够,还需要检验:

检验方法一:看偏度系数和峰度系数

我们把SPSS结果最上面的一个表格拿出来看看(见下图):

偏度系数Skewness=-0.333;峰度系数Kurtosis=0.886;两个系数都小于1,可认为近似于正态分布。

检验方法二:单个样本K-S检验

在SPSS里执行“分析—>非参数检验—>单个样本K-S检验,弹出对话框,检验变量选择“期初平均分”,检验分布选择“正态分布”,然后点“确定”。

检验结果为:

从结果可以看出,K-S检验中,Z值为0.493,P值(sig 2-tailed)=0.968>0.05,因此数据呈近似正态分布

检验方法三:Q-Q图检验

在SPSS里执行“图表—>Q-Q图”,弹出对话框,见下图:

变量选择“期初平均分”,检验分布选择“正态”,其他选择默认,然后点“确定”,最后可以得到Q-Q 图检验结果,结果很多,我们只需要看最后一个图,见下图。

QQ Plot 中,各点近似围绕着直线,说明数据呈近似正态分布。

体育统计与SPSS读书笔记(三)—

标准正态分布及深度理解汪晓赞老师关于等级评价标准的制订

在前面的学习中,说了正态分布及如何检验数据呈正态分布。不过在实际的研究工作过程,为了尽可能的简化和使用方便,引入了“标准正太分布”这一概念。标准正态分布是正态分布经过转换而来的。

上面的图是从网上找的,有文字说明,文字说明看不懂可以不去理会。先看看最上面的图,这是一个标准正态分布曲线图,先来看看它的一些特征:

1.横坐标变量为u,且在曲线最高点处,u=0。

2.u与正态分布曲线横坐标x的关系为(样本资料):

u=(x-)/s

3.从(-∝,+ ∝),曲线下面所围的面积为1(也可以说是概率)

说到标准正态分布,还需要知道“正态分布表”。这是前人已经根据公式计算出来各个数值形成的一个表(该表为公开表,网上很容易可以找到)。用来通过u值来查找标准正态分布曲线下某一区间的面积或者根据已知的面积来查找相关的u值。

明白了上面的一些概念后,我们再来看下面的图。下面的图是一个标准正态分布图,已知u 值为1.52,求u值不超过1.52的概率,也就是求(-∝,1.52)这个区间曲线所围成的面积(图中阴影部分)。查正态分布表,在最左边的u值找到1.5,上面的u值找到0.02,然后得到对应的数值为0.9357,也就是所围成的面积为0.9357

其实若把上个例子中反过来做,也就是已只阴影部分的面积为0.9357,求u值。也是查正态分布表,在表中间的数据区域找到与0.9357相等或最接近的数值,然后分别找到表中左边的u值和上面的u 值,相加就得到了我们要求的u值。

有了上面的概念后,我们再来理解汪晓赞老师有关等级评价标准的制定就容易多了(在未学统计前我

也是看了多遍也看不懂)。下面的图是汪晓赞老师有关等级标准制订的方法。

现在我们运用前面说的来深入理解下。确认在理想模式下,所有学生(指总体)踢毽子的成绩可以认为服从正态分布。然后根据需要,把踢毽子各个等级的比例(或者说概率) 定为10%,20%,30%,32%,8%,这里的比例实际在标准正态分布曲线里表示的就是面积,分别为0.1,0.2,0.3,0.32,0.8,相加即为(-∝,+∝)曲线的面积1。现在各个区域的面积都知道了,我们要把曲线上对应的u1,u2,u3,u4求出来。

因为正态分布里给出的数值都是从-∝到某个u值所围成的面积,所以u1的左边的面积为0.9,查表可以得到u左边的值取1.2,上面的值取0.08,相加即得到u1=1.28;u2左边的面积为0.7,查表可以得到u2=0.52.

U3,u4在曲线峰值的左边,也就是u3,u4为负值,但正态分布表只能查到正值。所以我们需要根据正态分布曲线左右两边对称的原理,分别再设两个点,一个是与u3的对称点u5,一个是与u4对称的点u6,然后仔细观看,不难发现u3右边的面积应该与u5左边的面积相等,u4右边的面积应该与u6左边的面积相等。所以u5的面积为0.1+0.2+0.3=0.6,u6的面积为1-0.08=1.92,然后可以求得u5=0.25,u6=1.41,根据对称原理,中间为0,那么u3=-0.25,u4=-1.41。这样我们就把4个u值全部求出来了。

前面我们也说了u与x的转换公式u=(x-)/s,得到x=us+,根据已经算好了的为52.3021,S

为15.7751及各个u值带入上面的公式,即可得到最后的等级标准。

说明一下:

1. 上面说的是五个等级,你也可以根据现在普遍的形式设置成优、良、及格、不及格。各自所占的比重也可以根据自己的需要设置,只要在标准正态分布曲线上标注好,就可以很容易的查正态分布表

得到相应的标准。

2. 根据我个人的理解及查阅相关资料,此方法应该不叫“离差法”,离差法应该是个体的数值与均值或均值再加减一至两个标准差进行比较来判断等级。关于此问题,看来以后还得向汪老师请教

体育统计与SPSS读书笔记(四)—样本正态分布检验及变量标准化

由于我也是一边学一边写的,学得越多,就会发现前面说的有遗漏的地方或说错了的地方。如果有发现有遗漏的地方或说错的地方,我将在当天的读书笔记中补充,而不在以前写的地方改了。

关于样本是否需要进行正态分布检验?

今天秦海权问我,对于样本进行t检验前是否要检查样本呈正态分布。查了下相关资料,这里补充下样本的正态分布检验。正态分布检验有两个定理:

1. 正态分布再生定理。如果变量X 服从于其总体平均数为μ 、总体标准差为σ 的正态分布,即总体变量X服从正态分布N(μ,σ 2 ),则从这个总体中抽取容量为n 的样本平均数x也服从于正态分布。简单的说就是如果总体为正态分布,那么从总体中抽取的样本也为正态分布。

2. 中心极限定理。可以理解为总体变量的分布通常是不知道,样本平均数分布是否接近于正态,或接近到什么程度,起决定作用的因素是样本容量n。样本容量n 越大,样本平均数的分布也越接近正态。一般认为样本单位数不少于30 的是大样本,抽样分布就接近于正态分布。

t检验为假设检验,在统计假设检验中,当总体的标准差σ 未知,而需要用样本标准差S来代替时,则统计量t再不是服从标准正态分布,而服从于另一种概率分布,称为t 分布。t分布是假定样本取自正态总体。所以对于t检验的样本不需要进行正态分布检验。

关于总体和样本的理解,是必须要理解透的,否则后面做分析的时候就容易出现误区,关于总体和样本的理解我也还没理解透,等我完全理解后再补上。

变量标准化

举个例子,我们现在在为子课题学校处理数据,其中就有一项是分析各子课题学校的体能数据,而体能数据包括多项如:100米,1000米/800米,立定跳远等,由于各体能数据单位不同,所以我们必须先查标准求出每个体能项目的分数,然后再求出体能的平均分。在求体能平均分的时候,我们将要花费比分析数据更多的时间。不过在统计学里,却有着另外的统一变量的方法。

1.U分法(或者也叫变量标准化)

U分法就是把变量转换成标准正态分布的横轴变量u的一种统一单位的方法。这种方法又叫变量标准化。公式就是我们在前面所说的u变量的公式:

u=(x- )/s

我们只要求出每个体能项目的平均分和标准差s,代入上面的公式就可以把不同单位的体能变量转化成统一单位的U变量。从而可以进行相加求平均。

2.Z分法

根据正态分布理论,以插值的方式建立的一种统一变量单位的方法。公式为

(正向计分为加,如跳远等,反向计分为减如跑步等)

3.累进计分法

运动水平越高,成绩上升一个单位的难度越大。累进记分的分数是与运动成绩提高的难度相适应的。

累进记分法的公式

汪晓赞老师关于制定绝对分数标准的方法用的就是该方法。详细的可查看汪老师的博士论文关于评价标准的制订部分

体育统计与SPSS读书笔记(五)—假设检验

整群抽样和多段抽样

整群抽样,将总体按照某种标准划分成一些子群体,每个子群体作为一个抽样单位,用随机的方法从总体中抽取若干子群,将抽中的子群中的所有单位集合起来,构成总体的样本。比如说想检验某个新的教学方法是否有效果,随机抽取一个试验班和一个对照班做试验。

多段抽样,首先采用整群抽样的方法,从总体中抽取若干个子群;然后,再从抽中的子群中抽取低一级子群,这样逐次往下经过多阶段的抽样,直到最终抽出所需样本。比如说想检验某个新的教学方法是否有效果,且对不同的年级是否有不同的效果,先抽取几个不同的年级,然后每个年级抽取一个试验班和一个对照班做试验。

小概率和显著性水平α

在统计学里,一般将0.05定位小概率的标准,0.01定为非常小概率的标准, 用α表示显著性水平,α 所对应的概率度称显著性水平α 的临界值。下面的图是标准正态分布曲线下α=0.05的临界值为1.96,也就是大于临界值1.96的事件称为小概率事件.。

双侧检验和单侧检验

双侧检验:当我们所关心的问题是要检验样本均值与总体均值有没有显著性差异,而不问差异的方向是正差或负差,应该采用双侧检验。见上图的两个阴影部分。

单侧检验:当我们所关心的问题是总体均值是否低于或高于预先假设(方向性已经确定),应该采用左或右单侧检验。

假设检验的基本思想

在实际研究中,样本统计量之间或样本统计量与总体参数之间一般是存在偏差的,造成这种偏差的原因有两种:一是抽样误差(同总体);二是非抽样误差(不同总体),假设检验就是要依据小概率时间原理来判断上述偏差究竟是哪种造成的,若是抽样误差造成的概率很小的话(p<0.05),则认为该偏差是由于不同的总体造成的,反之就是由于非抽样误差造成的。

(理解下同一总体下的样本,表示各方面的特征的差异性不显著。不同总体下的样本,表示特征的差异具有显著性)。

t 分布

在前面也简要说了下t分布,这里再补充下,t分布与正态分布有点相似,曲线单峰且左右对称,横轴上方曲线下方的面积为1,横轴为曲线的渐进线,t分布受自由度的影响n-1,单自由度无限增大时,t分布无限接近正态分布。

t检验

t检验主要用于样本之间均数或样本与总体均数之间的检验

t检验的SPSS的用法在热点沙龙里做了讲解,这里不再讲述如何用SPSS进行t检验。这里主要说说SPSS里几个主要t检验的使用范围:

独立样本t检验,适用于两个独立样本均数的检验。比如说不同教学法产生的效果,实验班用新教学法,对照班用传统的教学法,对最后产生的效果进行检验。

配对样本t检验,这里只说一种情况,同一个样本实验前后的结果比较用该检验。

这里再补充说一下总体和样本。用上面说的不同的教学法产生的效果。首先是抽取一个实验班和一个对照班,因为事先并不知道这两个班的总体是否相同,所以t检验看两个班是否属于同一总体,如果是(p>0.05),则表示两个样本具有相同的特征,然后对这同一总体下的两个样本进行不同的教学法实验,完后再次检验两个样本,看是否还属于同一总体,如果不是同一总体了(p<0.05),则表示两个样本的特征已经有了显著性的差异。

T检验一般用于2个样本的检验,如果涉及到3个或以上的样本,则需要用到方差分析。

体育统计与SPSS读书笔记(六)—假设检验:卡方检验

卡方检验又叫x 检验,通常用来对率(总体率或样本率)进行检验。

下面介绍下两样本率的卡方检验

在对样本率进行卡方检验时,常采用表格方式进行处理,这种表格称为R×C联表,R和C分别代表表格的行和列数。举个例子。

为了检验新的教学方法是否对提高学生的体质健康有校,选取一个实验班(50人)和一个对照班(53人),实验班采取新的教学方法,对照班采取原来的教学方法,经过一个学期后测验,两个班的体质

以下为SPSS的卡方检验操作步骤:

1. 首先在SPSS里输入数据,注意数据输入的变量设置(“是否及格”设置为数值型,并且在label 里设置1为及格,2为不及格)

2. 对频数进行加权处理

由于在SPSS里我们输入的不是原始数据,而是汇总数据,所以需要先进行加权处理。执行“数据—>观测量加权”(data--weight cases),弹出对话框,对什么变量进行加权,选择“人数”

3. 交叉分析同时进行卡方检验。

执行“分析—>描述统计—>交叉表”(analyze—>descriptive sta—>crosstabs),弹出对话框,行(row)选择变量“班级”,列(col)选择变量“是否及格”。

再点下面的“统计”按钮,弹出对话框,见下图,选中“卡方”(chi-square),然后点“继续”,返回到交叉表对话框。

我们输入的是实际频数,卡方检验还有一个很重要的变量就是“理论频数”,这里我们也要把“理论频数”也显示出来,点下面的“单元格(cells )按钮,弹出对话框,在“计数”里选择“观察值”和“期望值”,见下图,然后点“继续”。

4. 查看结果。

最后点“确定”,就可得到检验结果。见下面的图。

结果分析:

1. 最上面的表格是对人数加权后得到的表格。上面一排是实际计数值(实际频数),下面一排是理论计数值(理论频数)

2. 下面的表格是卡方检验得到的结果。Value是卡方值,df为自由度,sig为检验的P值。我们看到上面有4种卡方检验的结果。

根据适应条件:四格表,n>=40,理论频数>=5,随机成组两组设计的计数资料,适宜使用Pearson 卡方检验,结果:卡方值6.468,自由度1, p=0.011<0.05,拒绝两种教学方法率相等的假设,可以认为两种教学方法对学生的体质健康及格率有显著性的差异。

四格表的卡方检验应该需要注意的地方:

我们上面说的表格是四格表,对其进行卡方检验的条件如下:

1. 随机样本数据;

2.卡方检验的理论频数不能太小。

两个独立样本比较可以分以下3种情况:

1.所有的理论数T≥5并且总样本量n≥40,用Pearson卡方进行检验。也就是我们上面所选的第一个检验结果。

2.如果理论数T<5但T≥1,并且n≥40,用连续性校正的卡方进行检验。也就是上面检验结果的第二个。

3.如果有理论数T<1或n<40,则用Fisher’s检验(Fisher’s Extract Test)。

至于其他R×C联表的卡方检验,这里就不说了。

体育统计与SPSS读书笔记(七)—单因素方差分析

在前面说t检验的时候说过,对于两个样本均数差别的显著性检验时用t检验,但对于三个或三个样本以上样本的均数如果还进行两两t检验,将会降低统计结果的效度。此时要用方差分析。

方差分析的基本概念及分类

方差分析(ANOV A)又称“变异数分析”或“F检验”。方差分析主要用于:1、均数差别的显著性检验;

2、分离各有关因素并估计其对总变异的作用;

3、分析因素间的交互作用;

4、方差齐性检验。

根据设计的类型不同,可分为两类:

1、单因素方差分析。

2、多因素方差分析。

两类方差分析的基本步骤相同,只是变异的分解方式不同,对成组设计的资料,总变异分解为组内变异和组间变异(随机误差),即:SS总=SS组间+SS组内,而多因数方差分析,总离差平方和=列间离差平方和十行间离差平方和十残差平方和。若有交互的,还要加上交互平方差和

指标、因素、水平

方差分析中,我们通常把实验所要考察的结果称为指标;把影响指标的条件称为因数或因子;把因数在实验时所分的等级(或因数的各种状态)称为水平。比如说,在一个年级中随机抽取三个班,一个班采用原来的教学方法,一个班采用定性教学方法,一个班采用定量教学方法进行实验,并用学生的体能进步幅度成绩作为考核指标。那么这里的体能进步幅度就是指标,教学方法就是因数,三种不同的教学方法就称为水平。

方差分析的几个前提条件:

1. 各样本为相互独立的随机样本

2. 每个样本都来自正态总体

3. 每个总体的方差都相等即方差齐。

方差分析的基本思路

首先进行样本均数相等假设,经过方差分析若拒绝了检验假设,只能说明多个样本总体均数不相等或不全相等。若要得到各组均数间更详细的信息,应在方差分析的基础上进行多个样本均数的两两比较。

单因素方差分析

单因数顾名思义就是只有实验一个影响因数。

案例:

某学校在进行评价课题实验时,从五年级随机抽取了三个班做实验,并用学生的综合体能成绩作为考核指标,首先在实验前对三个班进行几个体能项目的测试作为前测数据。然后在实验中对这三个班采取不同的教学方法,其中一个班按定性的教学方法进行实验(1班),一个班按定量的教学方法进行实验(3班),一个班按定性定量相结合的教学方法进行实验(2班),经过一个学期的实验,再对这三个班的几个体能指标进行测试作为后测数据,检验这三种教学方法对学生综合体能的提高是否有差异。

分析:

指标:综合体能成绩

因数:班级(不同的教学方法)

水平:1班(定性),2班(定性和定量),3班(定量班)

因为该实验有三个样本,且因素只有一个,所以采用单因素分析.由于因素不同教学法是固定这三种模式,所以是固态效应,对于固态效应,总体正态性要求不是很高,即使有些偏态,影响也很小,但方差齐性的要求却是很高,所以在进行分析时要做方差齐性检验。

检验步骤:

1. 在SPSS里输入实验数据,并求出每个学生的前测和后测的综合体能成绩(把几个体能项目

的成绩相加,然后求平均)

2. 对前测数据进行差异性检验,若经检验三个班前测综合体能水平无显著差异,则不用再进行两两比较,表示三个班级在实验前是具有相同的条件。执行“分析——》均值比较——》一维方差分析”,弹出对话框,在因变量选择“前测平均”,因子选择“班级”,见下图:

由于方差齐对单因素方差影响很大,所以还要进行方差齐性检验,点“选项”,弹出对话框,选中“方差齐性检验”,然后点继续。

3. 点“确定”得到检验结果,见下图,最上面的表格为方差齐性检验,p=0.585,方差齐,适合做单因数方差分析,下图为分析结果:F=0.867, P=0.423>0.05,表明三个班级在实验前综合体能水平无显著差异。

4. 4. 下面对后侧数据进行检验,若后测数据有显著差异,则表示这三个班里至少有一对班级是有显著差异的,所以还需要进行两两比较。执行“分析——》均值比较——》一维方差分析”,弹出对话框,在因变量选择“后测平均”,因子选择“班级”,见下图:

这一步我们将多看一点东西,点下面的“两两比较”,弹出对话框,选择LSD,表示将采用SLD 法进行两两比较,见下图,然后点“继续”

最后得到后测检验结果:见下图,第一个图为方差分析结果,F=1.772,P=0.175,无显著性差异。F 检验为无显著性差异,那么两两检验也全部为无显著差异,见下面的图,所有的P值都大于0。05

5、既然后测也无显著差异,那么就要进行进步幅度的比较,求出每个学生的综合体能进步幅度,然后再对进步幅度进行方差分析,设置同第四步,结果如下:F=1.496,P=0.229>0.05,说明进步幅度也无显著差异。标明三种教学方法对学生的综合体能影响不大,对学生综合体能的进步也无显著影

响。

(今天在讨论多因数方差分析的时候曾讨论到什么是组内,什么是组间,经过上面的例子我们不难发现,首先看自由度,几个方差检验的between groups (组间)的自由度都为2,说明组间就是几个水平之间。Within groups的自由度为106,3个样本总个数为109,说明组内为各个水平下的样本)。

体育统计与SPSS读书笔记(八)—多因素方差分析

具有两个或两个以上因素的方差分析称为多因素方差分析。

多因素是我们在试验中会经常遇到的,比如我们前面说的单因素方差分析的时候,如果做试验的不是一个年级,而是多个年纪,那就成了双因素了:不同教学方法的班级,不同年级。如果再加上性别上的因素,那就成了三因素了。如果我们把实验前和试验后的数据用一个时间的变量来表示,那又多了一个时间的因素。如果每个年级都是不同的老师来上,那又多了一个老师的因素,等等等等,所以我们在设计试验的时候都要进行充分考虑,并确定自己只研究哪些因素。

下面用例子的形式来说说多因素方差分析的运用。还是用前面说单因素的例子,前面的例子说了只在五年级抽三个班进行不同教学方法的试验,现在我们还要在初二和高二各抽三个班进行不同教学方法的试验。形成年级和不同教学法班级双因素。

分析:

1.根据实验方案我们划出双因素分析的表格,可以看出每个单元格都是有重复数据(也就是不只一个数据),

2. A因素的不同水平上, B因素对因变量的影响不同, 则说明A、B两因素间存在交互作用。交互作用是多因素实验分析的一个非常重要的内容。如因素间存在交互作用而又被忽视, 则常会掩盖因素的主效应的显著性, 另一方面, 如果对因变量y, 因素A与B之间存在交互作用, 则已说明这两个因素都y对有影响, 而不管其主效应是否具有显著性。在统计模型中考虑交互作用, 是系统论思想在统计方法中的反映。在大多数场合, 交互作用的信息比主效应的信息更为有用。根据上面的判断。根据上面的说法,我也无法判断是否有交互作用,不像身高和体重那么直接。这里假设他们之间有交互作用。

根据上面的分析,可以把实验当成3*3的析因实验设计模式。下面是SPSS的分析步骤。SPSS步骤:

1.输入数据。

2.先对前测数据进行检验。执行“分析——〉一般线形模型——〉一元多因素方差分析”,弹出对话框。

因变量:为我们要分析的变量:选择“前测平均”;

固定因子和随机因子:这是因子的两个分类。固定因素指的是该因素在样本中所有可能的水平都出现了,换言之,该因素所有可能的水平就这几种。随机因素是指该样本所有可能的取值没有都出现或不可能都出现。

根据上面的理解,不同教学方法的班级应该放在固定因子,而年级应该放在随机因子(因为我是要分析不同年级,而不是只针对五年级、初二和高二,所以年级在这里具有随机性)。

协方差:用于选择协变量,如果在一个实验中, 因变量是y, 存在另一连续变量x, x不能被实验者控制, 但可以随着一起被观察到,x对y有影响, 而且其关系是线性的, 则称为协变量。关于协方差分析后面将会讲。

WLS加权:用于选入加权最小二乘法的权重系数。(我也不理解,反正也用不到,可以不用去理解)这个窗口我们了解后,点“模型”按钮,弹出对话框:

模型我们选择“自定义”,选中后就会发现中间的“建立条件”变为可选,”Interaction”为交互效应,只有选择这个选项才可以产生交互效应因子。“Main effects”主效应。如果选择这个,那么模型里就只能选择“班级”和“年级”这两个主效应。All 2-way, All 3-way等,二阶效应、三阶效应。平方和也有几个选项,只要默认的typeIII就可以了。

这里的操作是:由于我们是检验期初是否有差异,看是否实验前所有样本的条件都相同,还没进行实验,所以我们不用检查交互,只需要检验主效应就行。在“建立条件”里选择”Main effects”,然后选中左边的“班级”和“年级”变量。

至于“对比”对话框,目前我们不会怎么去用他,可以不必去理解。这里什么都不选。

下面看“画图”对话框,见下面的图。对于这个划图有没有用我也不太清楚,不过看学生们在用那就拿出来讲讲。左上的窗口为“因子”,水平坐标轴选择“年级”变量,分隔线选择“班级”表示按不同水平的班级分层做出均数直线。选择好后在下面点“增加”按钮。

“两两比较”对话框,这个我们做单因素的时候也做过了。就是在检验出现显著差异的时候,就需要进行两两比较,这里就是选择用什么样的方法进行两两比较。一般用LSD法(可以理解为每个实验

二统计表统计图SPSS

统计表、统计图 针对数据“某高校学生衣物支出情况的调查分析”,回答下列问题: 1. 分析被访者的月平均生活费、月平均衣物支出的分布情况;(频率)Frequencies 2. 男、女同学在买衣服首选因素(涉及两个分类变量性别和买衣服首选因素,Crosstabs只能处理两个变量)、月平均衣物支出((连续变量F/ D /E 性别和月平均衣物支出)连续-直方图)、主要衣服类型方面(Frequency) 有何异同?(频率) 1.其他分类变量(列联表)行=性别列=其他 1.、Graphs barcharts clustered categoryaxis:月平均衣物defineclustersby:性别 3. 四年级的同学中,主要衣物类型有哪些? Data->Select Cases frequencies 4. 比较不同年级的同学在月平均生活费、月平均衣物支出方面的差异;Graphs scatter/dot simplescatter xndy 5. 月平均生活费、月平均衣物支出之间有何关系? 先散点分析相关比例 Analyze comparemens one-wayanova dependentlist: 月平均生活费、月平均衣物支出factor:sex 6. 请分析所在年级与主要衣物类型的关系? Crossestab 7. 分析变量“平均月生活费”和“月平均衣物支出”的集中趋势,离散趋势; Graph –scatter-simple –define X Y 标准差 Variance 方差 Range 极差(全距) 均值的标准误 Median 中位数

Mode 众数 Skewness 偏度 Kurtosis 峰度 频数分布表是描述性统计中最常用的方法之一,Frequencies过程就是专门为产生频数表而设计的。 Frequencies过程不仅可以产生详细的频数表,还可以按要求给出百分位点的数值,以及常用的条图、圆图等统计图。 Frequencies过程还提供了多变量的比较 分析过程集中趋势离散趋势分布特征图形及其他Frequencies Mean Median Mode Sum Variance Range 最大最小值 四分位数 百分位数 Skewness Kurtosis 条图 饼图 直方图 多变量统计量 比较 Descriptive Mean Sum Variance Range 最大最小值Skewness Kurtosis 计算标准得分 Explore所有所有 五个最大值 五个最小值Skewness Kurtosis 箱图 茎叶图 直方图

spss常用统计图绘制及编辑

目录 第五章常用统计图绘制及编辑第一节条形图的绘制 一、条形图的概念 二、条形图分类变量划分 三、条形图特征值划分 第二节线图 一、线图分类变量划分 二、线图特征值划分 三、其他图形的绘制 第三节统计图的编辑技巧 一、图元素编辑 二、图形编辑 三、图模板的应用

第第五五章章 常用统计图绘制及编辑 在统计分析中,统计图作为数据描述的重要方法之一,主要是通过点、线、条、面积等 的位置与大小的变化来表现或说明所研究问题的变化及其规律。在数据分析的过程中,数据分析图与数据表格有时可同时产生,有时必须分开进行。 统计图具有简洁、直观、可读性强和易理解等特点,被分析者和信息使用者广泛使用,因此,数据分析人员在进行统计分析时,掌握统计图的绘制与编辑是必不可少的数据分析技能。在spss 中,提供了用原始数据和表格中数据进行绘图的功能,数据图的种类也比较多,可方便地供数据分析人员选用。 第第一一节节 条形图的绘制 一、条形图的概念 1、条形图的含义 条形图(bar )用条的根数代表分类变量所分组的多少,或者选用变量的个数,用条的高度反映各组分析指标值的大小,或者变量特征值的大小,各个条之间有间隔。它可以直观揭示或比较频数变量的频数特征值、分类变量在有关综述变量方面的特征值大小,以此发现重要组或类(group )。 2、分类轴(category axis ) 条形图的横轴为分类轴,用来统计分类变量所分的组数。如果只有一个分类变量,这种条形图称为简单条形图(simple bar ),如果有两个分类变量,这种条形图称为复合条形图,其中一个变量称为分组变量,另一个变量称为分层变量。根据分层变量绘图方式的不同,复合条形图又分为分组分层条形图(clustered bar)、分组分段条形图(stacked bars)。 3、刻度轴(scale axis ) 条形图的纵轴为刻度轴,用来统计各个分组的特征值。按照特征值描述的对象不同分为以下三种类型: 一是组内特征值描述(summaries for groups of cases ),即分类变量将统计个案分成若干组,统计每个组的特征值,如统计各个组的频数、频率或其他能反映组特征变量在各个组上的特征值,这类条形图简称为组特征值条形图或分组条形图。 二是平行变量特征值描述(summaries of separate variables ),即选择若干个平行变量(指性质相同,可放在一起进行比较的一组变量),对这些变量的特征值进行统计,这类条形图简称为平行变量条形图,如被访者对10个产品分别打分,将10个产品的各自得分可看作是10个平行变量。 三是个案值描述(values of individual cases ),即直接描述数据库的原始数据而不再进行统计计算,这类条形图简称为个案条形图。如果在数据分析的过程中,已经得到了分组变量、平行变量的特征值,不必进行重新计算,可直接用数据作图。如用数据综述的方法得到了平行变量的综述特征值表,用该表中的数据制图。该功能与Excel 中的画图功能相似,因此在分析时,可直接使用Excel 工具绘图可能更方便。 二、条形图分类变量划分 条形图按照分类变量的选用情况分为简单条形图、复合条形图两大类,复合条形图按照图形表达方法不同又分为分组分层条形图与分组分段条形图。三种图的区别如图5-1(a )、5-1(b )、5-1(c )所示,从图中可以看出,简单条形图只选用了一个分组变量来分组,没有进一步分层,各个条之间有间隔。分组分层条形图选用了一个分类变量(大类)和一个分

试验三SPSS基本统计分析

实验三SPSS基本统计分析 一.实验目的和要求 1.掌握频数分析; 2.掌握计算基本描述统计量; 3.掌握交叉分组下的频数分析和各种相关性检验; 4.掌握多选项分析; 5.掌握比率分析。 二.实验的基本方法和内容 1. 频数分析 操作步骤:参阅教材第63、64、65页。 2. 基本描述统计量 操作步骤:参阅教材第68、69、70、71页。 3. 交叉分组下的频数分析 操作步骤:参阅教材第73、74、75、76、77、78、79、80、81、82、83、84、85页。 4. 多选项分析 操作步骤:参阅教材第85、86、87、88、89、90页。 5. 比率分析 操作步骤:参阅教材第91、92页。 6. 实验内容: (一)验证性实验 (1)教材第65页“商品房购买意向的调查数据分析” (2)教材第71“商品房购买意向的调查数据分析” (3)教材第79“商品房购买意向的调查数据分析” (4)教材第90“商品房购买意向的调查数据分析” (5)教材第92“保险业务的保费收入占全部业务保费收入的比例情况” (二)实践性实验 (1)对“文科成绩”的数据文件作如下统计整理: 1.利用频数分析功能,分别对“文科成绩7”中“及格次数”变量和“文科成绩9”中的“value

range ”变量,要求绘制频数分布表和频数分布图,其中频数分布表中的内容按变量值的升序输出,频数分布图前者采用饼状图,后者采用带有分布曲线的直方图,二者均输出百分比数据。最后将输出结果保存为“文科成绩7-1”和“文科成绩9-1”。 2. 对“文科成绩5.1”的spss 文件,利用描述统计功能,统计第一、第二及第三次考试成 绩的最大值,最小值,区间范围,平均值,标准差,方差,峰度,偏度等统计量的数值, 要求三个变量的输出内容按均值升值的顺序排列。最后将输出结果保存为“文科成绩5.1-1”。并配文字对数据做出以适当的分析。 3. 如何在同一个输出结果中同时输出不同学院的“第三次考试成绩”的各种基本 描述统计量,并对不同学院的学生考试成绩情况进行深入比较。 (2)调查100名健康大学生的血清总蛋白含量(g%)如下表: 1.利用描述统计功能从集中趋势、分散程度、偏斜程度、有无异常值等方面分析血清蛋白含量这个变量的分布状况。 2.原始数据进行算术处理:已知最小值为6.430,最大值为8.430,全距为2.000,故可要求分成5组,试作分组后的频数分析,并给出带有正态曲线的直方图。 7.43 7.88 6.88 7.80 7.04 8.05 6.97 7.12 7.35 8.05 7.95 7.56 7.50 7.88 7.20 7.20 7.20 7.43 7.12 7.20 7.50 7.35 7.88 7.43 7.58 6.50 7.43 7.12 6.97 6.80 7.35 7.50 7.20 6.43 7.58 8.03 6.97 7.43 7.35 7.35 7.58 7.58 6.88 7.65 7.04 7.12 8.12 7.50 7.04 6.80 7.04 7.20 7.65 7.43 7.65 7.76 6.73 7.20 7.50 7.43 7.35 7.95 7.35 7.47 6.50 7.65 8.16 7.54 7.27 7.27 6.72 7.65 7.27 7.04 7.72 6.88 6.73 6.73 6.73 7.27 7.58 7.35 7.50 7.27 7.35 7.35 7.27 8.16 7.03 7.43 7.35 7.95 7.04 7.65 7.27 7.72 8.43 7.50 7.65 7.04 (3)对某城市家庭的社会经济调查中,美国某调查公司想确定家庭的家庭拥有量与汽车拥有量是否独立。该公司对10000户家庭组成的简单随机样本进行调查,获得如下资料。 现问: 1汽车用有量与量与电话拥有量是否独立?(01.0=α) 2请根据列联表特征,选择卡方统计量以外的检验方法分析行列变量之间的关联强度和关联方向。

用SPSS生成统计图

用SPSS生成统计图 第五章:SPSS统计绘图功能详解 5.1 常用统计图 5.1.1 操作界面介绍(条图) 5.1.1.1 条图的通用界面 5.1.1.2 复式条图与分段条图的界面 5.1.2 其他常用统计图 5.1.2.1 散点图 5.1.2.2 线图 5.1.2.3 饼图 5.1.2.4 面积图 5.1.2.5 直方图 5.1.2.6 其他 5.1.3 常用统计图编辑方法详解 5.2 交互式统计图 5.3 统计地图 在常用的统计软件中,SAS绘制的统计图不太美观;而SPSS绘制的统计图较为美观,可以满足大多数情况下的要求;STATA绘制的统计图形最为精美,但由于它采用命令行方式操作,美观的图形需要添加大量选项,普通人不易掌握;而S-PLUS、MATHLAB等偏数理统计的软件虽然绘图能力也非常强,但由于自身的定位问题,并不为大多数人所熟悉。因此,在各种统计软件中,以SPSS制作的统计图应用最为广泛。 EXECL的统计绘图功能非常的强,我们还有必要学习SPSS的绘图功能吗? 这个问题我的看法是:EXCEL由于它的纯中文界面和简单而强大的绘图功能,使得可以用它来直接绘制各种简单的统计图,但是,EXCEL可以直接绘制的统计图种类有限,象误差条图、自回归图等它就无能为力,即是它支持的线图、条图等,如果过于复杂,如叠式条图、累计条图等也无法作出,而这些图在统计中是经常会碰到的,此时就只有采用统计软件来绘制,SPSS就是其中的佼佼者。 §5.1 常用统计图 在SPSS 10.0版中,除了生存分析所用的生存曲线图被整合到ANALYZE菜单中外,其他的统计绘图功能均放置在graph菜单中。该菜单具体分为以下几部分: ?Gallery:相当于一个自学向导,将统计绘图功能做了简单的介绍,初学者可以通过它对SPSS的绘图能力有一个大致的了解。 ?Interactive:交互式统计图,这是SPSS 9.0版新增的内容。 ?Map:统计地图,这是SPSS 10.0版新增的内容。 市面上所能见到的SPSS 10.0 D版由于执照不全,并不能安装统计地图模块。 ?下方的其他菜单项是我们最为常用的普通统计图,具体来说有:

第4章 SPSS基本统计分析(课后练习参考)

第三章 1、利用习题二第6题数据,采用SPSS数据筛选功能将数据分成两份文件。其中,第一份数据文件存储常住地是“沿海或中心繁华城市”且本次存款金额在1000至5000之间的调查数据;第二份数据文件是按照简单随机抽样所选取的70%的样本数据。 第一份文件:选取数据数据——选择个案——如果条件满足——存款>=1000&存款<5000&常住地=沿海或中心繁华城市。 第二份文件:选取数据数据——选择个案——随机个案样本——输入70。 2、利用习题二第6题数据,将其按常住地(升序)、收入水平(升序)、存款金额(降序)进行多重排序。 排序数据——排序个案——把常住地、收入水平、存款金额作为排序依据分别设置排列顺序。 3、利用习题二第4题的完整数据,对每个学生计算得优课程数和得良课程数,并按得优课程数的降序排序。 计算转换——对个案内的值计数输入目标变量及目标标签,把所有课程选取到数字变量,定义值——设分数的区间,之后再排序。 4、利用习题二第4题的完整数据,计算每个学生课程的平均分以及标准差。同时,计算男生和女生各科成绩的平均分。 方法一:利用描述性统计,数据——转置学号放在名称变量,全部课程放在变量框中,确定后,完成转置。分析——描述统计——描述,将所有学生变量全选到变量框中,点击选项——勾选均值、标准差。先拆分数据——拆分文件按性别拆分,分析——描述统计——描述,全部课程放在变量框中,选项——均值。方法二:利用变量计算,转换——计算变量分别输入目标变量名称及标签——均值用函数mean完成平均分的计算,标准差用函数SD完成标准差的计算。数据——分类汇总——性别作为分组变量、全部课程作为变量摘要、(创建只包含汇总变量的新数据集并命名)——确定 5、利用习题二第6题数据,大致浏览存款金额的数据分布状况,并选择恰当的组限和组距进行组距分组。 根据存款金额排序,观察其最大值与最小值,算出组数和组距。转换——重新编码为其他变量——将存款金额作为输出变量——定义输出变量的名称及标签——设定旧值和新值. 6、在习题二第6题数据中,如果认为调查中“今年的收入比去年增加”且“预计未来一两年收入仍会增加”的人是对自己收入比较满意和乐观的人,请利用SPSS的计数和数据筛选功能找到这些人。 转换——对个案的值计数——设定目标变量及标签——将“今年的收入比去年增加”和“预计未来一两年收入仍会增加”两个变量选中——定义值。 7、对习题二第5题数据,选择恰当的加权变量进行加权处理进而还原为原始数据为后续分析做准备。 数据——加权个案——点击加权个案——将人数作为频率变量——确定。 第四章

SPSS统计分析软件基础教程(英文有图示)

An Introduction to SPSS Or PASW The two laboratory sessions created for this course introduce students to the use of SPSS software. Section One To Should be completed by all students Section Three Section Four Further statistical analysis for you to try It is expected that students should complete the exercises up to and including Section Three within class time, if this is not achieved students should complete the exercises in their own time. Introduction to SPSS Section One

Introduction Section One introduces the various screens and displays as well as explaining how to input your survey and your data. SPSS is one of the most popular statistical analysis packages in use today and has been around for well over 20 years. The latest version with the w indow?s interface is particularly easy to use. The windows environment also facilitates the import and export of data, for example importing data from a spreadsheet and exporting results to a word document. The University holds a license that allows students to have a copy of SPSS on their own computers. The CD for installing the latest version of SPSS can be borrowed from the Library. Starting SPSS PASW Version 18 is the latest version. It can be found from Start(Bottom left hand corner), Programmes, SPSS Inc, PASW 18. The opening display asks you to select one of a number of options. At the moment click on the Red Cross to close the box. The Opening Display The window displayed is called the Data Editor; this is used for entering, editing and selecting data. The Data Editor has two views: the Variable View and the Data View you can flip from one view to the other by using the tab at the bottom of the page. SPSS has a number of other windows including Output, Help and Tutorial.

SPSS教程统计图的绘制

SPSS教程第十六课:统计图的绘制 信息来源:本站原创更新时间:2004-7-12 21:52:00 第五节高低区域图 15.5.1主要功能 调用Graphs菜单的High-Low过程,可绘制高低区域图。高低区域图用于表现多种形式的数据区域,如一组测定值的范围(最小值—最大值)、95%可信区间值(低 限—高限)、±1.96·SD(低值—均值—高值)等,形象直观。 15.5.2实例操作 [例15-5]为了解水体污染情况,某市测定三种水源中放射性元素锶(90Sr)的含量(10-2Bq·L-1),资料如下,试绘制高低区域图。 15.5.2.1 数据准备 激活数据管理窗口,定义变量名:数据的变量名为DATA,将范围的低值与高值以及均值一并输入;设一变量为CAT,用于定义低值、高值和均值,低值为1、高值为2、均值为3;水源点变量名为GROUP,依次输入1、2、3。

15.5.2.2 操作步骤 选Graphs菜单的High-Low...过程,弹出High-Low Chart定义选项框,高低区域图有5种,即: Simple High-Low-Close:简单线型高低区域图; Clustered High-Low-Close:复式线型高低区域图; Simple Range Bar:简单直条型高低区域图; Clustered Range Bar:复式直条型高低区域图; Difference Line:差异线区域图。 本例选用简单线型高低区域图。然后点击Define钮,弹出Define Simple High-Low-Close:Summaries for Groups of Cases对话框(图15.6),在左侧的变量列表中选data点击 钮使之进入Bars Represent栏的Other snmmary function 选项的Variable框,选cat点击 钮使之进入Category Axis框, 选group点击 钮使之进入Define High-Low-Close by框。点击Titles...钮,弹出Titles对话框,在Title栏内输入“某市测定不同水体放射性元素锶的含量比较”,点击Continue钮返回Define Simple High-Low-Close:Summaries for Groups of Cases 对话框,再点击OK钮即完成。

SPSS基本统计分析

第6章SPSS基本统计分析 6-1定距变量的描述统计 1、有关概念 (1)均值Mean (2)标准差Standard Deviation与方差Variance (3)最小值Minimum、最大值Maximum与总和Sum (4)极差Range (5)峰度Kurtosis (6)偏度Skewness ☆正态:偏度为0的分布 ☆右偏态:偏度大于0 ☆左偏态:偏度小于0 (7)均值的标准误差Standard error of Mean 主要用来描述样本均值与总体均值之间平均差异程度的统计量 2、操作 (1)基本菜单选项 ——Statistics ->Summarize ->Descriptive ——将需要描述的变量放入Variables选择框 (2)其他重要的菜单选项 Save Standardized values as variable 将变量标准化处理 (3)Option选项 ☆选择描述统计量 ☆选择统计量的输出顺序Display Order 3、syntax Descriptive variable=relative friend others /STATISTICS=Mean stddev variance range min max semean kurtosis skewmess. 6-2 定序与定类变量的统计描述 一、频数、百分比

1、有关概念 (1)频次与频率 (2)百分比与有效百分比 2、操作 3、syntax FREQUENCIES variables=commtype ethnic hktype /STATISTICS=MODE /ORDER=ANALYSIS. FREQUENCIES all. 二、分位值Percentile Value 1、有关概念 (1)分位点与分位点数 (2)分位点与分位值 2、菜单操作方法:频数统计的其他选项——Statistic选项 ——Chart —— format Order by Suppress MutipleVariable 3、syntax: FREQUENCIES V ARIABLES=relative friend others /NTILES=4 /NTILES=10 /STATISTICS=MODE /ORDER=ANALYSIS. 三、异质性指数(index of qualitatitive variation) 1、概念 异众比率: 异质性指数: 2、计算方法 IQV=A/M

SPSS基本统计图表的制作

基本统计图表的制作 1 P-P图和Q-Q图 P-P图是根据变量的累积比例与指定分布的累积比例之间的关系所绘制的图形。通过P-P图可以检验数据是否符合指定的分布。当数据符合指定分布时,P-P 图中各点近似呈一条直线。如果P-P图中各点不呈直线,但有一定规律,可以对变量数据进行转换,使转换后的数据更接近指定分布。 Q-Q图同样可以用于检验数据的分布,所不同的是,Q-Q图是用变量数据分布的分位数与所指定分布的分位数之间的关系曲线来进行检验的。 由于P-P图和Q-Q图的用途完全相同,只是检验方法存在差异,SPSS17.0中用于做出P-P图的对话框和用于做出Q-Q图的对话框完全一致,下面将对两者统一加以说明。 具体操作步骤如下: 打开数据文件,选择【分析】(Analyze)菜单,单击【描述统计】(Descripti ve Statistics)命令下的【P-P图】(P-P Plots)或【Q-Q图】(Q-Q Plots)命令。“P-P图”(P-P Plots)、“Q-Q图”(Q-Q Plots)的对话框分别如图3-20和图3-21所示。

图3-20 “P-P图”对话框 图3-21 “Q-Q图”对话框 在“P-P图”(P-P Plots)或“Q-Q图”(Q-Q Plots)对话框中,最左边的变量列表为原变量列表,通过单击按钮可选择一个或者几个变量进入位于对话框中间的“变量”(Variables)列表框中。根据这些变量数据可创建P-P图或Q-Q图,并进行分布检验。 “P-P图”或“Q-Q图”对话框的中下方和右方有5个选项栏,选项栏中各选项的意义如下:

(1)转换(Transform)栏(复选项): l 自然对数转换(Natural log transform):选择此项,对当前变量的数据取自然对数,即将原有变量转换成以自然数e为底的对数变量。 l 标准值(Standardize values):选择此项,将当前变量的数据转换为标准值,即转换后变量数据的均值为0,方差为1。 l 差分(Difference):选择此项,对当前变量的数据进行差分转换,即利用变量中连续数据之间的差值来转换数据。选择此项以后,后面的 文本框变为可用,在其中输入一个正整数,以确定转换的差分度,默 认值为1。 l 季节性差分(Seasonally difference):用于确定指明计算时间序列的季节差分。只有在对当前变量的数据序列定义了周期(通过主菜单中 的【数据】(Data)菜单中的【定义日期】(Define Dates)选项定 义)以后才可用,如果当前周期为0,将不能计算季节差分。选择此 项,在后面的文本框中输入正整数,然后根据该正整数所确定的范围 来计算该范围内数据的差值,并用该差值来转换原数据。 需要注意的是,这些数据转换并不改变变量中的变量值,只影响正态概率图。(2)检验分布(Test Distribution)栏:可选择不同的分布类型,检验变量数据是否符合所选分布。单击选项分布栏下的箭头可选择不同的分布类型。SPSS默认的检验分布是正态分布(Normal)。 P-P图(或Q-Q图)可检验的分布包括: 贝塔分布(Beta)T分布(Student t) 卡方分布(Chi-square)伽马分布(Gamma)

相关文档
相关文档 最新文档