文档库 最新最全的文档下载
当前位置:文档库 › 第九章 信度分析-spss

第九章 信度分析-spss

第九章 信度分析-spss
第九章 信度分析-spss

第九章信度分析(Reliability)

一、信度分析的概念

1.信度

信度又叫可靠性,是指测验的可信程度。它主要表现测验结果的一贯性、一致性、再现性和稳定性。

信度只受随机误差影响,随机误差越大,测验的信度越低。因此,信度亦可视为测量结果受随机误差影响的程度。系统误差产生恒定效应,不影响信度。

在测量学中,信度被定义为:一组测量分数的真变异数功总变异数(实得变异数)的比率,即:

r xx=S2r/S2x 即:信度系数=真变异数/总变异数

2.信度的标准

在心理学中通常可以用已有的同类测验作为比较的标准。

一般能力与成就测验的信度系数常在0.90以上,性格、兴趣、态度等人格测验的信度系数通常在0.80-0.85之间。

任何测验或量表的信度系数如果在0.90以上,表示测验或量表的信度甚佳。在社会科学领域中,可接受的最小信度系数值为多少?

Gay(1992)观点:0.80以上;

DeVellis(1991)、Nunnally(1978)等人:认为在0.70以上是可接受的最小信度值。

如果量表的信度过低如在0.60以下,应考虑重新修订或重新编制研究工具。

3.信度的分类

信度可分为以下两类:

(1)内在信度:内在信度指的是调查表中的一组问题(或整个调查表)是否测量的是同一个概念,也就是这些问题之间的内在一致性如何。如果内在信度系数在0.8以上,则可以认为调查表有较高的内在一致性。最常用的内在信度系数为克朗巴哈α系数(Cronbach α)和分半信度(Split-half)。

(2)外在信度:指在不同时间进行测量时调查表结果的一致性程度。最常用的外在信度指标是重测信度,或"再测信度(Test-retest reliability),即用同一问卷在不同时间对同一对象进行重复测量,然后计算一致程度。

4.操作命令

(1)菜单Analyze→Scale→Reliability Analysis,进入主对话框;

(2)选变量到右侧Items栏;

(3)选Model

◆Alpha:α系数,内部一致性估计方法;

◆Split-half:分半信度。将测验题目分成对等两半,计算这两半分数的相关系

数;

◆Guttman:适用于用二值记分项目(0,1方式);

◆Parallel:平行测验信度估计的方法,条件为各项目的方差为齐性;

◆Strict Parallel:要求各项目的方差为齐性和均数相等。

(4)按Statistics按钮

◆Descriptive for描述统计栏

Item:计算各项目的均数,标准差和样本量;

Scale:计算量表变量的均数,标准差和样本量;

Scale if item deleted:计算量表变量减去各项目的均数,方差等统计量。

◆Summaries栏

◆Inter-Item栏

◆ANOV A Table栏

5.举例

数据文件test.sav是复旦大学某班级44名同学的卫生统计学期末考试成绩,请据此对该考试试卷进行信度分析。

解:本例的解题思路如下:

(1)常用的内在信度指标是克朗巴哈α系数和折半信度,用哪个好呢?折半信度是将整个样本一分为二进行分析,本例数据只有6个变量,折半后每半只有三个,效/果不会太好(不稳定)。因此采用克朗巴哈α系数。

(2)直接计算出信度系数是非常简单的,但在问卷或试卷的分析中,更重要的是具体分析每个问题的效果如何,即问卷中各个题目的难度、区分度如何,有无需要加以修改的问题,以便进一步提高试卷质量。下面我们还需要对这一点加以分析。

(3)操作命令

Item栏:a,b,c,d1,d2,d3

选择List item labels

Statistics按钮:Scale/Scale if item deleted

Continue

OK

SPSS实验报告_线性回归_曲线估计

《数据分析实务与案例实验报告》 曲线估计 学号:2013111104000614 班级:2013 应用统计 姓名: 日期: 2 0 1 4 – 12 – 7 数学与统计学学院

一、实验目的 1. 准确理解曲线回归分析的方法原理。 2. 了解如何将本质线性关系模型转化为线性关系模型进行回归分析。 3. 熟练掌握曲线估计的SPSS 操作。 4. 掌握建立合适曲线模型的判断依据。 5. 掌握如何利用曲线回归方程进行预测。 6. 培养运用多曲线估计解决身边实际问题的能力。 二、准备知识 1. 非线性模型的基本内容 变量之间的非线性关系可以划分为 本质线性关系和本质非线性关系。所谓本质线性关系是指变量关系形式上虽然呈非线性关系,但可以通过变量转化为线性关系,并可最终进行线性回归分析,建立线性模型。本质非线性关系是指变量之间不仅形式上呈现非线性关系,而且也无法通过变量转化为线性关系,最终无法进行线性回归分析,建立线性模型。本实验针对本质线性模型进行。 下面介绍本次实验涉及到的可线性化的非线性模型,所用的变换既有自变量的变换,也有因变量的变换。 乘法模型: 123y x x x βγδαε= 其中α,β,γ,δ 都是未知参数,ε是乘积随机误差。对上式两边取自然对数得到 123ln ln ln ln ln ln y x x x αβγδε=++++

上式具有一般线性回归方程的形式,因而用多元线性回归的方法来处理。然而,必须强调指出的是,在求置信区间和做有关试验时,必须是2ln (0,)n N I εδ: , 而不是2n N I εδ:(0,) ,因此检验之前,要先检验ln ε 是否满足这个假设。 三、实验内容 已有很多学者验证了能源消费与经济增长的因果关系,证明了能源消费是促进经济增长的原因之一。也有众多学者利用C-D 生产函数验证了劳动和资本对经济增长的影响机理。所有这些研究都极少将劳动、资本、和能源建立在一个模型中来研究三个因素对经济增长的作用方向和作用大小。 现从我国能源消费、全社会固定资产投资和就业人员的实际出发,假定生产技术水平在短期能不会发生较大变化,经济增长、全社会固定资产投资、就业人员、能源消费可以分别采用国内生产总值、全社会固定资产投资总量、就业总人数、能源消费总量进行衡量,并假定经济增长与能源消费、资本和劳动力的关系均满足C-D 生产函数。 问题中的C-D 生产函数为: Y AK L E αβγ= 式中:Y 为GDP ,衡量总产出;K 为全社会固定资产投资,衡量资本投入量;L 为就业人数,衡量劳动投入量;E 为能源消费总量,衡量能源投入量;A,α,β, γ 为未知参数。根据C-D 函数的假定,一般情形α,β,γ均在0和1之间,但当α,β,γ中有负数时,说明这种投入量的增长,反而会引起GDP 的下降,当α,β,γ中出现大于1的值时,说明这种投入量的增加会引起GDP 成倍增加,这在经济学现象中都是存在的。 以我国1985—2004年的有关数据建立了SPSS 数据集,参见

多元线性回归SPSS实验报告

回归分析基本分析: 将毕业生人数移入因变量,其他解释变量移入自变量。在统计量中选择估计和模型拟合度,得到如图 注解:模型的拟合优度检验:

第二列:两变量(被解释变量和解释变量)的复相关系数R=0.999。 第三列:被解释向量(毕业人数)和解释向量的判定系数R2=0.998。 第四列:被解释向量(毕业人数)和解释向量的调整判定系数R2=0.971。在多个解释变量的时候,需要参考调整的判定系数,越接近1,说明回归方程对样本数据的拟合优度越高,被解释向量可以被模型解释的部分越多。 第五列:回归方程的估计标准误差=9.822 回归方程的显著性检验-回归分析的方差分析表 F检验统计量的值=776.216,对应的概率p值=0.000,小于显著性水平0.05,应拒绝回归方程显著性检验原假设(回归系数与0不存在显著性差异),认为:回归系数不为0,被解释变量(毕业生人数)和解释变量的线性关系显著,可以建立线性模型。 注解:回归系数的显著性检验以及回归方程的偏回归系数和常数项的估计值第二列:常数项估计值=-544.366;其余是偏回归系数估计值。

第三列:偏回归系数的标准误差。 第四列:标准化偏回归系数。 第五列:偏回归系数T检验的t统计量。 第六列:t统计量对应的概率p值;小于显著性水平0.05,拒接原假设(回归系数与0不存在显著性差异),认为回归系数部位0,被解释变量与解释变量的线性关系是显著的;大于显著性水平0.05,接受原假设(回归系数与0不存在显著性差异),认为回归系数为0被解释变量与解释变量的线性关系不显著的。 于是,多元线性回归方程为: y=-544.366+0.032x1+0.009x2+0.001x3-0.1x5+3.046x6 回归分析的进一步分析: 1.多重共线性检验 从容差和方差膨胀因子来看,在校学生数和教职工总数与其他解释变量的多重共线性很严重。在重新建模中可以考虑剔除该变量

spss软件分析异常值检验实验报告

实验五:残差分析 【实验目的】 (1)通过残差检验,掌握残差分析的方法 (2)异常值检验 【仪器设备】 计算机、spss软件、何晓群《实用回归分析》表和表的数据 【实验内容、步骤和结果】 对何晓群《实用回归分析》表的数据进行残差分析 原始数据如表1,其中y表示货运总量(亿吨)x1表示工业总产值(亿元)x2表示农业总产值(亿元)x3表示居民非商业支出(亿元) 表1. 对表1数据用spss软件进行分析得以下各表

由上表可知复相关系数R=,决定系数R方=,由决定系数看出回归方程的显著性不高,接下来看方差分析表3 由表3知F值为较小,说明x1、x2、x3整体上对y的影响不太显著。 表4系数 模型非标准化系数标准系数 t Sig. B标准误差试用版 1(常量).096 x1.385.100 x2.535.049 x3.277.284

表4系数 模型 非标准化系数 标准系数 t Sig. B 标准 误差 试用版 1 (常量) .096 x1 .385 .100 x2 .535 .049 x3 .277 .284 回归方程为 123348.280 3.7547.10112.447y x x x =-+++

图1.学生化残差

差 残差: 对数据用spss进行分析得 表6异常值的诊断分析

数据不存在异常值.绝对值最大的删除学生化残差为SDR=,因而根据学生化删除残差诊断认为第6个数据为异常值.其中中心化杠杆值,cook距离为位于第一大.因此第6个数据为异常值. 对何晓群《实用回归分析》表的数据进行残差分析 原始数据为 : 表个啤酒品牌的广告费用和销售量

第九章---spss的回归分析

第九章spss的回归分析 1、利用习题二第4题的数据,任意选择两门课程成绩作为解释变量和被解释变量,利用SPSS 提供的绘制散点图功能进行一元线性回归分析。请绘制全部样本以及不同性别下两门课程成绩的散点图,并在图上绘制三条回归直线,其中,第一条针对全体样本,第二和第三条分别针对男生样本和女生样本,并对各回归直线的拟和效果进行评价。 选择fore和phy两门成绩做散点图 步骤:图形→旧对话框→散点图→简单散点图→定义→将phy导入X轴、将fore导入Y 轴,将sex导入设置标记→确定 图标剪辑器内点击元素菜单→选择总计拟合线→选择线性→确定→再次选择元素菜单→点击子组拟合线→选择线性→确定 分析:如上图所示,通过散点图,被解释变量y与fore有一定的线性相关关系。 2、线性回归分析与相关性回归分析的关系是怎样的? 线性回归分析是相关性回归分析的一种,研究的是一个变量的增加或减少会不会引起另一个变量的增加或者减少。

3、为什么需要对线性回归方程进行统计检验?一般需要对哪些方面进行检验? 线性回归方程能够较好地反映被解释变量和解释变量之间的统计关系的前提是被解释变量和解释变量之间确实存在显著的线性关系。 回归方程的显著性检验正是要检验被解释变量和解释变量之间的线性关系是否显著,用线性模型来描述他们之间的关系是否恰当。一般包括回归系数的检验,残差分析等。 4、SPSS多元线性回归分析中提供了哪几种解释变量筛选策略? 包括向前筛选策略、向后筛选策略和逐步筛选策略。 5、先收集到若干年粮食总产量以及播种面积、使用化肥量、农业劳动人数等数据,请利用建立多元线性回归方程,分析影响粮食总产量的主要因素。数据文件名为“粮食总产量.sav”。 步骤:分析→回归→线性→粮食总产量导入因变量、其余变量导入自变量→确定 结果如图: Variables Entered/Removed b Model Variables Entered Variables Removed Method 1 农业劳动者人数(百万人), 总播种面积(万公顷), 风灾 面积比例(%), 粮食播种面 积(万公顷), 施用化肥量 (kg/公顷), 年份a . Enter a. All requested variables entered. b. Dependent Variable: 粮食总产量(y万吨) ANOVA b Model Sum of Squares df Mean Square F Sig. 1 Regression 2.025E9 6 3.375E8 414.944 .000a Residual 2.278E7 28 813478.405 Total 2.048E9 34 a. Predictors: (Constant), 农业劳动者人数(百万人), 总播种面积(万公顷), 风灾面积比例(%), 粮食播种面积(万公顷), 施用化肥量(kg/公顷), 年份 b. Dependent Variable: 粮食总产量(y万吨) Coefficients a Model Unstandardized Coefficients Standardized Coefficients t Sig. B Std. Error Beta

回归分析实验报告

实验报告 实验课程:[信息分析] 专业:[信息管理与信息系统] 班级:[ ] 学生姓名:[ ] 指导教师:[请输入姓名] 完成时间:2013年6月28日

一.实验目的 多元线性回归简单地说是涉及多个自变量的回归分析,主要功能是处理两个变量之间的线性关系,建立线性数学模型并进行评价预测。本实验要求掌握附带残差分析的多元线性回归理论与方法。 二.实验环境 实验室308教室 三.实验步骤与内容 1打开应用统计学实验指导书,新建excel表 2.打开SPSS,将数据输入。 3.调用SPSS主菜单的分析——>回归——>线性命令,打开线性回归对话框,指定因变量(工业GDP比重)和自变量(工业劳动者比重、固定资产比重、定额资金流动比重),以及回归方式;逐步回归(图1)

图1 线性对话框 4.在统计栏中,选择估计以输出回归系数B的估计值、t统计量等,选择Duribin-watson以进行DW检验;选择模型拟合度输出拟合优度统计量值,如R^2、F统计量值等(图2)。 图2 统计量栏

5.在线性回归栏中选择直方图和正态概率图以绘制标准化残差的直方图和残差分析与正态概率比较图,以标准化预测值为纵坐标,标准化残差值为横坐标,绘制残差与Y的预测值的散点图,检验误差变量的方差是否为常数(图3)。 图3 绘制栏 6.提交分析,并在输出窗口中查看结果,以及对结果进行分析。 系统在进行逐步分析的过程中产生了两个回归模型,模型1先将与因变量(销售收入)线性关系的自变量地区人口引入模型,建立他们之间的一元线性关系。而后逐步引入其他变量,表1中模型2表明将自变量人均收入引入,建立二元线性回归模型,可见地区人口和人均收入对销售收入的影响同等重要。

spss 信度分析

第九章第九章信度分信度分析析?6?1一再测信度·用同一个测验对同一组被试前后两次施测两次测验分数所得的相关系数为再测信度·因为它能反映两次测验结果有无变动也就是测验分数的稳定程度故又称稳定性系数·计算再测信度应满足一下几个假设①所测量的特质必须是稳定的②遗忘与练习的效果相同③两次施测期间被试的学习效果没有差别···。·根据一组被试在两个平行等值测验上的得分计算的相关数。因为它反映的是两个测验之间的等值程度因此又叫等值性系数。·采用此法一定要注意①两个测验必须在项目的内容、形式、数量、难易、时限、指导语等方面相同或相似②两次测验的时间间隔要适当·复本信度的局限①复本法只能减少而不能完全排除练习和记忆的影响②对于许多测验来说建立复本是相对困难的?6?1按正常的程序实施测验然后将全部项目分成相等的两半根据各人在这两半测验的分数计算其相关系数?6?1斯皮尔曼—布朗校正公式弗朗那根估计信度公式。?6?1使用奇偶分半法一定要注意两个问题①如遇到有牵连的项目或一组解决同一问题的项目时这些项目应放在同一半否则将会高估信度的值②当试卷中存在任选题或试卷为速度测试时不宜采用分半法·同质性也称内部一致性指的是测验内部所有题目间的一致性。1、测量同质性的基本公式2、库德—理查逊公式估计测验的信度估计同质性信度·适用于答对一题得分答错无分3、克伦巴赫系数·适

用于项目多重记分的测验·评分者之间的变异是产生误差的重要原因之一·考察评分者信度的方法是随机抽取部分试卷由两个或多个评分者独立按评分标准打分然后求其间的相关。如果是两个评分者则采用积差相关或等级相关的方法一般认为结果训练的成对评分者之间的一致性达到0.90以上评分才是客观的。如果是多个评分者则采用和谐系数来估计信度。一评价测验·信度系数是衡量测验好坏的一个重要技术指标·一般能力与成就测验的信度系数常在0.90以上·性格、兴趣、态度等人格测验的信度系数通常在0.80-0.85之间二解释分数1、个人测验分数的误差·个人在两次测验中分数的差异就是测量误差据此可得出一个误差分数的分布这个分布 的标准差就是测量的标准差它是测量误差大小的指标。2、两种测验分数的比较·来自不同测验的原始分数是无法直接比较的只有参照同一团体的平均分数将它们转换成相同尺 度的标准分数才能进行比较。一被试的样本·团体的异质程度与分类的分布有关一个团体越是异质其分数分布的范围也 就越大信度系数就越高。·信度系数不仅受样本团体的异质程度的影响也受样本团体平均水平的影响。因为对于不同水平的团体项目具有不同的难度每个项目在难度上的变化累积 起来便会影响信度。这种影响不能用统计公式来推估只能从经验中发现。二测验的长度·一般来说测验越长信度值越高。因为①测验加长可能改进项目取样的代表性从而能更好地

SPSS实验报告材料91487

CENTRAL SOUTH UNIVERSITY SPSS实验报告 学生王强 学号4303110516 指导教师邵留国 学院商学院 专业工商1101

实验一、数据集 实验目的:掌握基本的统计学理论,学会使用SPSS录入数据,建立SPSS数据集。 实验容: 1.3:三十名儿童身高、体重样本数据如下表所示。建立SPSS数据集。 三十名儿童身高、体重样本数据

13 14 15 男 男 男 14 14 14 168.0 164.5 153.0 50.0 44.0 58.0 28 29 30 女 女 女 15 15 15 158.0 158.6 169.0 44.3 42.8 51.1 实验步骤: 步骤一:启动SPSS。 步骤二:选择文件,新建,数据,如图。 步骤三:切换到变量视图,定义变量。其中,性别变量需要设置值标签。如图所 示。 步骤四:切换到数据视图,按照次序依次输入数据。 步骤五:保存数据。

实验结果:

实验二:统计量描述 实验目的: (1)结合图表描述掌握各种描述性统计量的构造原理及其应用。 (2)熟练掌握运用SPSS进行统计描述的基本技能。 实验容:大学生在校期间的各门课程考试成绩,尽管在学生与学生之间、院系之间、男女生之间以及不同的课程之间,都存在着各种各样的差异,但整体上的分布状况还是有规律可循的。今有两个学院共1040名男女生的统计学和经济学期末考试成绩数据,储存在SPSS数据文件中,文件名:lytjcj.sav。试运用图表描述与统计量描述的方法,对此数据展开尽可能全面和深入的描述与分析。 实验步骤: 步骤一:打开SPSS数据,文件名:lytjcj.sav。如图。

SPSS相关分析实验报告.doc

SPSS相关分析实验报告 篇一:spss对数据进行相关性分析实验报告 实验一 一.实验目的 掌握用spss软件对数据进行相关性分析,熟悉其操作过程,并能分析其结果。 二.实验原理 相关性分析是考察两个变量之间线性关系的一种统计分析方法。更精确地说,当一个变量发生变化时,另一个变量如何变化,此时就需要通过计算相关系数来做深入的定量考察。P值是针对原假设H0:假设两变量无线性相关而言的。一般假设检验的显著性水平为0.05,你只需要拿p值和0.05进行比较:如果p值小于0.05,就拒绝原假设H0,说明两变量有线性相关的关系,他们无线性相关的可能性小于0.05;如果大于0.05,则一般认为无线性相关关系,至于相关的程度则要看相关系数R 值,r越大,说明越相关。越小,则相关程度越低。而偏相关分析是指当两个变量同时与第三个变量相关时,将第三个变量的影响剔除,只分析另外两个变量之间相关程度的过程,其检验过程与相关分析相似。三、实验内容 掌握使用spss软件对数据进行相关性分析,从变量之间的相关关系,寻求与人均食品支出密切相关的因素。

(1)检验人均食品支出与粮价和人均收入之间的相关关系。 a.打开spss软件,输入“回归人均食品支出”数据。 b.在spssd的菜单栏中选择点击,弹出一个对话窗口。 C.在对话窗口中点击ok,系统输出结果,如下表。 从表中可以看出,人均食品支出与人均收入之间的相关系数为0.921,t检验的显著性概率为0.000<0.01,拒绝零假设,表明两个变量之间显著相关。人均食品支出与粮食平均单价之间的相关系数为0.730,t检验的显著性概率为0.000<0.01,拒绝零假设,表明两个变量之间也显著相关。 (2)研究人均食品支出与人均收入之间的偏相关关系。 读入数据后: A.点击系统弹出一个对话窗口。 B.点击OK,系统输出结果,如下表。 从表中可以看出,人均食品支出与人均收入的偏相关系数为0.8665,显著性概率p=0.000<0.01,说明在剔除了粮食单价的影响后,人均食品支出与人均收入依然有显著性关系,并且0.8665<0.921,说明它们之间的显著性关系稍有减弱。通过相关关系与偏相关关系的比较可以得知:在粮价的影响下,人均收入对人均食品支出的影响更大。 三、实验总结 1、熟悉了用spss软件对数据进行相关性分析,熟悉其操

SPSS对主成分回归实验报告

《多元统计分析分析》实验报告 2012 年月日学院经贸学院姓名学号 实验 实验成绩名称 一、实验目的 (一)利用SPSS对主成分回归进行计算机实现. (二)要求熟练软件操作步骤,重点掌握对软件处理结果的解释. 二、实验内容 以教材例题为实验对象,应用软件对例题进行操作练习,以掌握多元统计分析方法的应用 三、实验步骤(以文字列出软件操作过程并附上操作截图) 1、数据文件的输入或建立:(文件名以学号或姓名命名) 将表数据输入spss:点击“文件”下“新建”——“数据”见图1: 图1 点击左下角“变量视图”首先定义变量名称及类型:见图2: 图2: 然后点击“数据视图”进行数据输入(图3): 图3

完成数据输入 2、具体操作分析过程: (1)首先做因变量Y与自变量X1-X3的普通线性回归: 在变量视图下点击“分析”菜单,选择“回归”-“线性”(图4): 图4 将因变量Y调入“因变量”栏,将x1-x3调入“自变量”栏(图5): 然后选择相关要输出的结果:①点击右上角“统计量(s)”:“回归系数”下选择“估计”;“残差”下选择“”;在右上角选择输出“模型拟合度”、“部分相关和偏相关”“共线性诊断”(后两项是做多重共线性检验)。选完后点击“继续”(见图6)②如果需要对因变量与残差进行图形分析则需要在“绘制”下选择相关项目(图7),一般不需要则继续③如果需要将相关结果如因变量预测值、残差等保存则点击“保存”(图8),选择要保存的项目④如果是逐步回归法或者设置不带常数项的回归模型则点击“选项”(图9) 其他选项按软件默认。最后点击“确定”,运行线性回归,输出相关结果(见表1-3)

第三篇 SPSS深入分析(第9章相关分析与一般线性模型)

第三篇SPSS深入分析 本篇要点导读: 第9章相关分析与广义线性模型 一般相关分析和偏相关分析,偏相关系数计算,以及广义线性模型简单应用; 第10章回归分析 一元线性回归、多元线性回归、非线性回归及Logistic回归的模型和应用; 第11章聚类分析和判别分析 聚类和判别分析的适用条件,聚类分析包括层次聚类和K-均值聚类,判别分析 包括Fisher判别和Bayes判别; 第12章因子分析和对应分析 因子分析的一般模型,因子分析的应用;对应分析的一般模型和应用; 第13章时间序列分析 时间序列的建立,预处理,时间序列中常用的ARIMA模型和季节调整模型。 本篇说明: 1. 本篇讲述的内容都是涉及两个以上变量的,称为多元统计分析,本篇重点说明多元统计分析方法的应用条件,统计方法的模型和统计方法的SPSS操作实现即结果分析; 2. 虽然本篇对各种多元统计分析方法的模型进行了比较详细的介绍,然而本书毕竟是以SPSS应用为重点,因此不可能对多元统计分析模型面面俱到详细介绍,模型的详细内容请读者参考专业多元统计分析书籍; 3. 请读者在阅读本篇时注意两个问题:一方面要注意各种多元统计分析方法应用的条件,条件不满足不能轻易使用多元统计分析模型;另一方面要注意归纳各种多元统计方法之间的区别和联系,书中列出了各方法的主要区别和联系,读者注意理解。同时读者也可能自己发现方法间新的区别与联系。 4. 由于篇幅关系,对于前面的基本SPSS操作和一元统计分析SPSS操作本篇不再详细说明,只是列出简要操作步骤,请读者注意自行练习,操作验证。

『 2 』 第9章相关分析与一般线性模型 第9章相关分析与一般线性模型 在前面的第2篇中,我们讲解的统计方法基本都是一元统计方法,只分析一个变量。这其中有几个例外:多选项分析中涉及多个SPSS变量,但是经过多选项集定义以后,还是将多选项集当作一个变量在分析;参数检验和非参数检验中都有配对样本检验,也涉及多个SPSS变量,只是对于配对变量来说,都是同一性质的变量,分析时也是结合在一起分析的,因此可以算作分析一个变量;方差分析中涉及多个变量;但是方差分析主要是分析观测变量,控制变量只是用来对观测变量分类的,因此仍然是分析一个变量。当然一元统计分析的模型还有很多,本书限于篇幅只是列举了SPSS中常用的功能,对于其他模型有兴趣的读者可以查阅相关统计专业书籍。 从本章开始,我们开始介绍多元统计分析的模型和方法,和一元统计分析对应,多元统计分析方法分析的是多个性质不同的SPSS变量;一元统计只是分析总体的某个特征,而多元统计分析则是分析总体的多个特征,分析这些特征各自的情况,并分析这些特征的联系,对这些特征进行处理的方法等等。因此多元统计的问题比一元统计复杂,处理的方法也更多。在本篇中将给读者介绍SPSS中常用的多元统计方法:相关分析、回归分析、聚类和判别、因子与对应分析,以及时间序列分析。 相关分析是比较简单的多元分析方法,但是也是经常使用的多元统计分析方法,它能快速发现总体特征(变量)之间关系,并检验这些特征的显著性。这一方面对于简单的统计分析已经可以提供足够的结论,另一方面也为后续的更加复杂的多元统计分析模型提供条件和依据。因此,相关分析在多元统计分析中的作用是非常大的。 一般线性模型是方差分析的推广和延伸,其作用是分析一个或多个自变量对一个或多个应变量的线性关系,其内容非常丰富,包含方差分析、重复测量方差分析、多元线性回归等等,在第8章我们已经接触过它的强大功能了,掌握一般线性模型对于我们提高自身的统计分析能力有很大帮助。我们就从这两个简单而又重要的方法开始学习多元统计分析的模型。 9.1 相关分析 现代自然科学研究、经济检验、企业管理等活动中普遍存在的相互影响、相互依存的关系可以概括为两大类:函数关系和相关关系,函数关系是一种严格的确定对应关系,而相关关系是一种不要求确定对应,具有一定随机性的关系,实际中,并且相关关系更具有一般性。相关分析是处理变量之间相关关系的一种统计方法。通过相关分析,可以了解两个或两个以上的变量之间是否有相关关系,相关关系的方向、形式以及相关密切程度。下面我们就为读者简单介绍相关分析。 9.1.1 引例,相关分析概述 相关分析是用来研究变量间相关关系的,因此读者必须对相关关系有一个比较清楚的概念。在现实生产生活中,各种事物特征、各种现象之间相互联系、相互制约、相互依存,某些现象发生变化时,另一现象也会随之变化,例如,居民收入的高低会影响银行储蓄额的增减,商品价格的变化会影响商品销售量的变化等等。这些影响依存的关系又可分为函数关系和相关关系两大类。

spss数据分析教程之SPSS信度分析和效度分析

信度分析和效度分析 数据计分方法说明 类别 小分类 对应题项 每题计分方法 维度计分方法 题项 职业倦怠 情感枯竭 1-3题 正向计分 全部题项直接加总 3 去个性化 4-6题 正向计分 全部题项直接加总 3 个人成就感 7-10题 逆向计分 全部题项取倒数后加 总 4 心理资本 11-18题 正向计分 全部题项直接加总 8 组织气氛 19-26题 21题为逆向计分,其余题项正向计分 21题取倒数后与其余 题项加总 8 总体幸福感 27-31题 27题和31题为逆向计分,其余题项为正 向计分 27和31题取到术后与 其余题项加总 5 整体问卷 以上各个维度的总分 直接加总 31 讲问卷调查的数据进行如上表的数据预处理后,接下来再进行如下分析。 1 信度分析 这里有63份问卷,首先我们需要的判定的是问卷中的调查题目能否反映调查的目的和调查的意图,问卷中的各个问题是否测量了相同的内容和信息;同时,对于调查问卷所得到的数据是否具有可靠性,就必须在对问卷分析之前做信度分析。信度本身与测量结果的正确与否无关,它的用途在于检测问卷本身的稳定性。信度分析中常用Cronbach α系数的大小来衡量调查问卷的信度。一般而言,如果问卷的信度系数达到0.9以上,该问卷调查的信度就较好;信度系数在0.8以上,是不错的;一般认为试卷信度在0.5至0.9以内是合理的,如果信度系数低于0.5,则此问卷的调查结果就不可信了。 将以上63份问卷的数据用SPSS21.0先进行标准化处理,再进行信度分析,其结果如表一所示: 表一 信度分析表

类别Cronbach's Alpha项数 整体问卷.61731 职业倦怠.82210 心理资本.8018 组织气氛.8378 总体幸福感.6795 表一显示,整体问卷和问卷中的各个维度的Cronbach's Alpha系数值均大于0.6,所以可以推断此问卷的可信度一般,该评价问卷只具有很较高的内在一致性。 2 效度分析 具备信度的问题不一定具备效度,因此做完信度分析,再用SPSS21.0对其进行效度分析。 2.1 因子模型适应性分析 效度分析使用的是因子分析模型,在运用因子模型分析之前,首先要对问卷数据进行因子模型适应性分析,分析结果如下表所示: 表二 KMO 和 Bartlett 的检验 KMO 和 Bartlett 的检验 取样足够度的 Kaiser-Meyer-Olkin 度量。.657 Bartlett 的球形度检验近似卡方1187.636 df 465 Sig. .000 由上表的数据可知,问卷数据的KMO值为0.657,并且通过了显著性水平为0.05的巴特利球型检验,说明问卷调查的数据非常适合做因子分析。 2.2 因子分析结果 在进行了适应性检验之后,接下来就进行因子分析,其结果如下: 表三方差贡献率 解释的总方差 成份初始特征值提取平方和载入旋转平方和载入

《统计分析与SPSS的应用(第五版)》课后练习答案(第9章)

《统计分析与SPSS的应用(第五版)》(薛薇) 课后练习答案 第9章SPSS的线性回归分析 1、利用第2章第9题的数据,任意选择两门课程成绩作为解释变量和被解释变量,利用SPSS 提供的绘制散点图功能进行一元线性回归分析。请绘制全部样本以及不同性别下两门课程 成绩的散点图,并在图上绘制三条回归直线,其中,第一条针对全体样本,第二和第三条 分别针对男生样本和女生样本,并对各回归直线的拟和效果进行评价。 选择fore和phy两门成绩体系散点图 步骤:图形旧对话框散点图简单散点图定义将fore导入Y轴,将phy导入X轴,将sex导入设置标记确定。 接下来在SPSS输出查看器中,双击上图,打开图表编辑

在图表编辑器中,选择“元素”菜单选择总计拟合线选择线性应用再选择元素菜单点击子组拟合线选择线性应用。

分析:如上图所示,通过散点图,被解释变量y(即:fore)与解释变量phy有一定的线性关系。但回归直线的拟合效果都不是很好。 2、请说明线性回归分析与相关分析的关系是怎样的? 相关分析是回归分析的基础和前提,回归分析则是相关分析的深入和继续。相关分析需要依靠回归分析来表现变量之间数量相关的具体形式,而回归分析则需要依靠相关分析来表现变 量之间数量变化的相关程度。只有当变量之间存在高度相关时,进行回归分析寻求其相关的具体形式才有意义。如果在没有对变量之间是否相关以及相关方向和程度做出正确判断之 前,就进行回归分析,很容易造成“虚假回归”。与此同时,相关分析只研究变量之间相关 的方向和程度,不能推断变量之间相互关系的具体形式,也无法从一个变量的变化来推测另 一个变量的变化情况,因此,在具体应用过程中,只有把相关分析和回归分析结合起来,才 能达到研究和分析的目的。 线性回归分析是相关性回归分析的一种,研究的是一个变量的增加或减少会不会引起另一个 变量的增加或减少。 3、请说明为什么需要对线性回归方程进行统计检验?一般需要对哪些方面进行检验? 检验其可信程度并找出哪些变量的影响显著、哪些不显著。 主要包括回归方程的拟合优度检验、显著性检验、回归系数的显著性检验、残差分析等。

应用回归分析实验报告

实验报告一、步骤: 本实验运用的是spss19.0中文版。 1.输入数据 2.画散点图

输出结果为: 3.回归分析

二、输出结果: 表一描述性统计量 均值 标准 偏差 N y 2.850 1.4347 10 x 762.00 379.746 10

表二相关性 y x Pearson 相关性y 1.000 .949 x .949 1.000 Sig. (单侧)y . .000 x .000 . N y 10 10 x 10 10 由上表可得 x与y的相关系数为0.949,在置性水平为0.05下,y与x显著相关。 表三输入/移去的变量b 模型输入的变量移去的变量方法 1 x a. 输入 a. 已输入所有请求的变量。 b. 因变量: y 表四模型汇总 模型R R 方调整 R 方标准估计的误 差 1 .949a.900 .888 .4800 a. 预测变量: (常量), x。 由上图知该回归方程的标准误差是0.4800 由图中的R 方知决定系数是0.900 表五Anova b 模型平方和df 均方 F Sig. 1 回归16.68 2 1 16.682 72.396 .000a 残差 1.843 8 .230 总计18.525 9 a. 预测变量: (常量), x。 b. 因变量: y 由ANOVA方差分析图知,此模型的回归平方和是16.682,残差平方和是1.843,总平方和是18.525;三者自由度分别为:1,8,9;回归平方和与残差平方和的平

均平方和依次为16.682,0.23;此模型的F 检验值为72.396. 表六系数a 模型 非标准化系数 标准系数 t Sig. B 的 95.0% 置信区间 B 标准 误差 试用版 下限 上限 1 (常量) .118 .355 .333 .748 -.701 .937 x .004 .000 .949 8.509 .000 .003 .005 a. 因变量: y 由上图知 (1).回归方程为0.1180.004y x ∧∧ =+ (2).回归系数的区间估计,在置信度为95%下,01ββ∧ ∧ 和的置信区间分别为(-0.701,0.937),(0.003,0.005)。 (3).10.004β∧ =,其标准误差为0,t 检验值是8.509,在显著性检验下看出y 与x 是显著相关的。 三、残差图 将spss 输出的残差作出相应的散点图如下: 从残差图上看出,残差是围绕0e =随机波动,从而模型的基本假设是满足的。

spss数据分析教程之SPSS信度分析和效度分析

信度分析和效度分析 数据计分方法说明 讲问卷调查的数据进行如上表的数据预处理后,接下来再进行如下分析。 1 信度分析 这里有 63 份问卷,首先我们需要的判定的是问卷中的调查题目能否反映调 查的目的和调 查的意图,问卷中的各个问题是否测量了相同的内容和信息;同时, 对于调查问卷所得到的数据是否具有可靠性,就必须在对问卷分析之前做信度分 析。信度本身与测量结果的正确与否无关,它的用途在于检测问卷本身的稳定性。 信度分析中常用 Cronbach α系数的大小来衡量调查问卷的信度。一般而言,如 果问卷的信度系数达到 0.9 以上,该问卷调查的信度就较好;信度系数在 0.8 以上,是不错的;一般认为试卷信度在 0.5至 0.9以内是合理的,如果信度系数 低于 0.5,则此问卷的调查结果就不可信了。 将以上 63份问卷的数据用 SPSS21.0先进行标准化处理,再进行信度分析, 其结果如表一所示: 表一 信度分析表 类别 小分类 对应题 项 每题计分方法 维度计分方法 心理资本 组织气氛 总体幸福感 整体问卷 情感枯竭 1-3 题 正向计分 去个性化 4-6 题 正向计分 个人成就感 7-10 题 逆向计分 11-18 题 19-26 题 27-31 正向计分 全部题项直接加总 全部题项直接加总 全部题项取倒数后加 总 全部题项直接加总 21 题为逆向计分,其 余题项正向计分 27 题和 31 题为逆向 计分,其余题项为正 向计分 21 题取倒数后与其余 题项加总 27 和 31题取到术后与 其余题项加总 以上各个维度的总分 直接加总 3 3 4 8 8 5 31

整体问卷.617 31 职业倦怠.822 10 心理资本.801 8 组织气氛.837 8 总体幸福感.679 5 表一显示,整体问卷和问卷中的各个维度的 Cronbach's Alpha 系数值均大于 0.6,所以可以推断此问卷的可信度一般,该评价问卷只具有很较高的内在一致性。 2 效度分析 具备信度的问题不一定具备效度,因此做完信度分析,再用 SPSS21.0 对其进行效度分析。 2.1 因子模型适应性分析效度分析使用的是因子分析模型,在运用因子模型分析之前,首先要对问卷数据进行因子模型适应性分析,分析结果如下表所示: 表二 KMO 和 Bartlett 的检验 KMO 和 Bartlett 的检验 取样足够度的 Kaiser-Mey er-Olkin 度量。.657 近似卡方1187.636 Bartlett 的球形度检验df465 Sig..000 由上表的数据可知,问卷数据的KMO 值为0.657,并且通过了显著性水平为0.05 的巴特利球型检验,说明问卷调查的数据非常适合做因子分析。 2.2 因子分析结果在进行了适应性检验之后,接下来就进行因子分析,其结果如下: 表三方差贡献率 解释的总方差 成份初始特征值提取平方和载入旋转平方和载入

应用回归分析实验报告

重庆交通大学学生实验报告 实验课程名称应用回归分析 开课实验室数学实验室 学院理学院年级专业班 学生姓名学号 开课时间2013 至2014 学年第2 学期 评分细则评分 报告表述的清晰程度和完整性(20分) 程序设计的正确性(40分) 实验结果的分析(30分) 实验方法的创新性(10分) 总成绩 教师签名邹昌文

2.15 一家保险公司十分关心其总公司营业部加班的程度,决定认真调查一下现状。经过10周时间,收集了每周加班工作时间的数据和签发新保单数目,x 为每周签发的新保单数目,y 为每周加班工作时间(小时)。 表2.7 y 3.5 1 4 2 1 3 4.5 1.5 3 5 x 825 215 1070 550 480 920 1350 325 670 1215 (1)画散点图; (2)x 与y 之间是否大致呈线性关系? (3)用最小二乘估计求出回归方程; (4)求回归标准误差?σ ; (5)给出0?β、1 ?β的置信度为95%的区间估计; (6)计算x 与y 的决定系数; (7)对回归方程做方差分析; (8)做回归系数1 ?β显著性检验; (9)做相关系数的显著性检验; (10)对回归方程做残差图并作相应的分析; (11)该公司预计下一周签发新保单01000x =张,需要的加班时间是多少? (12)给出0y 的置信水平为95%的精确预测区间和近视预测区间。 (13)给出0()E y 置信水平为95%的区间估计。 (1)将数据输入到SPSS 中,画出散点图如下:

(2)由下表可知x与y的相关系数高达0.949,大于0.8,所以x与y之间线性相关性显著。 相关性 y x Pearson 相关性y 1.000 .949 x .949 1.000 Sig. (单侧)y . .000 x .000 . N y 10 10 x 10 10

spss软件进行信度分析

spss软件进行信度分析 问卷的信度分析一、概念:信度是指根据测验工具所得到的结果的一致性或稳定性,反映被测特征真实程度的指标。一般而言,两次或两个测验的结果愈是一致,则误差愈小,所得的信度愈高,它具有以下特性:1 、信度是指测验所得到结果的一致性或稳定性,而非测问卷的信度分析 一、概念: 信度是指根据测验工具所得到的结果的一致性或稳定性,反映被测特征真实程度的指标。一般而言,两次或两个测验的结果愈是一致,则误差愈小,所得的信度愈高,它具有以下特性: 1、信度是指测验所得到结果的一致性或稳定性,而非测验或量表本身; 2、信度值是指在某一特定类型下的一致性,非泛指一般的一致性,信度系数会因不同时间、不同受试者或不同评分者而出现不同的结果; 3、信度是效度的必要条件,非充分条件。信度低效度一定低,但信度高未必表示效度也高; 信度检验完全依赖于统计方法。 信度可分为:内在信度:对一组问题是否测量同一个概念,同时组成量表题项的内在一致性程度如何;常用的检测方法是Cronbach’s alpha系数。外在信度:对相同的测试者在不同时间测得的结果是否一致,再测信度是外在信度最常用的检验法。 二、信度指标: 1.用信度系数来表示信度的大小。信度系数越大,表明测量的可信程度越大。究竟信度系数要多少才算有高的信度。学者DeVellis(1991)认为,0.60~0.65(最好不要);0.65~0.70(最小可接受值);0.70~0.80(相当好);0.80~0.90(非常好)。由此,一份信度系数好的量表或问卷,最好在0.80以上,0.70至0.80之间还算是可以接受的范围;分量表最好在0.70以上,0.60至0.70之间可以接受。若分量表的内部一致性系数在0.60以下或者总量表的信度系数在0.80以下,应考虑重新修订量表或增删题项。 2.信度指标多以相关系数来表示:大致可分为三类:稳定系数(跨时间的一致性)、等值系数(跨形式的一致性)和内在一致性系数(跨项目的一致性)。 三、信度分析方法: 1.重测信度法: 用同样的问卷对同一被测间隔一定时间的重复测试,也可称作测试——再测方法,计算两次测试结果的相关系数。很显然这是稳定系数,即跨时间的一致性。重测信度法适用于事实性的问卷,也可用于不易受环境影响的态度、意见式问卷。由于重测信度需要对同一样本试测两次,而被测容易受到各种事件、活动的影响,所以间隔时间需要适当。较常用者为间隔二星期或一个月。 2.复本信度法(等同信度法): 复本信度法是让被测一次填写两份问卷复本,计算两个复本的相关系数。由于这种方法要求两个复本除表达方式不同外,在内容、格式、难度和对应题项的提问方式等方面都要完全一致,所以复本信度属于等值系数。在实际的调查中,问卷很难达到这种要求,这种方法较少被采用。 3.折半信度法: 折半信度法是指将测量项目按奇偶项分成两半,分别记分,测算出两半分数之间的相关系数(实际应用EXCEL软件),再据此确定整个测量的信度系数RXX。折半信度属于内在一

多元回归分析实验报告

多元回归分析实验报告 【实验环境】SPSS 23.0 【实验名称】多元回归分析 【实验目的】 (1)掌握应用SPSS软件执行简单的多元回归分析,并根据统计输出结果整理报表 (2)熟悉按Enter和Stepwise等不同的方法把自变量置入回归模型,分析并报告结果 【实验内容】 1.分析前期的虚拟变量处理准备。利用“回归分析数据”执行统计分析,以便探讨主管品德、 主管工作能力、主管人际能力三个因素对员工离职倾向的影响。其中,为了排除员工性别(1=男,2=女)和组织类型(1=政府机关;2=事业单位;3=国有企业;4=非国有企业)两个因素对分析结果的干扰,通常需要把员工性别和组织类型作为控制变量建立分析模型。并且,由于上述两个控制变量均为分类变量,不宜直接置入回归模型,应将其应用重新编码为不同变量,分别将它们转换为取值为0或者1的虚拟变量。在进行虚拟变量转换时,可以把“男”作为性别的参照组,而把“政府机关”作为组织类型的参照组,以此进行转换(可以参照实验结果中的表1加以理解)。 2.按照Enter法置入解释变量执行回归分析。把主管品德、主管工作能力、主管人际能力三 个因素,以及经过上一步经过转换得到并用作控制变量的虚拟变量,同时置入模型作为IV (Independent Variable),同时注意勾选方差变化量及多重共线性检验,执行统计分析,并根据输出结果按表1要求的信息制作报表。 3.按照stepwise法置入解释变量执行回归分析。把主管品德、主管工作能力、主管人际能力 三个因素,以及经过上一步经过转换得到并用作控制变量的虚拟变量,同时置入模型作为IV(Independent Variable),同时注意勾选方法为Stepwise(步进,或译为逐步)及多重共线性检验,执行统计分析,并根据输出结果按表2要求的信息制作报表。 【实验过程】

spss数据分析教程之SPSS信度分析和效度分析

s p s s数据分析教程之S P S S信度分析和效度 分析 集团标准化工作小组 [Q8QX9QT-X8QQB8Q8-NQ8QJ8-M8QMN]

信度分析和效度分析 数据计分方法说明 1 信度分析 这里有63份问卷,首先我们需要的判定的是问卷中的调查题目能否反映调查的目的和调查的意图,问卷中的各个问题是否测量了相同的内容和信息;同时,对于调查问卷所得到的数据是否具有可靠性,就必须在对问卷分析之前做信度分析。信度本身与测量结果的正确与否无关,它的用途在于检测问卷本身的稳定性。信度分析中常用Cronbach α系数的大小来衡量调查问卷的信度。一般而言,如果问卷的信度系数达到以上,该问卷调查的信度就较好;信度系数在以上,是不错的;一般认为试卷信度在至以内是合理的,如果信度系数低于,则此问卷的调查结果就不可信了。 将以上63份问卷的数据用先进行标准化处理,再进行信度分析,其结果如表一所示:

表一显示,整体问卷和问卷中的各个维度的Cronbach's Alpha系数值均大于,所以可以推断此问卷的可信度一般,该评价问卷只具有很较高的内在一致性。 2 效度分析 具备信度的问题不一定具备效度,因此做完信度分析,再用对其进行效度分析。 因子模型适应性分析 效度分析使用的是因子分析模型,在运用因子模型分析之前,首先要对问卷数据进行因子模型适应性分析,分析结果如下表所示: 表二 KMO 和 Bartlett 的检验 KMO 和 Bartlett 的检验 取样足够度的 Kaiser-Meyer-Olkin 度量。.657 Bartlett 的球形度检验近似卡方 df465 Sig..000 由上表的数据可知,问卷数据的KMO值为,并且通过了显着性水平为的巴特利球型检验,说明问卷调查的数据非常适合做因子分析。 因子分析结果 在进行了适应性检验之后,接下来就进行因子分析,其结果如下: 表三方差贡献率 解释的总方差 成份 初始特征值提取平方和载入旋转平方和载入 合计方差的 %累积 %合计方差的 %累积 %合计方差的 %累积 % 1 2 3 4 5 6 7 8 9.958 10.880 11.762 12.714 13.684 14.623 15.580 16.509 17.449 18.394 19.342 20.289.934

相关文档
相关文档 最新文档