文档库 最新最全的文档下载
当前位置:文档库 › SPSS因子分析报告实例操作步骤

SPSS因子分析报告实例操作步骤

SPSS因子分析报告实例操作步骤
SPSS因子分析报告实例操作步骤

SPSS因子分析实例操作步骤

实验目的:

引入2003~2013年全国的农、林、牧、渔业,采矿业,制造业电力、热力、燃气及水生产和供应业,建筑业,批发和零售业,交通运输、仓储和邮政业7个产业的投资值作为变量,来研究其对全国总固定投资的影响。

实验变量:

以年份,合计(单位:千亿元),农、林、牧、渔业,采矿业,制造业电力、热力、燃气及水生产和供应业,建筑业,批发和零售业,交通运输、仓储和邮政业作为变量。

实验方法:因子分析法

软件:spss19.0

操作过程:

第一步:导入Excel数据文件

1.open data document——open data——open;

2. Opening excel data source——OK.

第二步:

1.数据标准化:在最上面菜单里面选中Analyze——Descriptive Statistics——OK (变量选择除年份、合计以外的所有变量).

2.降维:在最上面菜单里面选中Analyze——Dimension Reduction——

Factor ,变量选择标准化后的数据.

3.点击右侧Descriptive,勾选Correlation Matrix选项组中的

Coefficients和KMO and Bartlett’s text of sphericity,点击

Continue.

4.点击右侧Extraction,勾选Scree Plot和fixed number with factors,默认3个,点击Continue.

5.点击右侧Rotation,勾选Method选项组中的Varimax;勾选Display选项组中的Loding Plot(s);点击Continue.

6.点击右侧Scores,勾选Method选项组中的Regression;勾选Display factor score coefficient matrix;点击Continue.

7.点击右侧Options,勾选Coefficient Display Format选项组中所有选项,将Absolute value blow改为0.60,点击Continue.

8.返回主对话框,单击OK.

输出结果分析:

1.描述性统计量

Descriptive Statistics

N Minimum Maximum Mean Std. Deviation

农、林、牧、渔业11 3.27 9.73 7.6645 1.97515

采矿业11 .6 9.5 5.008 2.7092

制造业11 .44 7.07 2.6900 2.22405

电力、热力、燃气及水生产和

11 3.36 15.05 10.3545 3.22751

供应业

建筑业11 1.79 23.51 7.8955 6.18302

批发和零售业11 2.10 18.52 9.1018 5.50553

交通运输、仓储和邮政业11 .82 8.39 2.7891 2.20903

Valid N (listwise) 11

该表提供分析过程中包含的统计量,表格显示了样本容量以及11个变量的最小值、最大值、平均值、标准差。

2.KMO和球形Bartlett检验

KMO and Bartlett's Test

Kaiser-Meyer-Olkin Measure of Sampling Adequacy. .744

Bartlett's Test of Sphericity Approx. Chi-Square 97.122

df 21

Sig. .000

该表给出了因子分析的KMO和Bartlett检验结果。从表中可以看出,Bartlett球度检验的概率p值为0.000,即假设被拒绝,也就是说,可以认为相关系数矩阵与单位矩阵有显著差异。同时,KMO值为0.744,根据KMO度量标准可知,原变量适合进行因子分析。

3.因子分析的共同度

Communalities

Initial Extraction

Zscore(农、林、牧、渔业) 1.000 .883

Zscore: 采矿业 1.000 .741

Zscore: 制造业 1.000 .974

Zscore(电力、热力、燃气及

1.000 .992

水生产和供应业)

Zscore: 建筑业 1.000 .987

Zscore(批发和零售业) 1.000 .965

Zscore(交通运输、仓储和邮

1.000 .935

政业)

Extraction Method: Principal Component Analysis.

表格所示是因子分析的共同度。表格第二列显示初始共同度,全部为1.000;第三列是按照提取3个公因子得到的共同度,可以看到只有“采矿业”的共同度稍低,说明其信息丢失量稍严重。

4.因子分析的总方差解释

该表由3部分组成,分别为初始因子解的方差解释、提取因子解的方差解释和旋转因子解的方差解释。

个因子的特征跟都很大,从第四个开始,因子的特征根都小于一,且连线变得较平缓,及前三个因子对解释变量的贡献最大,

6.旋转前的因子载荷矩阵

Rotated Component Matrix a

Component

1 2 3

Zscore(农、林、牧、渔业) .899

Zscore(交通运输、仓储和邮政业) -.716 -.3.41

Zscore: 采矿业.771 .352

.749 .440 .441

Zscore(电力、热力、燃气及水生产和

供应业)

Zscore: 建筑业.985

Zscore(批发和零售业) .961

Zscore: 制造业 .873

Extraction Method: Principal Component Analysis.

Rotation Method: Varimax with Kaiser Normalization.

该表空白处表示相应载荷小于0.3。因子载荷矩阵中给出每一个变量在三个因子上的载荷。

在旋转后的载荷矩阵中可以看出,与第一产业相关的产业在第一个因子上的载荷较高,与第二产业相关的产业在第二个因子上的载荷较高,与第三产业相关的产业在第三个因子上的载荷较高。和没旋转相比,因子的含义清楚很多。

8.旋转空间的因子图

该图为可以看做是旋转后的载荷矩阵的图形表示。从图中又一次验证了前面旋转后的载荷矩阵对因子的解释。

8.因子得分系数

Component Score Coefficient Matrix

Component

1 2 3

Zscore(农、林、牧、渔业) .445 .075 -.350

Zscore: 采矿业.261 -.054 .093

Zscore: 制造业-.180 .008 .761

Zscore(电力、热力、燃气及

.201 .182 .263

水生产和供应业)

Zscore: 建筑业-.074 .429 .156

Zscore(批发和零售业) .071 .402 -.130

-.322 .204 .050

Zscore(交通运输、仓储和邮

政业)

Extraction Method: Principal Component Analysis.

Rotation Method: Varimax with Kaiser Normalization.

Component Scores.

列出了采用回归法估算的因子得分系数,根据表中的内容可以写出因子得分函数F1=0.445*Zscore1+0.261*Zscore2-0.180*Zscore3+0.201*Zscore4-0.074*Zscore 5+0.071*Zscore6-0.322*Zscore7

F2=0.075*Zscore1-0.054*Zscore2+0.008*Zscore3+0.182*Zscore4-0.429*Zscore 5+0.402*Zscore6-0.204*Zscore7

F3=-0.350*Zscore1+0.093*Zscore2+0.761*Zscore3+0.263*Zscore4+0.156*Zscor e5-0.130*Zscore6+0.050*Zscore7

不仅如此,原数据文件中增加了变量FAC_1和FAC_2、FAC_3,表示3个因子在不同年份的得分值。

9.总因子得分及排序

附件:

原始数据:

标准化后的数据:

【实验报告】SPSS相关分析实验报告

SPSS相关分析实验报告 篇一:spss对数据进行相关性分析实验报告 实验一 一.实验目的 掌握用spss软件对数据进行相关性分析,熟悉其操作过程,并能分析其结果。 二.实验原理 相关性分析是考察两个变量之间线性关系的一种统计分析方法。更精确地说,当一个变量发生变化时,另一个变量如何变化,此时就需要通过计算相关系数来做深入的定量考察。P值是针对原假设H0:假设两变量无线性相关而言的。一般假设检验的显著性水平为0.05,你只需要拿p值和0.05进行比较:如果p值小于0.05,就拒绝原假设H0,说明两变量有线性相关的关系,他们无线性相关的可能性小于0.05;如果大于0.05,则一般认为无线性相关关系,至于相关的程度则要看相关系数R值,r越大,说明越相关。越小,则相关程度越低。而偏相关分析是指当两个变量同时与第三个变量相关时,将第三个变量的影响剔除,只分析另外两个变量之间相关程度的过程,其检验过程与相关分析相似。三、实验内容 掌握使用spss软件对数据进行相关性分析,从变量之间的相关关系,寻求与人均食品支出密切相关的因素。 (1)检验人均食品支出与粮价和人均收入之间的相关关系。 a.打开spss软件,输入“回归人均食品支出”数据。

b.在spssd的菜单栏中选择点击,弹出一个对话窗口。 C.在对话窗口中点击ok,系统输出结果,如下表。 从表中可以看出,人均食品支出与人均收入之间的相关系数为0.921,t检验的显著性概率为0.0000.01,拒绝零假设,表明两个变量之间显著相关。人均食品支出与粮食平均单价之间的相关系数为0.730,t检验的显著性概率为 0.0000.01,拒绝零假设,表明两个变量之间也显著相关。 (2)研究人均食品支出与人均收入之间的偏相关关系。 读入数据后: A.点击系统弹出一个对话窗口。 B.点击OK,系统输出结果,如下表。 从表中可以看出,人均食品支出与人均收入的偏相关系数为0.8665,显著性概率p=0.0000.01,说明在剔除了粮食单价的影响后,人均食品支出与人均收入依然有显著性关系,并且0.86650.921,说明它们之间的显著性关系稍有减弱。通过相关关系与偏相关关系的比较可以得知:在粮价的影响下,人均收入对人均食品支出的影响更大。 三、实验总结 1、熟悉了用spss软件对数据进行相关性分析,熟悉其操作过程。 2、通过spss软件输出的数据结果并能够分析其相互之间的关系,并且解决实际问题。 3、充分理解了相关性分析的应用原理。

SPSS因子分析(因素分析)——实例分析

SPSS因子分析(因素分析)——实例分析 提起因子分析那是老生常谈,分析人士大都喜欢讨论主成分与因子分析。我也凑个热闹,顺便温习温习,时间长了就会很模糊。 一、概念 探讨存在相关关系的变量之间,是否存在不能直接观察到的但对可观测变量的变化其支配作用的潜在因子的分析方法就是因子分析,也叫因素分析。通俗点:原始变量是共性因子的线性组合。 二、简单实例 现在有12个地区的5个经济指标调查数据(总人口、学校校龄、总雇员、专业服务、中等房价),为对这12个地区进行综合评价,请确定出这12 个地区的综合评价指标。点击下载 三、解决方案 1、不同地区的不同指标不同,这导致目前我们拥有的5个指标数据很难对这12个地区给一个明确的评价。所以,有必要确定综合评价指标,便于对比。因子分析是一种选择,当然还有其他的方法。5个指标即为我们分析的对象,直接选入。

2、描述统计选项卡。我们要对比因子提取前后的方差变化,所以选定“初始分析结果”;现在是基于相关矩阵提取因子,所以,选定相关矩阵的“系数”;比较重要的还有KMO和球形检验,它告诉我们数据是不是适合做因子分析。选定。其他选择自定。 3、抽取选项卡。提取因子的方法有很多,最常用的就是主成分法。这里选主成分。关于特征值,不想解释太多,这和显著性水平一样,都是统计学的一个基本概念。因为参与分析的变量测度单位不同,所以选择“相关矩阵”,如果参与分析的变量测度单位相同,则考虑选用协方差矩阵。

4、是否需要旋转?因子分析要求对因子给予命名和解释,对因子旋转与否取决于因子的解释。如果不经旋转因子已经很好解释,那么没有必要旋转,否则,应该旋转。这里直接旋转,便于解释。至于旋转就是坐标变换,使得因子系数向1和0靠近,对公因子的命名和解释更加容易。 5、要计算因子得分,就必须先写出因子的表达式。而因子是不能直接观察到的,是潜在的。但是可以通过可观测到的变量获得。前面说到,因子分析模型是原始变量为因子的线性组合,现在我们可以根据回归的方法将模型倒过来,用

Spss数据分析报告

2 2 SPSS 期末报告 关于员工受教育程度对其工资水 平的影响统计分析报告 SPSS 统计分析方法 姓汤重阳 号:学 三班所在班级: 目录 一、 数据样本描 述 ..................... 二、 要解决的问题描 述 ..................... 1数据管理与软件入门部分 1 1.1分类汇总 ............ 1.2个案排秩 ............ 1.3连续变量变分组变量 2统计描述与统计图表部分 2.1频数分析.…… 2.2描述统计分析 3假设检验方法部分 2 3.1分布类型检验 3.1.1 正态分布. 3.1.2 二项分布. 课程名称: 名: 人力资源管理 所在专业:

3.1.3 游程检验 (2) 3.2 单因素方差分析 (2) 3.3 卡方检验 (2) 3.4 相关与线性回归的分析方法 (2) 3.4.1 相关分析(双变量相关分析&偏相关分析) (2) 3.4.2 线性回归模型 (2) 4 高级阶段方法部分..................................... 2 三、具体步骤描述 (3) 1 数据管理与软件入门部分.................................. 3 1.1 分类汇总 (3) 1.2 个案排秩 (3) 1.3 连续变量变分组变量 (4) 5 ........................................................ 统计描述与统计图表部 分2 2.1 频数分析 (5) 2.2 描述统计分析 (6) 3 假设检验方法部分..................................... 7 3.1 分布类型检验 (7) 3.1.1 正态分布 (7) 3.1.2 二项分布 (8) 3.1.3 游程检验 (9) 3.2 单因素方差分析 (10) 3.3 卡方检验 (12) 3.4 相关与线性回归的分析方法 (13) 3.4.1 相关分析 (13) 3.4.2 线性回归模型 (15) 4 高级阶段方法部分..................................... 16 4.1 信度 (16) 71 ................................................................... 效度4.2 一、数据样本描述 分析数据来自于“微盘一一SPSS数据包data02-01 ”。 本次分析的数据为某公司474名职工状况统计表,其中共包含11 个变量,分别是: id (职工编号),gender(性别),bdate(出生日期),edcu(受教育水平程度), jobcat (职务等级),salbegin (起始工资),salary (现工资),jobtime(本单位工作经历<月>),prevexp(以前工作经历<月>),minority(民族类型),age(年龄)。通过运用SPSS统计软件,对变量进行统计分析,以了解该公司职工总体状况,并分析职工受教育程度、起始工资、现工资的分布特点及相互间的关系。

SPSS相关分析报告实验报告材料

本科教学实验报告 (实验)课程名称:数据分析技术系列实验

实验报告 学生姓名: 一、实验室名称: 二、实验项目名称:相关分析 三、实验原理 相关关系是不完全确定的随机关系。在相关关系的情况下,当一个或几个相互联系的变量取一定值得时候,与之相应的另一变量的值虽然不确定,但它仍然按照某种规律在一定的范围内变化。 按照数据度量的尺度不同,相关分析的方法也不同,连续变量之间的相关性常用Pearson简单相关系数测定;定序变量的相关系数常用Spearman秩相关系数和Kendall 秩相关系数测定;定类变量的相关分析要使用列连表分析法。 四、实验目的 理解相关分析的基本原理,掌握在SPSS软件中相关分析的主要参数设置及其含义,掌握SPSS软件分析结果的含义及其分析。 五、实验内容及步骤 实验内容:以雇员表为例,共有474条数据,运用相关分析方法对变量间的相关关系进行分析。

1)分析性别与工资之间是否存在相关关系。 2)分析教育程度与工资之间是否存在相关关系。 实验要求:掌握相关分析方法的计算思路及其在SPSS环境下的操作方法,掌握输出结果的解释。 1. 分析性别与工资之间是否存在相关关系。 分析:性别属于定类变量,是离散值,因使用卡方检验。 Step1.操作为Analyze \ Descriptive Statistics \ Crosstabs Step2.将性别(Gender)和收入(Current Salary)分别移入Rows列表框和Columns 列表框。

Step3.单击Statistics按钮,在弹出的子对话框中选中默认的Chi-square,进行卡方检验。退回到主对话框,单击ok。

spss因子分析实例

一.研究目的:为了研究农民收入,我们选取了其中7种主要影响因素,包括财政用于农业的支出的比重(%),第二、三产业从业人数占全社会从业人数的比重(%),非农村人口比重,乡村从业人员占农村人口的比重(%),农业总产值占农林牧总产值的比重(%),农作物播种面积(千公顷),农村用电量(亿千瓦时)。(数据见最后一页) 二.研究变量:在经济生活中,根据以上分析,我们在影响农民收入因素中引入7个变量。即设置变量:x1-财政用于农业的支出的比重,x2-第二、三产业从业人数占全社会从业人数的比重,x3-非农村人口比重,x4-乡村从业人员占农村人 农村口的比重,x5-农业总产值占农林牧总产值的比重,x6-农作物播种面积,x7 — 用电量。 一、研究方法:SPSS中的因子分析。 具体操作步骤 (1)定义变量:x1-财政用于农业的支出的比重,x2-第二、三产业从业人数占全社会从业人数的比重,x3-非农村人口比重,x4-乡村从业人员占农村人口的 农村用电比重,x5-农业总产值占农林牧总产值的比重,x6-农作物播种面积,x7 — 量。 (2)导入数据: file-open-data (3)变量标准化Analyze-Descriptive Statistics-Descriptives

" 勾选Save standardized values as variables保存变量,再点击ok,就完成了对变量的标准化。 (3)因子分析 Analyze—Dimension Reduction—Faction

点击右侧的Description选项,选择Statistics选项组中的initial solution,勾选Correlation Matrix 选项组中的Coefficients和KMO and Bartlelts test of sphericity,点击Continue。 点击右侧Extraction选项,其中Method选Principal components,Analyze选择Correlation matrix,Display中选择Unrotated factor solution,Extract如图,点击Continue.

SPSS因子分析报告实例操作步骤

SPSS因子分析实例操作步骤 实验目的: 引入2003~2013年全国的农、林、牧、渔业,采矿业,制造业电力、热力、燃气及水生产与供应业,建筑业,批发与零售业,交通运输、仓储与邮政业7个产业的投资值作为变量,来研究其对全国总固定投资的影响。 实验变量: 以年份,合计(单位:千亿元),农、林、牧、渔业,采矿业,制造业电力、热力、燃气及水生产与供应业,建筑业,批发与零售业,交通运输、仓储与邮政业作为变量。 实验方法:因子分析法 软件:spss19、0 操作过程: 第一步:导入Excel数据文件 1.open data document——open data——open; 2、 Opening excel data source——OK、

第二步: 1、数据标准化:在最上面菜单里面选中Analyze——Descriptive Statistics——OK (变量选择除年份、合计以外的所有变量)、 2.降维:在最上面菜单里面选中Analyze——Dimension Reduction—— Factor ,变量选择标准化后的数据、

3.点击右侧Descriptive,勾选Correlation Matrix选项组中的 Coefficients与KMO and Bartlett’s text of sphericity,点击 Continue、 4、点击右侧Extraction,勾选Scree Plot与fixed number with factors,默认3个,点击Continue、

5、点击右侧Rotation,勾选Method选项组中的Varimax;勾选Display选项组中的Loding Plot(s);点击Continue、 6、点击右侧Scores,勾选Method选项组中的Regression;勾选Display factor score coefficient matrix;点击Continue、

spss的数据分析报告

关于某地区361个人旅游情况统计分析报告 一、数据介绍: 本次分析的数据为某地区361个人旅游情况状况统计表,其中共包含七变量,分别是:年龄,为三类变量;性别,为二类变量(0代表女,1代表男);收入,为一类变量;旅游花费,为一类变量;通道,为二类变量(0代表没走通道,1代表走通道);旅游的积极性,为三类变量(0代表积极性差,1代表积极性一般,2代表积极性比较好,3代表积极性好 4代表积极性非常好);额外收入,一类变量。通过运用spss统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析、。。。以了解该地区上述方面的综合状况,并分析个变量的分布特点及相互间的关系。 二、数据分析 1、频数分析。基本的统计分析往往从频数分析开始。通过频数分地区359个人旅游基本状 况的统计数据表,在性别、旅游的积极性不同的状况下的频数分析,从而了解该地区的男女职工数量、不同积极性况的基本分布。 首先,对该地区的男女性别分布进行频数分析,结果如下 表说明,在该地区被调查的359个人中,有198名女性,161名男性,男女比例分别为44.8%和55.2%,该公司职工男女数量差距不大,女性略多于男性。 其次对原有数据中的旅游的积极性进行频数分析,结果如下表:

其次对原有数据中的是否进通道进行频数分析,结果如下表:

表说明,在该地区被调查的359个人中,有没走通道的占81.6%,占绝大多数。 上表及其直方图说明,被调查的359个人中,对与旅游积极性差的组频数最高的,为171 人数的47.6%,其次为积极性一般和比较好的,占比例都为22.0%,积性为好的和非常好的比例比较低,分别为24人和6人,占总体的比例为6.7%和1.7%。 2、探索性数据分析 (1)交叉分析。 通过频数分析能够掌握单个变量的数据分布情况,但是在实际分析中,不仅要了解单个变量的分布特征,还要分析多个变量不同取值下的分布,掌握多个变量的联合分布特征,进而分析变量之间的相互影响和关系。就本数据而言,需要了解现工资与性别、年龄、受教育水平、起始工资、本单位工作经历、以前工作经历、职务等级的交叉分析。现以现工资与职务等级的列联表分析为例,读取数据(下面数据分析表为截取的一部分): Count

SPSS因子分析实例操作步骤

SPSS因子分析实例操作步骤 实验目的: 引入2003~2013年全国的农、林、牧、渔业,采矿业,制造业电力、热力、燃气及水生产和供应业,建筑业,批发和零售业,交通运输、仓储和邮政业7个产业的投资值作为变量,来研究其对全国总固定投资的影响。 实验变量: 以年份,合计(单位:千亿元),农、林、牧、渔业,采矿业,制造业电力、热力、燃气及水生产和供应业,建筑业,批发和零售业,交通运输、仓储和邮政业作为变量。 实验方法:因子分析法 软件: 操作过程: 第一步:导入Excel数据文件 1.open data document——open data——open; 2. Opening excel data source——OK. 第二步: 1.数据标准化:在最上面菜单里面选中Analyze——Descriptive Statistics——OK (变量选择除年份、合计以外的所有变量). 2.降维:在最上面菜单里面选中Analyze——Dimension Reduction——Factor ,变量选择标准化后的数据. 3.点击右侧Descriptive,勾选Correlation Matrix选项组中的 Coefficients和KMO and Bartlett’s text of sphericity,点击 Continue.

4.点击右侧Extraction,勾选Scree Plot和fixed number with factors,默认3个,点击Continue. 5.点击右侧Rotation,勾选Method选项组中的Varimax;勾选Display选项组中的Loding Plot(s);点击Continue. 6.点击右侧Scores,勾选Method选项组中的Regression;勾选Display factor score coefficient matrix;点击Continue. 7.点击右侧Options,勾选Coefficient Display Format选项组中所有选项,将Absolute value blow改为,点击Continue. 8.返回主对话框,单击OK. 输出结果分析:

spss相关分析实验报告

实验五相关分析实验报关费 一、实验目的: 学习利用spss对数据进行相关分析(积差相关、肯德尔等级相关)、偏相关分析。利用交叉表进行相关分析。 二、实验内容: 某班学生成绩表1如实验图表所示。 1.对该班物理成绩与数学成绩之间进行积差相关分析和肯德尔等级相关 分析。 2.在控制物理成绩不变的条件下,做数学成绩与英语成绩的相关分析(这 种情况下的相关分析称为偏相关分析)。 3.对该班物理成绩与数学成绩制作交叉表及进行其中的相关分析。 三、实验步骤: 1.选择分析→相关→双变量,弹出窗口,在对话框的变量列表中选变量 “数学成绩”、“物理成绩”,在相关系数列进行选择,本次实验选择 皮尔逊相关(积差相关)和肯德尔等级相关。单击选项,对描述统计 量进行选择,选择标准差和均值。单击确定,得出输出结果,对结果 进行分析解释。 2.选择分析→相关→偏相关,弹出窗口,在对话框的变量列表选变量“数 学成绩”、“英语成绩”,在控制列表选择要控制的变量“物理成绩” 以在控制物理成绩的影响下对变量数学成绩与英语成绩进行偏相关分 析;在“显著性检验”框中选双侧检验,单击确定,得出输出结果, 对结果进行分析解释。 3.选择分析→描述统计→交叉表,弹出窗口,对交叉表的行和列进行选 择,行选择为数学成绩,列选择为物理成绩。然后对统计量进行设置, 选择相关性,点击继续→确定,得出输出结果,对结果进行分析解释。 四、实验结果与分析:

表1

五、实验结果及其分析:

分析一:由实验结果可观察出,数学成绩与物理成绩的积差相关系数r=,肯德尔等级相关系数r=可知该班物理成绩和数学成绩之间存在显著相关。

SPSS因子分析经典案例

SPSS因子分析经典案例 因子分析已经被各行业广泛应用,各种案例琳琅满目,以前在百度空间发表过相关文章,是以每到4至6月,这些文章总会被高校毕业生扒拉一遍,也总能收到各种魅惑的留言,因此,有必要再次发布这经典案例以飨读者。 什么是因子分析? 因子分析又称因素分析,传统的因子分析是探索性的因子分析,即因子分析是基于相关关系而进行的数据分析技术,是一种建立在众多的观测数据的基础上的降维处理方法。其主要目的是探索隐藏在大量观测数据背后的某种结构,寻找一组变量变化的共同因子。 因子分析能做什么? 人的心理结构具有层次性,即分为外显和内隐。但是作为具有同一性的个体来说,内隐的方面总是和外显的方面相互作用,内隐方面制约着外显特征。所以我们经常说,一个人的内在自我会在相当程度上决定他的外在行为特征,表现为某些行为倾向具有高度的一致性或相关性。 反过来说,我们可以通过对个体进行系统的观察和测量,从一组高度相关的行为倾向(可观测)中,探索到某种稳定的内在心理结构(潜存在),这就是因子分析所能做的。 具体来说主要应用于: (1)个体的综合评价:按照综合因子得分对case进行排序; (2)调查问卷效度分析:问卷所列问题作为输入变量,通过KMO、因子特征值贡献率、因子命名等判断调查问卷架构质量; (3)降维处理,结果再利用:因子得分作为变量,进行聚类或其他分析。 案例描述: 高中大家都读过吧,那是一个以成绩论英雄的时代,理科王子、文科小生是时代标签。为什么我们会将数学、物理、化学归并为理科,其他的归并为文科,有没有数据支持?今天我们将用科学的方法找到答案。 100个学生数学、物理、化学、语文、历史、英语成绩如下表(部分),请你来评价他们。

SPSS因子分析法

因子分析 ? 因子分析(Factor analysis ):用少数几个因子来描述许多指标或因素之间的联系,以较少几个因子来反映原资料的大部分信息的统计学分析方法。从数学角度来看,主成分分析是一种化繁为简的降维处理技术。 主成分分析(Principal component analysis ):是因子分析一个特例,是使用最多的因子提取方法。它通过坐标变换手段,将原有的多个相关变量,做线性变化,转换为另外一组不相关的变量。选取前面几个方差最大的主成分,这样达到了因子分析较少变量个数的目的,同时又能与较少的变量反映原有变量的绝大部分的信息。 两者关系:主成分分析(PCA )和因子分析(FA )是两种把变量维数降低以便于描述、理解和分析的方法。 ? 特点 (1)因子变量的数量远少于原有的指标变量的数量,因而对因子变量的分析能够减少分析中的工作量。 (2)因子变量不是对原始变量的取舍,而是根据原始变量的信息进行重新组构,它能够反映原有变量大部分的信息。 (3)因子变量之间不存在显著的线性相关关系,对变量的分析比较方便,但原始部分变量之间多存在较显著的相关关系。 (4)因子变量具有命名解释性,即该变量是对某些原始变量信息的综合和反映。 在保证数据信息丢失最少的原则下,对高维变量空间进行降维处理(即通过因子分析或主成分分析)。显然,在一个低维空间解释系统要比在高维系统容易的多。 ? 类型 根据研究对象的不同,把因子分析分为R 型和Q 型两种。 当研究对象是变量时,属于R 型因子分析; 当研究对象是样品时,属于Q 型因子分析。 但有的因子分析方法兼有R 型和Q 型因子分析的一些特点,如因子分析中的对应分析方法,有的学者称之为双重型因子分析,以示与其他两类的区别。 ? 分析原理 假定:有n 个地理样本,每个样本共有p 个变量,构成一个n ×p 阶的地理数据矩阵 : 当p 较大时,在p 维空间中考察问题比较麻烦。这就需要进行降维处理,即用较少几个综合指标代替原来指标,而且使这些综合指标既能尽量多地反映原来指标所反映的信息,同时它们之间又是彼此独立的。 线性组合:记x1,x2,…,xP 为原变量指标,z1,z2,…,zm (m ≤p )为??????????????=np n n p p x x x x x x x x x X 212222111211

spss的数据分析报告

Gender Educational Level (years)N Valid 474474Missing 00关于某公司474名职工综合状况的统计分析报告 1、 数据介绍: 本次分析的数据为某公司474名职工状况统计表,其中共包含十一变量,分别是:id (职工编号),gender(性别),bdate(出生日期),edcu (受教育水平程度),jobcat (职务等级),salbegin (起始工 资),salary (现工资),jobtime(本单位工作经历<月>),prevexp(以前工作经历<月>),minority(民族类型),age(年龄)。通过运用spss 统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析、。。。以了解该公司职工上述方面的综合状况,并分析个变量的分布特点及相互间的关系。2、 数据分析 1、 频数分析。基本的统计分析往往从频数分析开始。通过频数分析 能够了解变量的取值状况,对把握数据的分布特征非常有用。此次分析利用了某公司474名职工基本状况的统计数据表,在gender(性别)、edcu (受教育水平程度)、不同的状况下的频数分析,从而了解该公司职工的男女职工数量、受教育状况的基本分布。 Statistics 首先,对该公司的男女 性别分布进行频数分析,结果如下: Gender FrequencyPercent Valid Percent Cumulative Percent Valid Female 21645.645.645.6 Male 258 54.4 54.4 100.0 Total 474100.0100.0 上表说明,在该公司的474名职工中,有216名女性,258名男性,男女比例分别为45.6%和54.4%,该公司职工男女数量差距不大,男性略多于女性。 其次对原有数据中的受教育程度进行频数分析,结果如下表 : Educational Level (years) Valid Cumulative

SPSS因子分析实例操作步骤

S P S S因子分析实例操作步骤 实验目的: 引入2003~2013年全国的农、林、牧、渔业,采矿业,制造业电力、热力、燃气及水生产和供应业,建筑业,批发和零售业,交通运输、仓储和邮政业7个产业的投资值作为变量,来研究其对全国总固定投资的影响。 实验变量: 以年份,合计(单位:千亿元),农、林、牧、渔业,采矿业,制造业电力、热力、燃气及水生产和供应业,建筑业,批发和零售业,交通运输、仓储和邮政业作为变量。 实验方法:因子分析法 软件:spss19.0 操作过程: 第一步:导入Excel数据文件??? 1.opendatadocument——opendata——open; 2.Openingexceldatasource——OK. 第二步: 1.数据标准化:在最上面菜单里面选中Analyze——DescriptiveStatistics——OK?(变量选择除年份、合计以外的所有变量). 2.降维:在最上面菜单里面选中 Analyze——DimensionReduction——Factor?,变量选择标准化后的数据. 3.点击右侧Descriptive,勾选CorrelationMatrix选项组中的 Coefficients和KMOandBartlett’stextofsphericity,点击Continue. 4.点击右侧Extraction,勾选ScreePlot和fixednumberwithfactors,默认3个,点击Continue. 5.点击右侧Rotation,勾选Method选项组中的Varimax;勾选Display选项组中的LodingPlot(s);点击Continue. 6.点击右侧Scores,勾选Method选项组中的Regression;勾选Displayfactorscorecoefficientmatrix;点击Continue. 7.点击右侧Options,勾选CoefficientDisplayFormat选项组中所有选项,将Absolutevalueblow改为0.60,点击Continue. 8.返回主对话框,单击OK. 输出结果分析: 1.描述性统计量

应用统计学因子分析与主成分分析案例解析_SPSS操作分析

因子分析与主成分分析 一、问题概述 现希望对30个省市自治区经济发展基本情况的八项指标进行分析。具体采用的指标只有:GDP、居民消费水平、固定资产投资、职工平均工资、货物周转量、居民消费价格指数、商品零售价格指数、工业总产值。这是一个综合分析问题,八项指标较多,用主成分分析法进行综合。 二、数据处理与分析 1.因子分析 打开数据后,在SPSS中进行因子分析的步骤如下: 选择“分析---降维---因子分析”,在弹出的对话框里 (1)描述---系数、KMO与Bartlett的球形度检验 (2)抽取---碎石图、未旋转的因子解 (3)旋转---最大方差法、旋转解、载荷图 (4)得分---保存为变量、显示因子得分系数矩阵 (5)选项---按大小排序 点击确定得到如下各图: 图3-1 图3-2 KMO 和 Bartlett 的检验 取样足够度的 Kaiser-Meyer-Olkin 度量。.620 Bartlett 的球形度检验近似卡方231.285 df 28 Sig. .000 图3-3 公因子方差

图3-6 成份矩阵a

图3-9

(2)因子模型中各统计量的意义 A)因子载荷错误!未找到引用源。:因子载荷错误!未找到引用源。为第i个变量在第j个因子上的载荷,实际上就是错误!未找到引用源。与错误!未找到引用源。的相关系数,表示变量错误!未找到引用源。依赖因子错误!未找到引用源。的程度,反应了第i个变量错误!未找到引用源。对于第j个因子错误!未找到引用源。的重要性。 B)变量错误!未找到引用源。的变量共同度:k个公因子对第i个变量方差的贡献,也称为公因子方差比,记为错误!未找到引用源。,公式为:错误!未找到引用源。=错误!未找到引用源。(j=1,2,….,k)

SPSS买房数据分析实施报告

《统计分析软件(双语)》 实验报告 题目:关于“某地区买房数据”的分析报告 姓名: 学号:1204100215 专业:统计学 院系:统计学院 指导教师: 完成日期:2014年12月10日

摘要 利用SPSS统计分析软件对“某地区买房”数据进行了描述性统计分析,比较均值,相关分析,回归分析四大类型的数据分析。其中在描述性统计分析中作了频数分析,探索分析,交叉分析,得出了该地区中年龄段在25~45居多,就业大多在国企,文化程度高中和大学所占比重大;大学学历的现居住面积较大,其最大值,最小值以及均值均大于其他三种学历的居住面积。人均居住面积的单样本T检验的出了的结论是人均居住面积与均值之间存在显著性差异。现居住面积和人居住面积的双变量的相关分析得出了两者之间存在显著性差异。在回归分析中得出的结论是现居住面积是服从正态分布的且和满意度是显著相关的。

目录 一、数据简要 (3) 二、数据分析 (3) (一)描述分析性统计, (3) 1,就业状况的频数分析 (3) 2,文化程度的频数分析 (3) 3,现居住面积及人均居住面积的描述性分析 (3) 4,居住面积和文化程度的探索分析 (3) 5,文化程度与年收入的交叉列联表分析 (3) (二)均值比较 (3) 1,人均现住面积和年龄段的描述统计 (3) 2,人均居住面积的单样本T检验 (3) 3,现居住面积的独立样本T检验 (3) (三)相关分析 (3) 1,现居住面积和人居住面积的双变量的相关分析 (3) 2,人均居住面积,现居住面,居住类型的偏相关分析 (3) (四)回归分析 (3) 三、小结 (3)

一、数据简要 本次分析的数据为某年某地719个人买房情况统计表,一共有11个变量,其中现居住面积与人均居住面积为scale变量,其余9个变量为nonscale变量,依次为年龄段,文化程度,从业状况,家庭类型,家庭年收入,住房满意度,卖掉现房,购买户型,是否贷款。

(完整版)SPSS因子分析法-例子解释

因子分析的基本概念和步骤 一、因子分析的意义 在研究实际问题时往往希望尽可能多地收集相关变量,以期望能对问题有比较全面、完整的把握和认识。例如,对高等学校科研状况的评价研究,可能会搜集诸如投入科研活动的人数、立项课题数、项目经费、经费支出、结项课题数、发表论文数、发表专著数、获得奖励数等多项指标;再例如,学生综合评价研究中,可能会搜集诸如基础课成绩、专业基础课成绩、专业课成绩、体育等各类课程的成绩以及累计获得各项奖学金的次数等。虽然收集这些数据需要投入许多精力,虽然它们能够较为全面精确地描述事物,但在实际数据建模时,这些变量未必能真正发挥预期的作用,“投入”和“产出”并非呈合理的正比,反而会给统计分析带来很多问题,可以表现在: 计算量的问题 由于收集的变量较多,如果这些变量都参与数据建模,无疑会增加分析过程中的计算工作量。虽然,现在的计算技术已得到了迅猛发展,但高维变量和海量数据仍是不容忽视的。 变量间的相关性问题 收集到的诸多变量之间通常都会存在或多或少的相关性。例如,高校科研状况评价中的立项课题数与项目经费、经费支出等之间会存在较高的相关性;学生综合评价研究中的专业基础课成绩与专业课成绩、获奖学金次数等之间也会存在较高的相关性。而变量之间信息的高度重叠和高度相关会给统计方法的应用带来许多障碍。例如,多元线性回归分析中,如果众多解释变量之间存在较强的相关性,即存在高度的多重共线性,那么会给回归方程的参数估计带来许多麻烦,致使回归方程参数不准确甚至模型不可用等。类似的问题还有很多。 为了解决这些问题,最简单和最直接的解决方案是削减变量的个数,但这必然又会导致信息丢失和信息不完整等问题的产生。为此,人们希望探索一种更为有效的解决方法,它既能大大减少参与数据建模的变量个数,同时也不会造成信息的大量丢失。因子分析正式这样一种能够有效降低变量维数,并已得到广泛应用的分析方法。 因子分析的概念起源于20世纪初Karl Pearson和Charles Spearmen等人关于智力测验的统计分析。目前,因子分析已成功应用于心理学、医学、气象、地址、经济学等领域,并因此促进了理论的不断丰富和完善。 因子分析以最少的信息丢失为前提,将众多的原有变量综合成较少几个综合指标,名为因子。通常,因子有以下几个特点: ↓因子个数远远少于原有变量的个数 原有变量综合成少数几个因子之后,因子将可以替代原有变量参与数据建模,这将大大减少分析过程中的计算工作量。 ↓因子能够反映原有变量的绝大部分信息 因子并不是原有变量的简单取舍,而是原有变量重组后的结果,因此不会造成原有变量信息的大量丢失,并能够代表原有变量的绝大部分信息。 ↓因子之间的线性关系并不显著 由原有变量重组出来的因子之间的线性关系较弱,因子参与数据建模能够有效地解决变量多重共线性等给分析应用带来的诸多问题。 ↓因子具有命名解释性 通常,因子分析产生的因子能够通过各种方式最终获得命名解释性。因子的命名解

spss的数据分析报告范例

关于某地区361个人旅游情况统计分析报告一、数据介绍: 本次分析的数据为某地区361个人旅游情况状况统计表,其中共包含七变量,分别是:年龄,为三类变量;性别,为二类变量(0代表女,1代表男);收入,为一类变量;旅游花费,为一类变量;通道,为二类变量(0代表没走通道,1代表走通道);旅游的积极性,为三类变量(0代表积极性差,1代表积极性一般,2代表积极性比较好,3代表积极性好 4代表积极性非常好);额外收入,一类变量。通过运用spss统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析,以了解该地区上述方面的综合状况,并分析个变量的分布特点及相互间的关系。 二、数据分析 1、频数分析。基本的统计分析往往从频数分析开始。通过频数分地 区359个人旅游基本状况的统计数据表,在性别、旅游的积极性不同的状况下的频数分析,从而了解该地区的男女职工数量、不同积极性情况的基本分布。 统计量 积极性性别 N有效359359 缺失00 首先,对该地区的男女性别分布进行频数分析,结果如下

性别 频率百分比有效百分 比 累积百分 比 有效女19855.255.255.2 男16144.844.8100.0 合计359100.0100.0 表说明,在该地区被调查的359个人中,有198名女性,161名男性,男女比例分别为44.8%和55.2%,该公司职工男女数量差距不大,女性略多于男性。 其次对原有数据中的旅游的积极性进行频数分析,结果如下表: 积极性 频率百分比有效百分 比 累积百分 比 有效差17147.647.647.6一般7922.022.069.6 比较 好 7922.022.091.6好24 6.7 6.798.3

spss相关分析实验报告

实验五相关分析实验报关费 一、实验目得: 学习利用s pss对数据进行相关分析(积差相关、肯德尔等级相关)、偏相关分析。利用交叉表进行相关分析。 二、实验内容: 某班学生成绩表 1 如实验图表所示。 1.对该班物理成绩与数学成绩之间进行积差相关分析与肯德尔等级相关分 析. 2.在控制物理成绩不变得条件下,做数学成绩与英语成绩得相关分析(这 种情况下得相关分析称为偏相关分析)。 3.对该班物理成绩与数学成绩制作交叉表及进行其中得相关分析。 三、实验步骤: 1.选择分析—相关—双变量,弹出窗口,在对话框得变量列表中选变量 “数学成绩"、“物理成绩” ,在相关系数列进行选择,本次实验选择 皮尔逊相关(积差相关)与肯德尔等级相关。单击选项,对描述统计 量进行选择,选择标准差与均值.单击确定,得出输出结果,对结果进 行分析解释。 2.选择分析一相关一偏相关,弹出窗口,在对话框得变量列表选变量数学 成绩”、“英语成绩”,在控制列表选择要控制得变量“物理成绩”以 在控制物理成绩得影响下对变量数学成绩与英语成绩进行偏相关分析; 在“显著性检验”框中选双侧检验,单击确定,得出输出结果,对结果 进行分析解释. 3.选择分析一描述统计-交叉表,弹出窗口,对交叉表得行与列进行选 择,行选择为数学成绩,列选择为物理成绩.然后对统计量进行设置, 选择相关性,点击继续-确定,得出输出结果,对结果进行分析解释。 四、实验结果与分析:

囲戏变量相关0 变旻(Y): 歹物理戍悄 相关浆勤 0 Pearson 叼兰endsll 的tau-b(K) J Spearman 叼标记SL苦性徇关(E) I ?―I粘址妃)][賞Jt? ][ ■備~ [ 鹽 ,丘示渎际說曹性水半(D 确定 ]|殆贴(E) H St賣(B)][ 取禱选顶(2)… 农孝号 /其 语威纽 显著性检验 双侧檢勉I) 单侧檢验(D 选他…]

【精品管理学】spss因子分析案例 共(13页)

[例11-1]下表资料为25名健康人的7项生化检验结果,7项生化检验指标依次命名为X1至X7,请对该资料进行因子分析。

图 ???对话框(图框。 图 钮返回 图11.3?描述性指标选择对话框 ???点击Extraction...钮,弹出FactorAnalysis:Extraction对话框(图11.4),系统提供如下因子提取方法: 图11.4?因子提取方法选择对话框 ???Principalcomponents:主成分分析法;

???Unweightedleastsquares:未加权最小平方法; ???Generalizedleastsquares:综合最小平方法; ???Maximumlikelihood:极大似然估计法; ???Principalaxisfactoring:主轴因子法; ???Alphafactoring:α因子法; ???对话框。 ???5种因图 ???旋转的目的是为了获得简单结构,以帮助我们解释因子。本例选正交旋转法,之后点击Continue钮返回FactorAnalysis对话框。 ???点击Scores...钮,弹出弹出FactorAnalysis:Scores对话框(图11.6),系统提供3种估计因子得分系数的方法,本例选Regression(回归因子得分),之后点击Continue钮返回FactorAnalysis对话框,再点击OK钮即完成分析。

图11.6?估计因子分方法对话框? ?11.2.3?结果解释 ??在输出结果窗口中将看到如下统计数据: ??系统首先输出各变量的均数(Mean)与标准差(StdDev),并显示共有25例观察单位进入分析;接着输出相关系数矩阵(CorrelationMatrix),经Bartlett检验表明:Bartlett值=326.28484,P<0.0001,即相关矩阵不是一个单位矩阵,故考虑进行因子分析。 好。今KMO值 NumberofCases?=?????25 CorrelationMatrix: X1???????X2???????X3???????X4???????X5???????X6???????X7 X1????????1.00000 X2?????????.58026??1.00000

SPSS简单数据分析报告

精选范文、公文、论文、和其他应用文档,希望能帮助到你们! SPSS简单数据分析报告

目录 一、数据样本描述 (4) 二、要解决的问题描述 (4) 1 数据管理与软件入门部分 (4) 1.1 分类汇总 (4) 1.2 个案排秩 (5) 1.3 连续变量变分组变量 (5) 2 统计描述与统计图表部分 (5) 2.1 频数分析 (5) 2.2 描述统计分析 (5) 3 假设检验方法部分 (5)

3.1 分布类型检验 (5) 3.1.1 正态分布 (5) 3.1.2 二项分布 (6) 3.1.3 游程检验 (6) 3.2 单因素方差分析 (6) 3.3 卡方检验 (6) 3.4 相关与线性回归的分析方法 (6) 3.4.1 相关分析(双变量相关分析&偏相关分析) (6) 3.4.2 线性回归模型 (6) 4 高级阶段方法部分 (6) 三、具体步骤描述 (7) 1 数据管理与软件入门部分 (7) 1.1 分类汇总 (7) 1.2 个案排秩 (8) 1.3 连续变量变分组变量 (10) 2 统计描述与统计图表部分 (11) 2.1 频数分析 (11) 2.2 描述统计分析 (14) 3 假设检验方法部分 (16) 3.1 分布类型检验 (16) 3.1.1 正态分布 (16) 3.1.2 二项分布 (17)

3.1.3 游程检验 (18) 3.2 单因素方差分析 (22) 3.3 卡方检验 (24) 3.4 相关与线性回归的分析方法 (26) 3.4.1 相关分析 (26) 3.4.2 线性回归模型 (28) 4 高级阶段方法部分 (32) 4.1 信度 (32) 一、数据样本描述 本次分析的数据为某公司474名职工状况统计表,其中共包含11个变量,分别是:id(职工编号),gender(性别),bdate(出生日期),edcu(受教育水平程度),jobcat(职务等级),salbegin(起始工资),salary(现工资),jobtime(本单位工作经历<月>),prevexp(以前工作经历<月>),minority(民族类型),age(年龄)。通过运用SPSS统计软件,对变量进行统计分析,以了解该公司职工总体状况,并分析职工受教育程度、起始工资、现工资的分布特点及相互间的关系。 二、要解决的问题描述 1 数据管理与软件入门部分 1.1 分类汇总 以受教育水平程度为分组依据,对职工的起始工资和现工资进行数据

相关文档