文档库 最新最全的文档下载
当前位置:文档库 › 第8章 相关分析

第8章 相关分析

第8章  相关分析
第8章  相关分析

第8章 相关分析

相关分析(Correlations)是研究两个变量间。或一个变量与多个变量间,或多个变量两两

变量间,或两组变量间,或多个变量组与组之间密切程度的一种常用统计学方法。变量间的密切程度常用相关系数(Correlation Coefficients)或统计量描述。SAS /Win(v8)系统非编程有如下5种相关量度(Correlation Measure)。

(1)Pearson product-moment correlation ,皮尔逊积矩相关分析。

(2)Spearman coefficients ,斯皮尔曼相关系数s r

(3)Cronbach ’coefficient alpha ,克龙巴哈系数α

(4)Kendall ’s tan –b coefficient ,肯德尔b τ系数。

(5)Hoeffding ’s D statistic ,霍夫丁D 统计量。

同时将输出变量的简单统计量(Simple Statistics),相关系数(Correlation Coefficients),相

应的P 值与图形(P1ots)等。

8-1皮尔逊积矩相关分析

[例8-1] 已知5-6岁儿童体检数据的指标为编号(1x ),性别(2x ),月龄(3x ),体重(4x ,

kg),身高(5x ,cm),坐高(6x ,cm),胸围(7x ,cm),头围(8x ,cm),左眼视力(9x )与右眼视力(10x ),并已建立SAS 数据集SASUSER.child 。试对体重(4x )与身高(5x )做皮尔逊(Pearson)相关分析。

(1)进入SAS /Win(V8)系统,单击So1utions->Analysis->Analyst ,进入分析家窗口。

(2)单击File->open By SAS Name->Sasuser->Child->OK ,调入SAS 数据集

SASUSER.child

(3)单击statistics->Descriptive->correlations ,得到图8-1所示对话框。本例相关分析的变

量为4x ,5x 。拖曳待选变量4x ,5x 到Correlate(相关变量)框。

图8-l Correlations :Child(相关分析)对话框

图8-1的右下方有如下5个备选项。

Options ,选择项。

Plots ,图形。

Save Data ,保存数据。

Titles ,标题。

Variables ,变量。

(1) 单击OK->Options ,得到图8-2所示对话框。

图8-2 Correlations:Options(选择项)对话框

在Correlations: Options对话框中有如下选项区

Correlation types, 相关分析类型。

Pearson, 皮尔逊积矩相关分析

r

Spearman, 斯皮尔曼相关系数

s

Cronbach's alpha, 克龙巴哈系数α。

τ系数

Kendall's tau-b, 肯德尔

b

Hoeffding's D, 霍夫丁D统计量‘

Pearson options, 皮尔逊积矩相关分析。

Covariances, 协方差

CSSCP matrix, 经均数校正的平方和及交叉积矩阵。

SSCP matrix, 平方和及交叉积矩阵。)

Print, 打印(显示)

P-values, P值

Descriptive statistics, 描述性统计量

Correlation format, 相关分析结果的输出格式

Rectangular table, 长方形表。

Highest to lowest, 从高到低的格式

Exclude missing values, 剔除缺失值

Pairwise, 配对剔除

Listwise, 串列剔除

(5)单击OK按钮,返回图8-1所示对话框。单击P1ots按钮,得到图8-3所示对话框。在图8-3中可以进行如下设置。

Types of plots,图形的类型。

Scatter plots,散点图。

Add confidence ellipses,对散点图加置信椭圆。

Confidence ellipses options,置信椭圆。

Probability value:0.95,概率值(用户可任选)。

图8-3 Correlations:P1ots(图形)对话框

(6)单击OK按钮,返回图8-1所示对话框。单击Save Data按钮,得到图8-4所示对话框。在Correlations data set (相关分析数据集的保存)选项区可进行如下设置。

Save correlations,保存相关分析结果。

Add correlations,加相关系数。

Add covariance,加协方差。 6

Add sum of squares &products,加平方和与交叉积。

图8-4 Correlations:Save Data(保存数据)对话框

(7)单击OK按钮,返回图8-1所示对话框,单击Titles按钮,得到图8-5所示对话框。Titles(标题)对话框有如下3个标签(本例未选择)。

Global,全局性的标题

Correlations,相关分析的标题。

Settings,设置标题。

图8-5 Titles(标题)对话框

(8)单击OK按钮,返回图8-1所示对话框。单击V ariables按钮,得到图8-6所示对话框。

在Correlations:Variables对话框可进行如下设置(本例未选择)。

Weight,权重。

Frequency ,频数。

By Group ,按组分。

Partial ,偏相关分析变量。

图8-6 Correlations :Variables(变量)对话框

(9)单击OK 按钮,返回图8-1所示对话框。单击OK 按钮,得到如下数值结果。

图形结果 如图8-7所示。

(10)由于在图8-2中选择了长方形相关分析表因此得到图8-8所示结果

结果分析与讨论

(1)本例的皮尔逊相关系数r =0.8261318097,P <0.0001。相关有显著性意义。

(2)带置信椭圆的散点图(见图8-7,置信度为95%)表明,大部分散点落在椭圆内,或落在边界线上,只有2个散点在椭圆之外。

(3)如果在图8-6的By Group(按组分)选择性别1x (1x =1为男孩,2x =2为女孩),而其余选择同上,可以得到图8-9所示结果。可见,体重与身高男孩的相关系数1r =0.8643091327大于女孩的相关系数2r =0.798621605。

图8-9 长方形相关分析表(1x =1为男孩,2x =2为女孩)

统计学基础 第八章 相关与回归分析

统计学基础第八章相关与回归分析 【教学目的】 1.掌握相关系数的测定和性质 2.明确相关分析与回归分析的特点 3.建立回归直线方程,掌握估计标准误差的计算 【教学重点】 1.相关关系、相关分析和回归分析的概念 2.相关系数计算 3.回归方程的建立和依此进行估计和预测 【教学难点】 1.相关分析和回归分析的区别 2.相关系数的计算 3.回归系数的计算 4.估计标准误的计算 【教学时数】 教学学时为8课时 【教学内容参考】 第一节相关关系 一、相关关系的含义 宇宙中任何现象都不是孤立地存在的,而是普遍联系和相互制约的。这种现象间的相互联系、相互制约的关系即为相关关系。 相关关系因其依存程度的不同而表现出相关程度的差别。有些现象间存在着严格的数据依存关系,比如,在价格不变的条件下销售额量之间的关系,圆的面积与半径之间的关系等等,均具有显著的一一对应关系。这些关系可由数学中的函数关系来确切的描述,因而也可以认为是一种完全相关关系。有些现象间的依存关系则没有那么严格。当一种现象的数量发生变化时,另一种现象的数量却在一定的范围内发生变化,比如身高与体重的关系就是如此。一般来说,身高越高,

体重越重,但二者之间的关系并非严格意义上的对应关系,身高1.75米的人,对应的体重会有多个数值,因为影响体重的因素不只身高而已,它还会受遗传、饮食习惯等因素的制约和影响。社会经济现象中大多存在这种非确定的相关关系。 在统计学中,这些在社会经济现象之间普遍存在的数量依存关系,都成为相关关系。在本章,我们主要介绍那些能用函数关系来描述的具有经济统计意义的相关关系。 二、相关关系的特点 1.现象之间确实存在数量上的依存关系 如果一个现象发生数量上的变化,则另一个现象也会发生数量上的变化。在相互依存的两个变量中,可以根据研究目的,把其中的一个变量确定为自变量,把另一个对应变量确定为因变量。例如,把身高作为自变量,则体重就是因变量。 2.现象之间数量上的关系是不确定的 相关关系的全称是统计相关关系,它属于变量之间的一种不完全确定的关系。这意味着一个变量虽然受另一个(或一组)变量的影响,却并不由这一个(或一组)变量完全确定。例如,前面提到的身高和体重之间的关系就是这样一种关系。 三、相关关系的种类 现象之间的相互关系很复杂,它们涉及的变动因素多少不同,作用方向不同,表现出来的形态也不同。相关关系大体有以下几种分类: (一)正相关与负相关 按相关关系的方向分,可分为正相关和负相关。当两个因素(或变量)的变动方向相同时,即自变量x值增加(或减少),因变量y值也相应地增加(或减少),这样的关系就是正相关。如家庭消费支出随收入增加而增加就属于正相关。如果两个因素(或变量)变动的方向相反,即自变量x值增大(或减小),因变量y值随之减小(或增大),则称为负相关。如商品流通费用率随商品经营的规模增大而逐渐降低就属于负相关。 (二)单相关与复相关 按自变量的多少分,可分为单相关和复相关。单相关是指两个变量之间的相关关系,即所研究的问题只涉及到一个自变量和一个因变量,如职工的生活水平与工资之间的关系就是单相关。复相关是指三个或三个以上变量之间的相关关系,即所研究的问题涉及到若干个自变量与一个因

SPSS典型相关分析及结果解释

SPSS典型相关分析及结果解释 SPSS 11.0 - 23.0 典型相关分析 1方法简介 如果要研究一个变量和一组变量间的相关,则可以使用多元线性回归,方程的复相关系数就是我们要的东西,同时偏相关系数还可以描述固定其他因素时某个自变量和应变量间的关系。但如果要研究两组变量的相关关系时,这些统计方法就无能为力了。比如要研究居民生活环境与健康状况的关系,生活环境和健康状况都有一大堆变量,如何来做?难道说做出两两相关系数?显然并不现实,我们需要寻找到更加综合,更具有代表性的指标,典型相关(Canonical Correlation)分析就可以解决这个问题。 典型相关分析方法由Hotelling提出,他的基本思想和主成分分析非常相似,也是降维。即根据变量间的相关关系,寻找一个或少数几个综合变量(实际观察变量的线性组合)对来替代原变量,从而将二组变量的关系集中到少数几对综合变量的关系上,提取时要求第一对综合变量间的相关性最大,第二对次之,依此类推。这些综合变量被称为典型变量,或典则变量,第1对典型变量间的相关系数则被称为第1典型相关系数。一般来说,只需要提取1~2对典型变量即可较为充分的概括样本信息。 可以证明,当两个变量组均只有一个变量时,典型相关系数即为简单相关系数;当一组变量只有一个变量时,典型相关系数即为复相关系数。故可以认为典型相关系 1

数是简单相关系数、复相关系数的推广,或者说简单相关系数、复相关系数是典型相关系数的特例。 2引例及语法说明 在SPSS中可以有两种方法来拟合典型相关分析,第一种是采用Manova过程来拟合,第二种是采用专门提供的宏程序来拟合,第二种方法在使用上非常简单,而输出的结果又非常详细,因此这里只对它进行介绍。该程序名为Canonical correlation.sps,就放在SPSS的安装路径之中,调用方式如下: INCLUDE 'SPSS所在路径\Canonical correlation.sps'. CANCORR SET1=第一组变量的列表 /SET2=第二组变量的列表. 在程序中首先应当使用include命令读入典型相关分析的宏程序,然后使用cancorr名称调用,注意最后的“.”表示整个语句结束,不能遗漏。 这里的分析实例来自曹素华教授所著《实用医学多因素统计分析方法》第176页:为了研究兄长的头型与弟弟的头型间的关系,研究者随机抽查了25个家庭的两兄弟的头长和头宽,数据见文件canonical lianxiti.sav,希望求得两组变量的典型变量及典型相关系数。显然,代表兄长头形的变量为第一组变量,代表弟弟头形的变量为第二组变量,这里希望求得的是两组变量间的相关性,在语法窗口中键入的程序如下: INCLUDE 'D:\SpssWin\Canonical correlation.sps'. 请使用时改为各自相应的安装目录 CANCORR SET1=long1 width1 列出第一组变量 2

第8章 相关分析

第8章 相关分析 相关分析(Correlations)是研究两个变量间。或一个变量与多个变量间,或多个变量两两 变量间,或两组变量间,或多个变量组与组之间密切程度的一种常用统计学方法。变量间的密切程度常用相关系数(Correlation Coefficients)或统计量描述。SAS /Win(v8)系统非编程有如下5种相关量度(Correlation Measure)。 (1)Pearson product-moment correlation ,皮尔逊积矩相关分析。 (2)Spearman coefficients ,斯皮尔曼相关系数s r (3)Cronbach ’coefficient alpha ,克龙巴哈系数α (4)Kendall ’s tan –b coefficient ,肯德尔b τ系数。 (5)Hoeffding ’s D statistic ,霍夫丁D 统计量。 同时将输出变量的简单统计量(Simple Statistics),相关系数(Correlation Coefficients),相 应的P 值与图形(P1ots)等。 8-1皮尔逊积矩相关分析 [例8-1] 已知5-6岁儿童体检数据的指标为编号(1x ),性别(2x ),月龄(3x ),体重(4x , kg),身高(5x ,cm),坐高(6x ,cm),胸围(7x ,cm),头围(8x ,cm),左眼视力(9x )与右眼视力(10x ),并已建立SAS 数据集SASUSER.child 。试对体重(4x )与身高(5x )做皮尔逊(Pearson)相关分析。 (1)进入SAS /Win(V8)系统,单击So1utions->Analysis->Analyst ,进入分析家窗口。 (2)单击File->open By SAS Name->Sasuser->Child->OK ,调入SAS 数据集 SASUSER.child (3)单击statistics->Descriptive->correlations ,得到图8-1所示对话框。本例相关分析的变 量为4x ,5x 。拖曳待选变量4x ,5x 到Correlate(相关变量)框。 图8-l Correlations :Child(相关分析)对话框 图8-1的右下方有如下5个备选项。 Options ,选择项。 Plots ,图形。 Save Data ,保存数据。 Titles ,标题。 Variables ,变量。 (1) 单击OK->Options ,得到图8-2所示对话框。

第8章 相关分析与回归分析及答案

第八章相关与回归分析 一、本章重点 1.相关系数的概念及相关系数的种类。事物之间的依存关系,可以分为函数关系和相关关系。相关关系又有单向因果关系和互为因果关系;单相关和复相关;线性相关和非线性相关;不相关、不完全相关和完全相关;正相关和负相关等类型。 2.相关分析,着重掌握如何画相关表、相关图,如何测定相关系数、测定系数以及进行相关系数的推断。相关表和相关图是变量间相关关系的生动表示,对于未分组资料和分组资料计算相关系数的方法是不同的,一元线性回归中相关系数和测定系数有着密切的关系,得到样本相关系数后还要对总体相关系数进行科学推断。 3.回归分析,着重掌握一元回归的基本原理方法,一元回归是线性回归的基础,多元线性回归和非线性回归都是以此为基础的。用最小平方法估计回归参数,回归参数的性质和显著性检验,随机项方差的估计,回归方程的显著性检验,利用回归方程进行预测是回归分析的主要内容。 4.应用相关与回归分析应注意的问题。相关与回归分析都有它们的应用范围,必须知道在什么情况下能用,什么情况下不能用。相关分析和回归分析必须以定性分析为前提,否则可能会闹出笑话,在进行预测时选取的样本要尽量分散,以减少预测误差,在进行预测时只有在现有条件不变的情况下才能进行,如果条件发生了变化,原来的方程也就失去了效用。 二、难点释疑 本章难点在于计算公式多,不容易记忆,所以更要注重计算的练习。为了掌握基本计算的内容,起码应认真理解书上的例题,做完本指导书上的全部计算题。初学者可能会感到本章公式多且复杂,难于记忆,其实只要抓住Lxx、Lxy、Lyy 这三个记号,记住它们的展开式,几个主要的公式就不难记忆了。如果能自己把这些公式推证一下,搞清其关系,那就更容易记住了。 三、练习题 (一)填空题 1事物之间的依存关系,根据其相互依存和制约的程度不同,可以分为(函数关系)和(相关关系)两种。 2.相关关系按相关关系的情况可分为()和();按自变量的多少分(单相关)和(复相关);按相关的表现形式分(线性相关)和(非线性相关);按相关关系的密切程度分(完全相关)、(不完全相关)和(不相关);按相关关系的方向分(正相关)和(负相关)。 3.回归方程只能用于由(自变量)推算(因变量)。 4.一个自变量与一个因变量的线性回归,称为(一元线性回归) 5.估计变量间的关系的紧密程度用(相关系数) 6.在相关分析中,要求两个变量都是随机的,而在回归分析中要求自变量是(不是随机的),因变量是(随机的)。 7.已知剩余变差为250,具有12对变量值资料,那么这时的估计标准误差是()。 8.将现象之间的相关关系,用表格来反映,这种表称为(相关表),将现象之间的相关关系用图表示称(相关图)。

第八章 方差分析与相关分析

第八章方差分析与相关分析 一.方差分析1.基本概念 方差分析的概念:比较组间方差是否可以用组内方差来进行解释,从而判断若干组样本是否来自同一总体。 方差分析,又称为ANOVA(Analysis Of Variance)分析。 方差分析可以一次检验多组样本,避免了t检验一次只能比较两组的缺陷。方差分析只能反映出各组样本中存在着差异,但具体是哪一组样本存在差异,无法进行判定。 考察下列例子: 某厂使用四种不同颜色对产品进行包装,经过在五个城市的试销,获得销售数据如下(单 观察数据的列平均值,列平均值的差异反映出不同颜色包装的销售业绩差异。此时,需要判断这种差异与同一颜色包装在不同城市间的差异相比,是否显著。如果不显著,则这种 2.方差分析原理 计算观察值的组间方差和组内方差,并计算两者的比值,如果该比值比较小,说明组间方差与组内方差比较接近,组间方差可以用组内方差来解释,从而说明组间差异不存在。 ●●建立原假设“H0:各组平均数相等” ●●构造统计量“F=组间方差/组内方差”

●●在计算组间方差时,使用自由度为(r-1),计算组内方差时,使用自由度为 (n-r)。 ●●F满足第一自由度为(r-1),第二自由度为(n-r)的F分布。 ●●查表,若F值大于0.05临界值,则拒绝原假设,认为各组平均数存在差异。 根据方差计算的原理,生成方差分析表如下: 其中: 组间离差平方和 SSA (Sum of Squares for factor A) =39.084 误差项离差平方和 SSE (Sum of Squares for Error) =76.8455 总离差平方和 SST (Sum of Squares for Total)=115.9295 P-value值为0.000466,小于0.05,所以拒绝原假设。 。 3.双因素方差分析 观察下列销售数据,欲了解包装方式和销售地区是否对于销售业绩有影响,涉及到双因素的方差分析。 此时需分别计算SSA、SSB与SSE之间的比值是否超过临界值。 计算方差分析表如下:

第8章 相关分析

第 8 章 相关分析 8.1 相关分析的理论与方法 社会经济现象总体数量上所存在的依存关系有两种不同的类型,一种是函数关系,一种 是相关关系。函数关系是指当某一变量的数值确定之后,另一个变量的数值也完全随之而确定了。例如电路中的欧姆定律表述了电压、电阻和电流之间的关系:电压=电流×电阻,若已知其中两个变量的值,则另一个变量的值就被唯一确定了。 相关关系是不完全确定的随机关系。在相关关系的情况下,当一个或几个相互联系的变量取一定的值时,与之相应的另一变量的值虽然不确定,但它仍然按某种规律在一定的范围内变化。例如,商品需求与商品价格之间的关系、投资额与国民收入之间的关系、得病率与性别的关系等等。 按照数据度量尺度的不同,相关分析的方法也不同。连续变量之间的相关性常用Pearson 简单相关系数来测定;定序变量的相关性常用Spearman 秩相关系数或Kendall 秩相关系数来测定;而定类变量的相关分析则要使用列联表分析方法。 8.1.1 连续变量的相关分析 1. Pearson 简单相关系数 对于像投资额、国民收入等连续变量之间的相关性分析常用Pearson 简单相关系数来测定,其基本公式如下: 2xy x y r σσσ= 其中,2 xy σ 为变量x 和的协方差,y x σ和y σ分别为变量x 和的标准差。 y Pearson 简单相关系数有如下的特征: r 1r ≤ ,r 越大表示两变量相关性越强,r 越小表示两变量相关性越弱 0r =时,表示两变量不存在线性相关关系 1r =时,表示两变量完全正相关 1r =?时,表示两变量完全负相关 2. Pearson 简单相关系数的检验 在实际分析中,相关系数大都是利用样本数据计算的,因而带有一定的随机性,因此也需要对相关关系的显著性进行检验,该检验的原假设为两总体相关系数等于0。 数学上可以证明,在原假设得到满足的条件下,有下面的t 统计量: t = 该统计量服从自由度为的t 分布。 2n ?

典型相关-spss

第八章 典型相关分析 在对经济问题的研究和管理研究中,不仅经常需要考察两个变量之间的相关程度,而且还经常需要考察多个变量与多个变量之间即两组变量之间的相关性。典型相关分析就是测度两组变量之间相关程度的一种多元统计方法。 第一节 典型相关的基本原理 (一)典型相关分析的基本思想 典型相关分析方法(canonical correlation analysis)最早源于荷泰林(H,Hotelling)于1936年在《生物统计》期刊上发表的一篇论文《两组变式之间的关系》。他所提出的方法经过多年的应用及发展,逐渐达到完善,在70年代臻于成熟。由于典型相关分析涉及较大量的矩阵计算,其方法的应用在早期曾受到相当的限制。但随着当代计算机技术及其软件的迅速发展,弥补了应用典型相关分析中的困难,因此它的应用开始走向普及化。 典型相关分析是研究两组变量之间相关关系的一种统计分析方法。为了研究两组变量 1X ,2X ,…,p X 和1Y , 2Y ,…,q Y 之间的相关关系,采用类似于主成分分析的方 法,在两组变量中,分别选取若干有代表性的变量组成有代表性的综合指标,通过研究这两组综合指标之间的相关关系,来代替这两组变量间的相关关系,这些综合指标称为典型变量。 (二)典型相关分析的数学描述 设有两随机变量组=X ( 1X ,2X ,…,)′p X 和=Y ( 1Y , 2Y ,…,q Y )′, 不妨设p ≤q 。 对于X ,Y ,不妨设第一组变量的均值和协方差为矩阵为 ()X E =1μ Cov ()X =∑ 11 第二组变量的均值和协方差为矩阵为 ()Y E =2μ Cov ()Y = ∑ 22 第一组与第二组变量的协方差为矩阵为 Cov ()Y X ,=∑12= ∑21' 于是,对于矩阵 Z = ?? ? ? ??Y X 有 (9—1—1) 均值向量 μ=E ()Z =E ()()??????Y E X E =?? ? ???21μμ (9—1—2) 协方差矩阵 ()() ∑ +×+q p q p =E ()μ?Z ()′ ?μZ

应用多元统计分析习题解答典型相关分析.doc

第九章 典型相关分析 9.1 什么是典型相关分析?简述其基本思想。 答: 典型相关分析是研究两组变量之间相关关系的一种多元统计方法。用于揭示两组变量之间的内在联系。典型相关分析的目的是识别并量化两组变量之间的联系。将两组变量相关关系的分析转化为一组变量的线性组合与另一组变量线性组合之间的相关关系。 基本思想: (1)在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。即: 若设(1) (1)(1)(1)12(,,,)p X X X =X L 、(2)(2)(2)(2) 12(,,,)q X X X =X L 是两组相互关联的随机变量, 分别在两组变量中选取若干有代表性的综合变量Ui 、Vi ,使是原变量的线性组合。 在(1)(1)(1)(2)()()1D D ''==a X b X 的条件下,使得(1)(1)(1)(2)(,)ρ''a X b X 达到最大。(2)选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对。 (3)如此继续下去,直到两组变量之间的相关性被提取完毕为此。 9.2 什么是典型变量?它具有哪些性质? 答:在典型相关分析中,在一定条件下选取系列线性组合以反映两组变量之间的线性关系,这被选出的线性组合配对被称为典型变量。具体来说, ()(1)()(1)()(1) ()(1)1122i i i i i P P U a X a X a X '=+++a X L @ ()(2)()(2)()(2)()(2)1122i i i i i q q V b X b X b X '=+++b X L @ 在(1)(1)(1)(2)()()1D D ''==a X b X 的条件下,使得(1)(1)(1)(2)(,)ρ''a X b X 达到最大,则称 (1)(1)'a X 、(1)(2)'b X 是(1)X 、(2)X 的第一对典型相关变量。 典型变量性质: 典型相关量化了两组变量之间的联系,反映了两组变量的相关程度。 1. ()1,()1 (1,2,,)k k D U D V k r ===L (,)0,(,)0()i j i j Cov U U Cov V V i j ==≠ 2. 0(,1,2,,)(,)0 ()0() i i j i j i r Cov U V i j j r λ≠==?? =≠??>? L 9.3 试分析一组变量的典型变量与其主成分的联系与区别。 答:一组变量的典型变量和其主成分都是经过线性变换计算矩阵特征值与特征向量得出的。主成分分析只涉及一组变量的相互依赖关系而典型相关则扩展到两组变量之间的相互依赖关系之中,度量了这两组变量之间联系的强度。 ()(1)()(1)()(1)()(1) 1122i i i i i P P U a X a X a X '=+++a X L @ ()(2)()(2)()(2)()(2)1122i i i i i q q V b X b X b X '=+++b X L @ (1)(1)(1)(1)1 2 (,,,)p X X X =L X 、(2)(2)(2)(2)1 2 (,,,)q X X X =L X

2015年《统计学》第八章 相关与回归分析习题及满分答案

2015年《统计学》第八章相关与回归分析习题及满分答案 一、单选题 1.相关分析研究的是( A ) A、变量间相互关系的密切程度 B、变量之间因果关系 C、变量之间严格的相依关系 D、变量之间的线性关系 2.若变量X的值增加时,变量Y的值也增加,那么变量X和变量Y之间存在着(A)。 A、正相关关系 B、负相关关系 C、直线相关关系 D、曲线相关关系3.若变量X的值增加时,变量Y的值随之下降,那么变量X和变量Y之间存在着(B)。 A、正相关关系 B、负相关关系 C、直线相关关系 D、曲线相关关系 4.相关系数等于零表明两变量(B)。 A.是严格的函数关系 B.不存在相关关系 C.不存在线性相关关系 D.存在曲线线性相关关系 5.相关关系的主要特征是(B)。 A、某一现象的标志与另外的标志之间的关系是不确定的 B、某一现象的标志与另外的标志之间存在着一定的依存关系,但它们不是确定的关系 C、某一现象的标志与另外的标志之间存在着严格的依存关系 D、某一现象的标志与另外的标志之间存在着不确定的直线关系 6.时间数列自身相关是指( C )。

A、两变量在不同时间上的依存关系 B、两变量静态的依存关系 C、一个变量随时间不同其前后期变量值之间的依存关系 D、一个变量的数值与时间之间的依存关系 7.如果变量X和变量Y之间的相关系数为负1,说明两个变量之间 (D)。 A、不存在相关关系 B、相关程度很低 C、相关程度很高 D、完全负相关 8.若物价上涨,商品的需求量愈小,则物价与商品需求量之间(C)。 A、无相关 B、存在正相关 C、存在负相关 D、无法判断是否相关 9.相关分析对资料的要求是(A)。 A.两变量均为随机的 B.两变量均不是随机的 C、自变量是随机的,因变量不是随机的 D、自变量不是随机的,因变量是随机的 10.回归分析中简单回归是指(D)。 A.时间数列自身回归 B.两个变量之间的回归 C.变量之间的线性回归 D.两个变量之间的线性回归 11.已知某工厂甲产品产量和生产成本有直线关系,在这条直线上,当产量为1000时,其生产成本为30000元,其中不随产量变化的成本为6000元,则成本总额对产量的回归方程为( A ) A. y=6000+24x B. y=6+0.24x C. y=24000+6x D. y=24+6000x 12.直线回归方程中,若回归系数为负,则(B) A.表明现象正相关 B.表明现象负相关

8第八章地理系统要素关系的主成分分析

第八章地理系统要素关系的主成分分析 地理工作者在地理系统的区域构成分析中,常常用多个指标来分析、比较各个地理区域的特征和“职能”,为地理区域类型的划分和制定区域发展战略提供依据。但由于指标多会增加分析问题的复杂性,能否通过某些线性组合,使原始变量减少为有代表意义的少数几个新的变量,以少数几个指标或“成分”来代表多数指标?这是对地理系统进行分析的关键问题。例如在环境研究中,需要对许多环境要素进行观测;在土地资源研究中,需要对土壤样品进行多指标的分析化验。而这些要素和指标之间,常存在密切关系,要考察全部要素和测试指标,常常要做大量重复的工作。例如有30测试指标,也许10多种指标即可代表。由此可见减少研究的要素,使系统简化,是地理学研究中的重要环节。事实上,如果复杂的地理系统,不加以任何简化,不抓住对地理系统影响的主要矛盾,要对之进行深入的研究,几乎是不可能的。本章介绍主成分分析方法就是解决上述问题的数学方法。 §1 主成分分析方法原理 主成分分析是把原来多个指标化为少数几个综合指标的一种统计方法,达到降维和去相关目的,既由多个变量变换为少数几个相互独立的综合变量。主成分分析也称K-L变换。因子分析不仅可以用来研

究变量之间的相关关系,还可用来研究样品之间的相关关系,通常将前者称之为R 型因子分析,后者称之为Q 型因子分析。 假设有n 个地理样本,每个样本观测p 个指标,如何从这么多指标的数据中抓住地理事物的内在规律性呢?如前所述,多数情况下,指标之间存在着相关关系,这时要弄清它们的规律须在p 维空间中加以考察,这是比较麻烦的。为了克服这一困难,一个自然的想法是找比较少的综合指标来代表原来较多的指标,而这些较少的综合指标既能尽量多地反映原来较多指标的信息,它们彼此之间又是独立的。综合指标如何选取呢?通常是取原指标的线性组合,适当调它们的系数,使综合指标之间相互独立且代表性最好。 记原来的变量指标为12,...,p x x x ,综合指标(新综合变量)为 12,,...,m z z z (m p ) 即

相关文档
相关文档 最新文档