文档库 最新最全的文档下载
当前位置:文档库 › 多元统计分析及R语言建模考试试卷

多元统计分析及R语言建模考试试卷

多元统计分析及R语言建模考试试卷
多元统计分析及R语言建模考试试卷

多元统计分析及R 语言建模考试试卷

一、简答题(共5小题,每小题6分,共30分)

1. 常用的多元统计分析方法有哪些? (1)多元正态分布检验

(2)多元方差-协方差分析

(3)聚类分析

(4)判别分析

______________

课程类别 必修[

] 选修[ ]

考试方式 开卷[ ] 闭卷[ ]

(5)主成分分析

(6)因子分析

(7)对应分析

(8)典型相关性分析

( 9)定性数据建模分析

(10)路径分析(又称多重回归、联立方程)

(11)结构方程模型

(12)联合分析

(13)多变量图表示法

(14)多维标度法

2. 简单相关分析、复相关分析和典型相关分析有何不同?并举例说明之。

简单相关分析:简单相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。例如,以X、Y分别记小学生的数学与语文成绩,感兴趣的是二者的关系如何,而不在于由X去预测Y。

复相关分析;研究一个变量 x0与另一组变量 (x1,x2,…,xn)之间的相关程度。例如,职业声望同时受到一系列因素(收入、文化、权力……)的影响,那么这一系列因素的总和与职业声望之间的关系,就是复相关。复相关系数R0.12…n的测定,可先求出 x0对一组变量x1,x2,…,xn的回归直线,再计算x0与用回归直线估计值悯之间的简单直线回归。复相关系数为R0.12…n的取值范围为0≤R0.12…n≤1。复相关系数值愈大,变量间的关系愈密切。

典型相关分析就是利用综合变量对之间的相关关系来反映两组指标之间的整体相关性的多元统计分析方法。它的基本原理是:为了从总体上把握两组指标之间的相关关系,分别在两组变量中提取有代表性的两个综合变量U1和V1(分别为两个变量组中各变量的线性组合),利用这两个综合变量之间的相关关系来反映两组指标之间的整体相关性。

3. 试说明主成分分析和因子分析不同点和相同之处。

主成分分析和因子分析的相同之处

1.都可以降维、分析多个变量的基本结构

2.因子分析是主成分分析的进一步推广。主成分分析可被视为一种固定效应的因子分析,是因子分析的特列

3.都是利用变量之间的相关性将它们进行分类

4.主成分分析中,各个主成分之间互不相关;因子分析中,公因子之间不相关、特殊因子之间不相关、公因子与特殊因子之间不相关

主成分分析和因子分析的区别

1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。

2、主成分分析的重点在于解释个变量的总方差,而因子分析则把重点放在解释各变量之间的协方差。

3、主成分分析中不需要有假设(assumptions),因子分析则需要一些假设。因子分析的假设包括:各个共同因子之间不相关,特殊因子(specific factor)之间也不相关,共同因子和特殊因子之间也不相关。

4、主成分分析中,当给定的协方差矩阵或者相关矩阵的特征值是唯一的时候,的主成分一般是独特的;而因子分析中因子不是独特的,可以旋转得到不同的因子。1、因子分析中是把变量表示成各因子的线性组合,而主成分分析中则是把主成分表示成个变量的线性组合。

4. 判别分析以及Fisher判别和Bayes判别的基本思想是什么?

判别分析:根据判别中的组数,可以分为两组判别分析和多组判别分析;

根据判别函数的形式,可以分为线性判别和非线性判别;

根据判别式处理变量的方法不同,可以分为逐步判别、序贯判别等;

根据判别标准不同,可以分为距离判别、Fisher判别、Bayes判别法等

Fisher判别法;通过将多维数据投影到某一方向上,使得投影之后类与类之间尽可能分开,然后再寻找合适的判别准则。

Bayes判别法:假设已知对象的先验概率和“先验条件概率”, 而后得到后验概率, 由后验概率作出判别。

5. 指出综合评价中指标的标准化方法及其优缺点和有哪些综合评价方法。

标准化方法

(1)主成分分析法。主成分分析是多元统计分析的一个分支。是将其分量相关的原随机向量,借助于一个正交变换,转化成其分量不相关的新随机向量,并以方差作为信息量的测度,对新随机向量进行降维处理。再通过构造适当的价值函数,进一步做系统转化。

(2)数据包络分析法。它是创建人以其名字命名的DEA模型——CR模型。DEA法不仅可对同一类型各决策单元的相对有效性做出评价与排序,而且还可进一步分析各决策单元非DE有效的原因及其改进方向,从而为决策者提供重要的管理决策信息。

(3)模糊评价法。模糊评价法奠基于模糊数学。它不仅可对评价对象按综合分值的大小进行评价和排序,而且还可根据模糊评价集上的值按最大隶属度原则去评定对象的等级。

综合评价方法

1、计分法

2、综合指数法

3、Topsis法

4、秩和比(RSR)法

5、层次分析(AHP)法

6、模糊评价方法

7、多元统计分析方法

8、灰色系统评价方法

得分 评阅人 二、证明题(共1小题,共20分)

设 y = a 1x 1+ a 2x 2 +…+a p x p a x ,其中a = (a 1,a 2,…,a p ),x = (x 1,

x 2,…,x p ),求主成分就是寻找x 的线性函数a x 使相应的方差达到最大,即Var (a

x ) = a a 达到最大,且a a =1,此处为x 的协方差阵。

设的特征根为。试证明下面性质:

(1)y=U

x ,U U=I ,这里U 为x 的协方差阵的特征向量(单位化的)组

成的正交阵。

(2)y 的各分量之间是互不相关的。

(3)y 的p 个分量是按方差大小、由大到小排列的。 (4)y 的协方差阵为对角阵。

(5)ii i σλ=∑∑, 这里

= (

ii )

p p

(6)

证明(1)(2)(3):

设的特征向量为U= (u 1,u 2,…,u p ),则U

U=I ,即U 为一正交阵,且

= U ΛU

= U diag(12,,,p λλλ)U

=1

p

i i λ=∑u i u i

因此a

a=1

p i i λ=∑a u i u i a =1

p i i λ=∑(a u i ) (a u i)= 1

p

i i λ=∑(a u i )2

于是a

a 1

p

i i λ=≤∑(a u i )2=1λ(a U) (a U )= 1λa UU a =1λa a=1λ

应取1a u =时,u 1 u 1= u 1 1λ u 1=1λ

故y 1= u

x 就是第一主成分,其方差最大,

Var (y 1) = Var (u 1 x ) =1λ 同理,Var (y i ) = Var (u i x ) =i λ

另外,Cov (y i, y j )= Cov (u i

x, u j x )= u i u j = u i j λ u j =j λ u i u j =0,

i ≠j

因此,有上述可得变量x 的主成分是以

的特征向量为系数的线性组合,且主成

分y 之间互不相关,y 的p 个分量是按方差大小、由大到小排列的。性质(1)(2)(3)得证。

性质(4)可有(1)(2)(3)得到。 证明性质(5): 由U =12(,,,)p u u u ,则有

= U ΛU

于是

1

p

ii i σ=∑=tr (

)=tr (U ΛU )= tr (ΛU

U )= tr (Λ)=1

p

i i λ=∑

证明性质(6):(6)

由前面的证明得知var(),var()i i j jj y x λσ== 令e j =(0,

,0,1,0,

,0)为单位向量,则

x j = e j x ,y i = u i x 所以,Cov (y i, x j )= Cov (u i

x, e j x )= e j D (x ) u i= e j

u i=i e j u i = u ij

故 (,)(,)var()var()

i j ij i

i j i j jj

Cov y x u a y x y x λσ=

=

性质(6)得证 得分 评阅人 三、运算题(共3小题,共20分)

下面左表为五个观察值,两个变量的数据,右表为用欧氏距离计算的距离矩阵,

x1 x2 1 5 7

2 7 1

3 3 2

4 6

5 5

6

6

1. (10分)写出用R 语言分析的命令 (1) 请将数据x1和x2写入R 向量中:

x1=c(5,7,3,6,6);x1 x2=c(7,1,2,5,6);x2

(2) 写出绘制上面散点图的R 命令:

x1=c(5,7,3,6,6);x1 x2=c(7,1,2,5,6);x2 plot(x1,x2)

(3) 写出绘制系统聚类图的R 命令:

X=data.frame(x1,x2);X

D=dist(X,diag=TRUE,upper=TRUE);D hc=hclust(D,'complete');hc plot(hc)

2.(5分)

3

4

56

7

12

3

4

567

x1

x 2

1

2

3

4

5

(1) 写出计算下面绝对距离阵的R命令:

x1=c(5,7,3,6,6)

x2=c(7,1,2,5,6)

X=data.frame(x1,x2);X

D=dist(X,diag=TRUE,upper=TRUE,p=1);D

1 2 3 4 5

1 0 8 7 3 2

2 8 0 5 5 6

3 7 5 0 6 7

4 3

5

6 0 1

5 2

6

7 1 0

(2)试在图中标出这些距离

3.(5分)试用最长距离法对其进行聚类分析,画出聚类图,并按二类、三类

进行分类

第一步:计算距离阵

X=data.frame(x1,x2);X

D=dist(X,diag=TRUE,upper=TRUE);D

第二步:进行系统聚类(最长距离法)

hc=hclust(D,'complete');hc

第三步:画出聚类图

(1)按二类进行分类

plot(hc); rect.hclust(hc,2)

(2)按三类进行分类

plot(hc); rect.hclust(hc,3)

1

4

5

2

3

1

23456

Cluster Dendrogram

hclust (*, "complete")

D

H e i g h t

1

4

5

2

3

1

23456

Cluster Dendrogram

hclust (*, "complete")

D

H e i g h t

四、案例分析题(共2小题,共30分)

我们知道,财政收入与国民生产总值和税收等经济指标有密切的依存关系。今收集了我国改革开放以来财政收入(y:百亿元),国民生产总值 (x1:百亿元),税收(x2:百亿元),进出口贸易总额(x3:百亿元),经济活动人口(x4:百万人)的部分数据,见下表所示,分析财政收入和国民生产总值、税收、进出口贸易总额、经济活动人口之间的关系。

表1 财政收入多因素分析数据

1. 基本统计分析和R语言命令(15分)

(1) 如果将该数据存入到一个文本文件reg.txt中,写出将该文本数据读入

数据框dat中的R命令:dat=read.table("reg.txt",,header=T) (1分) (2) 如果将该数据拷贝到剪切板中,写出将该数据读入数据框dat中的

R命令:dat=read.table("clipboard",header=T) (1分)

(3) 写出提取2000年数据的R命令:dat[10,] (1分)

写出提取税收(x2)数据的R命令:dat[,5] (1分)

写出提取2001年至2008年经济活动人口(x4)数据的R命令:

dat[11:18,5] (1分)

(4) 写出计算财政收入统计量的R命令:summary(y) (2分)

Min. 1st Qu. Median Mean 3rd Qu. Max.

31.49 65.34 124.20 188.70 252.30 613.30

(5) 写出计算下面相关阵R命令:cor(dat) (2分)

y x1 x2 x3 x4

y 1.0000 0.9924 0.9999 0.9874 0.8736

x1 0.9924 1.0000 0.9938 0.9883 0.9126

x2 0.9999 0.9938 1.0000 0.9881 0.8811

x3 0.9874 0.9883 0.9881 1.0000 0.8807

x4 0.8736 0.9126 0.8811 0.8807 1.0000

(6) 写出计算下面回归系数的R命令:fm=lm(y~x1+x2+x3+x4,data=dat);fm (2分)

Coefficients:

(Intercept) x1 x2 x3 x4

84.62030 0.00207 1.16908 -0.00305 -0.13391

(7) 写出计算下面检验的R命令: summary(fm) (2分)

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 84.62030 12.74442 6.64 1.6e-05 ***

x1 0.00207 0.00491 0.42 0.68

x2 1.16908 0.02113 55.32 < 2e-16 ***

x3 -0.00305 0.00367 -0.83 0.42

x4 -0.13391 0.01969 -6.80 1.3e-05 ***

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.18 on 13 degrees of freedom

Multiple R-squared: 0.999, Adjusted R-squared: 0.998

F-statistic: 8.87e+04 on 4 and 13 DF, p-value: <2e-16

(8) 写出计算下面检验的R命令:

fm1=lm(y~x2+x4,data=dat);fm1

summary(fm1) (2分)

Coefficients:

Estimate Std. Error t value Pr(>|t|)

(Intercept) 82.10361 9.04442 9.078 1.76e-07 ***

x2 1.16768 0.00385 303.331 < 2e-16 ***

x4 -0.12945 0.01318 -9.818 6.36e-08 ***

---

Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 1.126 on 15 degrees of freedom

Multiple R-squared: 1, Adjusted R-squared: 1

F-statistic: 1.942e+05 on 2 and 15 DF, p-value: < 2.2e-16

2. 在上面计算的基础上进行进一步分析(15分)

(1) 试问该回归方程有无统计学意义,为什么?(2分)

由F检验结果可知,P值小于0.5,于是在0.05的显著性水平上拒绝原假设,所以认为整个回归方程有统计学意义。

(2) 该模型的复相关系数、决定系数、调整复相关系数平方和剩余标准差(3

分)

复相关系数:0.9994

决定系数:0.999

多元统计分析期末复习试题

第一章: 多元统计分析研究的内容(5点) 1、简化数据结构(主成分分析) 2、分类与判别(聚类分析、判别分析) 3、变量间的相互关系(典型相关分析、多元回归分析) 4、多维数据的统计推断 5、多元统计分析的理论基础 第二三章:

二、多维随机变量的数字特征 1、随机向量的数字特征 随机向量X 均值向量: 随机向量X 与Y 的协方差矩阵: 当X=Y 时Cov (X ,Y )=D (X );当Cov (X ,Y )=0 ,称X ,Y 不相关。 随机向量X 与Y 的相关系数矩阵: 2、均值向量协方差矩阵的性质 (1).设X ,Y 为随机向量,A ,B 为常数矩阵 E (AX )=AE (X ); E (AXB )=AE (X )B; D(AX)=AD(X)A ’; Cov(AX,BY)=ACov(X,Y)B ’; (2).若X ,Y 独立,则Cov(X,Y)=0,反之不成立. (3).X 的协方差阵D(X)是对称非负定矩阵。例2.见黑板 三、多元正态分布的参数估计 2、多元正态分布的性质 (1).若 ,则E(X)= ,D(X)= . )' ,...,,(),,,(2121P p EX EX EX EX μμμ='= )' )((),cov(EY Y EX X E Y X --=q p ij r Y X ?=)(),(ρ) ,(~∑μP N X μ ∑ p X X X ,,,21

特别地,当 为对角阵时, 相互独立。 (2).若 ,A为sxp 阶常数矩阵,d 为s 阶向量, AX+d ~ . 即正态分布的线性函数仍是正态分布. (3).多元正态分布的边缘分布是正态分布,反之不成立. (4).多元正态分布的不相关与独立等价. 例3.见黑板. 三、多元正态分布的参数估计 (1)“ 为来自p 元总体X 的(简单)样本”的理解---独立同截面. (2)多元分布样本的数字特征---常见多元统计量 样本均值向量 = 样本离差阵S= 样本协方差阵V= S ;样本相关阵R (3) ,V分别是 和 的最大似然估计; (4)估计的性质 是 的无偏估计; ,V分别是 和 的有效和一致估计; ; S~ , 与S相互独立; 第五章 聚类分析: 一、什么是聚类分析 :聚类分析是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法。用于对事物类别不清楚,甚至事物总共可能有几类都不能确定的情况下进行事物分类的场合。聚类方法:系统聚类法(直观易懂)、动态聚类法(快)、有序聚类法(保序)...... Q-型聚类分析(样品)R-型聚类分析(变量) 变量按照测量它们的尺度不同,可以分为三类:间隔尺度、有序尺度、名义尺度。 μ ) ,(~∑μP N X ) ,('A A d A N s ∑+μ) () 1(,,n X X X )' ,,,(21p X X X )' )(() () (1 X X X X i i n i --∑=n 1 X μ∑μ X ) 1 , (~∑n N X P μ) ,1(∑-n W p X X

多元统计分析与R语言建模考试试卷

.. .. 多元统计分析及R 语言建模考试试卷 一、简答题(共5小题,每小题6分,共30分) 1. 常用的多元统计分析方法有哪些? (1)多元正态分布检验 (2)多元方差-协方差分析 (3)聚类分析 (4)判别分析 (5)主成分分析 ______________ 课程类别 必修[ ] 选修[ ] 考试方式 开卷[ ] 闭卷[ ]

(7)对应分析 (8)典型相关性分析 ( 9)定性数据建模分析 (10)路径分析(又称多重回归、联立方程) (11)结构方程模型 (12)联合分析 (13)多变量图表示法 (14)多维标度法 2. 简单相关分析、复相关分析和典型相关分析有何不同?并举例说明之。 简单相关分析:简单相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。例如,以X、Y分别记小学生的数学与语文成绩,感兴趣的是二者的关系如何,而不在于由X去预测Y。 复相关分析;研究一个变量 x0与另一组变量 (x1,x2,…,xn)之间的相关程度。例如,职业声望同时受到一系列因素(收入、文化、权力……)的影响,那么这一系列因素的总和与职业声望之间的关系,就是复相关。复相关系数R0.12…n的测定,可先求出 x0对一组变量x1,x2,…,xn的回归直线,再计算x0与用回归直线估计值悯之间的简单直线回归。复相关系数为R0.12…n的取值围为0≤R0.12…n≤1。复相关系数值愈大,变量间的关系愈密切。 典型相关分析就是利用综合变量对之间的相关关系来反映两组指标之间的整体相关性的多元统计分析方法。它的基本原理是:为了从总体上把握两组指标之间的相关关系,分别在两组变量中提取有代表性的两个综合变量U1和V1(分别为两个变量组中各变量的线性组合),利用这两个综合变量之间的相关关系来反映两组指标之间的整体相关性。

多元统计分析期末试题

一、填空题(20分) 1、若),2,1(),,(~)(n N X p 且相互独立,则样本均值向量X 服从的分布 为 2、变量的类型按尺度划分有_间隔尺度_、_有序尺度_、名义尺度_。 3、判别分析是判别样品 所属类型 的一种统计方法,常用的判别方法有__距离判别法_、Fisher 判别法、Bayes 判别法、逐步判别法。 4、Q 型聚类是指对_样品_进行聚类,R 型聚类是指对_指标(变量)_进行聚类。 5、设样品),2,1(,),,(' 21n i X X X X ip i i i ,总体),(~ p N X ,对样品进行分类常用的距离 2 ()ij d M )()(1j i j i x x x x ,兰氏距离()ij d L 6、因子分析中因子载荷系数ij a 的统计意义是_第i 个变量与第j 个公因子的相关系数。 7、一元回归的数学模型是: x y 10,多元回归的数学模型是: p p x x x y 22110。 8、对应分析是将 R 型因子分析和Q 型因子分析结合起来进行的统计分析方法。 9、典型相关分析是研究两组变量之间相关关系的一种多元统计方法。 二、计算题(60分) 1、设三维随机向量),(~3 N X ,其中 200031014,问1X 与2X 是否独立?),(21 X X 和3X 是否独立?为什么? 解: 因为1),cov(21 X X ,所以1X 与2X 不独立。 把协差矩阵写成分块矩阵 22211211,),(21 X X 的协差矩阵为11 因为12321),),cov(( X X X ,而012 ,所以),(21 X X 和3X 是不相关的,而正态分布不相关与相互

多元统计分析试题(2012)

近几年,中国房地产业得到了长足的发展,但房地产价格的上涨一直饱受争议,甚至有逃离“北、上、广”的言论,这也从侧面反映了房地产价格的区域性特征,下表为2008年中国31个省、市、自治区房地产业的相关统计数据,试根据这些数据进行聚类分析。 表1中指标说明如下: X1:房屋平均销售价格; X2:住宅平均销售价格; X3:别墅、高档公寓平均销售价格; X4:经济适用房平均销售价格; X5:办公楼平均销售价格; X6:商业营业用房平均销售价格 X7:其他平均销售价格; X8:商品房销售面积; X9:住宅销售面积 表1

为研究某地区人口死亡状况,已按某种方法将15个已知样品分为3类,指标及原始数据见表2,试建立判别函数,并判定另外4个待判样品属于哪类? 表2 X1:0岁组死亡概率X4:55岁组死亡概率 X2:1岁组死亡概率X5:80岁组死亡概率 X3:10岁组死亡概率X6:平均预期寿命 题3 利用主成分分析综合评价全国重点水泥企业的经济效益。原始数据见表3。 表3

题4 反映城镇居民消费支出状况的指标主要有食品、衣着、居住、家庭设备用品及服务、医疗保健、交通和通信以及教育文化娱乐服务等八项消费支出指标,数据如下表4所示。以2008年为例进行说明。选取反映我国各省、市、自治区的城镇居民人均消费支出8个指标作为原始变量,运用SPSS软件,对全国31个中心城市的人均消费水平水平作因子分析。

题5、在研究国家财政收入时,我们把财政收入按收入形式分为:各项税收收入、企业收入、债务收入、国家能源交通重点建设基金收入、基本建设贷款归还收入、国家预算调节基金收入、其他收入等。为了建立国家财政收入回归模型,我们以财政收入y(亿元)为因变量。自变量如下:x 1 ——农业增 加值(亿元),x 2——工业增加值(亿元),x 3 ——建筑业增加值(亿元),x 4 ——人口数(万人),x 5 ——社会 消费总额(亿元),x 6 ——受灾面积(万公顷)。据《中国统计年鉴》获得1979—1998共20个年分的统计数据,见表5。由定性分析知,所选自变量都与变量y有较强的相关性,试做出一个较为理想的回归方程。 表5

多元统计分析期末试卷

一、(本大题共2小题,每题5分,共10分) 1、设),(~3∑μN X ,其中???? ? ?????=∑-==221231111,)'1,3,2(,)',,(321μX X X X ,试求32123X X X +-的分布。 2、设三个总体321,G G G 和的分布分别为:)1,3()2,0(),5.0,2(222N N N 和。试按马氏距离判别准则判别x =2.5应判归哪一类? 二、(本题10分)设'1233(,,)~(,)X X X X N μ=∑,其中 )10(11 1 ,)',,(321<

三、(本题10分)已知5个样品的观测值为:1,4,5,7,11.试用按类平均法对5个样品进行分类。 四、(本题10分)设有两个正态总体21G G 和,已知(m=2) ? ? ? ???=∑=∑??????=??????=32121218,2520,151021)1()1(μμ ,先验概率21q q =,而,10)12(=L 75)21(=L 。试问按贝叶斯判别准则样品?? ? ???=??????=2015,2020)2() 1(X X 各应判归哪一类?

五、(本题10分)假定人体尺寸有这样的一般规律:身高(1X ),胸围(2X )和上半臂围(3X )的平均尺寸比例是6:4:1。假定),,1()(n X =αα为来自总体)',,(321X X X X =的随机样本,并设),(~3∑μN X 。试利用下表中数据来检验其身高、胸围和上半臂围这三个尺寸是否符合这一规律。(94.6)4,2(,05.005.0==F α)

多元统计分析试题及答案

华南农业大学期末试卷(A 卷) 2006学年第2学期 考试科目:多元统计分析 考试类型:(闭卷) 考试时间:120 分钟 学号 姓名 年级专业 题号 一 二 三 四 五 六 七 八 总分 得分 评阅人 一、填空题(5×6=30) 22121212121~(,),(,),(,),, 1X N X x x x x x x ρμμμμσρ ?? ∑==∑= ???+-1、设其中则Cov(,)=____. 10 31 2~(,),1,,10,()()_________i i i i X N i W X X μμμ=' ∑=--∑、设则=服从。 ()1 2 34 433,4 92,32 16___________________ X x x x R -?? ?'==-- ? ?-? ? =∑、设随机向量且协方差矩阵则它的相关矩阵 4、 __________, __________, ________________。 215,1, ,16(,),(,) 15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。 (), 123设X=x x x 的相关系数矩阵通过因子分析分解为 211X h = 的共性方差111 X σ = 的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.83511 00.4170.8940.02700.8940.44730.8350.4470.1032013 R ? ? - ????? ? -?? ? ? ?=-=-+ ? ? ? ??? ? ? ????? ? ???

多元统计分析模拟试题教学提纲

多元统计分析模拟试 题

多元统计分析模拟试题(两套:每套含填空、判断各二十道) A卷 1)判别分析常用的判别方法有距离判别法、贝叶斯判别法、费歇判别法、逐 步判别法。 2)Q型聚类分析是对样品的分类,R型聚类分析是对变量_的分类。 3)主成分分析中可以利用协方差矩阵和相关矩阵求解主成分。 4)因子分析中对于因子载荷的求解最常用的方法是主成分法、主轴因子法、 极大似然法 5)聚类分析包括系统聚类法、模糊聚类分析、K-均值聚类分析 6)分组数据的Logistic回归存在异方差性,需要采用加权最小二乘估计 7)误差项的路径系数可由多元回归的决定系数算出,他们之间的关系为 = 8)最短距离法适用于条形的类,最长距离法适用于椭圆形的类。 9)主成分分析是利用降维的思想,在损失很少的信息前提下,把多个指标转 化为几个综合指标的多元统计方法。 10)在进行主成分分析时,我们认为所取的m(m

多元统计分析期末试题及答案.doc

22121212121 ~(,),(,),(,),, 1X N X x x x x x x ρμμμμσρ ?? ∑==∑= ??? +-1、设其中则Cov(,)=____. 10 31 2~(,),1,,10,()()_________i i i i X N i W X X μμμ=' ∑=--∑L 、设则=服从。 ()1 2 34 433,4 92,32 16___________________ X x x x R -?? ?'==-- ? ?-? ? =∑、设随机向量且协方差矩阵则它的相关矩阵 4、 __________, __________, ________________。 215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--L 、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。 12332313116421(,,)~(,),(1,0,2),441, 2142X x x x N x x x x x μμ-?? ?'=∑=-∑=-- ? ?-?? -?? + ??? 、设其中试判断与是否独立? (), 1 2 3设X=x x x 的相关系数矩阵通过因子分析分解为 211X h = 的共性方差111X σ= 的方差21X g = 1公因子f 对的贡献1213 30.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.10320 13 R ? ? - ????? ? -?? ? ? ?=-=-+ ? ? ? ??? ? ? ????? ? ???

应用多元统计分析试题及答案

一、填空题: 1、多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法. 2、回归参数显著性检验是检验解释变量对被解释变量的影响是否著. 3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。通常聚类分析分为 Q型聚类和 R型聚类。 4、相应分析的主要目的是寻求列联表行因素A 和列因素B 的基本分析特征和它们的最优联立表示。 5、因子分析把每个原始变量分解为两部分因素:一部分为公共因子,另一部分为特殊因子。 6、若 () (,), P x N αμα ∑=1,2,3….n且相互独立,则样本均值向量x服从的分布 为_x~N(μ,Σ/n)_。 二、简答 1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。 在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。 2、简述相应分析的基本思想。 相应分析,是指对两个定性变量的多种水平进行分析。设有两组因素A和B,其中因素A包含r个水平,因素B包含c个水平。对这两组因素作随机抽样调查,得到一个rc的二维列联表,记为。要寻求列联表列因素A和行因素B的基本分析特征和最优列联表示。相应分析即是通过列联表的转换,使得因素A

和因素B 具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素A 、B 的联系。 3、简述费希尔判别法的基本思想。 从k 个总体中抽取具有p 个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数 系数: 确定的原则是使得总体之间区别最大,而使每个总体内部的离差最小。将新样品的p 个指标值代入线性判别函数式中求出 值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。 5、简述多元统计分析中协差阵检验的步骤 第一,提出待检验的假设 和H1; 第二,给出检验的统计量及其服从的分布; 第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域; 第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受)。 协差阵的检验 检验0=ΣΣ 0p H =ΣI : /2 /21exp 2np n e tr n λ???? =-?? ? ???? S S 00p H =≠ΣΣI : /2 /2**1exp 2np n e tr n λ???? =-?? ? ???? S S

多元统计分析模拟考题及答案

一、判断题 ( 对 )112(,,,)p X X X X '=L 的协差阵一定是对称的半正定阵 ( 对 )2标准化随机向量的协差阵与原变量的相关系数阵相同。 ( 对)3典型相关分析是识别并量化两组变量间的关系,将两组变量的相关关系 的研究转化为一组变量的线性组合与另一组变量的线性组合间的相关关系的研究。 ( 对 )4多维标度法是以空间分布的形式在低维空间中再现研究对象间关系的数据分析方法。 ( 错)5),(~),,,(21∑'=μp p N X X X X Λ,,X S 分别是样本均值和样本离差阵,则, S X n 分别是,μ∑的无偏估计。 ( 对)6),(~),,,(21∑'=μp p N X X X X Λ,X 作为样本均值μ的估计,是 无偏的、有效的、一致的。 ( 错)7 因子载荷经正交旋转后,各变量的共性方差和各因子的贡献都发生了变化 ( 对)8因子载荷阵()ij A a =中的ij a 表示第i 个变量在第j 个公因子上的相对重要性。 ( 对 )9 判别分析中,若两个总体的协差阵相等,则Fisher 判别与距离判别等 价。 (对)10距离判别法要求两总体分布的协差阵相等,Fisher 判别法对总体的分布无特定的要求。 二、填空题 1、多元统计中常用的统计量有:样本均值向量、样本协差阵、样本离差阵、样本相关系数矩阵. 2、设∑是总体1(,,)m X X X =L 的协方差阵,∑的特征根(1,,)i i m λ=L 与相应的单 位正交化特征向量 12(,,,)i i i im a a a α=L ,则第一主成分的表达式是 11111221m m y a X a X a X =+++L ,方差为 1λ。 3设∑是总体1234(,,,)X X X X X =的协方差阵,∑的特征根和标准正交特征向量分别 为:' 112.920(0.1485,0.5735,0.5577,0.5814)U λ==--- ' 221.024(0.9544,0.0984,0.2695,0.0824)U λ==- '330.049(0.2516,0.7733,0.5589,0.1624)U λ==--

秋季多元统计分析考试答案

《多元统计分析》课程试卷答案 A 卷 2009年秋季学期 开课学院:理 考试方式:√闭卷、开卷、一纸开卷、其它 考试时间:120 分钟 班级 姓名 学号 散卷作废。 一、(15分)设()∑????? ??=,~3321μN x x x X ,其中????? ??-=132μ,??? ? ? ??=∑221231111, 1.求32123x x x +-的分布; 2. 求二维向量???? ??=21a a a ,使3x 与??? ? ??'-213x x a x 相互独立。 解:1.32123x x x +-()CX x x x ???? ? ? ??-=321123,则()C C C N CX '∑,~μ。(2分) 其中:μC ()13132123=????? ??--=,()9123221231111123=??? ? ? ??-????? ??-='∑C C 。(4分) 所以32123x x x +-()9,13~N (1分) 2. ????? ?????? ??'-213 3x x a x x =AX x x x a a ????? ? ?????? ??--3212 1110 ,则()A A A N AX '∑,~2μ。(1分) 其中: 订 线 装

μA ???? ??++-=???? ? ??-???? ??--=132113********* a a a a ,(1分) ??? ? ??+--+++--+--='???? ??--???? ? ?????? ??--='∑242232222211002212311111100 2121222121212121 a a a a a a a a a a a a a a A A (2分) 要使3x 与???? ??'-213x x a x 相互独立,必须02221=+--a a ,即2221=+a a 。 因为2221=+a a 时24223212122 21 +--++a a a a a a 0>。所以使3x 与??? ? ??'-213x x a x 相互独立,只要 ???? ??=21a a a 中的21,a a 满足2221=+a a 。 (4分) 二、(14分)设一个容量为n=3的随机样本取自二维正态总体,其数据矩阵为 ??? ? ? ??=3861096X ,给定显著性水平05.0=α, 1. 求均值向量μ和协方差矩阵∑的无偏估计 2. 试检验,38:H 0???? ??=μ .38:H 1??? ? ??≠μ (已知F 分布的上α分位数为19)2,2(F ,5.199)1,2(F ,51.18)2,1(F 0.050.050.05===) 解:1、??? ? ??==∑=68X n 1X n 1i i (3分) ???? ??--='--=∑=9334)X X ()X X (1-n 1S i n 1i i (3分) 2、,38:H 0???? ??=μ .38:H 1??? ? ??≠μ…(1分)

多元统计分析期末复习试题

第一章: 多元统计分析研究的容(5点) 1、简化数据结构(主成分分析) 2、分类与判别(聚类分析、判别分析) 3、变量间的相互关系(典型相关分析、多元回归分析) 4、多维数据的统计推断 5、多元统计分析的理论基础 第二三章: 二、多维随机变量的数字特征 1、随机向量的数字特征 随机向量X均值向量: 随机向量X与Y的协方差矩阵: 当X=Y时Cov(X,Y)=D(X);当Cov(X,Y)=0 ,称X,Y不相关。 随机向量X与Y的相关系数矩阵: 2、均值向量协方差矩阵的性质 (1).设X,Y为随机向量,A,B 为常数矩阵 E(AX)=AE(X); E(AXB)=AE(X)B; D(AX)=AD(X)A’; )' ,..., , ( ) , , , ( 2 1 2 1P p EX EX EX EXμ μ μ = ' = )' )( ( ) , cov(EY Y EX X E Y X- - = q p ij r Y X ? =) ( ) , (ρ

Cov(AX,BY)=ACov(X,Y)B ’; (2).若X ,Y 独立,则Cov(X,Y)=0,反之不成立. (3).X 的协方差阵D(X)是对称非负定矩阵。例2.见黑板 三、多元正态分布的参数估计 2、多元正态分布的性质 (1).若 ,则E(X)= ,D(X)= . 特别地,当 为对角阵时, 相互独立。 (2).若 ,A为sxp 阶常数矩阵,d 为s 阶向量, AX+d ~ . 即正态分布的线性函数仍是正态分布. (3).多元正态分布的边缘分布是正态分布,反之不成立. (4).多元正态分布的不相关与独立等价. 例3.见黑板. 三、多元正态分布的参数估计 (1)“ 为来自p 元总体X 的(简单)样本”的理解---独立同截面. (2)多元分布样本的数字特征---常见多元统计量 样本均值向量 = 样本离差阵S= 样本协方差阵V= S ;样本相关阵R (3) ,V分别是 和 的最大似然估计; (4)估计的性质 是 的无偏估计; ,V分别是 和 的有效和一致估计; ; S~ , 与S相互独立; 第五章 聚类分析: 一、什么是聚类分析 :聚类分析是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法。用于对事物类别不清楚,甚至事物总共可能有几类都不能确定的情况下进行事物分类的场合。聚类方法:系统聚类法(直观易懂)、动态聚类法(快)、有序聚类法(保序)...... Q-型聚类分析(样品)R-型聚类分析(变量) 变量按照测量它们的尺度不同,可以分为三类:间隔尺度、有序尺度、名义尺度。 二、常用数据的变换方法:中心化变换、标准化变换、极差正规化变换、对数变换(优缺点) 1、中心化变换(平移变换):中心化变换是一种坐标轴平移处理方法,它是先求出每个变量的样本平均值,再从原始数据中减去该变量的均值,就得到中心化变换后的数据。不改变样本间的相互位置,也不改变变量间的相关性。 2、标准化变换:首先对每个变量进行中心化变换,然后用该变量的标准差进行标准化。 经过标准化变换处理后,每个变量即数据矩阵中每列数据的平均值为0,方差为1,且也不再具有量纲,同样也便于不同变量之间的比较。 3、极差正规化变换(规格化变换):规格化变换是从数据矩阵的每一个变量中找出其最大值和最小值,这两者之差称为极差,然后从每个变量的每个原始数据中减去该变量中的最小值,再除以极差。经过规格化变换后,数据矩阵中每列即每个变量的最大数值为1,最小数值为0,其余数据取值均在0-1之间;且变换后的数据都不再具有量纲,便于不同的变量之间的比较。 4、对数变换:对数变换是将各个原始数据取对数,将原始数据的对数值作为变换后的新值。它将具有指数特征的数据结构变换为线性数据结构。 三、样品间相近性的度量 研究样品或变量的亲疏程度的数量指标有两种:距离,它是将每一个样品看作p 维空),(~∑μP N X μ∑μp X X X ,,,21 ),(~∑μP N X ),('A A d A N s ∑+μ)()1(,,n X X X )',,,(21p X X X )')(()()(1X X X X i i n i --∑=n 1X μ ∑μX )1,(~∑n N X P μ),1(∑-n W p X X

多元统计分析期末考试考点整理

二名词解释 1、多元统计分析:多元统计分析是运用数理统计的方法来研究多变量(多指标)问题的理论和方法,是一元统计学的推广 2、聚类分析:是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法。将个体或对象分类,使得同一类中的对象之间的相似性比与其他类的对象的相似性更强。使类内对象的同质性最大化和类间对象的异质性最大化 3、随机变量:是指变量的值无法预先确定仅以一定的可能性(概率)取值的量。它是由于随机而获得的非确定值,是概率中的一个基本概念。即每个分量都是随机变量的向量为随机向量。类似地,所有元素都是随机变量的矩阵称为随机矩阵。 4、统计量:多元统计研究的是多指标问题,为了了解总体的特征,通过对总体抽样得到代表总体的样本,但因为信息是分散在每个样本上的,就需要对样本进行加工,把样本的信息浓缩到不包含未知量的样本函数中,这个函数称为统计量 三、计算题 解:

答: 答:

题型三解答题 1、简述多元统计分析中协差阵检验的步骤 答: 第一,提出待检验的假设和H1; 第二,给出检验的统计量及其服从的分布; 第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域; 第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受)。 2、简述一下聚类分析的思想 答:聚类分析的基本思想,是根据一批样品的多个观测指标,具体地找出一些能够度量样品或指标之间相似程度的统计量,然后利用统计量将样品或指标进行归类。把相似的样品或指标归为一类,把不相似的归为其他类。直到把所有的样品(或指标)聚合完毕. 3、多元统计分析的内容和方法 答:1、简化数据结构,将具有错综复杂关系的多个变量综合成数量较少且互不相关的变量,使研究问题得到简化但损失的信息又不太多。(1)主成分分析(2)因子分析(3)对应分析等

多元统计分析模拟试题

多元统计分析模拟试题(两套:每套含填空、判断各二十道) A卷 1)判别分析常用的判别方法有距离判别法、贝叶斯判别法、费歇判别法、逐步 判别法。 2)Q型聚类分析是对样品的分类,R型聚类分析是对变量_的分类。 3)主成分分析中可以利用协方差矩阵和相关矩阵求解主成分。 4)因子分析中对于因子载荷的求解最常用的方法是主成分法、主轴因子法、极 大似然法 5)聚类分析包括系统聚类法、模糊聚类分析、K-均值聚类分析 6)分组数据的Logistic回归存在异方差性,需要采用加权最小二乘估计 7)误差项的路径系数可由多元回归的决定系数算出,他们之间的关系为 P e= 1?R2 8)最短距离法适用于条形的类,最长距离法适用于椭圆形的类。 9)主成分分析是利用降维的思想,在损失很少的信息前提下,把多个指标转化 为几个综合指标的多元统计方法。 10)在进行主成分分析时,我们认为所取的m(m

多元统计分析模拟考题及答案

、判断题 (对)1X (兀公2丄,X p)的协差阵一定是对称的半正定阵 (对)2标准化随机向量的协差阵与原变量的相关系数阵相同。 (对)3典型相关分析是识别并量化两组变量间的关系,将两组变量的相关关系的研究转化为一组变量的线性组合与另一组变量的线性组合间的相关关系的研究。 (对)4多维标度法是以空间分布的形式在低维空间中再现研究对象间关系的数据分析方法。(错)5X (X-X2,,X p) ~ N p( , ),X,S分别是样本均值和样本离 S 差阵,则X,—分别是,的无偏估计。 n (对)6X (X「X2, ,X p) ~ N p( , ),X作为样本均值的估计,是无偏的、有效的、一致的。 (错)7因子载荷经正交旋转后,各变量的共性方差和各因子的贡献都发生了变化 (对)8因子载荷阵A (a j)中的a ij表示第i个变量在第j个公因子上的相对重要性。 (对)9判别分析中,若两个总体的协差阵相等,则Fisher判别与距离判别等价。(对)10距离判别法要求两总体分布的协差阵相等,Fisher判别法对总体的分布无特 定的要求。 二、填空题 1、多元统计中常用的统计量有:样本均值向量、样本协差阵、样本离差阵、样本相关系数矩阵. 2、设是总体X (X」,X m)的协方差阵,的特征根i(i 1,L ,m)与相应的单 位正交化特征向量i (盼无丄,a m),则第一主成分的表达式是 y1 Q1X1 812X2 L QmX m 方差为1。 3设是总体X (X1,X2,X3, X4)的协方差阵,的特征根和标准正交特征向量分别为: 1 2.920 U;(0.1485, 0.5735, 0.5577, 0.5814) 2 1.024 U2(0.9544, 0.0984,0.2695,0.0824) 3 0.049 U3(0.2516,0.7733, 0.5589, 0.1624) 0.007U4 ( 0.0612,0.2519,0.5513, 0.7930),则其第二个主成分的表达式是 4

多元统计分析试题(A卷)(答案)

《多元统计分析》试卷 1、若),2,1(),,(~)(n N X p =∑αμα 且相互独立,则样本均值向量X 服从的分布为 2、变量的类型按尺度划分有_间隔尺度_、_有序尺度_、名义尺度_。 3、判别分析是判别样品 所属类型 的一种统计方法,常用的判别方法有__ 距离判别法_、Fisher 判别法、Bayes 判别法、逐步判别法。 4、Q 型聚类是指对_样品_进行聚类,R 型聚类是指对_指标(变量)_进行聚类。 5、设样品),2,1(,),,(' 21n i X X X X ip i i i ==,总体), (~∑μp N X ,对样品进行分类 常用的距离有:明氏距离,马氏距离 2 ()ij d M =)()(1 j i j i x x x x -∑'--,兰氏距离()ij d L = 6、因子分析中因子载荷系数ij a 的统计意义是_第i 个变量与第j 个公因子的相关系数。 7、一元回归的数学模型是:εββ++=x y 10,多元回归的数学模型 是: εββββ++++=p p x x x y 22110。 8、对应分析是将 R 型因子分析和Q 型因子分析结合起来进行的统计分析方法。 9、典型相关分析是研究两组变量之间相关关系的一种多元统计方法。 一、填空题(每空2分,共40分) 二、计算题(每小题10分,共40分)

1、设三维随机向量),(~3∑μN X ,其中??? ?? ??=∑200031014,问1X 与2X 是否独立? ),(21'X X 和3X 是否独立?为什么? 解: 因为1),cov(21=X X ,所以1X 与2X 不独立。 把协差矩阵写成分块矩阵??? ? ??∑∑∑∑=∑22211211 ,),(21'X X 的协差矩阵为11∑因为12321),),cov((∑='X X X ,而012=∑,所以),(21'X X 和3X 是不相关的,而正态分布不 相关与相互独立是等价的,所以),(21'X X 和3X 是独立的。 2、设抽了五个样品,每个样品只测了一个指标,它们分别是1 ,2 ,4.5 ,6 ,8。若样 本间采用明氏距离,试用最长距离法对其进行分类,要求给出聚类图。 解:样品与样品之间的明氏距离为:????????? ? ??=02 5 .36 7 05.14505 .25.30 105 432154 321) 0(x x x x x x x x x x D 样品最短距离是1,故把21X X 与合并为一类,计算类与类之间距离(最长距离法) 得距离阵 ??????? ? ?? =025.3705.1505.30} ,{},{54 32154321) 1(x x x x x x x x x x D 类与类的最短距离是 1.5,故把43X X 与合并为一类,计算类与类之间距离(最长距

多元统计分析期末试题

1 、填空题(20分) 1、 若X Q ~ N p (g ,(a =1,2,…n)且相互独立,则样本均值向量X 服从的分布为X ~ N p (g^|。 2、 变量的类型按尺度划分有 _间隔尺度_、_有序尺度_、名义尺度_。 3、 判别分析是判别样品 所属类型 的一种统计方法,常用的判别方法有 —距离判别法_、Fisher 判别法、 Bayes 判别法、逐步判别法。 4、 Q 型聚类是指对_样品-进行聚类,R 型聚类是指对_指标(变量)_进行聚类。 5、 设样品X i =(X i1,X i2^ X ip )',(i =1,2,…n),总体X~N p (」「),对样品进行分类常用的距离有: 明氏距离d j (q)=(壬|Xy q i j i j 6、 因子分析中因子载荷系数a j 的统计意义是—第i 个变量与第j 个公因子的相关系数。 7、 一元回归的数学模型是:y 曆x 童,多元回归的数学模型是 8、 对应分析是将 R 型因子分析和Q 型因子分析结合起来进行的统计分析方法。 9、 典型相关分析是研究两组变量之间 相关关系的一种多元统计方法。 、计算题(60分) '4 1 1、设三维随机向量X~N 3(?2),其中送=1 3 e 0 独立?为什么? 解:因为cov(X 1,X 2^1,所以X 1与X 2不独立。 把协差矩阵写成分块矩阵瓦=f 11 ;12丨,(X 1,X 2/的协差矩阵为瓦 11 因为 —21 - 22 cov((X 1,X 2),X 3)=為12,而' 12 =0,所以(X 1, X 2)和X 3是不相关的,而正态分布不相关与相互独 立是等价的,所以(X 1,X 2)和X 3是独立的。 0,问X 1与X 2是否独立? 2> (X 1,X 2)和X 3是否

多元统计分析试卷A答案

东 北 大 学 秦 皇 岛 分 校 课程名称: 多元统计分析 试卷类型: 答案 考试形式:开 授课专业: 数学与应用数学 考试日期: 2012年12月12日 试卷:共 3 页 一、填空题:(每空2分,共30分) 1、设(1)(2)(,)p N ??=????:X X μX ∑(2)p ≥,(1)(2)??=????μμμ,11122122??=?? ??∑∑∑∑∑,其中(1)X ,(1) μ为1r ?,11∑为r r ?,则(1):X (1)11(,)r N μ∑,(2):X (2)22(,)p r N -μ∑ 2、系统聚类分析的方法很多,其中的五种分别为最短距离法、最长距离法、重心法、类平均法、离差平方和法。 3、若p 维随机向量~(,)p X N μ∑,~(,)p W W n ∑,且X 与W 相互独立,则 1()()~n X W X μμ-'--2(,)T p n , 2 1(,)~n p T p n pn -+(,1)F p n p -+。 4、i X 与前个主成分的全相关系数的平方和21 (,)m k i k Y X ρ=∑称为12,,,m Y Y Y L 对原始变量 i X 的方差贡献率,在因子分析中也称之为共同度。 5、Q 型因子分析研究样品之间的相关关系,R 型因子分析研究变量之间的相关关系。 6、Fisher 判别法的基本思想是投影,并利用方差分析的思想来导出判别函数。 二、判断题(每题2分,共10分) 1、( √ )随机向量12(,,,)p X X X 'L 的协方差阵()D X =∑是对称非负定阵。 2、( × )因子载荷矩阵A 是对称阵。 3、( × )聚类分析中快速聚类法指的就是模糊聚类法。 4、( √ )设(,)p N :X μ∑,(,)p W n :W ∑,且X 与W 相互独立,则 12()()(,)n T p n -':X μW X μ--。 5、( × )主成分分析中,从相关矩阵出发求解的主成分一定会比从协方差矩阵出发求解的主成分更可信。 装 订 线装 订 线 内 不 要 答 题 学 号 姓 名 班 级

多元统计分析试题及答案.doc

xxx 大学期末试卷(A 卷) 考试科目:多元统计分析 考试类型:(闭卷) 考试时间:120 分钟 一、填空题(5×6=30) 22121212121~(,),(,),(,),,1X N X x x x x x x ρμμμμσρ ?? ∑==∑= ??? +-1、设其中则Cov(,)=____. 10 31 2~(,),1,,10,()()_________i i i i X N i W X X μμμ=' ∑=--∑L 、设则=服从。 ()1 2 34 433,4 92,32 16___________________ X x x x R -?? ?'==-- ? ?-? ? =∑、设随机向量且协方差矩阵则它的相关矩阵 4、 __________, __________, ________________。 (), 123设X=x x x 的相关系数矩阵通过因子分析分解为 211X h = 的共性方差111 X σ = 的方差21X g =1公因子f 对的贡献121330.93400.1280.9340.4170.83511 00.4170.8940.02700.8940.44730.8350.4470.1032013 R ? ? - ????? ? -?? ? ? ?=-=-+ ? ? ? ??? ? ? ????? ? ???

215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--L 、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。 二、计算题(5×11=50) 12332313116421(,,)~(,),(1,0,2),441, 2142X x x x N x x x x x μμ-?? ?'=∑=-∑=-- ? ?-?? -?? + ??? 、设其中试判断与是否独立?

相关文档
相关文档 最新文档