文档库 最新最全的文档下载
当前位置:文档库 › 多元统计期末复习题

多元统计期末复习题

多元统计期末复习题
多元统计期末复习题

多元数据分析练习题

第二章多元正态的参数估计

一. 判断题

(1)若∑∑=),,(~)

,,,(21μp T

p N X X X X 是对角矩阵,则p X X X ,,,21 相互独立。

( )

(2)多元正态分布的任何边缘分布为正态分布,反之也成立。( )

(3)对任意的随机向量T

p X X X X ),,,(21 =来说,其协方差矩阵∑是对称矩阵,并且总是半正定的。( )

(4)对标准化的随机向量来说,它的协方差矩阵与原来变量的相关系数阵相同。( ) (5)若),,(~)

,,,(21∑=μp T

p N X X X X S X ,分别为样本均值和样本协差阵,则

S n

X 1,

分别为∑,μ的无偏估计。( )

二.计算题

1. 假设随机向量T

X X X X ),,(321=的协方差矩阵为???

?

?

?????---=∑92

3244

3416

,试求相关系数矩阵R 。????????

?

?????????

---

-=1314

131121

412

11R

2. 假设随机向量T

x x x )

,(21=的协方差矩阵为??

?

?

??=∑2011

9,令

212211,2x x y x x y -=+=,试求T

y y y ),(21=的协方差矩阵。

??

??

??--=∑27

3

360 3.假设??

?

?

??---=∑5.00

5

.05.015

.0),,(~3A N X μ,其中T

)

1,2,1(-=μ,

??

?

?

?

?????--=∑41

1121

112,试求Ax y =的分布。)2224,02(2???

? ??--???? ??-N 三.证明题

1.设)()2()1(,,,n X X X 是来自),(∑μp N 的随机样本,X 为样本均值。试证明:

μ=)(X E ,∑=

n X D 1)(。

2.设)()2()1(,,,n X X X 是来自),(∑μp N 的随机样本,

S n 1

1-为样本协差阵。

试证明: ∑=-)1

1(

S n E 。

3.证明:若p 维正态随机向量),,,(21'=p X X X X 的协差阵为对角矩阵,则X 的各分量是相互独立的随机变量。

第四章判别分析

一.判断题

1.从某种意义上讲,距离判别是Bayes 判别的一种特例。( )

2.距离判别的思想是分别计算样本到各个总体的欧几里得距离,根据距离的大小判别样本属于哪个总体。( )

3.量纲的变化对欧几里得距离的计算结果有影响,而马氏距离则克服了这种影响。欧氏距离是马氏距离的一种特例。( )

4.贝叶斯判别法是一种考虑了总体出现的先验概率和误判损失的判别方法。( )

5.在贝叶斯判别法中,),,,(21k R R R R =是一个划分,)(x h i 是将样品误判给总体i G 的加权平均损失,则k i x h x h x R j k

j i i ,,2,1)},(min )({1 ===≤≤。 ( )

6.费希尔判别法是借助方差分析的思想构造线性判别函数,使得总体之间区别最大,而使每个个体内部的离差最小。( ) 二.计算题

1.设有两个正态总体21,G G ,已知: ???

?

??--=∑???? ?

?=∑???

???=???

???=1114,42

23

,32)2(,52)1(21μμ (1)建立距离判别法的判别准则;

(2)判断:样品:??

?

???=31X ,应归属于哪一类?2G x ∈

(答案:

)

52281024(3

1),(),

51224434(81),(21212

22

1221212

22

11+--++=

+-+-+=

x x x x x x G x D x x x x x x G x D )

2.设G1,G2为两个二元总体,从中分别抽取容量为3的样本如下:

(1)求两样本的样本均值)2()1(,x x 及协方差矩阵21,S S ;

T

T x x )8,5(,)6,3()2()1(==???

?

?

?=???? ?

?=2112,63

3221S S (2)假定两总体协方差矩阵相等,记为∑,用21,S S 联合估计∑;

???

? ??--=∑???? ?

?=∑-111221,21

11

21 (3)建立距离判别法则;

2211212121,0),(;,0),(),253(2),(G x x x W G x x x W x x x x W ∈>∈<-+-=

(4)假设有一新样品T

T x x x )7,2()2,1(0==,进行距离判别。2G x ∈

3.已知两总体的概率密度分别为)(1x f 和)(2x f ,且总体的先验分布为8.0,2.021==p p ,误判损失为100)21(,50)12(==c c 。 (1)建立Bayes 判别准则;

(2)假设有一新样品0x 满足3.6)(01=x f 和5.0)(02=x f ,判定0x 的归属问题。 4. 假设两总体G1,G2的概率密度分别为1,1)(1≤-=x x x f 和 5.15.0,5.01)(2<≤---=x x x f 。

(1)做出)(1x f 和)(2x f 的图像。若假定先验概率21p p =,)21()12(c c =,求Bayes 判别区间的临界点;(0.25)

(2)若8.0,2.021==p p ,)21()12(c c =,求Bayes 判别区间的临界点;(-0.33) 5.假定有321,,G G G 三个组,已知30.0,65.0,05.0321===p p p ,10.0)(01=x f 和

63.0)(02=x f ,4.2)(03=x f 。

(1)若不计误判损失,判定0x 属于哪个组;(3G )(后验概率分别为0.004,0.361,0.635)

判定0x 属于哪个组。(误判的平均损失为51.39,36.05,41.95 2G )

6. 已知两总体的概率密度分别为)(1x f 和)(2x f ,且总体的先验分布为4.0,6.021==p p ,误判损失为12)21(,4)12(==c c 。 (1)建立Bayes 判别准则;

(2)假设有一新样品0x 满足36.0)(01=x f 和24.0)(02=x f ,判定0x 的归属问题。(2G ) 7.假设先验概率,误判代价及概率密度值已列于下表。试用贝叶斯判别法将样品分到组

321,,G G G 中的一个。若不考虑误判代价,则判别结果又将如何?

8. 金融分析员需要有两项重要指标来衡量,设总体G1为“金融分析员满足要求”;总体G2为“金融分析员不满足要求”(两个总体均服从正态分布,协差阵相等),今测得两个总体的若干数据,并由这些数据得到

??

?

?

??=∑??

????=??

????=41

11

?,24

?,62

?21μμ (1)假设对某一金融分析员进行测量得到两个指标为T

x )4,5(=,判别这一分析员是否能满足这项工作。(满足)

(2)当两组先验概率分别为731.0,269.021==q q ,损失相同。问该金融分析员满足要求吗?为什么?(不满足)

第五章聚类分析

一.判断题

1.快速(动态)聚类分析中,分类的个数是确定的,不可改变。( )

2.K 均值聚类分析中,样品一旦划入某一类就不可改变。( )

3.判别分析,聚类分析和主成分分析都不要求数据来自正态总体。( )

4.系统聚类可以对不同的类数产生一系列的聚类结果。( )

5. K 均值聚类和系统聚类一样,可以用不同的方法定义点点间的距离。( )

6. K 均值聚类和系统聚类一样,都是以距离的远近亲疏为标准进行聚类的。( ) 二. 计算题

1. 下面是5个样品两两间的距离矩阵

???????

????

??

?

?

?=08

53601071096040

)

0(D

试用最长距离法作系统聚类,并画出谱系聚类图。

2. 假设有6个样本,每个样本只测量一个指标,数据如表。样本点间使用绝对值距离,类

间使用最长距离,利用系统聚类法对这6个样本进行分类。 要求:(1)写出距离矩阵及类的合并过程;

(2)画出聚类的谱系图;

(3)写出样本分成两类时的结果。

3. 假定我们对C B A ,,三个样品分别测量两个变量1X 和2X 得到结果如表:

用快速聚类法将以上样品聚成两类。

4. 检验某产品的重量,抽了6个样品,每个样品只测了一个指标,分别为1,2,3,6,9,11,试用最短距离法,重心法进行聚类分析。

5. 考虑下列4个样品的距离矩阵:????

?

??

??

?

??04

3

502110

10,用最短距离,最长距离法和类平均法对这4个样品进行聚类,并画出谱系图。

6. 有8个样本,每个样本两个指标,数据如表。样本点间使用欧氏距离,类间使用最短距

7.检验某产品的重量,抽了5个样品,每个样品只测了一个指标,分别为1,2,6,11,试用快速聚类法将样品分为两类。

三.简答题

1.判别分析与聚类分析有何区别?

判别分析是对于n 个给定的样本,已知每个样本属于k 个类别中的某一类,利用这些数据,找到一种判别方法,使得这种判别方法具有某种最优性质,能把属于不同种类的样本点尽可能的区别开来,并对测得同样指标数据的新样本,能够判别这个样本归属于哪一类。 聚类分析是在样品和类之间定义一种距离,按照距离的大小对样品进行聚类,距离相近的样品先聚成类,距离相远的后聚成类,过程一直进行下去,每个样品总能聚到合适的类中。

聚类分析没有判别函数,对新的样品无法判别它应该归属哪一类,必须重新进行聚类过程,才能判别它属于哪类。系统聚类分析能够得到样品从最小的分类(每个样品自成一类)到最大的分类的情况,而判别分析没有这种功能,但判别分析的距离判别法与聚类分析非常相似,也是根据距离的远近判别样本的归属问题。 2.K 均值法与系统聚类法的异同

(1) K 均值法事先必须确定分类的个数,分类的个数确定,而系统聚类分析系统聚类分

析能够得到样品从最小的分类(每个样品自成一类)到最大的分类的情况,可以根据需要将样品分为几类。 (2) K 均值法可以随意将样品分为K 类,根据样品到类中心的距离远近重新进行分类,

而系统聚类中样品一旦划入某一类就不能更改。 (3) K 均值法样品与不同类间的距离采用点到类中心的平方欧氏距离,而系统聚类中点

间距离有很多种定义方法。 3. 简述系统聚类法的思想。 4. 简述快速聚类法的思想。

第六章主成分分析

一.判断题

1.主成分分析数学模型中的正交变换,在几何上就是做一个坐标旋转。( )

2.假设p X X X ,...,,21为某实际问题所涉及的p 个变量,p Y Y Y ,...,,21是其p 个主成分,

判断下列说法是否正确:

(1)由原始变量p X X X ,...,,21的协方差矩阵和相关矩阵出发,求得的主成分是一致的。 ( )

(2)对变量做主成分分析之前,必须对原始数据进行标准化。( )

(3)由标准化数据的协方差矩阵出发求得的主成分与由原始数据的相关系数矩阵出发求得的主成分一致。( ) (4)j i Y Y Cov j i ≠=,0),(。( )

(5)由于p Y Y Y ,...,,21包含原始变量的信息量递减,因而实际应用中选取前几个主成分代替原来的原始变量。( )

(6)当各个变量取值范围相差不大或者是度量单位相同的指标时,一般选择直接从协方差矩阵求解。( )

(7)∑∑===

p

i i

p i i X

Var Y Var 1

1

)()(。 ( )

(8)假设p

X X X ,...,,21的协方差矩阵为∑,m λλλ,...,,21为∑的非零特征根,

m i i ,...,2,1,=γ 为对应的单位化的特征向量,则第i 个主成分为m i X Y T

i i ,...,2,1,==γ。( )

(9)i Y 是p X X X ,...,,21的线性组合。 ( ) (10)p i Y D i i ,...,2,1,)(==λ。( )

(11)主成分的协方差矩阵是对角阵。( )

(12)方差贡献率表明了主成分综合原始变量的能力。( ) 3.主成分分析中的信息,是用变量期望的大小来表示的。( ) 二. 计算题

1.假设总体T X X X ),(21=的协方差矩阵为??

?

???=∑22

25,求X 的主成分,,21Y Y 并计算第一主成分1Y 的累计贡献率。

2.假设总体T

X X X X ),,(321=的相关矩阵为????

?

?????=111ρρρρρρR ,)11(<<-ρ求X 的标准

化变量的主成分,,,321Y Y Y 并计算各主成分的贡献率和累计贡献率。 (

ρ

λλρλ-==-+=1,)1(1321p ,

)6

2,61,61(

),0,2

1,21(

),1,1,1(

321-=-==t t p p p t )

3.假设总体T

X X X X ),,(321=的协方差矩阵为????

?

?????--=∑50

2

040

202

,求X 的主成分,,,321Y Y Y 并计算各主成分的贡献率和累计贡献率,确定应取几个主成分。

4.设T

p X X X X ),,,(21 =的协方差矩阵为

?????

?

?

?????

??=∑pp

σ

σσ0

022

11

,其中pp

σ

σσ≥≥≥ (22)

11,试求X 的主成分及主成分具有

的特征值。

(i i x y =,方差为ii σ)

三.简答题

1.试述主成分分析的基本思想及求解步骤。

2.简述主成分分析中累积贡献率的具体意义。

第七章因子分析

一.判断题

1.因子载荷矩阵经过旋转后,每个公因子对原始变量的贡献度2i g 不变。( )

2.因子分析模型中公共因子i F 是互不相关、不可测的变量,并且()1i Var F =。( )

3.因子分析一般从变量的相关系数阵出发求因子模型。( )

4.因子载荷矩阵经过旋转后,变量i X 的共同度2i h 不变。( )

5.因子分析模型中特殊因子与公共因子是不相关的。( )

6.因子分析与主成分分析都是一种降维,简化数据的方法,都是通过把原变量转化为新变量的线性组合达到降维的目的。( )

7.主成分分析中,主成分是不唯一的,但在因子分析中,因子模型是唯一的。( ) 二. 计算题

1.设标准化变量321,,X X X 的协差阵(即相关阵)为 ????

?

?

?=135

.045.035.0163

.045.063.01

R R 的特征值和相应的单位正交化的特征向量分别为:

36

.0,68.0,96.1321===λλλ),18.0,64.0,75.0(),84.0,49.0,22.0(),51.0,59.0,63.0(321--=-==l l l

要求:

1) 计算因子载荷矩阵A ,并建立因子模型;

2)计算变量3X 的共同度2

3h 和公因子2F 的方差贡献2

2g ,并说明其各自的统计意义。

2. 为研究某一片树叶的叶片形态,选取50片叶测量其长度x1(mm)和宽度x2(mm),按样本数据求得其平均值和协差阵为??

?

?

??===4548

4890,92,13421S x x ,求相关系数矩阵R ,并由R 出发进行因子分析。 三.简答题

1.简述因子模型ε+=AY X 中载荷矩阵A 的统计意义。

2.因子分析与主成分分析的区别与联系 (1) 因子分析从变量的相关性出发,根据相关性的大小将变量进行分组,同组变量的相

关性较强,不同组变量的相关性较弱,每组代表一个结构,这个结构用一个公因子表示,将变量表示成公因子的线性组合和特殊因子的和。

主成分分析是从空间生成的角度寻找能解释诸多变量变异绝大部分的几组彼此不相关的新变量。

(2) 因子分析是把变量表示成公因子的线性组合和特殊因子的和,主成分分析是把主成分表示成各变量的线性组合。

(3) 抽取因子的方法不仅有主成分法,还有主轴因子法,极大似然估计法等,主成分分

析只有主成分法抽取主成分。 (4) 主成分分析中当给定的协差阵或相关系数阵的特征值唯一时,主成分一般是固定

的,而因子分析中的因子不是固定的,可以旋转得到不同的因子。

四.下表是以学生六门考试成绩为变量,从相关系数阵出发,以主成分法抽取因子,进行因子分析的部分结果,根据表格回答下列问题:

表1 Total Variance Explained

表2 Component Matrix(a) 表3 Rotated Component Matrix(a)

5.

(1) 写出变量21,X X 的相关系数阵R 的特征根 及 621,,,X X X 的方差和; (2) 假设用i Y 表示主成分,写出前二个主成分的表达式及1Y 的贡献率和前两个主成分的

累计贡献率并说明累计贡献率的统计意义;

(3) 写出旋转后的因子载荷矩阵A 及因子模型;

(4) 求变量math 的共同度2

1h 及因子2F 的方差贡献2

2g ,并解释2

1h ,2

2g 的统计意义; (5) 对因子1F ,2F 进行合理的命名和解释。

第八章相应分析

一.判断题

1.相应分析中,行惯量与列惯量相同。( )

2.对变量进行相应分析时,应首先检验变量之间的独立性,只有当变量不独立时,进行相应分析才有意义。( )

3.相应分析实际是对两组高维空间的点的二维投影进行分析,并且相应分析主要是建立在图形分析的基础上,因此,相应分析的结果带有一定的主观性。( )

二.计算题

1.假定有两个因素B A ,,每个因素各有两个水平,随机考察100个样品,得到一个二维的列

联表如下,求:

(1)频率矩阵F ;

(2)因素A 的第一个水平的分布轮廓; (3)因素A 两个水平之间的2χ距离;

(4)检验因素B A ,是否独立。(05.0=α,841.3)1(2

05.0=χ)

第九章典型相关分

一.判断题

1.典型相关分析是研究多组变量之间相关关系的一种

多元统计方法。( )

2.典型相关分析是识别并量化两组变量之间的关系,将两组变量的相关关系的研究转化为一组变量的线性组合与另一组变量的线性组合之间的相关关系的研究。( )

3.若Y b V X a U '='=,是两组变量Y X ,的第一对典型相关变量,则V U ,是Y X ,的所有线性组合对中相关系数最大的一对。( )

4.进行典型相关分析时,若变量的量纲不同时,需要对变量进行标准化或从相关阵出发求典型相关变量;而若变量的单位相同时,则不需要对数据进行标准化,直接分析即可。( )

5.若r k V U k k ,,2,1,, =是变量Y X ,的典型相关变量,则

r k V D U D k k ,,2,1,1)(,1)( ===,并且j i V V Cov U U Cov j i j i ≠==,0),(),(( )

6. 若r k V U k k ,,2,1,, =是变量Y X ,的典型相关变量,2211,∑∑分别是变量Y X ,的方差阵,12∑是变量Y X ,的协方差阵,r i i ,,2,1,2 =λ是矩阵211

2212111∑∑∑∑--的特征根,则(1)r j j i V U Cov r i j i V U Cov j i i j i >≠===≠=或,0),(.,,2,1,,0),( λ。其中r 为矩阵211

22121

11∑∑∑∑--的秩。( )

(2)若2

2

22

1r λλλ≥≥≥ ,则第一典型相关系数为2

1λ。( ) (3)若2

2

22

1r λλλ≥≥≥ ,)

1()

1(,b

a 分别为矩阵2112212111∑∑∑∑--,121

1121122∑∑∑∑--相

应于2

1λ的特征向量,则)

2()

1()

1()

1(,X b

X

a

'

'

即为第一对典型相关变量。( )

7. 典型相关分析中,分别求出两组变量的第一主成分,两个第一主成分即构成第一对典型相关变量。( )

8.利用样本对两组变量)

2()

1(,X

X

进行典型相关分析时,即使)

2()

1(,X

X

互不相关,也有可

能得到的典型相关变量的协差阵不为零,因而利用样本数据进行典型相关分析时要对原始变量的协差阵是否为零进行检验。( )

9.典型载荷分析是了解每组变量提取的典型变量解释的该组样本总方差的比例,从而定量的测度典型变量所包含的原始信息量的大小;典型冗余分析是指原始变量与典型变量之间的相关性分析。( ) 10.对变量进行相应分析时,应首先检验变量之间的独立性,只有当变量不独立时,进行相应分析才有意义。( )

二.以下是对一对二维变量的典型相关分析的结果,请根据结果回答下列问题。

表1 Canonical Correlations 1 .788 2

.054

表2 Test that remaining correlations are zero

Wilk's Chi-SQ DF Sig. 1 .378 20.930 4.000 .000 2 .997 .062 1.000 .803

表3 Raw Canonical Coefficients for Set-1 表4 Raw Canonical Coefficients for Set-2

1 2 x1 -.057 -.140 x2 -.071 .187

表5 Canonical Loadings for Set-1 表6 Proportion of Variance of Set-1

Explained by Its Own Can. Var.

1 2 x1 -.935 -.354 x2 -.927

.375

(1)写出两对典型相关变量的相关系数;

(2)应该选几对典型相关变量,为什么?并写出典型相关变量; (3)1x 与其典型相关变量的相关系数是多少?

(4)第一组变量被自身的典型变量解释的方差比例是多少? 三.简答题

1.针对典型相关分析而言,简述典型变量与典型相关系数的概念。

2.简述典型相关分析中典型载荷分析及典型冗余分析的内容与作用。

第十章多维标度法

一.判断题

1 2 y1 -.051 -.174 y2

-.080

.262

Prop Var CV1-1 .867 CV1-2

.133

1.古典多维标度法中,若距离矩阵D 为欧几里得矩阵,则D 的构图唯一。 ( )

2.所有的距离矩阵都是欧几里得矩阵。( )

3.多维标度分析中,若内积距离阵B 的特征根全部大于零,则距离阵D 为欧几里得矩阵。( ) 二.计算题

1.假设距离矩阵?????

???

?????

?

???

?=010310

23

10

3

2310D ,求D 的拟合构图。 2.给定距离阵?????

??

?????

?

??

?=0

10

210

2210

12210D ,求它的拟合构造点,并说明它是否是欧式型的。 三.简答题

1.简述古典多维标度分析的思想。

2.论述古典多维标度法的求解步骤。

统计学期末综合测试 一、单项选择题(每小题1分,共20分) 1、社会经济统计的数量特点表现在它是( )。 A 一种纯数量的研究 B 从事物量的研究开始来认识事物的质 C 从定性认识开始以定量认识为最终目的 D 在质与量的联系中,观察并研究社会经济现象的数量方面 2、欲使数量指标算术平均法指数的计算结果、经济内容与数量指标综合法指数相同,权数应是( )。 A 00p q B 11p q C 01p q D 10p q 3、如果你的业务是销售运动衫,哪一种运动衫号码的度量对你更为有用( )。 A 均值 B 中位数 C 众数 D 四分位数 4、某年末某地区城市人均居住面积为20平方米,标准差为8.4平方米,乡村人均居住面积为30平方米,标准差为11.6平方米,则该地区城市和乡村居民居住面积的离散程度( )。 A 乡村较大 B 城市较大 C 城市和乡村一样 D 不能比较 5、某厂某种产品生产有很强的季节性,各月计划任务有很大差异,今年1月超额完成计划3%,2月刚好完成计划,3月超额完成12%,则该厂该年一季度超额完成计划( )。 A 3% B 4% C 5% D 无法计算 6、基期甲、乙两组工人的平均日产量分别为70件和50件,若报告期两组工人的平均日产量不变,乙组工人数占两组工人总数的比重上升,则报告期两组工人总平均日产量( )。 A 上升 B 下降 C 不变 D 可能上升也可能下降

7、同一数量货币,报告期只能购买基期商品量的90%,是因为物价( )。 A 上涨10.0% B 上涨11.1% C 下跌11.1% D 下跌10.0% 8、为消除季节变动的影响而计算的发展速度指标为( )。 A 环比发展速度 B 年距发展速度 C 定基发展速度 D 平均发展速度 9、计算无关标志排队等距抽样的抽样误差,一般采用( )。 A 简单随机抽样的误差公式 B 分层抽样的误差公式 C 等距抽样的误差公式 D 整群抽样的误差公式 10、我国统计调查方法体系改革的目标模式是以( )为主体。 A 抽样调查 B 普查 C 统计报表 D 重点调查 11、设总体分布形式和总体方差都未知,对总体均值进行假设检验时,若抽取一个容量为100 的样本,则可采用( )。 A Z 检验法 B t 检验法 C 2χ检验法 D F 检验法 12、要通过移动平均法消除季节变动得到趋势值,则移动平均项数( )。 A 应选择奇数 B 应和季节周期长度一致 C 应选择偶数 D 可取4或12 13、回归估计标准差的值越小,说明( )。 A 平均数的代表性越好 B 平均数的代表性越差 C 回归方程的代表性越好 D 回归方程的代表性越差 14、某企业最近几批同种产品的合格率分别为90%、95.5%、96%,为了对下一批产品的合格率 进行抽样检验,确定抽样数目时P 应选( )。 A 90% B 95.5% C 96% D 3 % 96%5.95%90++ 15、假设检验中,第二类错误的概率β表示( )。 A 0H 为真时拒绝0H 的概率 B 0H 为真时接受0H 的概率

计算题 1.甲、乙两种不同水稻品种,分别在5个田块上试种,其中乙品种平均亩产量是1098公斤,标准差是182公斤。甲品种产量情况如下: 甲品种 要求:(1)以亩产量1000斤及以上为一等,计算甲品种一等品率分布的标准差。(2)以亩产量的稳定性确定哪一品种更有推广价值? 答案:p=3.9/5=0.78 % 58.16%58.1290.14411524142 .0)1(=====-=乙甲甲甲,,,v v x p p σσ 1、已知甲、乙两个班级,乙班学生《统计学》考试平均成绩为76.50分,标准差为10.30分,而甲的成绩如下所示: 甲班 ━━━━━┯━━━━━ 分 数 │ 人 数 ─────┼───── 50以下 │ 5 50─60 │ 7 60─70 │ 8 70─80 │ 20 80─90 │ 14 90以上 │ 6 ━━━━━┷━━━━━ 要求:计算有关指标比较两个班级学生平均成绩的代表性。(计算结果保留2位小

数) 1、已知甲厂职工工资资料如下: 又已知乙厂职工的月平均工资为600元,标准差为120元,试比较甲乙两厂职工 月平均工资的代表性大小。 1.现已知甲企业在2007年前10个月的月平均产值为400万元,标准差为16 请计算乙企业的月平均产值及标准差,并根据产值比较2007年前10个月甲乙 两企业的生产稳定性。 1.某企业三个车间生产同种产品,1995年上半年有关生产资料如下: 要求:(1)计算该企业产品计划完成率; (2)计算该企业产品的实际优质品率。 1.若已知甲、乙两企业1980年的产值分别为300万元和500万元,1994年的产 值分别为800万元和1500万元。要求: (1)分别计算甲、乙两个企业的平均发展速度; (2)若按各自的发展速度,甲企业从1994年起还需几年才能达到乙企业1994 年的产值水平;

一、判断题 ( 对 ) 1 X ( X 1 , X 2 ,L , X p ) 的协差阵一定是对称的半正定阵 ( 对 ( ) 2 标准化随机向量的协差阵与原变量的相关系数阵相同。 对) 3 典型相关分析是识别并量化两组变量间的关系,将两组变量的相关关系 的研究转化为一组变量的线性组合与另一组变量的线性组合间的相关关系的研究。 ( 对 )4 多维标度法是以空间分布的形式在低维空间中再现研究对象间关系的数据 分析方法。 ( 错)5 X (X 1 , X 2 , , X p ) ~ N p ( , ) , X , S 分别是样本均值和样本离 差阵,则 X , S 分别是 , 的无偏估计。 n ( 对) 6 X ( X 1 , X 2 , , X p ) ~ N p ( , ) , X 作为样本均值 的估计,是 无偏的、有效的、一致的。 ( 错) 7 因子载荷经正交旋转后,各变量的共性方差和各因子的贡献都发生了变化 ( 对) 8 因子载荷阵 A ( ij ) ij 表示第 i 个变量在第 j 个公因子上 a 中的 a 的相对重要性。 ( 对 )9 判别分析中, 若两个总体的协差阵相等, 则 Fisher 判别与距离判别等价。 (对) 10 距离判别法要求两总体分布的协差阵相等, Fisher 判别法对总体的分布无特 定的要求。 二、填空题 1、多元统计中常用的统计量有:样本均值向量、样本协差阵、样本离差阵、 样本相关系数矩阵. 2、 设 是总体 的协方差阵, 的特征根 ( 1, , ) 与相应的单 X ( X 1,L , X m ) i i L m 位 正 交 化 特 征 向 量 i ( a i1, a i 2 ,L ,a im ) , 则 第 一 主 成 分 的 表 达 式 是 y 1 a 11 X 1 a 12 X 2 L a 1m X m ,方差为 1 。 3 设 是总体 X ( X 1, X 2 , X 3, X 4 ) 的协方差阵, 的特征根和标准正交特征向量分别 为: 1 2.920 U 1' (0.1485, 0.5735, 0.5577, 0.5814) 2 1.024 U 2' (0.9544, 0.0984,0.2695,0.0824) 3 0.049 U 3' (0.2516,0.7733, 0.5589, 0.1624) 4 0.007 U 4' ( 0.0612,0.2519,0.5513, 0.7930) ,则其第二个主成分的表达式是

一、填空题(20分) 1、若),2,1(),,(~)(n N X p 且相互独立,则样本均值向量X 服从的分布 为 2、变量的类型按尺度划分有_间隔尺度_、_有序尺度_、名义尺度_。 3、判别分析是判别样品 所属类型 的一种统计方法,常用的判别方法有__距离判别法_、Fisher 判别法、Bayes 判别法、逐步判别法。 4、Q 型聚类是指对_样品_进行聚类,R 型聚类是指对_指标(变量)_进行聚类。 5、设样品),2,1(,),,(' 21n i X X X X ip i i i ,总体),(~ p N X ,对样品进行分类常用的距离 2 ()ij d M )()(1j i j i x x x x ,兰氏距离()ij d L 6、因子分析中因子载荷系数ij a 的统计意义是_第i 个变量与第j 个公因子的相关系数。 7、一元回归的数学模型是: x y 10,多元回归的数学模型是: p p x x x y 22110。 8、对应分析是将 R 型因子分析和Q 型因子分析结合起来进行的统计分析方法。 9、典型相关分析是研究两组变量之间相关关系的一种多元统计方法。 二、计算题(60分) 1、设三维随机向量),(~3 N X ,其中 200031014,问1X 与2X 是否独立?),(21 X X 和3X 是否独立?为什么? 解: 因为1),cov(21 X X ,所以1X 与2X 不独立。 把协差矩阵写成分块矩阵 22211211,),(21 X X 的协差矩阵为11 因为12321),),cov(( X X X ,而012 ,所以),(21 X X 和3X 是不相关的,而正态分布不相关与相互

2009---2010学年第2学期统计学原理课程考核试卷(B)考核方式: (闭卷)考试时量:120 分钟 一、填空题(每空1分,共15分) 1、按照统计数据的收集方法,可以将其分为和。 2、收集数据的基本方法是、和。 3、在某城市中随机抽取9个家庭,调查得到每个家庭的人均月收入数据:1080,750,780,1080,850,960,2000,1250,1630(单位:元),则人均月收入的平均数是,中位数是。 4、设连续型随机变量X在有限区间(a,b)内取值,且X服从均匀分布,其概率密 度函数为 0 ()1 f x b a ? ? =? ?- ? 则X的期望值为,方差为。 5、设随机变量X、Y的数学期望分别为E(X)=2,E(Y)=3,求E(2X-3Y)= 。 6、概率是___ 到_____ 之间的一个数,用来描述一个事件发生的经常性。 7、对回归方程线性关系的检验,通常采用的是检验。 8、在参数估计时,评价估计量的主要有三个指标是无偏性、和 。 二、判断题,正确打“√”;错误打“×”。(每题1分,共10 分) 1、理论统计学与应用统计学是两类性质不同的统计学() 2、箱线图主要展示分组的数值型数据的分布。() 3、抽样极限误差可以大于、小于或等于抽样平均误差。() 4、在全国人口普查中,全国人口数是总体,每个人是总体单位。() 5、直接对总体的未知分布进行估计的问题称为非参数估计;当总体分布类型已知, 仅需对分布的未知参数进行估计的问题称为参数估计。() 6.当置信水平一定时,置信区间的宽度随着样本量的增大而减少() 7、在单因素方差分析中,SST =SSE+SSA() 8、右侧检验中,如果P值<α,则拒绝H 。() 9、抽样调查中,样本容量的大小取决于很多因素,在其他条件不变时,样本容量 与边际误差成正比。() 10、当原假设为假时接受原假设,称为假设检验的第一类错误。() 三、单项选择题(每小题1分,共 15分) 1、某研究部门准备在全市200万个家庭中抽取2000个家庭,推断该城市所有职 工家庭的年人均收入。这项研究的样本()。 A、2000个家庭 B、200万个家庭 C、2000个家庭的人均收入 D、200个万个家庭的总收入 2、当变量数列中各变量值的频数相等时()。 A、该数列众数等于中位数 B、该数列众数等于均值 C、该数列无众数 D、该众数等于最大的数值 其他 (a

统计期末练习题 单选题 1.如果要研究某市30万在校高等学校大学生的月消费支 出情况,总体单位是(B ) A.30万个大学生 B.每一位在校大学生 C.每一所大学 2.如果要研究某市3000家外资企业的基本情况,其中甲 企业职工人数800人,这是一个什么指标 (A ) A.数量指标B.质量指标 C.数量标志值 3.如果要研究某市2万户贫困家庭的生活状况,总体是 (B ) A.每一户贫困家庭 B.2万户贫困家庭 C.所有贫困人口 4.现一组数:25,27,29,30,32,34。其中位数的值 是( B ) A.29 B.29.5 C.30 5. 某企业月初1000人,月内职工变动情况为:10日增加 5人,16日增加5人,20日减少10人,则该月的平均职工 人数为( B ) A.1000人B.1002人 C. 1005人 6.在对工业企业的生产设备进行普查时,调查对象是 ( C)

A 所有工业企业 B 每一个工业 企业 C 工业企业的所有生产设备 D 工业企业的 每台生产设备 7.一组数据的均值为20, 离散系数为0.4, 则该组数据 的标准差为 B 离散系数=(标准差/平均值)*100% A 50 B 8 C 0.02 D 4 8.某连续变量数列,其末组为“500以上”。又知其邻 组的组中值为480,则末组的组中值为 A A 520 B 510 C 530 D 540 9.已知一个数列的各环比增长速度依次为5%、7%、9%, 则最后一期的定基增长速度为 C A.5%×7%×9% B. 105% ×107%×109% C.(105%×107%×109%)-1 D. 10.某地区今年同去年相比,用同样多的人民币可多购买 5%的商品,则物价增(减)变化的百分比为 B A. –5% B. –4.76% C. –33.3% D. 3.85% 11. 已知甲、乙两班学生统计学考试成绩:甲班平均分 为70分,标准差为7.5分;乙班平均分为75分,标准差为 7.5分。由此可知两个班考试成绩的离散程度(A ) A. 甲班较大 B.乙班较大 C.两班相同 D.无法作比较 12. 对在全国茶叶产量中占较大比重的几个大茶场进行 茶叶生产调查,这种调查方式属于( B ) A.普查 B. 重点调查 C. 抽样调查 D.

一、填空题: 1、多元统计分析是运用数理统计方法来研究解决多指标问题的理论和方法. 2、回归参数显著性检验是检验解释变量对被解释变量的影响是否著. 3、聚类分析就是分析如何对样品(或变量)进行量化分类的问题。通常聚类分析分为 Q型聚类和 R型聚类。 4、相应分析的主要目的是寻求列联表行因素A 和列因素B 的基本分析特征和它们的最优联立表示。 5、因子分析把每个原始变量分解为两部分因素:一部分为公共因子,另一部分为特殊因子。 6、若 () (,), P x N αμα ∑=1,2,3….n且相互独立,则样本均值向量x服从的分布 为_x~N(μ,Σ/n)_。 二、简答 1、简述典型变量与典型相关系数的概念,并说明典型相关分析的基本思想。 在每组变量中找出变量的线性组合,使得两组的线性组合之间具有最大的相关系数。选取和最初挑选的这对线性组合不相关的线性组合,使其配对,并选取相关系数最大的一对,如此下去直到两组之间的相关性被提取完毕为止。被选出的线性组合配对称为典型变量,它们的相关系数称为典型相关系数。 2、简述相应分析的基本思想。 相应分析,是指对两个定性变量的多种水平进行分析。设有两组因素A和B,其中因素A包含r个水平,因素B包含c个水平。对这两组因素作随机抽样调查,得到一个rc的二维列联表,记为。要寻求列联表列因素A和行因素B的基本分析特征和最优列联表示。相应分析即是通过列联表的转换,使得因素A

和因素B 具有对等性,从而用相同的因子轴同时描述两个因素各个水平的情况。把两个因素的各个水平的状况同时反映到具有相同坐标轴的因子平面上,从而得到因素A 、B 的联系。 3、简述费希尔判别法的基本思想。 从k 个总体中抽取具有p 个指标的样品观测数据,借助方差分析的思想构造一个线性判别函数 系数: 确定的原则是使得总体之间区别最大,而使每个总体内部的离差最小。将新样品的p 个指标值代入线性判别函数式中求出 值,然后根据判别一定的规则,就可以判别新的样品属于哪个总体。 5、简述多元统计分析中协差阵检验的步骤 第一,提出待检验的假设 和H1; 第二,给出检验的统计量及其服从的分布; 第三,给定检验水平,查统计量的分布表,确定相应的临界值,从而得到否定域; 第四,根据样本观测值计算出统计量的值,看是否落入否定域中,以便对待判假设做出决策(拒绝或接受)。 协差阵的检验 检验0=ΣΣ 0p H =ΣI : /2 /21exp 2np n e tr n λ???? =-?? ? ???? S S 00p H =≠ΣΣI : /2 /2**1exp 2np n e tr n λ???? =-?? ? ???? S S

多元统计分析模拟试 题

多元统计分析模拟试题(两套:每套含填空、判断各二十道) A卷 1)判别分析常用的判别方法有距离判别法、贝叶斯判别法、费歇判别法、逐 步判别法。 2)Q型聚类分析是对样品的分类,R型聚类分析是对变量_的分类。 3)主成分分析中可以利用协方差矩阵和相关矩阵求解主成分。 4)因子分析中对于因子载荷的求解最常用的方法是主成分法、主轴因子法、 极大似然法 5)聚类分析包括系统聚类法、模糊聚类分析、K-均值聚类分析 6)分组数据的Logistic回归存在异方差性,需要采用加权最小二乘估计 7)误差项的路径系数可由多元回归的决定系数算出,他们之间的关系为 = 8)最短距离法适用于条形的类,最长距离法适用于椭圆形的类。 9)主成分分析是利用降维的思想,在损失很少的信息前提下,把多个指标转 化为几个综合指标的多元统计方法。 10)在进行主成分分析时,我们认为所取的m(m

1.统计总论练习 单项选择题 1.对某市工业生产设备情况进行统计研究,这时,总体单位是该市( 4 )①每一个工业企业②每一台设备③每一台生产设备④每一台工业生产设备 2.几位工人的工资分别是100元、120元、150元、200元这几个数字是(3 ) ①指标②变量③变量值④标志 3.标志是( 3 ) ①总体的特征②总体的数量特征③总体单位的属性或特征的名称④总体单位的数量特征 多项选择题 在全国人口普查中(235 ) ①全国所有人口数是总体②每一个人是总体单位③人的年龄是变量④某人的性别为“女性”是一个品质标志 ⑤全部男性人口的平均寿命是统计指标 2.统计调查练习 一、单项选择题 1、统计调查方案中调查期限是指_1____。 ①调查工作的起迄时间②搜集资料的时间③时期现象资料所属的时间④时点现象资料所属的时间 2、重点调查中的重点单位是指___4__。 ①这些单位是工作的重点②这些单位举足轻重 ③这些单位数量占总体全部单位的比重很大 ④这些单位的标志总量在总体标志总量中占较大比重 3、研究某型号炮弹的平均杀伤力,可以采用__4___。 ①重点调查②普查③典型调查④抽样调查 4、对某地食品物价进行一次全面调查,调查单位是__4__。 ①该地区所有经营食品的商店②每一个经营食品的商店③全部零售食品④每一种零售食品 二、多项选择题 1、抽样调查和重点调查的主要区别有_24____。 ①抽选调查单位的多少不同②抽选调查单位的方式方法不同③调查的组织形式不同 ④在对调查资料使用时,所发挥的作用不同⑤原始资料的来源不同 2、第四次全国人口普查的标准时点是1990年7月1日零点,下列人员不应计入人口总数之中_135____。 ①1990年7月1日23时出生的人口 ②1990年7月10日死亡的人口 ③1990年6月25日出生,30日23时死亡的人口④1990年6月29日出生,7月2日死亡的人口 ⑤1990年6月30日零点死亡的人口 3、以系统为单位调查某市全部商业状况,调查对象是__34___。 ①该市全部商品销售额②该市商业企业的总和③该市各商业系统商业状况总和④该市所有商业系统商业状况总和 3.统计整理练习单项选择题 1.一个分配数列的构成要素有_4___。 ①分组标志和指标②数量分组标志值和频数③品质分组标志和频数④分组标志及次数 2.某连续变量数列,其末组为开口组,下限为200,又知其邻组的组中值为170,则末组组中值为__1___。 ①230 ②560 ③185 ④515 3.有20名工人看管机器台数资料如下:3,5,4,6,5,2,3,4,4,3,4,2,3,5,4,4,5,3,3,4,按上述资料编制变量数列应采用___1___。 ①单项分组②组距分组③等距分组④异距分组 4.组距数列中影响各组次数分布的要素是_2_____。 ①组中值②组距和组数③全距④总体单位数 多项选择题 1.对离散型变量分组_12345____。 ①可按每个变量值分别列组②也可采用组距分组③相邻组的组限可以不重④各组组距可相等也可不等 ⑤要按“上组限不在本组内”的原则处理与上组限相同的变量值 2.统计分组的作用是_134____。 ①反映总体的内部结构②比较现象间的一般水平③区分事物的性质④研究现象之间的依存关系 ⑤分析现象的变化关系 判断:将某市500家工厂按产值多少分组而形 成的变量数列,其次数是各厂的产值数。 4.综合指标练习 一、单项选择题 1.平均指标将总体内各单位数量差异(a ) a.抽象化 b.具体化 c.一般化 d.形象化 2. 加权算术平均方法中的权数为( d ) a.标志值 b.标志总量 c.次数之和 d.单位数比重 3. 某公司有十个下属企业,现已知每个企业的产值计划完成百分比和实际产值资料,计算该公司平均产值计划完成程度时,所采用的权数应该是(c ) a.企业数 b.工人数 c.实际产值 d.计划产值 4. 计算平均比率最适宜的平均数是(c ) a.算术平均数 b.调和平均数 c.几何平均数 d.位置平均数 5. 受极端数值影响最小的平均数是( d ) a.算术平均数 b.调和平均数 c.几何平均数 d.位置平均数 6. 由组距数列确定众数时,如果众数组相邻两组的次数 相等,则 ( b ) a.众数为零 b.众数组的组中值就是众数 c.众数不能确定 d.众数组的组限就是众数 7.已知甲数列的平均数为100,标准差为;乙数列的平均数为,标准差为。由此可断言( a ) a.甲数列平均数的代表性好于乙数列 b.乙数列平均数的代表性好于甲数列 c.两数列平均数的代表性相同

一、判断题 ( 对 )112(,,,)p X X X X '=L 的协差阵一定是对称的半正定阵 ( 对 )2标准化随机向量的协差阵与原变量的相关系数阵相同。 ( 对)3典型相关分析是识别并量化两组变量间的关系,将两组变量的相关关系 的研究转化为一组变量的线性组合与另一组变量的线性组合间的相关关系的研究。 ( 对 )4多维标度法是以空间分布的形式在低维空间中再现研究对象间关系的数据分析方法。 ( 错)5),(~),,,(21∑'=μp p N X X X X Λ,,X S 分别是样本均值和样本离差阵,则, S X n 分别是,μ∑的无偏估计。 ( 对)6),(~),,,(21∑'=μp p N X X X X Λ,X 作为样本均值μ的估计,是 无偏的、有效的、一致的。 ( 错)7 因子载荷经正交旋转后,各变量的共性方差和各因子的贡献都发生了变化 ( 对)8因子载荷阵()ij A a =中的ij a 表示第i 个变量在第j 个公因子上的相对重要性。 ( 对 )9 判别分析中,若两个总体的协差阵相等,则Fisher 判别与距离判别等 价。 (对)10距离判别法要求两总体分布的协差阵相等,Fisher 判别法对总体的分布无特定的要求。 二、填空题 1、多元统计中常用的统计量有:样本均值向量、样本协差阵、样本离差阵、样本相关系数矩阵. 2、设∑是总体1(,,)m X X X =L 的协方差阵,∑的特征根(1,,)i i m λ=L 与相应的单 位正交化特征向量 12(,,,)i i i im a a a α=L ,则第一主成分的表达式是 11111221m m y a X a X a X =+++L ,方差为 1λ。 3设∑是总体1234(,,,)X X X X X =的协方差阵,∑的特征根和标准正交特征向量分别 为:' 112.920(0.1485,0.5735,0.5577,0.5814)U λ==--- ' 221.024(0.9544,0.0984,0.2695,0.0824)U λ==- '330.049(0.2516,0.7733,0.5589,0.1624)U λ==--

期末复习题(答案仅供参考) 一、判断题(把正确的符号“V”或错误的符号“X”填写在题后的括号中。) 1. 社会经济统计的研究对象是社会经济现象总体的各个方面。(X) 2. 在全国工业普查中,全国企业数是统计总体,每个工业企业是总体单位。(X) 3. 总体单位是标志的承担者,标志是依附于单位的。(V ) 4. 在全国工业普查中,全国工业企业数是统计总体,每个工业企业是总体单位。(X) 5. 全面调查和非全面调查是根据调查结果所得的资料是否全面来划分的(X)。 6. 调查单位和填报单位在任何情况下都不可能一致。(X) 7. 对全同各大型钢铁生产基地的生产情况进行调查,以掌握全国钢铁生产的基本情况。这种调查属于非全面调查。(V) 8. 统计分组的关键问题是确定组距和组数(V) 9. 总体单位总量和总体标志总量是固定不变的,不能互相变换。(X) 10. 相对指标都是用无名数形式表现出来的。() 11. 国民收入中积累额与消费额之比为1: 3,这是一个比较相对指标。(X) 12. 抽样推断是利用样本资料对总体的数量特征进行估计的一种统计分析方法,因此不可避免的 会产生误差,这种误差的大小是不能进行控制的。(X) 13. 从全部总体单位中按照随机原则抽取部分单位组成样本,只可能组成一个样本。(X) 14. 在抽样推断中,作为推断的总体和作为观察对象的样本都是确定的、唯一的。(X) 15. 抽样估计置信度就是表明抽样指标和总体指标的误差不超过一定范围的概率保证程度。(V) 16. 在其它条件不变的情况下,提高抽样估计的可靠程度,可以提高抽样估计的精确度。(X) 17. 施肥量与收获率是正相关关系。(X ) 18. 计算相关系数的两个变量都是随机变量(V) 19. 利用一个回归方程,两个变量可以互相推算(X) 20. 数量指标作为同度量因素,时期一般固定在基期(X)。 Z q1 p1 21. 在单位成本指数——中,'p1p1 —'弋1卩0表示单位成本增减的绝对额(V)。 瓦q1 P o

近几年,中国房地产业得到了长足的发展,但房地产价格的上涨一直饱受争议,甚至有逃离“北、上、广”的言论,这也从侧面反映了房地产价格的区域性特征,下表为2008年中国31个省、市、自治区房地产业的相关统计数据,试根据这些数据进行聚类分析。 表1中指标说明如下: X1:房屋平均销售价格; X2:住宅平均销售价格; X3:别墅、高档公寓平均销售价格; X4:经济适用房平均销售价格; X5:办公楼平均销售价格; X6:商业营业用房平均销售价格 X7:其他平均销售价格; X8:商品房销售面积; X9:住宅销售面积 表1

为研究某地区人口死亡状况,已按某种方法将15个已知样品分为3类,指标及原始数据见表2,试建立判别函数,并判定另外4个待判样品属于哪类? 表2 X1:0岁组死亡概率X4:55岁组死亡概率 X2:1岁组死亡概率X5:80岁组死亡概率 X3:10岁组死亡概率X6:平均预期寿命 题3 利用主成分分析综合评价全国重点水泥企业的经济效益。原始数据见表3。 表3

题4 反映城镇居民消费支出状况的指标主要有食品、衣着、居住、家庭设备用品及服务、医疗保健、交通和通信以及教育文化娱乐服务等八项消费支出指标,数据如下表4所示。以2008年为例进行说明。选取反映我国各省、市、自治区的城镇居民人均消费支出8个指标作为原始变量,运用SPSS软件,对全国31个中心城市的人均消费水平水平作因子分析。

题5、在研究国家财政收入时,我们把财政收入按收入形式分为:各项税收收入、企业收入、债务收入、国家能源交通重点建设基金收入、基本建设贷款归还收入、国家预算调节基金收入、其他收入等。为了建立国家财政收入回归模型,我们以财政收入y(亿元)为因变量。自变量如下:x 1 ——农业增 加值(亿元),x 2——工业增加值(亿元),x 3 ——建筑业增加值(亿元),x 4 ——人口数(万人),x 5 ——社会 消费总额(亿元),x 6 ——受灾面积(万公顷)。据《中国统计年鉴》获得1979—1998共20个年分的统计数据,见表5。由定性分析知,所选自变量都与变量y有较强的相关性,试做出一个较为理想的回归方程。 表5

西安交大统计学考试试卷 一、单项选择题(每小题2分,共20分) 1.在企业统计中,下列统计标志中属于数量标志的是(C) A、文化程度 B、职业 C、月工资 D、行业 2.下列属于相对数的综合指标有(B ) A、国民收入 B、人均国民收入 C、国内生产净值 D、设备台数 3.有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有(B)个变量? A、0个 B、两个 C、1个 D、3个 4.下列变量中属于连续型变量的是(A ) A、身高 B、产品件数 C、企业人数 D、产品品种 5.下列各项中,属于时点指标的有(A ) A、库存额 B、总收入 C、平均收入 D、人均收入 6.典型调查是(B )确定调查单位的 A、随机 B、主观 C、随意D盲目 7.总体标准差未知时总体均值的假设检验要用到(A ): A、Z统计量 B、t统计量 C、统计量 D、X统计量 8. 把样本总体中全部单位数的集合称为(A ) A、样本 B、小总体 C、样本容量 D、总体容量 9.概率的取值范围是p(D ) A、大于1 B、大于-1 C、小于1 D、在0与1之间 10. 算术平均数的离差之和等于(A ) A、零 B、1 C、-1 D、2 二、多项选择题(每小题2分,共10分。每题全部答对才给分,否则不计分) 1.数据的计量尺度包括(ABCD ): A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 E、测量尺度 2.下列属于连续型变量的有(BE ): A、工人人数 B、商品销售额 C、商品库存额 D、商品库存量 E、总产值 3.测量变量离中趋势的指标有(ABE ) A、极差 B、平均差 C、几何平均数 D、众数 E、标准差 4.在工业企业的设备调查中(BDE ) A、工业企业是调查对象 B、工业企业的所有设备是调查对象 C、每台设备是 填报单位D、每台设备是调查单位E、每个工业企业是填报单位 5.下列平均数中,容易受数列中极端值影响的平均数有(ABC ) A、算术平均数 B、调和平均数 C、几何平均数 D、中位数 E、众数 三、判断题(在正确答案后写“对”,在错误答案后写“错”。每小题1分,共10分) 1、“性别”是品质标志。(对) 2、方差是离差平方和与相应的自由度之比。(错) 3、标准差系数是标准差与均值之比。(对) 4、算术平均数的离差平方和是一个最大值。(错)

22121212121 ~(,),(,),(,),, 1X N X x x x x x x ρμμμμσρ ?? ∑==∑= ??? +-1、设其中则Cov(,)=____. 10 31 2~(,),1,,10,()()_________i i i i X N i W X X μμμ=' ∑=--∑L 、设则=服从。 ()1 2 34 433,4 92,32 16___________________ X x x x R -?? ?'==-- ? ?-? ? =∑、设随机向量且协方差矩阵则它的相关矩阵 4、 __________, __________, ________________。 215,1,,16(,),(,)15[4()][4()]~___________i p p X i N X A N T X A X μμμμ-=∑∑'=--L 、设是来自多元正态总体和分别为正态总体的样本均值和样本离差矩阵,则。 12332313116421(,,)~(,),(1,0,2),441, 2142X x x x N x x x x x μμ-?? ?'=∑=-∑=-- ? ?-?? -?? + ??? 、设其中试判断与是否独立? (), 1 2 3设X=x x x 的相关系数矩阵通过因子分析分解为 211X h = 的共性方差111X σ= 的方差21X g = 1公因子f 对的贡献1213 30.93400.1280.9340.4170.8351100.4170.8940.02700.8940.44730.8350.4470.10320 13 R ? ? - ????? ? -?? ? ? ?=-=-+ ? ? ? ??? ? ? ????? ? ???

第一章绪论 一、填空题 1.标志是说明特征的,指标是说明数量特征的。 2.标志可以分为标志和标志。 3.变量按变量值的表现形式不同可分为变量和变量。4.统计学是研究如何、、显示、统计资料的方法论性质的科学。 5.配第在他的代表作《》中,用数字来描述,用数字、重量和尺度来计量,为统计学的创立奠定了方法论基础。 二、判断题 1.企业拥有的设备台数是连续型变量。() 2.学生年龄是离散型变量。() 3.学习成绩是数量标志。() 4.政治算术学派的创始人是比利时的科学家凯特勒,他把概率论正式引进统计学。() 5.指标是说明总体的数量特征的。() 6.对有限总体只能进行全面调查。() 7.总体随着研究目的的改变而变化。() 8.要了解某企业职工的文化水平情况,总体单位是该企业的每一位职工。() 9.数量指标数值大小与总体的范围大小有直接关系。() 10.某班平均成绩是质量指标。()

三、单项选择题 1.考察全国的工业企业的情况时,以下标志中属于数量标志的是( )。 A.产业分类 B.劳动生产率 C.所有制形式 D.企业名称 2.要考察全国居民的人均住房面积,其统计总体是( )。 A.全国所有居民户 B.全国的住宅 C.各省市自治区 D.某一居民户 3.若要了解全国石油企业采油设备情况,则总体单位是( )。 A.全国所有油田 B.每一个油田 C.每一台采油设备 D.所有采油设备 4.关于指标下列说法正确的是( )。 A.指标是说明总体单位数量特征的 B.指标都是用数字表示的 C.数量指标用数字表示,质量指标用文字表示 D.指标都是用文字表示的 5.政治算术学派的代表人物是( )。 A.英国人威廉·配第 B.德国人康令 C.德国人阿亨瓦尔 D.比利时人凯特勒 6.关于总体下列说法正确的是( )。 A.总体中的单位数都是有限的 B.对于无限总体只能进行全面调查 C.对于有限总体只能进行全面调查 D.对于无限总体只能进行非全面调查 7.关于总体和总体单位下列说法不正确的是( )。 A.总体和总体单位在一定条件下可以相互转换 B.总体和总体单位是固定不变的 C.构成总体的个别单位是总体单位 D.构成总体的各个单位至少具有某种相同的性质 8.关于标志下列说法不正确的是( )。

《统计学》复习题 一、单项选择题 1、某城市进行工业企业未安装设备普查,个体是( B )。 A、工业企业全部未安装设备 B、工业企业每一台未安装设备 C、每个工业企业的未安装设备 D、每一个工业企业 2、以产品的等级来衡量某种产品的质量好坏,则该产品等级是( B )。 A、数量标志 B、品质标志 C、数量指标 D、质量指标 3、几位学生的某门课成绩分别是67分、78分、88分、89分、96分,则“成绩”是( B )。 A、品质标志 B、数量标志 C、标志值 D、数量指标 4、统计指标按所反映的数量特征不同可以分为数量指标和质量指标两种。 其中数量指标的表现形式是( A )。 A、绝对数 B、相对数 C、平均数 D、小数 5、对教师按职称进行分组,则适合采用的测定尺度是( B )。 A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 6、以样本调查结果来推断总体数量特征,运用的方法是( B )。 A、演绎推理法 B、概率估计法 C、数学分析法 D、主观判断法 7、某市全部商业企业职工的生活状况进行调查,调查对象是( B )。 A、该市全部商业企业 B、该市全部商业企业的职工 C、该市每一个商业企业 D、该市商业企业的每一名职工 8、对一批商品进行质量检验,最适宜采用的调查方法是( B )。 A、全面调查 B、抽样调查 C、典型调查 D、重点调查 9、抽样调查与重点调查的主要区别是( D )。 A、作用不同 B、组织方式不同 C、灵活程度不同 D、选取调查单位的方法不同 10、统计整理阶段最关键的问题是( B )。 A、对调查资料的审核 B、统计分组 C、统计汇总 D、编制统计表

第一章: 多元统计分析研究的容(5点) 1、简化数据结构(主成分分析) 2、分类与判别(聚类分析、判别分析) 3、变量间的相互关系(典型相关分析、多元回归分析) 4、多维数据的统计推断 5、多元统计分析的理论基础 第二三章: 二、多维随机变量的数字特征 1、随机向量的数字特征 随机向量X均值向量: 随机向量X与Y的协方差矩阵: 当X=Y时Cov(X,Y)=D(X);当Cov(X,Y)=0 ,称X,Y不相关。 随机向量X与Y的相关系数矩阵: 2、均值向量协方差矩阵的性质 (1).设X,Y为随机向量,A,B 为常数矩阵 E(AX)=AE(X); E(AXB)=AE(X)B; D(AX)=AD(X)A’; )' ,..., , ( ) , , , ( 2 1 2 1P p EX EX EX EXμ μ μ = ' = )' )( ( ) , cov(EY Y EX X E Y X- - = q p ij r Y X ? =) ( ) , (ρ

Cov(AX,BY)=ACov(X,Y)B ’; (2).若X ,Y 独立,则Cov(X,Y)=0,反之不成立. (3).X 的协方差阵D(X)是对称非负定矩阵。例2.见黑板 三、多元正态分布的参数估计 2、多元正态分布的性质 (1).若 ,则E(X)= ,D(X)= . 特别地,当 为对角阵时, 相互独立。 (2).若 ,A为sxp 阶常数矩阵,d 为s 阶向量, AX+d ~ . 即正态分布的线性函数仍是正态分布. (3).多元正态分布的边缘分布是正态分布,反之不成立. (4).多元正态分布的不相关与独立等价. 例3.见黑板. 三、多元正态分布的参数估计 (1)“ 为来自p 元总体X 的(简单)样本”的理解---独立同截面. (2)多元分布样本的数字特征---常见多元统计量 样本均值向量 = 样本离差阵S= 样本协方差阵V= S ;样本相关阵R (3) ,V分别是 和 的最大似然估计; (4)估计的性质 是 的无偏估计; ,V分别是 和 的有效和一致估计; ; S~ , 与S相互独立; 第五章 聚类分析: 一、什么是聚类分析 :聚类分析是根据“物以类聚”的道理,对样品或指标进行分类的一种多元统计分析方法。用于对事物类别不清楚,甚至事物总共可能有几类都不能确定的情况下进行事物分类的场合。聚类方法:系统聚类法(直观易懂)、动态聚类法(快)、有序聚类法(保序)...... Q-型聚类分析(样品)R-型聚类分析(变量) 变量按照测量它们的尺度不同,可以分为三类:间隔尺度、有序尺度、名义尺度。 二、常用数据的变换方法:中心化变换、标准化变换、极差正规化变换、对数变换(优缺点) 1、中心化变换(平移变换):中心化变换是一种坐标轴平移处理方法,它是先求出每个变量的样本平均值,再从原始数据中减去该变量的均值,就得到中心化变换后的数据。不改变样本间的相互位置,也不改变变量间的相关性。 2、标准化变换:首先对每个变量进行中心化变换,然后用该变量的标准差进行标准化。 经过标准化变换处理后,每个变量即数据矩阵中每列数据的平均值为0,方差为1,且也不再具有量纲,同样也便于不同变量之间的比较。 3、极差正规化变换(规格化变换):规格化变换是从数据矩阵的每一个变量中找出其最大值和最小值,这两者之差称为极差,然后从每个变量的每个原始数据中减去该变量中的最小值,再除以极差。经过规格化变换后,数据矩阵中每列即每个变量的最大数值为1,最小数值为0,其余数据取值均在0-1之间;且变换后的数据都不再具有量纲,便于不同的变量之间的比较。 4、对数变换:对数变换是将各个原始数据取对数,将原始数据的对数值作为变换后的新值。它将具有指数特征的数据结构变换为线性数据结构。 三、样品间相近性的度量 研究样品或变量的亲疏程度的数量指标有两种:距离,它是将每一个样品看作p 维空),(~∑μP N X μ∑μp X X X ,,,21 ),(~∑μP N X ),('A A d A N s ∑+μ)()1(,,n X X X )',,,(21p X X X )')(()()(1X X X X i i n i --∑=n 1X μ ∑μX )1,(~∑n N X P μ),1(∑-n W p X X

交大统计学考试试卷 一、单项选择题(每小题2分,共20分) 1.在企业统计中,下列统计标志中属于数量标志的是( C) A、文化程度 B、职业 C、月工资 D、行业 2.下列属于相对数的综合指标有(B ) A、国民收入 B、人均国民收入 C、国生产净值 D、设备台数 3.有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有( B)个变量? A、0个 B、两个 C、1个 D、3个 4.下列变量中属于连续型变量的是(A ) A、身高 B、产品件数 C、企业人数 D、产品品种 5.下列各项中,属于时点指标的有(A ) A、库存额 B、总收入 C、平均收入 D、人均收入 6.典型调查是(B )确定调查单位的 A、随机 B、主观 C、随意 D盲目 7.总体标准差未知时总体均值的假设检验要用到( A ): A、Z统计量 B、t统计量 C、统计量 D、X统计量 8. 把样本总体中全部单位数的集合称为(A ) A、样本 B、小总体 C、样本容量 D、总体容量 9.概率的取值围是p(D ) A、大于1 B、大于-1 C、小于1 D、在0与1之间 10. 算术平均数的离差之和等于(A ) A、零 B、 1 C、-1 D、2 二、多项选择题(每小题2分,共10分。每题全部答对才给分,否则不计分) 1.数据的计量尺度包括( ABCD ): A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 E、测量尺度 2.下列属于连续型变量的有( BE ): A、工人人数 B、商品销售额 C、商品库存额 D、商品库存量 E、总产值 3.测量变量离中趋势的指标有( ABE ) A、极差 B、平均差 C、几何平均数 D、众数 E、标准差 4.在工业企业的设备调查中( BDE ) A、工业企业是调查对象 B、工业企业的所有设备是调查对象 C、每台设备是 填报单位 D、每台设备是调查单位 E、每个工业企业是填报单位 5.下列平均数中,容易受数列中极端值影响的平均数有( ABC ) A、算术平均数 B、调和平均数 C、几何平均数 D、中位数 E、众数 三、判断题(在正确答案后写“对”,在错误答案后写“错”。每小题1分,共10分) 1、“性别”是品质标志。(对) 2、方差是离差平方和与相应的自由度之比。(错) 3、标准差系数是标准差与均值之比。(对)

相关文档
相关文档 最新文档