文档库 最新最全的文档下载
当前位置:文档库 › 统计学复习(简答题) (1)

统计学复习(简答题) (1)

复习题

1.什么是统计学?为什么统计学可以通过对数据的分析达到对事物性质的认识?

答:(1)统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据内在的数量规律性。(2)这是由客观事物本身的特点和统计方法的特性共同决定的。a.从客观事物方面来说,根据辩证法的基本原理,任何客观事物都是必然性与偶然性的对立统一。同样,任何一个数据,也都是必然性与偶然性共同作用的结果,是二者作用的对立统一。b.从统计方法来看,统计学提供了一系列的方法,专门用来收集数据、整理数据、显示数据的特征,进而分析和探索(或推断)出事物总体的数量规律性。

2.解释总体与样本、参数和统计量的含义。

总体是我们所要研究的所有基本单位的总和。

样本是总体的一部分单位。

描述总体或概率分布的数量值称为参数。

统计量是对样本数据特征的数量描述。

3.解释总体分布、样本分布和抽样分布的含义。

答:(1)总体分布:整体取值的概率分布规律,通常称为总体分布。(2)样本分布:从总体中抽取容量为n的样本,得到n个样本观测值的概率分布,则为样本分布。(3)抽样分布:就是由样本n个观察值计算的统计量的概率分布。

4.简述描述统计学和推断统计学的概念及其联系。

描述统计学是研究如何取得、加工整理和显示数据资料,进而通过综合、概括与分析得出反映客观现象的规律性数量特征的科学。

推断统计学是研究如何根据样本数据去推断总体数量特征的方法,它是在对样本数据进行描述的基础上,对总体未知的数量特征做出以概率论为基础的推断和估计。

联系:描述统计学和推断统计学是现代统计学的两个组成部分,相辅相成、缺一不可。描述统计学是现代统计学的基础和前提,推断统计学是现代统计学的核心和关键。

5.简述中心极限定理。

从均值为μ、方差为σ2的总体中,抽取容量为n的随机样本,当n充分大时(通常要求n≥30),样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布。

6.解释置信水平、置信区间、显著性水平的含义,它们有什么联系。

在对参数估计的许多置信区间中包含总体参数真值的次数所占的比例称为置信水平。

在区间估计中,由样本统计量所构造的总体参数的估计区间,称为置信区间。

假设检验中犯第一类错误的概率被称为显著性水平。

它们的联系是:置信水平越高,置信区间越宽,显著性水平越底。

7.样本统计量的分布和总体分布的关系是什么?

答:样本统计量包括样本均值、样本比率、样本方差。(1)样本均值总体分布的关系:a无论是重复还是不重复抽样,样本均值的数学期望始终等于总体均值;b在重复抽样条件下,样本均值的方差为总体方差的1/n;在不重复抽样条件下,样本均值的方差为

(2)样本比率与总体分布的关系:a样本比率p的数学期望等于总体比率π;b在重复条件下,;在不重复条件下,用修正系数加以修正,

(3)样本方差与总体分布的关系:对于来自正态总体的简单随机样本,则比值

的抽样分布服从自由度为(n-1)的x2分布。

8.抽样推断时为什么必须遵循随机原则抽取样本?

抽样推断是按照随机的原则从总体中抽取一部分调查单位进行观察,并依据所获得的部分单位的数量特征对全部研究对象的数量特征做出具有一定可靠性的估计和判断,从而达到对总体现象的认识的一种方法。必须遵循随机原则是因为样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有一个已知的不为零的中选机会。

9.简述假设检验的一般步骤。

答:⑴陈述原假设和备择假设

⑵从所研究的总体中抽出一个随机样本

⑶确定一个适当的检验统计量,并利用样本数据算出其具体数值

⑷确定一个适当的显著性水平,并计算出其临界值,指定拒绝域

⑸将统计量的值与临界值进行比较,作出决策。统计量的值落在拒绝域,拒绝H0,否则不拒绝H0;也可以直接利用P值作出决策,P值小于显著性水平的拒绝H0,否则不拒绝H0。

10.简述第Ⅰ类错误和第Ⅱ类错误的概念,它们发生的概率之间存在怎样的关系?

当原假设为真时拒绝原假设,所犯的错误称为第Ⅰ类错误。犯第Ⅰ类错误的概率记为α。当原假设为假时没有拒绝原假设,所犯的错误称为第Ⅱ类错误。犯第Ⅱ类错误的概率记为β。关系:和α增大时,β减小;当α减小时,β增大.

11.简述众数、中位数和均值的特点和应用场合。

答:(1)定义:众数是将数据按大小顺序排队形成次数分配后,在统计分布中具有明显集中趋势点的数值,是数据一般水平代表性的一种。中位数是数据排序后,位置在最中间的数值。均值就是算术平均数,是数据集中趋势的最主要测度值.

(2)特点:众数和中位数是从数据分布形状及位置角度来考虑的集中趋势代表值,而均值是经过对所有数据计算后得到的集中趋势值。

(3)应用场合:在对称次数分配和统计分布中,众数、中位数和均值都是同一数值。在有偏的分布中,众数则能更好地描述数据的集中趋势。

12. 为什么要计算离散系数?

当对不同总体或样本数据的离散程度进行比较时,由于平均值不同、计量单位不同,因此直接比较离散指标的绝对数形式,如极差、平均差、标准差等,必须将上述指标与平均值对比,消除平均值不同和计量单位不同的影响,即必须计算离散系数。

13.简述移动平均法的基本原理和特点。

答:⑴基本原理是消除时间序列中的不规则变动和其他变动,揭示出时间序列的长期趋势;

⑵移动平均的方式是选择一定的用于平均的时距项数N,采用对序列逐项递移的方式,对原序列递移的N项计算一系列序时平均数。

⑶移动平均法的特点:①对原序列有修匀或平滑的作用。时距项数N越大,对数列的修匀作用越强;

②移动平均项数N为偶数时,需做二项移动平均以移正其位置

③平均时距项数N与季节变动长度一致才能消除季节变动;时距项数N和周期一致才能消

除周期波动。

④移动平均会使原序列失去部分信息,平均项数越大,失去的信息越多。

14.简述加权平均指数的基本编制原理。

答:1为了对复杂现象总体进行对比分析,首先对构成总体的个别元素计算个体指数,所得到的无量纲化的相对数是编制总指数的基础2为了反映个别元素在总体中的重要性的差异,必须以相应的总值指标作为权数对个体指数进行加权平均,就得到说明总体现象数量对比关系的总指数。

15.简述编制总指数的两种方法的区别与联系。

答:编制总指数的两种基本形式是综合指数和平均指数。区别主要表现在三个方面:(1)解决复杂总体不能直接同度量问题的基本思路不同。综合指数的特点是“先综合,后对比”;而平均数指数的特点是“先对比,后综合”。(2)运用资料的条件不同。综合指数要求全面调查的资料;而平均指数既可以用于全面调查资料的情况,也可以用于非全面调查资料的情况。

(3)在经济分析中的作用不同。平均指数除作为综合指数变形加以应用的情况外,主要是用以反映复杂总体的变动方向和程度,一般不用于因素分析;而综合指数则由于用以对比的问题指标有明确的经济内容,因此,在经济分析中,不仅用以表明复杂总体的变动方向和程度,而且用以进行因素分析,且能表明因素变动对对象变动影响的绝对量。联系的表现:在一定的权数条件下,两类指数之间有变形关系,即平均指数可作为综合指数的变形形式加以应用。

16.简述样本容量与置信水平、总体方差、允许误差的关系。

答:样本容量与置信水平成正比,在其他条件不变的情况下,置信水平越大,所需的样本容量也就越大;样本容量与总体方差成正比,总体的差异越大,所要求的样本容量也越大;样本容量与允许误差成反比,可以接受的允许误差越大,所需的样本容量就越小。

17.比较单侧检验和双侧检验的区别。

(1)问题的提法不同,双侧检验研究的是新方法与旧方法是否有差异;单侧检验研究的是新方法明显好于旧方法还是新方法明显不如旧方法。(2) 建立假设的形式不同,双侧检验的假设是H0: u=u0, H1: u ≠u0;单侧检验的假设是H0: u≤u0, H1: u>u0或H0: u>u0, H1: u≤u0 。(3)否定的区域不同,双侧检验的否定区域是IZ I> Z a/2;单侧检验的否定区域是Z<-Za 或Z>Za

18.甲企业近四年产品销售量分别增长了9%、7%、8%、6%;乙企业这四年产品的次品率也正好是9%、7%、8%、6%。这两个企业这四年的平均增长率和平均次品率的计算是否一样?为什么?

答:不一样。因为计算的对象不同,所使用的方法不同。

平均增长率要将增长率变成发展速度后,通过几何平均法求出平均发展速度后减去1得平均增长率,即:

四年的平均增长率=

()()()()%

100

%

6

1

%

8

1

%

7

1

%

9

1

4-

+

?

+

?

+

?

+

平均次品率是以每年的产品量(包括次品)为权数对每年的次品率进行加权平均得到的,设四年的产品量分别为A、B、C、D,则

四年的平均次品率=(9%A+7%B+8%C+6%D)/(A+B+C+D)

19. 在总量指标的两因素分析中,指数体系如下:

)()(0

01010110011001010110011∑∑∑∑∑∑∑∑∑∑∑∑-+-=-?=q p q p q p q p q p q p q

p q

p q p q p q p q p 以下计算出来的是一组与上述指数体系相对应的销售额、销售价格和销售量的数据。请根据以下数据解释该指数体系的含义。

20.1)联系:具有共同的研究对象,两者互相补充。

只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。 简单说:相关分析是回归分析的基础和前提;回归分析是相关分析的深入和继续。

2)区别:(1)在相关分析中,不必确定自变量和因变量;而在回归分析中,必须事先确定哪个为自变量,哪个为因变量,而且只能从自变量去推测因变量,而不能从因变量去推断自变量。(2)相关分析不能指出变量间相互关系的具体形式;而回归分析能确切的指出变量之间相互关系的具体形式,它可根据回归模型从已知量估计和预测未知量。(3)相关分析所涉及的变量一般都是随机变量,而回归分析中因变量是随机的,自变量则作为研究时给定的非随机变量。

21.解释因子和处理的含义。

1)在方差分析中,所要检验的对象称为因素或因子。

2)因素的不同表现称为水平或处理。

22..简述假设检验中P 值的含义。

如果原假设H0是正确的,所得到的样本结果会像实际观测结果那么极端或更极端的概率,称为P 值。P 值是假设检验中的另一个决策工具,对于给定的显著性水平α,若P <α,则拒绝原假设。

二、计算题

1.第四章例题。

2.第五章习题的第2、4、6题

3..第六章一个总体均值的检验相关例题。

4.第七章习题的第1、3、5、7题。

5..第八章:简单线形回归及其方差分析表。

6.第九章习题的第1、3、5、7题。

7.第十章习题的第1、3、6、7题。

注:对于判断题和选择题中的需要计算的内容要从所要掌握的内容去复习。

130%=108.33%×120% 2160万元=600万元+1560万元

相关文档