文档库 最新最全的文档下载
当前位置:文档库 › 统计学问答题

统计学问答题

统计学问答题
统计学问答题

统计学问答题

1. 什么是统计学?怎样理解统计学与统计数据的关系?

答:统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据内在的数量规律性。统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法乃至统计学就失去了其存在意义。

3.简要说明抽样误差和非抽样误差

答:统计调查误差可分为非抽样误差和抽样误差。非抽样误差是由于调查过程中各有关环节工作失误造成的,从理论上看,这类误差是可以避免的。抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以计量和控制的。

4(先分为集中趋势与分散程度,再继续细分,即综述7、8)

一组数据的分布特征可以从哪几个方面进行测度?

答:数据分布特征一般可从集中趋势、离散程度、分布形状(偏态和峰度)几方面来测度。

分布集中趋势的测度有众数、中位数、分位数、均值、几何平均数、切尾均值;分布离散程度的测度有极差、内距、方差和标准差、离散系数。

7.简述众数、中位数和均值的特点和应用场合。

答:众数、中位数和均值是分布集中趋势的三个主要测度,众数和中位数是从数据分布形状及位置角度来考虑的,而均值是对所有数据计算后得到的。

众数一组数据分布的峰值,容易计算,但不是总是存在,众数只有在数据量较多时才有意义,数据量较少时不宜使用。主要适合作为分类数据的集中趋势测度值,应用场合较少;

中位数是一组数据中间位置上的代表值,直观,不受极端数据的影响,但数据信息利用不够充分,当数据的分布偏斜较大时,使用中位数也许不错。主要适合作为顺序数据的集中趋势测度值。

均值数据对数值型数据计算的,而且利用了全部数据信息,提取的信息最充分,当数据呈对称分布或近似对称分布时,三个代表值相等或相近,此时应选择平均数。但受极端数据的影响,对于偏态分布的数据,平均数的代表性较差,此时应考虑中位数或众数。

8.标准差和方差反映数据的什么特征

反映数据离散程度的特征. 标准差反应数据的变化幅度,即上下左右波动的剧烈程度。在统计中可以用来计算某变量值的区间范围(即置信区间)。方差:即标准差的平方。

所以,标准差和方差两者没有本质区别。

5怎样理解均值在统计中的地位?

答:均值是对所有数据平均后计算的一般水平的代表值,数据信息提取得最充分,具有良好的数学性质,是数据误差相互抵消后的客观事物必然性数量特征的一种反映,在统计推断中显示出优良特性,由此均值在统计中起到非常重要的基础地位。受极端数值的影响是其使用时存在的问题。

10为什么要计算离散系数?

答:在比较二组数据的差异程度时,由于方差和标准差是以均值为中心计算出来的,有时直接比较标准差是不准确的,需要剔除均值大小不等的影响,计算并比较离散系数

1怎样理解频率与概率的关系?频率的极限是概率吗?

频率在一定程度上反映了事件发生的可能性大小. 尽管每进行一连串(n次)试验,所得到的频率可以各不相同,但只要n相当大,频率与概率是会非常接近的.因此,概率是可以通过频率来“测量”的, 频率是概率的一个近似. 概率是频率稳定性的依据,是随机事件规律的一个体现. 实际中,当概率不易求出时,人们常通过作大量试验,用事件出现的频率去近似概率. 当实验次数趋向于无穷时,频率的极限就是概率。

2概率的三种定义各有什么应用场合和局限性

⑴古典概率实验的基本事件总数有限,每个基本事件出现的可能性相同;要求样本空间是有限并且是已知的。机会游

戏的很多问题可以满足这些条件;但现实生活的实际问题样本空间或者出现的结果无限或者未知,因此具有较强的局限性

⑵统计概率历史上同类事物发生的稳定频率。在日常生活与工作中,应用较为普遍;统计概率通常是计算大量重复试

验中该事件出现次数的频率,但有些试验是不能重复的

⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计,但决

策者又必须对其进行估计从而做出相应决策。具有主观随意性

3概率密度函数和分布函数的联系与区别表现在哪些方面

一元函数下.

概率分布函数是概率密度函数的变上限积分,就是原函数.

概率密度函数是概率分布函数的一阶导函数.

多元函数下.

联合分布函数是联合密度函数的重积分.

联合密度函数是联合分布函数关于每个变量的偏导.

6随机变量的数学期望和方差与第二章所讲的均值和方差有何区别,联系

数学期望又称均值,实质上是随机变量所有可能取值的一个加权平均,其权数就是取值的概率,方差一样

12解释总体分布、样本分布和抽样分布的含义

总体分布:所有元素出现概率的分布

样本分布:样本n个观察值的概率分布。

抽样分布:由样本n个观察值计算的统计量的概率分布

1.简述评价估计量好坏的标准

1、无偏性:估计量抽样分布的数学期望等于被估计的总体参数

2、有效性:对同一总体参数的两个无偏点估计量,有更小标准差的估计量更有效

3、一致性:随着样本量的增大时,点估计量的值越来越接近被估总体的参数。

举例

2.说明区间估计的基本原理

答:总体参数的区间估计是在一定的置信水平下,根据样本统计量的抽样分布计算出用样本统计量加减抽样误差表示的估计区间。

3解释置信水平的含义(画图)

置信区间中包含总体参数真值的次数所占的比率称为置信水平;而置信区间是指由样本统计量所构成的总体参数的估计区间。置信区间越大,置信水平越高。

4.解释置信水平为95%的置信区间的含义

答:总体参数是固定的,未知的,置信区间是一个随机区间。置信水平为95%的置信区间的含义是指,在相同条件下多次抽样下,在所有构造的置信区间里大约有95%包含总体参数的真值。

5.简述样本容量与置信水平、总体方差、允许误差的关系

答:以估计总体均值时样本容量的确定公式为例:样本容量与置信水平成正比、与总体方差成正比、与允许误差成反比。

附加题:简(综)述述置信区间和显著性水平的关系

显著性水平为a检验的拒绝域,与置信水平为1-a的置信区间互为补集的,也即:求接受域就是求置信区间,所以假设检验和区间估计本质是一回事。

1.理解原假设与备择假设的含义,并归纳常见的几种建立原假设与备择假设的原则.

答:原假设通常是研究者想收集证据予以反对的假设;而备择假设通常是研究者想收集证据予以支持的假设。

建立两个假设的原则有:

(1)原假设和备择假设是一个完备事件组,而且相互对立。(2)一般先确定备择假设。再确定原假设。(3)等号“=”总是放在原假设上。(4)假设的确定带有一定的主观色彩。(5)假设检验的目的主要是收集证据来拒绝原假设。

3.什么是显著性水平?它对于假设检验决策的意义是什么?

答:假设检验中犯第一类错误的概率被称为显著性水平。

显著性水平通常是人们事先给出的一个值,用于检验结果的可靠性度量,但确定了显著性水平等于控制了犯第一错误的概率,对检验结果的可靠性起一种度量作用

4.什么是p 值?p 值检验和统计量检验有什么不同?

答:p 值是当原假设为真时,检验统计量小于或等于根据实际观测样本数据计算得到的检验统计量值的概率。P 值常常作为观察到的数据与原假设不一致程度的度量。统计量检验采用事先确定显著性水平,来控制犯第一类错误的上限,p 值可以有效地补充提供地关于检验可靠性的有限信息。p值检验的优点在于,它提供了更多的信息,让人们可以选择一定的水平来评估结果是否具有统计上的显著性。

6比较单侧检验和双侧检验的区别

(1)问题的提法不同,双侧检验研究的是新方法与旧方法是否有差异;单侧检验研究的是新方法明显好于旧方法还是新方法明显不如旧方法。2 建立假设的形式不同,双侧检验的假设是 H0: u=u0 H1: u ≠u0;单侧检验的假设是 H0: u≤u0 H1: u>u0 或 H0: u Z a/2;单侧检验的否定区域是 Z<-Za 或 Z>Za

1什么是方差分析?它研究的是什么?

方差分析是检验多个总体均值是否相等的统计方法,来判断分类型自变量对数值型因变量是否有显著影响。

它所研究的是分类型自变量对数值型因变量的影响。

2方差分析中有哪些基本假定

每个总体都应服从正态分布;每个总体的方差必须相同;观测值是独立的

3简述方差分析的基本思想

通过分析研究不同来源的变异对总变异的贡献大小,从而确定可控因素对研究结果影响力的大小

7解释水平项平方和、误差项平方和的含义

水平项误差平方和简记为SSA,它是各组平均值与总平均值的误差平方和,反映各总体的样本均值之间的差异程度,是对随机误差和系统误差的大小的度量,因此又称为组间平方和

误差项平方和,简记为SSE,它是每个水平或的各样本数据与其组平均值误差的平方和,反映了每个样本各观测值的离散状况,是对随机误差的大小的度量,因此又称为组内平方和或残差平方和

1.相关分析与回归分析的区别与联系是什么?

答:相关与回归分析是研究变量之间不确定性统计关系的重要方法

相关分析主要是判断两个或两个以上变量之间是否存在相关关系,并分析变量间相关关系的形态和程度。

回归分析主要是对存在相关关系的现象间数量变化的规律性作出测度。

具有共同的研究对象,都是对变量间相关关系的分析,二者可以相互补充。相关分析可以表明变量间相关关系的性质和程度,只有当变量间存在相当程度的相关关系时,进行回归分析去寻找变量间相关的具体数学形式才有实际的意义。同

时在进行相关分析时,如果要具体确定变量间相关的具体数学形式,又要依赖于回归分析,而且在多个变量的相关分析中相关系数的确定也是建立在回归分析基础上

但它们在研究目的和对研究方法上有明显区别。

2简单线性相关系数与等级相关系数的区别是什么?

简单线性相关系数要求两个随机变量的联合分布是二维正态分布。等级相关系数主要适用于变量值表现为等级的变量3.什么是总体回归函数和样本回归函数?它们之间的区别是什么?

4什么是随机误差项和残差?它们之间的区别是什么?

随机误差项Ui表示自变量之外其他变量的对因变量产生的影响,是不可观察的,通常要对其给出一定的假设。

残差项ei 指因变量实际观察值与样本回归函数计算的估计值之间的偏差,是可以观测的。

它们的区别在于,反映的含义是不同且可观察性也不同

7如果要分析“影响中国妇女生育水平的决定因素是什么?”的问题,你认为对此问题可以建立什么样的回归方程去研究

12对回归系数显著性作t检验的基本思想是什么

利用样本回归系数b与总体平均数回归系数进行比较来判断回归方程是否成立。

2时间序列有哪些速度分析指标?它们之间的关系是什么?(6个)

(1)时间序列有发展速度与增长速度、平均发展速度与平均增长速度等速度指标;按基期的不同有定基速度和环比速度;(2)它们之间的关系:发展速度=增长速度+1

3为什么平均发展速度要用几何平均法计算?计算平均发展速度的几何平均法的特点是什么?

现象发展的平均速度,一般用几何平均法计算。平均速度是总速度的平均,但现象发展的总速度不等于各年发展速度之和,而等于各年环比发展速度的连乘积,所以求平均发展速度要用几何平均法。

几何平均法的实质是要求从最初水平出发,按所求的平均发展速度发展,计算出的末期水平应等于实际末期水平,这种方法可以只根据最初水平与最末水平计算而不考虑中间水平的变化,其侧重点在于考虑最末一期发展水平

4甲企业近四年产品销售量分别增长了9%、7%、8%、6%;乙企业这四年产品的次品率也正好是9%、7%、8%、6%。这两个企业这四年的平均增长率和平均次品率的计算是否一样?为什么?

不一样。因为计算的对象不同,所使用的方法不同。

平均增长率要将增长率变成发展速度后,通过几何平均法求出平均发展速度后减去1得平均增长率,即:四年的平均增

长率=

平均次品率是以每年的产品量(包括次品)为权数对每年的次品率进行加权算术平均得到的,设四年的产品量分别为A、B、C、D,则四年的平均次品率=(9%A+7%B+8%C+6%D)/(A+B+C+D)

5循环变动与季节变动的联系和区别

联系:都是影响时间序列变动的因素.

区别:季节变动是指客观现象由于受自然因素和生产或生活条件的影响,在一年内随着季节的更换而引起的比较有规律的,可以预测的周期变动.循环变动的周期在一年以上,且周期长短不同,没有固定的变动期限和明显的规律性,很难事先预知.

4总指数有哪两种基本编制方式?它们各自有何特点?

(1)综合指数先综合,后对比的方法。

(2)平均数指数先对比,后平均的方法。

简单综合指数通常难以成为现象变动程度的一种客观测度(直接加总无经济意义,不同度量)。从经济分析的角度看,各种商品的重要性程度通常是有差异的,简单平均指数不能反映这种差异,因而难以满足分析的要求。

10构建综合评价指数的基本问题有哪些?解决这些问题的实际意义何在(4个)

1建立综合评价指标体系2确定各项指标的评价标准3确定各项评价指标的权重4选择评价指标的合成方法

以上四个问题第一个问题指标体系决定了综合评价的实质内容,后面三个问题则共同决定了综合评价的方式、方法。通过以上步骤解决了有关的各项问题就能够构建出相应的综合评价指数。而对有关问题处理方式的不同则将导致不完全相同的综合评价指数编制形式和评价结果。

题型:是非、判断、计算、问答。

第一章

1、名词解释:

P1:统计学;P2:统计数据;P4:统计学产生的源头;P5:20世纪初到中叶,统计学发展的主要成就和代表人物的主要思想和贡献;P5-P6:描述统计、推断统计、两者关系;思考:统计指数和国民经济统计是否属于上述其中一种统计方法?涉及到P7:理论统计和应用统计;P9-P10:抽样误差与非抽样误差;P10-P11;总体与样本;

2、典型习题:第一章思考与练习:1、5;案例1:思考“小概率原理”;

习题集第1章习题:3、4、8、10、14、24、26、30、33

第二章

1、名词解释:

P16:统计分组;P18:“分组原则:不重不漏” ;P20-21:统计曲线(常用4种):正态分布、偏态(+P31-P32:偏态分布图形中众数、中位数、均植之间关系)、J形、U形;P24:众数;P25-P26:中位数、中位数性质;P26:分位数、均值;P26-28;均值的3个重要性质,P28-P31;算术平均数、几何平均数;P33;方差与标准差;P34-P35:样本分组数据方差、样本方差计算公式,(2.11)-(2.13);P34-P35:偏态系数和峰度系数;

2、典型习题:第二章思考:4(先分为集中趋势与分散程度,再继续细分,即综述7、8)、5、10;

练习:10、11、14;习题集第2章习题:11、16、32、38、71、76、97、98、119、123

第三章

1、名词解释:

P63:样本空间;P63-P65:概率定义(4种);P72-P74:独立事件、全概率公式和贝叶斯公式、例3.14;P75:随机变量;P77-P78:离散型、例3.16,数学期望与方差;P85-86:连续型、概率密度函数与分布函数,公式(3.20-3.27);P96-98:常用抽样方法(4个名词及其意义相同的其它称呼、各举一例);P103:

抽样分布特征;P103-106:样本均值的总体方差已知、未知所服从的抽样分布;P107-111:样本比率抽样分布、样本方差的抽样分布、两个样本统计量(差、比率、方差比)的抽样分布;P111-113:中心极限定理的应用,例3.33、例3.34

2、典型习题:第三章思考:1、2、6、12;练习:17、18;习题集第3章习题:39、49、51;第4章:6、12、15、2

3、71、110、112、176;

第四章

1、名词解释:

P123-P125:参数估计、估计值与估计量、区间估计、置信区间、置信水平;P126-P127:评价估计量的3个标准;P128-140:允许误差、熟悉各种类型的总体均植区间估计计算公式与方法;P140:表4.7;P142-143:总体均植样本量的确定;

2、典型习题:第四章思考:1、

3、

4、

5、6;习题集第5章习题:10、11、17、18、31、32-44、62-65、70-75、102、108、121、128-129;181-183;

第五章

1、名词解释:

P149-P152:综述假设检验基本原理、过程、单、双侧检验(表5.2),P153-P155:显著性水平、检验统计量、拒绝域和临界值;P155-P156:P值;(重复第四章)各种样本类型的检验方法;

2、典型习题:第五章思考:1、

3、

4、6;附加题:简(综)述述置信区间和显著性水平的关系*;练习:

5、

6、7;习题集第6章习题:5、15、19、35-38、50-53、62-64、76-7

7、152-154、159-162、170-172;

第六章

1、名词解释:

P185-189:方差分析定义、基本原理和3个假定、一般模型;P187-188:单因素方差分析的计算过程、SST、SSA、SSE/MSA、MSE;及自由度;随机误差、系统误差、组内误差、组间误差的相互关系;P205-P208:总结方差分析与试验设计方法的对应关系;

2、典型习题:第六章思考:1、

3、

4、7;练习:1、2、3;习题集第7章习题:1、2、11、12、43、44、79

第七章

1、名词解释:

P215-P219:相关关系、相关系数(总体、样本)和特点;P22-P222:回归分析目的、与相关分析的联系、区别;P231-P232:R2判定系数特点;

2、典型习题:第七章思考:1-4、7、12;练习:1、2、3;习题集第8章习题:1-4、11-16、25-27、31-39、43-44、51-58、65-70

第八章

1、名词解释:

P256:基期(水平)与报告期(水平)、对时间序列进行分析的目的;P257-P260:时间序列速度分析:发展速度与增长速度(环比、定基、平均);

2、典型习题:第八章思考:2、

3、

4、10;练习:1、2、3;习题集:第9章习题:

5、

6、8、9、1

7、69、72-73

第九章

1、名词解释:

P294-295:统计指数概念;P297-302:总指数的编制方式与加权总指数的编制原理;P302-307:拉氏指数与帕氏指数及总量变动因素分析(公式和计算);P307-310:几种常用的经济指数;P311-315:综合评价指数法,例9.5,表格与计算;

2、典型习题:第九章思考:4、7、10;练习:1、5、6;习题集第10章,7-10、17、25-27、29-31、40、47-48、55-56、6

3、66、77-7926、47、48;计算题:7-8、10、11

统计学试题库及答案

统计学试题库及答案 Document serial number【KKGB-LBS98YT-BS8CB-BSUT-BST108】

《统计学》试题库 知识点一:统计基本理论和基本概念 一、填空题 1、统计是、和的统一体,是统计工作的成果,是统计工作的经验总结和 理论概括。 2、统计研究的具体方法主要有、、和。 3、统计工作可划分为、、和四个阶段。 4、随着的改变,总体和是可以相互转化的。 5、标志是说明,指标是说明。 6、可变的数量标志和所有的统计指标称为,变量的具体数值称为。 7、变量按分,可分为连续变量和离散变量,职工人数、企业数属于变量;变量按分,可 分为确定性变量和随机变量。 8、社会经济统计具有、、、等特点。 9、一个完整的统计指标应包括和两个基本部分。 10、统计标志按是否可用数值表示分为和;按在各个单位上的具体表现是否相同分为 和。 11、说明特征的名称叫标志,说明特征的名称叫指标。 12、数量指标用表示,质量指标用或平均数表示。 13、在统计中,把可变的和统称为变量。 14、由于统计研究目的和任务的变更,原来的变成,那么原来的指标就相应地变成标志,两者 变动方向相同。 二、是非题 1、统计学和统计工作的研究对象是完全一致的。 2、运用大量观察法,必须对研究对象的所有单位进行观察调查。 3、统计学是对统计实践活动的经验总结和理论概括。 4、一般而言,指标总是依附在总体上,而总体单位则是标志的直接承担者。 5、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。 6、某同学计算机考试成绩80分,这是统计指标值。 7、统计资料就是统计调查中获得的各种数据。 8、指标都是用数值表示的,而标志则不能用数值表示。 9、质量指标是反映工作质量等内容的,所以一般不能用数值来表示。 10、总体和总体单位可能随着研究目的的变化而相互转化。 11、女性是品质标志。

统计学基础知识要点 很重要

第一章:导论 1、什么是统计学?统计方法可以分为哪两大类? 统计学是收集、分析、表述和解释数据的科学。统计方法可分为描述统计方法和推断统计方法。 2、统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照所采用的计量尺度不同,分为分类数据、顺序数据和数值型数据;按照统计数据的收集方法,分为观测的数据和实验的数据;按照被描述的对象与时间的关系,分为截面数据和时间序列数据。 按计量尺度分时:分数数据中各类别之间是平等的并列关系,各类别之间的顺序是可以任意改变的;顺序数据的类别之间是可以比较顺序的;数值型数据其结果表现为具体的数值。按收集方法分时:观测数据是在没 有对事物进行人为控制的 条件下等到的;实验数据的 在实验中控制实验对象而 收集到的数据。按被描述的 对象与时间关系分时:截面 数据所描述的是现象在某 一时刻的变化情况;时间序 列数据所描述的是现象随 时间而变化的情况。 3、举例说明总体、样本、 参数、统计量、变量这几个 概念。 总体是包含研究的全部个 体的集合。比如要检验一批 灯泡的使用寿命,这一批灯 泡构成的集合就是总体。样 本是从总体中抽取的一部 分元素的集合。比如从一批 灯泡中随机抽取100个,这 100个灯泡就构成了一个样 本。参数是用来描述总体特 征的概括性数字度量。比如 要调查一个地区所有人口 的平均年龄,“平均年龄” 即为一个参数。统计量是用 来描述样本特征的概括性 数字度量。比如要抽样调查 一个地区所有人口的平均 年龄,样本中的“平均年龄” 即为一个统计量。变量是说 明现象某种特征的概念。比 如商品的销售额是不确定 的,这销售额就是变量。 第二章:数据的收集 1、调查方案包括哪几个方 面的内容? 调查目的,是调查所要达到 的具体目标。调查对象和调 查单位,是根据调查目的确 定的调查研究的总体或调 查范围。调查项目和调查 表,要解决的是调查的内 容。 2、数据的间接来源(二手 数据)主要是公开出版或公 开报道的数据;数据的直接 来源一是调查或观察,二是 实验。 3、统计调查方式:抽样调

统计学计算题

统计学计算题 27、【104199】(计算题)某班级30名学生统计学成绩被分为四个等级:A .优;B .良;C .中;D .差。结果如下: B C B A B D B C C B C D B C A B B C B A B A B B D C C B C A B D A A C D C A B D (1)根据数据,计算分类频数,编制频数分布表; (2)按ABCD 顺序计算累积频数,编制向上累积频数分布表和向下累计频数分布表。 【答案】 28、【104202】(计算题)某企业某班组工人日产量资料如下: 根据上表指出: (1)上表变量数列属于哪一种变量数列; (2)上表中的变量、变量值、上限、下限、次数; (3)计算组距、组中值、频率。 【答案】(1)该数列是等距式变量数列。 (2)变量是日产量,变量值是50-100,下限是,、、、、9080706050上限是,、、、、10090807060次数是111625199、、、、; (3)组距是10,组中值分别是 9585756555、、、、 ,频率分别是13.75%31.25%.20%23.75%11.25% 、、。 29、【104203】(计算题) 甲乙两班各有30名学生,统计学考试成绩如下:

(1)根据表中的数据,制作甲乙两班考试成绩分类的对比条形图; (2)比较两班考试成绩分布的特点。 【答案】 乙班学生考试成绩为优和良的比重均比甲班学生高,而甲班学生考试成绩为中和差的比重比乙班学生高。因此乙班学生考试成绩平均比乙班好。两个班学生都呈现出"两头大,中间小"的特点,即考试成绩为良和中的占多数,而考试成绩为优和差的占少数。 30、【104205】(计算题)科学研究表明成年人的身高和体重之间存在着某种关系,根据下面一组体重身高数据绘制散点图,说明这种关系的特征。 体重(Kg ) 50 53 57 60 66 70 76 75 80 85 身高(cm ) 150 155 160 165 168 172 178 180 182 185 【答案】散点图:

统计学试题及答案

统计学试题及答案文件排版存档编号:[UYTR-OUPT28-KBNTL98-UYNN208]

统计学试题及答案 一.单选题(每题2分,共20分) 1.在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设备 2.一组数据的均值为20, 离散系数为, 则该组数据的标准差为 A 50 B 8 C D 4 3.某连续变量数列,其末组为“500以上”。又知其邻组的组中值为480,则末组的组中值为 A 520 B 510 C 530 D 540 4.已知一个数列的各环比增长速度依次为5%、7%、9%,则最后一期的定基增长速度为 A.5%×7%×9% B. 105%×107%×109% C.(105%×107%×109%)-1 D. 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品,则物价增(减)变化的百分比为 A. –5% B. –% C. –% D. % 6.对不同年份的产品成本配合的直线方程为 , 回归系数b= -表示 A. 时间每增加一个单位,产品成本平均增加个单位 B. 时间每增加一个单位,产品成本平均下降个单位 C. 产品成本每变动一个单位,平均需要年时间

7.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600 公斤,其余亩产为500 公斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间: =70件, =件乙车间: =90件, =件 哪个车间日加工零件的离散程度较大: A甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是 A 用各年的环比增长速度连乘然后开方 B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间 A. 相关程度很低 B.不存在任何相关关系 C. 不存在线性相关关系 D.存在非线性相关关系 二. 多选题 (每题2分,共14分) 1. 下列数据中属于时点数的有 A. 流动资金平均余额20万元 B. 储蓄存款余额500万元 C. 商品销售额80万元 D. 固定资产300万元 E. 企业职工人数2000人 2. 在数据的集中趋势的测量值中,不受极端数值影响的测度值是

统计学原理考试知识点整理

第1章 绪论 1、统计的含义统计一词最基本的含义是对客观事物的数量方面进行核算和分析,是人们对客观事物的数量表现、数量关系和数量变化进行描述和分析的一种计量活动。 2、统计的特点P3 数量性 具体性 综合性 3、统计学的若干基本概念 总体与总体单位P10: 总体是指在某种共性的基础上由许多个别事物结合起来的整体,构成总体的个别事物叫总体单位; 总体的特征:同质性,大量性,差异性;总体的分类:有限总体与无限总体;标志、变异与变量P10: 标志,是指说明总体单位特征的名称。变异:总体单位之间品质和数量上的差异,即可变标志在总体各单位之间所表现出的差异。变量:可变的数量标志。 连续型变量与离散型变量联系和区别:连续型:变量值可作无限分割的变量离散型:变量值只能以整数出现的变量指标与标志P11 (指标,说明总体数量特征的概念)区别:第一,指标说明总体的特征,而标志则说明总体单位的特征。第二,指标只反映总体的数量特征,所有指标都要用数字来回答问题,没有用文字回答问题的指标。而标志既有反映数量也有反映品质。 第2 章统计调查 1、统计调查的含义及其在统计工作中的地位P13 含义:根据统计研究的目的,有组织、有计划地搜集统计资料的过程地位:是统计工作的第一阶段,是整个统计工作的基础一环 2、统计调查的基本原则P13-14 一、要实事求是,如实反映情况 二、要及时反映,及时预报 三、要数字与情况相结合 3、统计调查的组织形式:普查P14:含义:为搜集某种社会经济现象在某时某地的情况而专门组织的一次性全面调查、优缺点:,适用场合:主要用于一些重要项目呢的调查,如人口普查、耕地普查、基本单位普查、工业普查和库存普查等; 随机抽样调查P14:含义(按随机原则(机会均等原则)从总体中抽取部分单位进行调查,并借以推断和认识总体的一种统计方法)以及具体的抽样方法【第七章】系统抽样、多阶 简单随机、分层抽样、整群抽样、 段抽样)及适用场合;非随机抽样:含义(调查者有意识地或随意而 非随机地从总体中抽取部分单位进行调查的统计方法)以及具体的抽样方法P15 (重点抽样:只对总体中为数不多但影响颇大的重点单位进行研究的一种非

贾俊平 统计学(第六版)思考题答案

1、什么是统计学? 统计学是一门收集、分析、表述、解释数据的科学和艺术。 2、描述统计:研究的是数据收集、汇总、处理、图表描述、概括与分析等统计方法。 推断统计:研究的是如何利用样本数据来推断总体特征。 3、统计学据可以分成哪几种类型,个有什么特点? 按照计量尺度不同,分为:分类数据、顺序数据、数值型数据。 分类数据:只能归于某一类别的,非数字型数据。 顺序数据:只能归于某一有序类别的,非数字型数据。 数值型数据:按数字尺度测量的观察值,结果表现为数值。 按收集方法不同。分为:观测数据、和实验数据 观测数据:通过调查或观测而收集到的数据;不控制条件; 社会经济领域 实验数据:在试验中收集到的数据;控制条件;自然科学领域。 按时间不同,分为:截面数据、时间序列数据 截面数据:在相同或近似相同的时间点上收集的数据。 时间序列数据:在不同时间收集的数据。 4、举例说明总体、样本、参数、统计量、变量这几个概念。 总体:是包含全部研究个体的集合,包括有限总体和无限总体(范围、数目判定)样本:从总体中抽取的一部分元素的集合。 参数:用来描述总体特征的概括性数字度量。(平均数、标准差、比例等) 统计量:用来描述样本特征的概括性数字度量。(平均数、标准差、比例等) 变量:是说明样本某种特征的概念,其特点:从一次观察到下一次观察结果会呈现出差别或变化。(商品销售额、受教育程度、产品质量等级等) (对一千灯泡进行寿命测试,那么这千个灯泡就是总体,从中抽取一百个进行检测,这一百个灯泡的集合就是样本,这一千个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是参数,这一百个灯泡的寿命的平均值和标准差还有合格率等描述特征的数值就是统计量,变量就是说明现象某种特征的概念,比如说灯泡的寿命。) 5、变量可以分为哪几类? 分类变量:说明事物类别;取值是分类数据。 顺序变量:说明事物有序类别;取值是顺序数据 数值型变量:说明事物数字特征;取值是数值型数据。 变量也可以分为:随机变量和非随机变量;经验变量和理论变量 6、举例说明离散型变量和连续型变量。 离散型变量:只能取有限个、可数值的变量。(企业个数、产品数量) 连续型变量:可以在一个或多个区间中取任何值的变量。(年龄、温度、零件尺寸误差)7、请举出统计应用的几个例子。 市场调查、人口普查等。 8、请举出应用统计学的几个领域。 社会科学中的经济分析、政府政策制定等;自然科学中的物理、生物领域等。

统计学计算题

解:基期总平均成本=1800 120018007001200600+?+?=660 报告期总平均成本=1600 24001600 7002400600+?+?=640 总平均成本下降的原因是该公司产品的生产结构发生了变化, 即成本较低的甲企业产量占比上升而成本较高的乙企业产量占比相应下降所致。 2.某商贸公司从产地收购一批水果,分等级的收购价格和收购进入如下, (元) 收购总量收购总额6268.130.1832060.11664000.2127008320 1664012700)()(11=++++=∑ ∑====k i i i i k i i i X f X f X X 3.某中学正在准备给一年级新生定制校服。男生校服分小号、中号和大号三种规格, 分别适合于身高在160cm 以下、160~168cm 之间和168cm 以上的男生。一直一年级 新生中有1200名男生,估计他们身高的平均数为164cm ,标准差为4cm 。试由此粗 略估计三种规格男生校服分别准备多少套? 解:均值=164;标准差=4;总人数=1200 身高分布通常为钟形分布,按经验法则近似估计: 规格 身高 分布范围 比重 数量(套) 小号 160以下 0.15865 190.38 中号 160-168 均值±1*标准差 0.6827 819.24 大号 168以上 0.15865 190.38 合计 1200 4. 根据长期实验,飞机的最大飞行速度服从正态分布。先对某新型飞机进行了 15次试飞,测得各次试飞时的最大飞行速度(单位:米/秒)为: 422.2 417.2 42 5.6 425.8 423.1 418.7 428.2 438.3 434.0 412.3 431.5 413.5 441.3 423.0 420.3 试对该飞机最大飞行速度的数学期望值进行区间估计。(置信概率0.95) 解:样本平均数 X =425, S 2 n-1=72.049, S 14=8.488 X S 2.1916 1510.05/2()t -=2.1448 ?==/2 (n-1) t α×2.1916=4.7005 所求μ425-4.70<μ<425+4.7t0,即(420.30,429.70)。 5.某微波炉生产厂家想要了解微波炉进入居民家庭生活的深度。他们从某地区 已购买了微波炉的2200个居民户中用简单随机不还原抽样方法以户为单位抽取 了30户,询问每户一个月中使用微波炉的时间。调查结果依次为: 300 450 900 50 700 400 520 600 340 280 380 800 750 550 20 1100 440 460 580 650 430 460 450 400 360 370 560 610 710 200 试估计该地区已购买了微波炉的居民户平均一户一个月使用微波炉的时间。 解:根据已知条件可以计算得:14820y n 1 i i =∑= 8858600 y n 1 i 2i =∑= 估计量 n i i 1 1y n μ=== ∑ =301 *14820= 494(分钟) 估计量的估计方差 2s n v()v(y)(1)n N μ==- =30 1 *291537520*)2200301(-=1743.1653 其中 () ??? ? ??= = ∑∑==2n 1i 2i n 1 i 2 i 2n -y 1-n 1-y 1-n 1 s = () 2 494*308858600*1 301 -- =29 1537520=53017.93, S=230.26 6.一个市场分析人员想了解某一地区看过某一电视广告的家庭所占的比率。该地区共有居民1500户,分析人员希望以95%的置信度对总体比率进行估计,并要求估计的误差不超过5个百分点。另外,根据先前所做的一个调查,有25%的家庭看过该广告。试根据上述资料,计算要进行总体比率的区间估计,应当抽取的样本单位数。 解: ()222 2222211500 1.960.25(10.25) 115000.05 1.960.25(10.25) P Nz P P n N z P P αα-???-= = ?+-?+??- 241.695= 应抽取242户进行调查。 7.设销售收入X 为自变量,销售成本Y 为因变量。现已根据某百货公司12个月的有关资料 计算出以下数据(单位:万元)。() 2425053.73 t X X -=∑ 647.88X = () 2 262855.25t Y -=∑ 549.8 Y = ()()334229.09t t Y Y X X --=∑ 试利用以上数据:(1)拟合简单线性回归方程,并对回归系数的经济意义作出解释。(2)计算决定系数和回归估计的标准误差。(3)对2β进行显著水平为5%的显著性检验。(4)假定明年1月销售收入为800万元,利用拟合的回归方程预测相应的销售成本,并给出置信度为95%的预测区间。 解:(1) ()() () t t 22 Y Y X X 334229.09|=0.7863425053.73 t X X β--==-∑∑ 12|=Y-X=549.8-0.7863* 647.88=40.3720β β (2) ( )() ( )( ) 2 2 2 334229.092 20.999834425053.73*262855.25 t t t t Y Y X X r X X Y Y ?? --??===--∑∑∑ ()() 2 2 2 143.6340t e r Y =--=∑∑ 2.0889 e S = = (3)02 12:0,:0H H β=≠ 20.003204 S β = = 2220.7863 245.41200.003204 t S β β β == = t 值远大于临界值2.228,故拒绝零假设, 说明2在5%的显著性水平下通过了显著性检验 (4)40.3720 + 0.7863*800 = 669.41(f Y =万元) f e S = = 2n-2f f e Y t S α± 669.41 2.228*1.0667 =± = 669.41 2.3767± 即有:664.64 674.18f Y ≤ ≤ 8.对9位青少年的身高Y 和体重X 进行观测,并以得出以下数据: 2 i i Y=13.54;Y =22.9788∑∑ 2 i i X=472;X =28158∑∑ i X 803.02i Y =∑ (1) 以身高为因变量,体重为自变量,建立线性回归方程 (2) 计算残差平方和决定系数 (3) 计算身高和体重的相关系数并进行显著性检验(自由度为7, (4) 显著水平为0.05的t-分布双侧检验临界值为2.365) (5) 对回归系数2β进行显著性检验 9.某商业企业某年第一季度的销售额、库存额及流量费用额资料 品流转次数=销售额/平均库存额;商品流通费用=流通费用额/销售额)。 解:第一季度的月平均商品流转次数为: 第一季度的月平均销售额第一季度的平均库存额 ()()()2880+2170+23403 = 19802+1310+1510+156024-1 2466.333= =1.61 1530 第一季度的平均商品流通费用率为:第一季度的月平均流通费用第一季度的平均销售额 () ()230+195+2023 = 2880+2170+23403209 ==8.48%2466.333

统计学期末考试试题(含答案)..

西安交大统计学考试试卷 一、单项选择题(每小题2分,共20分) 1.在企业统计中,下列统计标志中属于数量标志的是(C) A、文化程度 B、职业 C、月工资 D、行业 2.下列属于相对数的综合指标有(B ) A、国民收入 B、人均国民收入 C、国内生产净值 D、设备台数 3.有三个企业的年利润额分别是5000万元、8000万元和3900万元,则这句话中有(B)个变量 A、0个 B、两个 C、1个 D、3个 4.下列变量中属于连续型变量的是(A ) A、身高 B、产品件数 C、企业人数 D、产品品种 5.下列各项中,属于时点指标的有(A ) A、库存额 B、总收入 C、平均收入 D、人均收入 6.典型调查是(B )确定调查单位的 A、随机 B、主观 C、随意D盲目 7.总体标准差未知时总体均值的假设检验要用到(A ): A、Z统计量 B、t统计量 C、统计量 D、X统计量 8. 把样本总体中全部单位数的集合称为(A ) A、样本 B、小总体 C、样本容量 D、总体容量 9.概率的取值范围是p(D ) A、大于1 B、大于-1 C、小于1 D、在0与1之间 10. 算术平均数的离差之和等于(A ) A、零 B、1 C、-1 D、2 二、多项选择题(每小题2分,共10分。每题全部答对才给分,否则不计分) 1.数据的计量尺度包括(ABCD ): A、定类尺度 B、定序尺度 C、定距尺度 D、定比尺度 E、测量尺度 2.下列属于连续型变量的有(BE ): A、工人人数 B、商品销售额 C、商品库存额 D、商品库存量 E、总产值 3.测量变量离中趋势的指标有(ABE ) A、极差 B、平均差 C、几何平均数 D、众数 E、标准差 4.在工业企业的设备调查中(BDE ) A、工业企业是调查对象 B、工业企业的所有设备是调查对象 C、每台设备是填报 单位D、每台设备是调查单位E、每个工业企业是填报单位 5.下列平均数中,容易受数列中极端值影响的平均数有(ABC ) A、算术平均数 B、调和平均数 C、几何平均数 D、中位数 E、众数 三、判断题(在正确答案后写“对”,在错误答案后写“错”。每小题1分,共10分) 1、“性别”是品质标志。(对) 2、方差是离差平方和与相应的自由度之比。(错) 3、标准差系数是标准差与均值之比。(对) 4、算术平均数的离差平方和是一个最大值。(错) 5、区间估计就是直接用样本统计量代表总体参数。(错) 6、在假设检验中,方差已知的正态总体均值的检验要计算Z统计量。(错)

统计学基础知识要点

第一章:导论 1、什么就是统计学?统计方法可以分为哪两大类? 统计学就是收集、分析、表述与解释数据的科学。统计方法可分为描述统计方法与推断统计方法。 2、统计数据可分为哪几种类型?不同类型的数据各有什么特点? 按照所采用的计量尺度不同,分为分类数据、顺序数据与数值型数据;按照统计数据的收集方法,分为观测的数据与实验的数据;按照被描述的对象与时间的关系,分为截面数据与时间序列数据。 按计量尺度分时:分数数据中各类别之间就是平等的并列关系,各类别之间的顺序就是可以任意改变的;顺序数据的类别之间就是可以比较顺序的;数值型数据其结果表现为具体的数值。按收集方法分时:观测数据就是在没有对事物进行人为控制的条件下等到的;实验数据的在实验中控制实验对象而收集到的数据。按被描述的对象与时间关系分时:截面数据所描述的就是现象在某一时刻的变化情况;时间序列数据所描述的就是现象随时间而变化的情况。 3、举例说明总体、样本、参数、统计量、变量这几个概念。 总体就是包含研究的全部个体的集合。比如要检验一批灯泡的使用寿命,这一批灯泡构成的集合就就是总体。样本就是从总体中抽取的一部分元素的集合。比如从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。参数就是用来描述总体特征的概括性数字度量。比如要调查一个地区所有人口的平均年龄,“平均年龄”即为一个参数。统计量就是用来描述样本特征的概括性数字度量。比如要抽样调查一个地区所有人口的平均年龄,样本中的“平均年龄”即为一个统计量。变量就是说明现象某种特征的概念。比如商品的销售额就是不确定的,这销售额就就是变量。 第二章:数据的收集 1、调查方案包括哪几个方面的内容? 调查目的,就是调查所要达到的具体目标。调查对象与调查单位,就是根据调查目的确定的调查研究的总体或调查范围。调查项目与调查表,要解决的就是调查的内容。 2、数据的间接来源(二手数据)主要就是公开出版或公开报道的数据;数据的直接来源一就是调查或观察,二就是实验。 3、统计调查方式:抽样调查、普查、统计报表等。 抽样调查就是从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种数据收集方法。特点:经济性,时效性强,适应面广,准确性高。普查就是为某一特定目的而专门组织一次性全面调查。我国进行的普查主要有人中普查、工业普查、农业普查等。统计报表就是按照国家有关法规的规定,自上而下地统一布置、自下而上地逐级提供基本统计数据的一种调查方式。 除此之外,还有重点调查与典型调查。 4、统计数据的误差通常就是指统计数据与客观现实之间的差距,误差的主要类型有抽样误差与非抽样误差两类。 抽样误差主要就是指在样本数据进行推断时所产生的随机误差(无法消除);非抽样误差就是人为因素造成的(理论上可以消除) 5、统计数据的质量评价标准:精度,即最低的抽样误差或随机误差;准确性,即最小的非抽样误差或偏差;关联性,即满足用户决策、管理与研究的需要;及时性,即在最短的时间里取得并公布数据;一致性,即保持时间序列的可比性;最低成本,即在满足以上标准的前提下,以最经济的方式取得数据。 6、数据的收集方法分为询问调查与观察实验。 7、统计调查方案包括哪些内容? 调查目的即调查所要达到的具体目标;调查对象与调查单位,调查对象就是根据调查目的确定的调查研究的总体或调查范围,调查单位就是构成调查对象中的每一个单位;调查项目与调查表,就就是调查的具体内容;其它问题,即明确调查所采用的方式与方法、调查时间及调查组织与实施细则。 第三章:数据整理与展示 1、对于通过调查取得的原始数据,应主要从完整性与准确性两个方面去审核。 2、对分类数据与顺序数据主要就是做分类整理,对数值型数据则主要就是做分组整理。 3、数据分组的步骤:确定组数、组距,最后制成频数分布表 统计分组时“上组限不在内”,相邻两组组限间断,上限值采用小数点。 组中值=(下限值+上限值)/2 4、频数:落在各类别中的数据个数;频数分布指把各个类别及落在其中的相应频数全部列出,并用表格形式表现出来;比例:某一类别数据占全部数据的比值;百分比:将对比的基数作为100而计算的比值;比率:不同类别数值的比值;分类数据的图示包括条形图与饼图。 5、直方图与条形图的差别:条形图就是用条形的长度表示各类别频数的多少,宽度则就是固定的,直方图就是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。其次,直方图的各矩形通常就是连续排列,而条形图则就是分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。 第四章:数据分布特征的测度 1、一组数据的分布特征可以从哪几个方面进行测度? 一就是分布的集中趋势反映各数据向其中心值靠拢或聚集的程度;二就是分布的离散程度,反映各数据据远离其中心值的趋势;三就是分布的形状,反映数据分布偏斜程度与峰度。 2、简述众数、中位数与均值的特点与应用场合及关系。

统计学思考题(20200920020408)

思考题: 1什么是统计学?怎样理解统计学与统计数据的关系? 答:⑴统计学是一门收集、整理、显示和分析统计数据的科学,其目的是探索数据的内在的数量规律性;⑵统计学是由收集、整理、显示和分析统计数据的方法组成的,这些方法来源 于对统计数据的研究,目的也在于对统计数据的研究; ⑶离开了统计数据,统计方法乃至统计学就失去其存在的意义。 2、简要说明统计数据的来源。 答:(1)统计数据来源于直接获取的数据和间接获取的数据;(2)直接获取的数据来自于直接 组织的调查、观察和科学试验;(3)间接获取的数据来源于报纸、杂志、统计年鉴、网络或 从调查公司或数据库公司等处购买。 3、简要说明抽样误差和非抽样误差。 答:(1)非抽样误差是由于调查过程中各有关环节工作失误造成的。它包括调查方案中有关规定或解释不明确所导致的填报错误、抄录错误、汇总错误,不完整的抽样框导致的误差,调查中由于被调查者不回答产生的误差等。从理论上看,这类误差是可以避免的;(2)抽样误差是利用样本推断总体时产生的误差。抽样误差对任何一个随机样本来讲都是不可避免的,可以计量,可以控制。 4、怎样理解均值在统计学中的地位? 答:(1 )反映了一组数据的中心点或代表值,是数据误差互相抵消后的客观事物必然性数量 特征的一种反映;(2)是统计分布的均衡点;(3)任何统计推断和分析都离不开均值。 5、解释洛伦茨曲线及其用途。 答:(1)洛伦茨曲线是累积次数分配曲线,由(美)洛伦茨()提出,依据(意)帕累托() 的“二八原理”和收入分配公式绘制;(2)用于描述收入和财富分配性质。 6、简述基尼系数的使用。 答:基尼系数用于反应收入分配的变化情况,取值在0?1之间 ①基尼系数小于,表明分配平均;②在?之间,分配比较适当;③是收入分配不公平的警 戒线,超过,收入分配不公平。 7、一组数据的分布特征可以从哪几个方面进行测度? 答:可以从三个方面测度:⑴分布的集中趋势反映的是数据一般水平的代表值或者数据分 布的中心值;⑵分布的离散程度反映的是分布离散和差异程度;⑶分布的偏态与峰 度反映数据的分布形态是否对称、偏斜的程度以及分布的扁平程度。 8、简述频率与概率的关系。 答:①频率反映的是某一事物出现的频繁程度;②概率是指事件在一次试验中发生的可能性; ③当观察次数n很大时,频率与概率非常接近。 9、概率的三种定义各有什么应用场合。 答:⑴古典概率实验的基本事件总数有限,每个基本事件出现的可能性相同;⑵统计概率 实验的基本事件总数有限,每个基本事件出现的可能性不完全相同;⑶主观概率随机事件发生的可能性既不能通过等可能事件个数来计算,也不能根据大量重复试验的频率来估计。 10、概率密度函数和分布函数的联系与区别表现在哪些方面? 答:(1)联系:概率密度函数的积分是分布函数,分布函数的导数是概率密度函数;别:概率密 (2)区 度函数的函数值是某点的概率密度,分布函数的函数值表示某个区间的概率。

统计学计算题整理

: 典型计算题一 1、某地区销售某种商品的价格和销售量资料如下: 根据资料计算三种规格商品的平均销售价格。 解: 36== ∑∑ f f x x (元) 点评: 第一,此题给出销售单价和销售量资料,即给出了计算平均指标的分母资料,所以需采用算术平均数计算平均价格。第二,所给资料是组距数列,因此需计算出组中值。采用加权算术平均数计算平均价格。第三,此题所给的是比重权数,因此需采用以比重形式

表示的加权算术平均数公式计算。 2、某企业1992年产值计划是1991年的105%,1992年实际产值是1991的的116%,问1992年产值计划完成程度是多少? 解: %110% 105% 116=== 计划相对数实际相对数计划完成程度。即1992年计划完成程度为 110%,超额完成计划10%。 点评:此题中的计划任务和实际完成都是“含基数”百分数,所以可以直接代入基本公式计算。 3、某企业1992年单位成本计划是1991年的95%,实际单位成本是1991年的90%,问1992年单位成本计划完成程度是多少? 解: 计划完成程度 %74.94% 95% 90==计划相对数实际相对数。即92年单位成本计划完成程度是 94.74%,超额完成计划5.26%。 点评:本题是“含基数”的相对数,直接套用公式计算计划完成程度。 4、某企业1992年产值计划比91年增长5%,实际增长16%,问1992年产值计划完成程度是多少? 解: 计划完成程度%110% 51% 161=++= 点评:这是“不含基数”的相对数计算计划完成程度,应先将“不含基数”的相对数还原成“含基数”的相对数,才能进行计算。 5、某企业1992年单位成本计划比1991年降低5%,实际降低10%,问1992年单位成

统计学主观题

二、主观题(共4道小题) 6. 指出下面的数据类型: (1)年龄 (2)性别 (3)汽车产量 (4)员工对企业某项改革措施的态度(赞成、中立、反对) (5)购买商品时的支付方式(现金、信用卡、支票) 参考答案: (1)年龄:离散数值数据 (2)性别:分类数据 (3)汽车产量:离散数值数据 (4)员工对企业某项改革措施的态度(赞成、中立、反对):顺序数据 (5)购买商品时的支付方式(现金、信用卡、支票):分类数据 7. 某研究部门准备抽取2000个职工家庭推断该城市所有职工家庭的年人均收入。要求: (1)描述总体和样本。 (2)指出参数和统计量。 参考答案: (1) 总体:全市所有职工家庭; 样本:2000个职工家庭 (2) 参数:全市所有职工家庭的人均收入; 统计量:2000个职工家庭的人均收入。 8. 一家研究机构从IT从业者中随机抽取1 000人作为样本进行调查,其中60%回答他们的月收入在5 000元以上,50%的人回答他们的消费支付方式是用信用卡。要求: (1)这一研究的总体是什么? (2)月收入是分类变量、顺序变量还是数值型变量? (3)消费支付方式是分类变量、顺序变量还是数值型变量? (4)这一研究涉及截面数据还是时间序列数据? 参考答案: (1) 所有IT从业者。 (2) 月收入十数值型变量 (3)消费支付方式是分类变量(4) 涉及截面数据 9.一项调查表明,消费者每月在网上购物的平均花费是200元,他们选择在网上购物的主要原因是“价格便宜”。要求: (1)这一研究的总体是什么? (2)“消费者在网上购物的原因”是分类变量、顺序变量还是数值型变量? (3)研究者所关心的参数是什么? (4)“消费者每月在网上购物的平均花费是200元”是参数还是统计量? (5)研究者所使用的主要是描述统计方法还是推断统计方法? 参考答案: (1)网上购物的所有消费者 (2) 分类变量 (3) 所有消费者网上购物的平均花费、所有消费者选择网上购物的主要原因 (4) 统计量

统计学基础知识及其概念

一、概念篇 总体:总体是指客观存在的,在同一性质基础上结合起来的许多个别事务的整体,亦称统计总体。 总体单位:总体单位是指构成统计总体的个别事物的总称。 指标:指标是反映总体现象数量特征的概念。 标志:标志是说明总体单位特征的名称。 统计调查:是按照预定的目的和任务,运用科学的统计调查方法,有计划有组织地向客观实际搜集统计资料的过程。 调查对象:是根据调查目的、任务确定的调查的范围,即所要调查的总体,它是由某些性质上相同的许多调查单位所组成的。 调查单位:是所要调查的现象总体中的个体,即调查对象中的一个一个具体单位,它是调查中要调查登记的各个调查项目的承担者。 报告单位:是负责向统计调查机关提交调查资料的单位。 普查:是专门组织的一次性的全面调查,用来调查属于一定时点上或时期内的现象的总量。 抽样调查:是从研究的总体中按随机原则抽取部分单位作为样本进行观察研究,并根据这部分单位的调查结果来推断总体,以达到认识总体的一种统计调查方法。抽样调查又称为概率抽样或称为随机抽样。 抽样调查是抽取总体重的部分单位,收集这些单位的信息,用来对总体进行推断的调查方法。这里的总体是指抽样推断所要认识的研究对象的整体,它是由所要研究的范围内具同一性质的全体单位所组成的整体。被抽中的部分单位构成样本。一般的,将总体记作N,将样本记作n。 面谈访问法:是由访问员与被调查者见面,通过直接访问来填写调查问卷的方法。 统计整理:是统计工作的一个重要环节,它是根据统计研究的任务与要求,对调查所取得的各种原始资料,进行审核、分组、汇总,使之系统化、条理化,从而得到反映总体特征的综合资料的过程。 复合分组:对同一总体选择两个或两个以上的标志重叠起来进行分组。 复合分组体系:多个复合分组组成的分组体系。 频数:是指分配数列中各组的单位数,也称次数。 频率:是将跟组的单位数(频数)与总体单位数相比,求得的用百分比表示的相对数,也称比率或比重。 统计指标:是反映总体现象数量特征的基本概念及其具体数值的总称。 总量指标:是反映总体规模的统计指标,表明现象总体发展的结果。 平均指标:是总体各单位某一数量标志一般水平的统计指标。 是将一个总体内各个单位在某个数量标志上的差异抽象化,以反映总体的一般水平的综合指标。 标志变异指标:是表明总体各个单位标志值的差异程度(离散程度)的指标。 强度相对指标:是不属于同一总体的两个性质不同但相互间有联系的总量指标对比的比值,是用来反映现象的强度、密度和普遍程度、利用程度的综合指标。 加权算数平均数:是在总体经过分组形成变量数列(包括单项数列和组距数列),有变量值和次数的情况下,将各组变量值分别与其次数相乘后加总求得标志总量,再除以总体单位数(即次数总和)而求得的数值。 标准差:是总体各单位变量值与其平均数的离差平方的算术平均数的平方根。 发展速度:是表明社会经济现象发展程度的相对指标,它是根据两个不同时期发展水平对比求得,说明报告期水平是基期水平的几倍或百分之几,常用倍数或百分数来表示。由于所采用的基期不同,发展速度又可分为定基发展速度和环比发展速度。 概率抽样:概率抽样在抽取样本时不带有任何倾向性,它通过从总体中随机抽选单位来避免这种偏差,因而对总体的推断更具代表性。 比例分析法:比例分析法又名“比率分析法”,是用倍数或百分比表示的分数式,即通过计算相关指标之间的相对比值,来揭示和对比不同规模、不同性质事物的水平和效益的好坏,或分析部分和整体之间比例关系的分析方法。 国家统计报表制度:国家统计报表制度是各级政府统计部门实施国家统计调查项目的业务工作方案,由国家统计局制定,或者由国家统计局和国务院有关部门共同制定。 现行国家统计报表制度分为周期性普查制度、经常调查制度和非经常性调查制度三大类。 周期性普查制度:是国家统计报表制度的一个类型,是就我国社会经济发展的状况,由国务院组织,每隔一段时

统计学思考题最新版本

思考题(仅供参考) 部分题目超出范围。同学们仅作上课讲授过的题目即可 二、判断题 1、对于定性变量不能确定平均数.( ) 2、根据组距式数列计算的平均数、标准差等都是近似值.( ) 3、任何平均数都受变量数列中的极端值的影响.( ) 4、中位数把变量数列分成了两半,一半数值比它大,一半数值比它小.( ) 5、任何变量数列都存在众数.( ) 6、如果x >,”,由此可以肯定B 企业生产的均衡性比A 企业好。 ( ) 18.对于分组资料,若不同时期相比,各组平均数均程度不同地上升,则总平均数一定上升。 ( ) 19.n 个同性质独立变量和的方差等于各个变量方差之和。 ( ) 20.n 个同性质独立变量平均数的方差等于各变量方差的平均数。 ( ) 21.变量的方差等于变量平均数的平方减变量平方的平均数。 ( ) 22、峰态一词是由统计学家Galton 于1905年首次提出的。它是对数据分布平峰或尖峰程度的测度。( ) 三、选择题 1、某工厂新工人月工资400元,工资总额为200000元,老工人月工资800元,工资总额80000元,则总平均工资为( ) A 、 600元 B 、 533.33元 C 、466.67元 D 、 500元 2、标志变异指标是反映同质总体的( ). A 、集中程度 B 、离中程度 C 、一般水平 D 、变动程度 3、权数对算术平均数的影响作用,实质上取决于( ) A 、作为权数的各组单位数占总体单位数比重的大小 B 、各组标志值占总体标志总量比重的大小

统计学计算题

第二章 六、计算题. 1.下面是某公司工人月收入水平分组情况和各组工人数情况: 月收入(元)工人数(人) 400-500 20 500-600 30 600-700 50 700-800 10 800-900 10 指出这是什么组距数列,并计算各组的组中值和频率分布状况。 2.抽样调查某省20户城镇居民平均每人全年可支配收入(单位:百元)如下: 88 77 66 85 74 92 67 84 77 94 58 60 74 64 75 66 78 55 70 66 ⑴根据上述资料进行分组整理并编制频数分布数列 ⑵编制向上和向下累计频数、频率数列 答:⑴⑵

第三章 六、计算题. 要求:⑴填满表内空格. ⑵对比全厂两年总产值计划完成程度的好坏。 ⑵该企业2005年的计划完成程度相对数为110.90%,而2006年只有102.22%,所以2005年完成任务程度比2006好。 ⒉某工厂2006年计划工业总产值为1080万吨,实际完成计划的110%,2006年计划总产值比2005年增长8%,试计算2006年实际总产值为2005年的百分比? 解:118.8% 3.某种工业产品单位成本,本期计划比上期下降5%,实际下降了9%,问该种产品成本

计划执行结果? 解:95.79% 4.我国“十五”计划中规定,到“十五”计划的最后一年,钢产量规定为7200万吨, 根据上表资料计算: ⑴钢产量“十五”计划完成程度; ⑵钢产量“十五”计划提前完成的时间是多少? 解:⑴102.08%;⑵提前三个月 5.某城市2005年末和2006年末人口数和商业网点的有关资料如下: 计算:⑴平均每个商业网点服务人数; ⑵平均每个商业职工服务人数; ⑶指出是什么相对指标。 ⑶上述两个指标是强度相对指标。 6.某市电子工业公司所属三个企业的有关资料如下:

相关文档