文档库 最新最全的文档下载
当前位置:文档库 › 统计复习资料

统计复习资料

统计复习资料
统计复习资料

总体:总体(population)是根据研究目的确定的同质观察单位(研究对象)的全体,实际上是某一变量值的集合。可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。总体population:根据研究目的而确定的同质观察单位的全体。

样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。样本sample:从总体中随机抽得的部分观察单位,其实测值的集合。

小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件。P值:P 值即概率,反映某一事件发生的可能性大小。统计学根据显著性检验方法所得到的P 值反应结果真实程度,一般以P ≤ 0.05 认为有统计学意义,P ≤0.01 认为有高度统计学意义,其含义是样本间的差异由抽样误差所致的概率等于或小于0.05 或0.01。P值是:1) 一种概率,一种在原假设为真的前提下出现观察样本以及更极端情况的概率。2) 拒绝原假设的最小显著性水平。3) 观察到的(实例的) 显著性水平。4) 表示对原假设的支持程度,是用于确定是否应该拒绝原假设的另一种方法。

小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实际实验中是不会发生的,数学上称之小概率原理,也称为小概率的实际不可能性原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。

计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料measurement data)。计量资料亦称定量资料、测量资料。计量资料measurement data定量资料quantitative data数值变量资料numerical variable 为观测每个观察单位某项指标的大小,而获得的资料。计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。计量资料enumeration data定性资料qualitative data无序分类变量资料unordered categorical variable 名义变量资料nominal variable 为将观察单位按某种属性或类别分组计数,分组汇总各组观察单位数后而得到的资料。等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。等级资料又称有序变量。等级资料

ranked data半定量资料semi-quantitative data有序

分类变量ordinal categorical variable资料为将观察

单位按某种属性的不同程度分成等级后分组计数,分

类汇总各组观察单位后而得到的资料。等级资料与计

数资料不同:属性分组有程度差别,各组按大小顺序

排列。等级资料与计量资料不同:每个观察单位未确

切定量,故亦称为半计量资料

抽样误差(sampling error )由于抽样而引起的总体

指标(参数)与样本指标(统计数)之间的差异。抽样误

差是由个体变异或其它随机因素造成的,是不可避免

的,但误差分布有规律可循,可进行估计和分析。

系统误差(systematic error):由于测量仪器结构本

身的问题、刻度不准确或测量环境改变等原因,在多

次测量时所产生的,总是偏大或总是偏小的误差,称为

系统误差。它带有规律性,经过校正和处理,通常可以

减少或消除。

统计工作的步骤:设计:设计内容包括资料收集、整

理和分析全过程总的设想和安排。设计是整个研究中

最关键的一环,是今后工作应遵循的依据。收集资料:

应采取措施使能取得准确可靠的原始数据。整理资料:

简化数据,使其系统化、条理化,便于进一步分析计

算。分析资料:计算有关指标,反映事物的综合特征,

阐明事物的内在联系和规律。分析资料包括统计描述

和统计推断。

实验设计的基本原则:随机化原则、对照的原则、重

复的原则。

参数:参数(paramater)是指总体的统计

指标,如总体均数、总体率等。总体参数是固定的常

数。多数情况下,总体参数是不易知道的,但可通过

随机抽样抽取有代表性的样本,用算得的样本统计量

估计未知的总体参数。

统计量:统计量(statistic)是指样本的

统计指标,如样本均数、样本率等。样本统计量可用

来估计总体参数。总体参数是固定的常数,统计量是

在总体参数附近波动的随机变量。

频数分布表的编制步骤:找出观察值中的最大值最小

值求极差。确定分组数和组距。确定组段。划记。统

计各组段的频数。1、描述资料的分布特征和分布类

型。2、便于进一步计算有关指标或进行统计分析。

3、发现特大、特小的可疑值。

4、据此绘制频数分

布图。描述数据分布集中趋势的指标和描述数据分布

离散程度的指标。描述数据分布集中趋势的指标算术

均数、几何均数、中位数。描述数据分布离散程度的

指标υ是正态分布的位置参数,描述正态分布的集中

趋势位置。正态分布以x =υ为对称轴,左右完全对

称。正态分布的均数、中位数、众数相同,均等于υ。

(2)σ描述正态分布资料数据分布的离散程度,σ越大,

数据分布越分散,σ越小,数据分布越集中。σ也称

为是正态分布的形状参数,σ越大,曲线越扁平,反

之,σ越小,曲线越瘦高。

标准正态分布是一种特殊的正态分布,标准正态分布

的υ= 0,σ2=1 ,通常用u(或Z)表示服从标准正

态分布的变量,记为υ~N(0,12)

应用:某些医学现象,如同质群体的身高、红细胞数、

血红蛋白量,以及实验中的随机误差,呈现为正态或

近似正态分布;有些指标(变量)虽服从偏态分布,

但经数据转换后的新变量可服从正态或近似正态分

布,可按正态分布规律处理。其中经对数转换后服从

正态分布的指标,被称为服从对数正态分布。

1. 估计频数分布一个服从正态分布的变量只要知

道其均数与标准差就可根据公式即可估计任意取值

范围内频数比例。

2. 制定参考值范围

(1)正态分布法适用于服从正态(或近似正态)分

布指标以及可以通过转换后服从正态分布的指标。

(2)百分位数法常用于偏态分布的指标。表3-1

中两种方法的单双侧界值都应熟练掌握。

3. 质量控制:为了控制实验中的测量(或实验)误

差,常以作为上、下警戒值,以作为上、下控制值。

这样做的依据是:正常情况下测量(或实验)误差服

从正态分布。

4. 正态分布是许多统计方法的理论基础。检验、方

差分析、相关和回归分析等多种统计方法均要求分析

的指标服从正态分布。许多统计方法虽然不要求分析

指标服从正态分布,但相应的统计量在大样本时近似

正态分布,因而大样本时这些统计推断方法也是以正

态分布为理论基础的。

95%正常值范围为:x±1.96S99%正常值范围为:

x±2.58S

抽样研究中,样本统计量与总体参数间的差别称为抽

样误差(sampling error)。统计上用标准误(standard

error,SE)来衡量抽样误差的大小,即样本均数的

标准差,是描述均数抽样分布的离散程度及衡量均数

抽样误差大小的尺度。

t分布的图形特征:以0为中心,左右对称的单峰分布。t分布是一簇曲线,其形态变化与n(确切地说与自由度ν)大小有关。自由度ν越小,t分布曲线越低平;自由度ν越大,t分布曲线越接近标准正态分布(u分布)曲线。对应于每一个自由度ν,就有一条t分布曲线,每条曲线都有其曲线下统计量t的分布规律,计算较复杂。

t 分布与正态分布比较的区别:t 分布与标准正态分布相比有以下特点:①都是单峰、对称分布;②t 分布峰值较低,而尾部较高;③随自由度增大,t 分布趋近与标准正态分布;当ν趋向∞,t 分布的极限分布是标准正态分布。

置信区间:在统计学中,一个概率样本的置信区间(Confidence interval)是对这个样本的某个总体参数的区间估计。置信区间展现的是这个参数的真实值有一定概率落在测量结果的周围的程度。给出的是被测量参数的测量值的可信程度。

参数估计:指用样本指标值(统计量)估计总体指标值(参数)。参数估计有两种方法:点估计和区间估计。

可信区间与参考值范围的不同点:1.从意义和用途来看:95%参考值范围是指同质总体内包括95%个体值的估计范围,而总体均数95%可信区间是指按95%可信度估计的总体均数的所在范围。可信区间用于估计总体参数,总体参数只有一个。参考值范围用于估计变量值的分布范围,变量值可能很多甚至无限。

2.从计算公式看:若指标服从正态分布,95%参考值范围的公式是:±1.96s。总体均数95%可信

区间的公式是:。

前者用标准差,后者用标准误。前者用1.96,后者用α为0.05,自由度为v的t界值。

t检验的应用条件:要求各样本来自相互独立的正态总体且各总体方差齐。

t检验的类型:单样本t检验,独立t检验,配对t 检验完全随机设计(completely random design):完全

随机设计仅涉及一个处理因素(但可为多水平),故

又称单因素(one-way)设计。它是将受试对象按随

机化的方法分配到各个处理组中,观察实验效应,临

床试验中的随机对照试验也属于此类设计。

配对设计(paired design):是将受试对象按一定条

件匹配成对,再随机分配每对中的两个受试对象到不

同处理组。配对的因素是影响实验效应的主要非处理

凶素。

假设检验的基本步骤:1.建立假设,确定检验水准α2.

根据研究目的和设计类型选择适合的检验方法3.确

定P值并作出统计结论

假设检验时应注意的事项:(一)要有严密的抽样研

究设计;样本必须是从同质总体中随机抽取的;要保

证组间的均衡性和资料的可比性。(二)根据现有的

资料的性质、设计类型、样本含量大小正确选用检验

方法。(三)对差别有无统计学意义的判断不能绝对

化,因检验水准只是人为规定的界限,是相对的。(四)

统计学上差别显著与否,与实际意义是有区别的。

Ⅰ型错误又称第一类错误(type Ⅰerror):拒绝了实

际上成立的,为“弃真”的错误,其概率通常用

表示。可取单尾也可取双尾,假设检验时研

究者可以根据需要确定值大小,一般规定=

0.05或=0.01

,其意义为:假设检验中如果拒绝

时,发生Ⅰ型错误的概率为5%或1%,即100

次拒绝的结论中,平均有5次或1次是错误的。

Ⅱ型错误又称第二类错误(type Ⅱerror):不拒绝

实际上不成立的,为“存伪”的错误,其概率通

常用表示。只取单尾,假设检验时值

一般不知道,在一定情况下可以测算出,如已知两总

体的差值(如)、样本含量和

检验水准。

方差分析(analysis of variance,ANOVA )的基本

思想就是根据资料的设计类型,即变异的不同来源将

全部观察值总的离均差平方和(sum of squares of

deviations from mean,SS)和自由度分解为两个或

多个部分,除随机误差外,其余每个部分的变异可由

某个因素的作用(或某几个因素的交互作用)加以解

释,如各组均数的变异SS 组间可由处理因素的作用

加以解释。通过各变异来源的均方与误差均方比值的

大小,借助F 分布作出统计推断,判断各因素对各

组均数有无影响。

方差分析的应用条件(1)各样本是相互独立的随机

样本,且来自正态分布总体。(2)各样本的总体方

差相等,即方差齐性(homoscedasticity)。

分类资料的统计描述:率(强度相对数,频率相对数)、

构成比、相对比

应用相对数时应注意的问题⑴计算相对数的分母一

般不宜过小。⑵分析时不能以构成比代替率。⑶不

能用构成比的动态分析代替率的动态分析。⑷对观

察单位数不等的几个率,不能直接相加求其总率。⑸

在比较相对数时应注意可比性。⑹对样本率(或构

成比)的比较应随机抽样,并做假设检验。

率的标准化的基本思想:要比较两个总率时,发现两

组资料的内部构成(如年龄、性别构成等)存在明显

不同,而且影响到了总率的结果,这时就不宜再直接

比较总率,而应考虑采用标准化法。标准化法的基本

思想,就是采用统一的标准(统一的内部构成)计算

出消除内部构成不同影响后的标准化率(调整率),

然后再进行比较。

二项分布,Piosson分布在什么条件下接近正态分

布:π不接近0也不接近1时μ大于等于20时

四格表的计算:

参数统计:样本所来自的总体分布具有某个已知的函

数形式,而其中有的参数是未知的,统计分析的目的

就是对这些未知的参数进行估计或检验。此类方法称

为参数统计。

非参数统计:样本所来自的总体分布难以用某种函数

式来表达,还有一些资料的总体分布的函数式是未

知的,只知道总体分布是连续型的或离散型的,解决

这类问题的一种不依赖总体分布的具体形式的统计

方法。

非参数统计的特点:(1)样本所来自的总体的分布形

式为任何形式,甚至是未知的,都能适用。(2)收集

资料方便,可用“等级”或“符号”来评定观察结果。(3)

多数非参数方法比较简便,易于理解和掌握。(4)缺

点是损失信息量,

适用于参数统计法的资料用非参数

统计方法进行检验将降低检验效能。适用范围:(1)等级资料。(2)偏态分布资料。(3)各组离散程度相差悬殊(4)个别数据偏离过大,5)分布类型不明。(6)初步分析(7)对于一些特殊情况

非参数检验的优缺点:优点:1、非参数统计方法要求的假定条件比较少,因而它的适用范围比较广泛。

2、多数非参数统计方法要求的运算比较简单,可以迅速完成计算取得结果,因而比较节约时间。

3、大多数非参数统计方法在直观上比较容易理解,不需要太多的数学基础知识和统计学知识。

4、大多数非参数统计方法可用来分析如象由等级构成的数据资料,而对计量水准较低的数据资料,参数统计方法却不适用。

5、当推论多达3个以上时,非参数统计方法尤具优越性。缺点:1、由于方法简单,用的计量水准较低,因此,如果能与参数统计方法同时使用时,就不如参数统计方法敏感。若为追求简单而使用非参数统计方法,其检验功效就要差些。这就是说,在给定的显著性水平下进行检验时,非参数统计方法与参数统计方法相比,第Ⅱ类错误的概率β要大些。

2、对于大样本,如不采用适当的近似,计算可能变得十分复杂。

配对设计的符号秩和检验方法(1)假设:H0:差值总体中位数Md=0H1:Md≠0α=0.05 (2)求差值(3)编秩次:依差值的绝对值从小到大编秩次。(4)求秩和并确定检验统计量(5)确定P 值和作出推断结论

线性相关系数:表示两个变数线性相关方向及程度的统计数或参数。又叫直线相关系数,简称相关系数。,|R|的极值为1,|R|越大(接近1),则直线关系越好。线性相关系数取值范围-1≤r≤1

样本相关系数r的假设检验:r 界值表法。t检验法。线性相关或回归应用应注意的问题:⑴作回归分析和相关分析时要有实际意义,不能把毫无关联的两种现象作回归、相关分析,必须对两种现象间的内在联系有所认识。⑵在进行回归分析和相关分析之前,应绘制散点图。但观察点的分布有直线趋势时,才适宜作回归、相关分析。如果散点图呈明显曲线趋势,应使之直线化再行分析。散点图还能提示资料有无可疑异常点。⑶直线回归方程的应用范围一般以自变量的取值范围为限。若无充分理由证明超过自变量取值范围外还是直线,应避免外延。⑷双变量的小样本经t 检验只能推断两变量间有无直线关系,而不能推断相关的紧密程度,要推断相关的紧密程度,样本含量必须很大。⑸相关或回归关系不一定是因果关系,也可能是伴随关系,有相关或回归关系不能证明事物间确有内在联系。

秩相关的应用适用范围秩相关,又称等级相关(rank correlation),是用双变量等级数据作直线相关分析,适用于下列资料⒈不服从双变量正态分布而不宜作积差相关分析⒉总体分布型未知⒊用等级表示的原始数据。

相关与回归区别:1.意义:相关反映两变量的相互关系,即在两个变量中,任何一个的变化都会引起另一个的变化,是一种双向变化的关系。回归是反映两个变量的依存关系,一个变量的改变会引起另一个变量的变化,是一种单向的关系。2.应用:研究两个变量的相互关系用相关分析。研究两个变量的依存关系用回归分析。3.研究性质:相关是对两个变量之间的关系进行描述,看两个变量是否有关,关系是否密切,关系的性质是什么,是正相关还是负相关。回归是对两个变量做定量描述,研究两个变量的数量关系,已知一个变量值可以预测出另一个变量值,可以得到定量结果。4.相关系数r与回归系数b :r与b的绝对值反映的意义不同。r的绝对值越大,散点图中的点越趋向于一条直线,表明两变量的关系越密切,相关程度越高。b的绝对值越大,回归直线越陡,说明当X变化一个单位时,Y的平均变化就越大。反之也是一样。

联系:1. r与b值可相互换算;2. r与b正负号一致;

3. r与b的假设检验等价;

4. 回归可解释相关。相关系数的平方r2(又称决定系数)是回归平方和与总的离均差平方和之比,故回归平方和是引入相关变量后总平方和减少的部分。

回归系数的估计原则:最小二乘(least squares)原则应用直线回归时的注意事项:1.作回归分析要有实际意义,不能把毫无关联的两种现象作回归分析,必须对两种现象间的内在联系有所认识。2.在进行直线回归分析之前,应绘制散点图,当观察点的分布有直线趋势时,才适宜作直线回归分析,散点图还能提示资料有无异常点。异常点的存在往往对方程中的系数(a、b)的估计产生较大影响。因此,需对异常点进行复查。3.建立直线回归方程后,要对系数进行假设检验,以确定回归方程有无意义。4.直线回归方程的适用范围一般以自变量的取值范围为限,避免外延。获得自变量值的手段也应与建立方程时相同。否则会产生较大偏差。

教育统计学考试复习资料

第一章:1、何谓心理与教育统计学?学习它有何意义? 教育统计学是专门研究如何运用统计学原理和方法,搜集、整理、分析教育科学研究中获得的随机性数据资料,并根据这些数据资料所传递的信息,进行科学推论找出教育活动规律的一门科学。具体讲,就是在教育研究中,通过调查、实验、测量等手段有意获取一些数据,并将得到的数据按统计学原理和步骤加以整理、计算、绘制图表、分析、判断、推理,最后得出结论的一种研究方法。 意义:(1)统计学为科学研究提供了一种科学方法。(2)教育统计学是教育科学研究定量分析的重要重要工具。 (3)广大教育工作者学习教育统计学既可以顺利地阅读国内外先进的研究成果,又可以提高工作的科学性和效率,同时也为学习教育测量打下基础。 2、教育科学研究数据的特点 (1)教育科学研究数据与结果多用数字形式呈现;(2)教育科学研究数据具有随机性和变异性;(3)教育科学研究数据具有规律性;(4)教育科学研究的目的是通过部分数据来推测总体特征。总之,在教育科学实验或调查中,所获得的数据都具有变异性与规律性的特点。 3、思考题:选用统计方法有哪几个步骤? ①要分析一下实验设计是否合理,即所获得的数据是否适合用统计方法去处理,正确的数量化是应用统计方 法的起步,如果对数量化的过程及其意义没有了解,将一些不着边际的数据加以统计处理是毫无意义的。②要分析实验数据的类型。不同数据类型所使用的统计方法有很大差别,了解实验数据的类型和水平,对选用恰当的统计方法至关重要。③要分析数据的分布规律,如总体方差的情况,确定其是否满足所选用的统计方法的前提条件。 4、教育统计学的分类 (1)依研究的问题实质来划分,教育统计学的研究内容可划分为描述一件事物的性质、比较两件事物之间的差异、分析影响事物变化的因素、一件事物两种不同属性之间的相互关系、取样方法等等。(2)依统计方法的功能进行分类,教育统计学的研究内容可分为描述统计、推论统计和实验设计。 5、描述统计:主要研究如何整理科学实验或调查得来的大量数据,描述一组数据的全貌,表达一件事物的性 质。 具体内容包括:(1)数据如何分组,如何使用各种统计图表描述一组数据的分布情况;(2)怎样计算一组数据的特征值,简缩数据,进一步描述一组数据的全貌;(3)表示一事物两种或两种以上属性间相互关系的描述及各种相关系数的计算及应用条件,描述数据分布特征的峰度及偏度系数计算方法等。 6、推论统计:主要研究如何通过局部数据所提供的信息,推论总体(或称全局)的情形。 具体内容包括:(1)如何对假设进行检验,即各种各样的假设检验,包括大样本检验方法(z检验),小样本检验方法(t检验),各种计数资料的假设检验的方法(百分数检验、χ2检验等),变异数分析的方法(F检验),回归分析方法等等。(2)总体参数的估计方法。(3)各种非参数的统计方法等。 7、思考题:描述统计、推论统计和实验设计这三部分统计内容有何关系? 教育统计学的三个组成部分的内容不是截然分开的,而是相互联系的。描述统计是推论统计的基础,推论统计离不开描述统计计算所获得的特征值;描述统计只是对数据进行一般的分析归纳,如果不进一步应用推论统计作进一步的分析,描述统计的结果就不会产生更大的价值和意义,达不到统计分析的最终目的要求。同样,只有良好的实验设计才能使所获得的数据具有意义,进一步的统计处理才能说明问题。当然一个好的实验设计,也必须符合基本的统计方法的要求,否则,再好的设计,如果事先没有确定适当的统计方法处理,在处理研究结果时可能会遇到许多麻烦问题。 8、教育统计与心理统计的异同 相同之处:二者的研究对象都是人,教育现象在很多情况下要通过人的心理现象去观察和分析,统计方法基本相同。不同之处:①在统计方法上:在教育方面的研究中,大样本的统计方法应用较多;而在心理学上小样本的方法较多。②在实验设计的水平上:教育实验中控制因素较难,采用自然实验、准实验设计方式较多,对统计结果的解释需要特别谨慎;而心理学实验则在实验室条件下进行较多,对各种实验变量的控制相对容易,统计处理结果的解释也较易进行。 9、数据的类型 (一)从数据的观测方法和来源划分,研究数据可区分为计数数据和测量数据两大类。 计数数据是指计算个数的数据,一般属性的调查获得的是此类数据,它具有独立的分类单位,一般都取整数的形式。测量数据是借助于一定的测量工具或一定的测量标准而获得的数据。 (二)根据数据反映的测量水平,可把数据区分为称名数据、顺序数据、等距数据和比率数据四种类型。

厦门大学统计学原理期末试题与答案完整版

厦门大学网络教育 2013-2014学年第一学期 《统计学原理》复习题 、单选题 1、统计调查方法体系中,作为“主体”的是( A ) A .经常性抽样调查 B.必要的统计报表 2、考虑全国的工业企业的情况时,以下标志中属于不变标志的有( A .产业分类 B.职工人数 C.劳动生产率 3、某地区抽取3个大型钢铁企业对钢铁行业的经营状况进行调查,这种调查是 4、下列这组数列15,17,17,18,22,24,50,62的中位数是(C )。 现象之间的相关程度越低,贝刑关系数越( 接近+1 B 接近-1 接近0 8、假定其他变量不改变,研究一个变量和另一个变量间的相关关系的是( 9、已知两个同类型企业职工平均工资的标准差分别为 8元,12元,则两个企业职 工平均工资的代表性是(A ) 10、( C 。是标志的承担者。 C.重点调查及估计推算 D.周期性普查 D.所有制 A .普查 B .典型调查 C.重点调查 D .抽样调查 A.17 B.18 C.20 5、标志变异指标中最容易受极端值影响的是( A.极差 B.平均差 &简单分组与复合分组的区别在于( 总体的复杂程度不同 选择分组标志的性质不同 A. C. D.22 C. B. D. 标准差 D.标准差系数 ) 组数多少不同 选择的分组标志的数量不同 7、 A.偏相关 B.正相关 C.完全相关 D.复相关 A.甲大于乙 B.乙大于甲 C. 一样的 D.无法判断

11、 下列各项中属于数量标志的是(A ) A.年龄 B.学历 C.民族 D.性别 12、 某商品价格上涨了 5%,销售额增加了 10%,则销售量增加了( C ) A. 15% B. 5.2 % C. 4.8 % D. 2 % 13、某变量数列末组为开口组,下限是 500;又知其邻组的组中值是 480,则该组 的组 中值应为(D )0 B.时间和指标数值 C.时间和次数 20、现象总体中最普遍出现的标志值是( A ) A.变量 B.总体 C.总体单位 D.指标 A. 490 B. 500 C. 510 D. 520 14、根据最小二乘法原理所配合的一元线性回归方程,是使( B )0 无 (Y -Y?)2 为最小 送(Y -Y?) = 0 A S (Y -Y ) = 0 C 送(Y -Y )为最小 15、 以下不是统计量特点的是( A.不确定 B.已知 16、 不属于专门调查的有(A A.统计年报 B.抽样调查 C.未知 C 普查 17、 今有N 辆汽车在同一距离的公路上行驶的速度资料, Z xf B. ----- Z f C 旦 C 7 x D.不唯一 D.典型调查 m 表示路程,x 表示速度, ) D. 18、 抽样推断的特点有(B )0 A.事先人为确定好样本 C.缺乏一定的科学性和可靠性 19、 时间数列的构成要素是( B.按随机原则抽取样本 D.事先无法计算和控制抽样误差 A.变量和次数 D.主词和宾词 A.众数 B.中位数 C.平均数 D.频数 21、定基发展速度等于相应的各环比发展速度(C A.之和 B.之差 C.之积 D.之商 22、平均指标不包括(A ) 0 A.标准差 B.调和平均数

大学统计学期末考试试题

河南科技学院2016-2017学年第一学期期终考试 统计学试卷(A 卷) 适用班级:人力141-人力145。 注意事项:1.在试卷的标封处填写院(系)、专业、班级、姓名和准考证号。 2. 考试时间共100分钟。 一、名词解释 参数 分层抽样 离散系数 中心极限定理 参数估计 号证考准

、选择题. 1、统计学的研究对象是( ) A 、各种现象的内在规律 B C 、统计活动过程 D 、各种现象的数量方面 、总体与样本的关系 2、以产品的等级来衡量某种产品的质量好坏,则该产品等级是( A 、数量指标 B 、质量指标 C 、数量标志 3、一个统计总体( )。 A 、只能有一个标志 B C 、可以有多个标志 D D 品质标志 、只能有一个指标 、可以有多个指标 4、对某企业500名职工的工资收入状况进行调查, 则总体单位是( ) A 、每一名职工 B C 、500名职工 D 5、在全国人口普查中,( )。 A 、女性是品质标志 B C 、人口的平均寿命是数量指标 D 6重点调查的重点单位是( )。 A 、收集数据资料的重点单位 、每一名职工的工资水平 、500名职工的工资总额 、某人的年龄30岁是变量 、全国人口总数是统计指标 B 、在全局工作中处于重要地位的单位 C 这些单位的标志值在总体标志总量中占有很大比重 D 这些单位数量占总体单位数的很大比重 7、 要了解我国煤炭生产的基本情况,最适合的调查方式是( ) A 、抽样调查 B 、重点调查 C 、典型调查 D 普查 8、 对一批商品进行质量检验,最适宜采用的方法( )。 A 、全面调查 B 、抽样调查 C 、典型调查 D 重点调查 9、 目前我国城镇职工家庭收支情况调查是采用( )。 A 、普查 B 抽样调查 C 、典型调查 D 重点调查 10、 下列分组中属于按品质标志分组的是( ) A 、学生按考试分数分组 E 、产品按品种分组

2017统计学考试复习资料

统计学考试复习资料 简答题(12题选5个) 1、统计数据的类型有哪些? (1)、按计量层次分类: a.分类数据:只能归于某一类别的非数字型数据;对事物进行分类的结果,数据表现为类别,用文字来表述,例如:人口按性别分为男、女两类。 b.顺序数据:只能归于某一有序类别的非数字型数据;对事物类别顺序的测度,数据表现为类别,用文字来表述,例如:产品分为一等品、二等品、三等品、次品等。 c.数值型数据:按数字尺度测量的观察值,结果表现为具体的数值,对事物的精确测度,例如:身高为175cm、168cm、183cm。 (2).按收集方法分类: a.观测的数据:通过调查或观测而收集到的数据在没有对事物人为控制的条件下而得到的有关社会经济现象的统计数据几乎都是观测数据。 b.试验的数据:在试验中控制试验对象而收集到的数据,比如,对一种新药疗效的试验,对一种新的农作物品种的试验等自然科学领域的数据大多数都为试验数据。 (3).按时间状况分类: a.截面数据:在相同或近似相同的时间点上收集的数据 描述现象在某一时刻的变化情况,比如,2005年我国各地区的国内生产总值数据。 b.时间序列数据:在不同时间上收集到的数据描述现象随时间变化的情况比如,2000年至2005年国内生产总值数据。 2、简述数据误差的来源? (1)抽样误差:由于抽样的随机性带来的误差,所有样本可能的结果与总体真值

之间的平均性差异,影响抽样误差的大小的因素为样本量的大小和总体的变异性。 (2)非抽样误差:相对抽样误差而言,除抽样误差之外的,由于其他原因造成的样本观察结果与总体真值之间的差异。存在与所有的调查之中:概率抽样、非概率抽样、全面性调查。有抽样框误差、回答误差、无回答误差、调查员误差、测量误差。 3、衡量数据离散程度的指标有哪些? 衡量数据离散程度的指标有:(1).异众比率,用于测度分类数据的离散程度,衡量众数对一组数据的代表程度;(2).四分位差,用于测量顺序数据的离散程度,衡量中位数对一组数据的代表程度;(3).方差和标准差,用于测度数据离散程度的最常用测度值,衡量均值对一组数据的代表程度。 4、为什么说正态分布是客观现象中最主要的分布? 正态分布有极其广泛的实际背景,生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布。从理论上看,正态分布具有很多良好的性质,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t分布、F分布等。 5、请你说明小概率原理的含义? 在概率论中,我们将发生概率很小一般来说不超过百分之五的事件称为小概率事件,小概率原理指的是在假设检验中,我们提出一个假设,用小概率事件去检验,如果小概率事件发生了,证明我们的假设有问题。 6、评价估计量的标准有哪些?并解释他们的含义。 在实际工作中,总体参数往往是未知的,需要使用样本统计量来估计总体参数。衡量估计量优劣的标准一般有以下三个: (1)无偏性:无偏性不是要求估计量与总体参数不得有偏差,因为这是不可能的,既然是抽样,必然存在抽样误差,不可能与总体完全相同。无偏性指的是如果对这同一个总体反复多次抽样,则要求各个样本所得出的估计量(统计量)的平均值等于总体参数。符合这种要求的估计量被称为无偏估计量。(2)有效性:估计量与总体之间必然存在着一定的误差,衡量这个误差大小的一个指标就是方差,

《统计学原理》期末复习资料(1)

2015秋季学期《统计学原理》复习资料 一、单选题 1. 某厂4月份产量与1月份产量相比增长了10%,若已知4月份产量为1000,那么1月份的产量为(A )。 A.909.09 B.976.45 C.968.73 D.1032.28 2.以下各项属于品质标志的有(B )。 A.工龄 B.健康状况 C.工资水平 D.劳动时间利用率 3.连续变量( C)。 A.表现形式为整数 B.取值可一一列举 C.取值连续不断,不能一一列举 D.一般都四舍五入取整数 4.了解某公司职工文化程度情况,总体单位是( B)。 A.该公司全体职工 B.该公司每一位职工 C.该公司全体职工文化程度 D.该公司每一位职工文化程度 5.在某市工业设备普查中,调查单位是(D )。 A. 该市每一家工业企业 B. 该市全部工业设备 C. 该市全部工业企业 D. 某公司新推出了一种饮料产品,欲了解该产品在市场上的受欢迎程度,公司派人到各商 场、超市随机调查了200 名顾客。该公司采用的调查方法是(C )。 A. 直接观察法 B. 报告法 C. 访问调查法 D.很难判断 7.企业要对流水生产线上的产品质量实行严格把关,那么,在质量检验时最合适采用的调 查组织方式是( D)。 A. 普查 B. 重点调查 C.典型调查 D. 抽样调查 8. 统计资料按数量标志分组后,处于每组两端的数值叫(C )。 A. 组距

C. 组限 D. 组中值 9.统计分组的核心问题是(A )。 A.选择分组的标志 B.划分各组界限 C.区分事物的性质 D.对分组资料再分组 10. 在分组的情况下,总体平均指标数值的大小(C )。 A. 只受各组变量值水平的影响,与各组单位数无关 B. 只受各组单位数的影响,与各组变量值水平无关 C. 既受各组变量值水平的影响,又与各组次数有关 D. 既不受各组变量值水平的影响,也部受各组次数的影响 11. 在组距数列中,用组中值作为计算算术平均数直接依据的假定条件是(D )。 A. 各组次数必须相等 B. 各组必须是闭口组 C. 总体各单位变量值水平相等 D. 总体各单位变量值水平在各组内呈均匀分布 12. 标志变异指标反映了总体各单位变量值分布的(B )。 A. 集中趋势 B. 离散趋势 C. 变动趋势 D. 长期趋势 13. 抽样误差( D)。 A.既可以避免,也可以控制 B. 既不可以避免,也不可以控制 C. 可以避免, 但不可以控制 D. 不能避免, 但可以控制 14. 抽样平均误差反映了样本估计量与总体参数之间的(C )。 A. 实际误差 B. 可能误差范围 C. 平均差异程度 D. 实际误差的绝对值 15.凡是用来反映现象数量对比关系的相对数被称为( C)。 A. 增(减)量 B. 增加速度 C. 广义指数 D. 狭义指数 16.用来反映个别事物数量对比的相对数称为( C)。 A. 总指数 B. 类指数 C. 个体指数 D. 平均指数 17.在综合指数的变形中,加权算术平均指数所用权数是(D )。

大学统计学简答题复习及答案

习题一总论 1?简述统计总体和总体单位的含义及其关系。 统计总体(简称总体)是指统计所研究的事物的全体,它是由客观存在的具有某种共同性质的许多个别事物组成的集合体。总体单位是指构成统计总体的个别事物,是组成总体的基本单位,简称个体。统计总体和总体单位所指的具体内容不是固定不变的,而是随着研究的目的不同而变化的。总体可以变为总体单位,总体单位可以变为总体。 2 ?什么是指标和标志?指标与标志的关系如何? 指标即统计指标,指反映统计总体综合数量特征的概念和数值。标志指说明总体单位特征的名称。指标与标志的区别:①指标是说明总体特征的,而标志是说明总体单位特征的;②所有指标都能用数值表示,而标志中的数量标志能用数值表示,品质标志却通常不能用数值表示。指标与标志的联系:①指标是对总体中各单位标志表现进行综合的结果,有许多统计指标其数值是由数量标志值汇总而来的,品质标志本身虽无数值,但许多指标却是按品质标志分组计算出来的。②指标和数量标志之间存在着变换关系,由于研究目的的变化,原来的总体变成总体单位,则相对应的统计指标就变成数量标志;反之,则相对应的数量标志就变成了统计指标。 习题二统计调查 1.完整的统计调查方案应包括哪些主要内容? 应包括:①确定调查目的;②确定调查对象和调查单位;③确定调查内容,拟订调查表;④ 确定调查时间和调查期限;⑤确定调查的组织和实施计划。 2.调查对象、调查单位和填报单位有何区别? 调查对象是指根据调查目的确定的需要进行调查研究的现象总体,它是由性质相同的许多个别单位组成的。调查单位是指调查对象中所要调查的具体单位,它是进行登记的标志的承担者;报告单位也叫填报单位,它是提交调查资料的单位,它与调查单位有时一致,有时不一致。 3?重点调查与典型调查的区别是什么? 主要区别表现在两个方面: ①典型单位和重点单位性质不同。典型调查强调被选单位在同类社会经济现象中所具有的代表性、典型性,是有 意识地选取的;而重点调查则强调被选单位某标志值在总体标志值总和中所占的比重较大,是客观存在的。 ②侧重点不同。典型调查的主要目的是认识事物本质特征及其发展规律,调查深入细致,同时也注重定性调查; 而重点调查的目的主要是掌握总体的数量状况,着眼于普遍情况,注重量的调查。

统计学期末考试题库及答案

第一章绪论 一、填空题 1.标志是说明特征的,指标是说明数量特征的。 2.标志可以分为标志和标志。 3.变量按变量值的表现形式不同可分为变量和变量。4.统计学是研究如何、、显示、统计资料的方法论性质的科学。 5.配第在他的代表作《》中,用数字来描述,用数字、重量和尺度来计量,为统计学的创立奠定了方法论基础。 二、判断题 1.企业拥有的设备台数是连续型变量。() 2.学生年龄是离散型变量。() 3.学习成绩是数量标志。() 4.政治算术学派的创始人是比利时的科学家凯特勒,他把概率论正式引进统计学。() 5.指标是说明总体的数量特征的。() 6.对有限总体只能进行全面调查。() 7.总体随着研究目的的改变而变化。() 8.要了解某企业职工的文化水平情况,总体单位是该企业的每一位职工。() 9.数量指标数值大小与总体的范围大小有直接关系。() 10.某班平均成绩是质量指标。() 三、单项选择题 1.考察全国的工业企业的情况时,以下标志中属于数量标志的是( )。 A.产业分类 B.劳动生产率 C.所有制形式 D.企业名称 2.要考察全国居民的人均住房面积,其统计总体是( )。 A.全国所有居民户 B.全国的住宅 C.各省市自治区 D.某一居民户 3.若要了解全国石油企业采油设备情况,则总体单位是( )。 A.全国所有油田 B.每一个油田 C.每一台采油设备 D.所有采油设备

4.关于指标下列说法正确的是( )。 A.指标是说明总体单位数量特征的 B.指标都是用数字表示的 C.数量指标用数字表示,质量指标用文字表示 D.指标都是用文字表示的 5.政治算术学派的代表人物是 ( )。 A.英国人威廉·配第 B.德国人康令 C.德国人阿亨瓦尔 D.比利时人凯特勒 6.关于总体下列说法正确的是( )。 A.总体中的单位数都是有限的 B.对于无限总体只能进行全面调查 C.对于有限总体只能进行全面调查 D.对于无限总体只能进行非全面调查 7.关于总体和总体单位下列说法不正确的是( )。 A.总体和总体单位在一定条件下可以相互转换 B.总体和总体单位是固定不变的 C.构成总体的个别单位是总体单位 D.构成总体的各个单位至少具有某种相同的性质 8.关于标志下列说法不正确的是( )。 A.标志是说明总体单位特征的 B.品质标志是用文字表示的 C.数量标志是用数字表示的 D.数量标志说明总体量的特征 9.关于变量下列说法不正确的是( )。 A.只能取整数的变量是离散变量 B.可以用小数表示的是连续变量 C.只能用小数表示的是连续变量 D.数量标志的具体表现称为变量值 10.关于指标下列说法不正确的是( )。 A.数量指标说明总体规模和水平 B.数量指标用绝对数表示 C.质量指标只能用相对数表示 D.质量指标用相对数或平均数表示 四、多项选择题 1.属于连续型变量的有( )。 A.国内生产总值 B.企业数 C.身高 D.体重 E.人数2.属于离散型变量的有( )。 A.增加值 B.学校数 C.机器台数 D.销售额 E.粮食产量3.下列属于品质标志的有( )。

关于生物统计学考试复习题库

生物统计学各章题目 一 填空 1.变量按其性质可以分为(连续)变量和(非连续)变量。 2.样本统计数是总体(参数)的估计值。 3.生物统计学是研究生命过程中以样本来推断(总体)的一门学科。 4.生物统计学的基本内容包括(试验设计)和(统计分析)两大部分。 5.生物统计学的发展过程经历了(古典记录统计学)、(近代描述统计学)和(现代推断统计学)3个阶段。 6.生物学研究中,一般将样本容量(n ≥30)称为大样本。 7.试验误差可以分为(随机误差)和(系统误差)两类。 判断 1.对于有限总体不必用统计推断方法。(×) 2.资料的精确性高,其准确性也一定高。(×) 3.在试验设计中,随机误差只能减小,而不能完全消除。(∨) 4.统计学上的试验误差,通常指随机误差。(∨) 二 填空 1.资料按生物的性状特征可分为(数量性状资料)变量和(质量性状资料)变量。 2. 直方图适合于表示(连续变量)资料的次数分布。 3.变量的分布具有两个明显基本特征,即(集中性)和(离散性)。 4.反映变量集中性的特征数是(平均数),反映变量离散性的特征数是(变异数)。 5.样本标准差的计算公式s=( )。 判断题 1. 计数资料也称连续性变量资料,计量资料也称非连续性变量资料。(×) 2. 条形图和多边形图均适合于表示计数资料的次数分布。(×) 3. 离均差平方和为最小。(∨) 4. 资料中出现最多的那个观测值或最多一组的中点值,称为众数。(∨) 5. 变异系数是样本变量的绝对变异量。(×) 单项选择 1. 下列变量中属于非连续性变量的是( C ). A. 身高 B.体重 C.血型 D.血压 2. 对某鱼塘不同年龄鱼的尾数进行统计分析,可做成( A )图来表示. A. 条形 B.直方 C.多边形 D.折线 3. 关于平均数,下列说法正确的是( B ). 12 2--∑∑n n x x )(

高校统计学期末考试试题及答案

1、一个统计总体( ) A 、只能有一个标志 B 、只能有一个指标 C 、可以有多个标志 D 、可以有多个指标 2、调查某大学2000名学生学习情况,则总体单位是( ) A 、2000名学生 B 、 2000名学生的学习成绩 C 、每一名学生 D 、 每一名学生的学习成绩 3、某地进行国有商业企业经营情况调查,则调查对象是( )。 A 、该地所有商业企业 B 、该地所有国有商业企业 C 、该地每一国有商业企业 D 、该地每一商业企业 4、以下哪种调查的报告单位与调查单位是一致的( )。 A 、工业普查 B 、工业设备调查 C 、职工调查 D 、未安装设备调查 5、某市进行工业企业生产设备普查,要求在7月1日至7月10日全部调查完毕,则这一时间规定是( )。 A 、调查时间 B 、调查期限 C 、标准时间 D 、登记期限 6、某连续变量分为5组:第一组为40——50,第二组为50——60,第三组为60——70,第四组为70——80,第五组为80以上,则( ) A 、50在第一组,70在第四组 B 、60在第三组,80在第五组 C 、70在第四组,80在第五组 D 、80在第四组,50在第二组 7、已知某局所属12个工业企业的职工人数和工资总额,要求计算该局职工的平均工资,应该采用( ) A 、简单算术平均法 B 、加权算术平均法 C 、加权调和平均法 D 、几何平均法 8、用水平法检查长期计划完成程度,应规定( ) A 、计划期初应达到的水平 B 、计划期末应达到的水平 C 、计划期中应达到的水平 D 、整个计划期应达到的水平 9、某地区有10万人,共有80个医院。平均每个医院要服务1250人,这个指标是( )。 A 、平均指标 B 、强度相对指标 C 、总量指标 D 、发展水平指标 10、时间序列中,每个指标数值可以相加的是( )。 A 、相对数时间序列 B 、时期数列 C 、间断时点数列 D 、平均数时间序列 11、根据时间序列用最小平方法配合二次曲线,所依据的样本资料的特点是( )。 A 、时间序列中各期的逐期增长量大体相等 B 、各期的二级增长量大体相等 C 、各期的环比发展速度大体相等 D 、各期同比增长量的大体相 12、红星机械厂计划规定,今年甲产品的单位产品成本比去年降低4%,实际执行的结果降低了5%,则该产品单位成本降低计划完成程度的算式为( )。 A 、%4%5 B 、%104%105

统计学考试题库

一、判断题(4个) 1.统计学的研究对象是社会经济总体现象的质量方面。(×) 2.重点调查中的重点单位是根据当前工作的重点来确定的。(×) 3.对于连续型变量,其组限是按照“上限不包括在内”的原则进行汇总的。(√)4.平均数是测定总体各单位的离散程度。(×) 5.在时间序列的乘法合成模型中,季节变动成分S通常是季节的个数(F) 6.用最小二乘法拟合时间序列的直线趋势方程Y=a+bt时,若0≤b≤1则该时间序列的趋势为逐步上升的趋(T) 7.从计算方式看,综合评价指数是一种算术平均指数(F) 8.特殊原因偏差表示过程中固有的偏差,这些偏差随机或偶然出现。(F) 9.当样本量给定时,置信区间的宽度随着置信系数的增大而增大;而当置信水平固定时,置信区间的宽度随着样本量的增大而减小。(√) 10.置信区间是一个随机区间,它因样本量的不同而不同,而且所有的区间都包含总体参数的真值。(×) 11通常是在控制犯取伪错误概率的条件下,尽可能使弃真错误的概率小一点。(×) 12抽样单位既可以是一个简单的个体,也可以是一组个体。(√) 13. 第一类错误是假设检验中出现的第一种错误,是将不真实的现象检验为真实的现象(错误) 14. 正态分布总体有两个参数,即均值与方差,当这两个参数确定以后,一个正态分布也就确定了。(正确) 15. 在一元线性回归模型中,回归模型的标准差等于随机干扰项的标准差。(正确) 16. 根据最小二乘估计,可以得到总体回归方程。(错误) 17.单纯依靠相关与回归分析,无法判断事物之间存在的因果关系。 答:对,因果关系的判断还有赖于实质性科学的理论分析。 18.圆的直径越大,其周长也越大,两者之间的关系属于正相关关系。 答:错。两者是精确的函数关系。 19.X2检验不适用于定类变量和定序变量的相关统计。(错) 20.多样本计量资料的比较,当分布类型不清时选择H检验。(对) 21在多元回归分析中,多重共线性是指模型中因变量与一个自变量相关。(×) 22对回归模型y=β0 +β1X1 +β2X2+…+βpXP+ε的假定有自变量X1 ,X2,…,XP 相互之间不存在较强的线性关系。(√) 23如果经检验所有回归系数都是显著的,则可以判定不存在多重共线性问题。(√) 24.DW 值越接近2, t 序列的自相关性就越小。(√) 二、选择题(4个) 1. “统计”一词的三种涵义是(B )。 A、统计调查、统计资料、统计分析 B、统计工作、统计资料、统计学 C、统计设计、统计调查、统计整理 D、大量观察法、分组法、综合指标法 2. 下列属于品质标志的是(D )。

2020年统计学考试复习资料

《统计学》复习资料 一、单项选择题: 1. 调查项目通常以表的形式表示,称作调查表,一般可分为( B )。 A.单一表和复合表 B.单一表和一览表 C.简单表和复合表 D.简单表和一览表 2. 要准确地反映异距数列的实际分布情况,必须采用( D ) A.次数 B.累计频率 C.频率 D.次数密度 3. 政治算术派产生于17世纪资本主义的英国,代表人物是( B )。 A.亚当·斯密 B.威廉·配第 C.康令 D.凯特勒 4. 进行相关分析,要求相关的两个变量( A )。 A.都是随机的 B.都不是随机的 C.一个是随机的,一个不是随机的 D.随机或不随机都可以 5. 调查某市工业企业职工的工种、工龄、文化程度等情况( D )。 A.填报单位是每个职工 B.调查单位是每个企业 C.调查单位和填报单位都是企业 D.调查单位是每个职工,填报单位是每个企业 6. 下面的函数关系是( B )。

A.销售人员测验成绩与销售额大小的关系 B.圆周的长度决定于它的半径 C.家庭的收入和消费的关系 D.数学成绩与统计学成绩的关系 7.统计总体的同质性是指( B )。 A.总体各单位具有某一共同的品质标志或数量标志 B.总体各单位具有某一共同的品质标志属性或数量标志值 C.总体各单位具有若干互不相同的品质标志属性或数量标志值D.总体各单位具有若干互不相同的品质标志或数量标志 8.反映抽样指标与总体指标之间抽样误差可能范围的指标是( C )。 A.抽样平均误差;B.抽样极限误差; C.抽样误差系数;D.概率度 9.某工人月工资90元,则工资是( C )。 A、质量指标 B、数量指标 C、数量标志 D、变量值 10.某厂工业总产值逐年有所增加,1999年、2001年、2002年分别增长5%、8%、10%,三年工业总产值总共增长( D )。A.23% B.22% C.11.2% D.24.74% 11.某电器厂为了掌握该厂的产品质量,拟进行一次全厂的质量大检查,这种检查应选择( C ). A.统计报表B.重点调查C.全面调查D.抽样调查

2018统计学-18总复习资料

《统计学》综合复习资料 一、单项选择题 1.统计一词的三种涵义是()。 A.统计工作.统计资料.统计学B.统计调查.统计整理.统计分析 C.统计设计.统计分组.统计预测D.统计方法.统计分析.统计预测 2.要研究某地区570家工业企业的产品生产情况,总体是()。 A.每个工业企业 B.570家工业企业 C.570家工业企业每一件产品 D.570家工业企业全部工业产品 3.为了解全国钢铁生产的基本情况,对鞍钢、武钢、宝钢等特大型钢铁企业的产量进行调查,属于 ()。 A.重点调查 B.典型调查 C.简单随机抽样调查 D.整群抽样调查 4.某商品销售量的前三个季度的季节指数分别为:112%,88%,90%,则第四个季度的季节指数为()。 A.102% B.110% C.98% D.100% 5.某厂2009年完成产值2千万,2010年计划增长10%,实际完成2310万元,则计划完成程度为()。 A.105% B.5% C.115.5% D.15.5% 6.统计调查按其组织形式分类,可分为()。 A.普查和典型调查 B.重点调查和抽样调查 C.统计报表和专门调查 D.经常性调查和一次性调查 7.现有一数列:3,9,27,81,243,729,2187,反映其平均水平最好用()。 A.算术平均数 B.调和平均数 C.几何平均数 D.众数 8.第一组工人的平均工龄为6年,第二组为8年,第三组为10年,第一组工人数占总数的30%,第二组占50%,则三组工人的平均工龄为()。 A.8年 B.7.55年 C.32.5年 D.7.8年 9.直接反映总体规模大小的指标是()。 A.总量指标 B.相对指标 C.平均指标 D.变异指标 10.某商品价格比原先降低5%,销售量增长了5%,则销售额()。 A.上升 B.下降 C.不变 D.无法确定

大学统计学期末复习计算题(有答案)

1对10名成年人和10名幼儿的身高(厘米)进行抽样调查,结果 如下 第1页共4页 成年组 166 169仃2仃7 180 仃0 仃2仃4 168 173 幼儿组 68 69 68 70 71 73 72 73 74 75 (1)要比较成年组和幼儿组的身高差异, 你会采用什么样的指标 测度值?为什么? (2)比较分析哪一组的身高差异大? 解:(1)采用标准差系数比较合适,因为各标志变动值的数值大 小,不仅受离散程度的影响,而且还受到平均水平高低的影响。 标准 差系数适合于比较不同组数据的相对波动程度。 10 (2)成年组的均值:乂 =7 =172.1 cm ,标准差为:S = 4. 202cm 离散系数:V 1 二基二 4^202 : 0. 024 X 172. 1 10 X i 幼儿组的均值:X = V 71.3 cm ,标准差为:= 2. 497 cm 离散系数:v 2 = X = 71 3 : 0. 035 v1

(2)相对数分析 ' P i q i ' p°q 、 pq ' P o q 。 ' P o q 。 ' p°q 125550 117100 绝对数分析 ' pg 八 p °q ° =、 p °q 1 - p °q ° ' pg 八 p °q 1 94500-12500二 117100-125550 94500-117100 31050二 8450 -22600 由于产量q 下降6.73%,使总成本下降8450元; 由于单位成本p 下降 19.30%,使总成本下降22600元。 3、从一个标准差为5的总体中抽出一个容量为40的样本,样本均值 为25。 (1) 样本均值的抽样标准差C X 等于多少? (2) 在95%的置信水平下,允许误差是多少? (3) 试确定该总体均值95%的置信区间。(血25 = 1.96) 解:(1)样本均值的抽样标准差: (2) 在95%的置信水平下,允许误差是: z 0.025▽犬=0. 79 X 1. 96 1. 55 (3) 该总体均值95%的置信区间: 65 340 1000 35 400 150 94500 125550 65 65 340 1000 35 400 150

统计学考试重点题目

1、某车间30 要求:累计 要求:按考试成绩分组编制组距式变量数列,并计算出各组频率和组中值。 比上期增长多少;又该企业产品单位成本计划在上期699元水平上降低12元,实际上本期单位成本为672元,试计算单位成本计划完成百分数。 (2)某企业2001年产品销售计划为上年的108%,实际为上年的114%,

试计算该企业2001年度产品销售计划完成百分数。 (3)某企业2001年劳动生产率增长计划完成102%,这一年劳动生产率为2000年的107%,试计算该企业2001年劳动生产率计划比2000年增长百分数。 (1)(1+5%)÷103%-1=1.94% 672÷(699-12)=97.82% (2)114%÷108%=105.56% (3)107%÷102%-1=14.90% 3、已知甲、乙两农贸市场某种农产品分等级的销售资料如下表: 要求:通过计算比较甲、乙两农贸市场哪一个的平均价格高,并说明两市场平均价格不一致的理由。 ∑∑===(元)甲38.14/5.5/f Xf X (元) 乙33.14/3.5/===∑∑f Xf X 4、某厂生产的某种零件,要经过三道工序,已知各工序的合格率分别为95%、93%和98%。要求:计算该零件在各道工序的总合格率和平均合格率。 总合格率=%583.86%98%93%95=?? 平均合格率=%31.95%98%93%953=?? 5、某商业局系统所属20个商店2000年的商品销售额与流通费用率资料如下表: 要求:计算该系统所属商店的平均流通费用率和销售额计划平均完成百分数。

M/m/x ym/m 6、(1)某数列的平均数为1000,标准差系数为0.256,求标准差; (2)某数列的平均数为12,各变量值平方的平均数为169,求标准差系数; (3)某数列的标准差为3,各变量值平方的平均数为25,求平均数; (4)某数列的标准差为30,平均数为50,求变量值对90的方差; (5)设y = x ± a ,若y σ=28,求x σ; (6)设y = 0,若y σ=12,求x σ。 (1)2561000256.0=?=?=X V σ(2)5)12(169222=-=-=X X σ 4167.012/5/===X V σ (3)4325222=-=-=σX X (4)2500)5090(30)90(2222 2 90=-+=-+=X X σσ (5)28==y x σσ (6)158.0/12||/===a y x σσ 9、设甲县农民人均收入为5880元,标准差为680元,农业人口为88.2万人;乙县农民人均收入6240元,标准差860元,农业人口89.50万人。要求:计算甲、乙两县农民人均纯收入的平均数、方差和标准差系数。

期末考试复习--统计学

习题课 1、有两个班同学参加统计学考试,甲班的平均分数81分,标准差9.9分,乙班的考试成绩如下: 要求:(1)计算乙班的平均分数和标准差。 (2)比较哪个班的平均分数更有代表性。 解题过程参考教材和作业。 2、某钢铁厂2002年—2007年钢铁产量如下表。 (1)计算出表中各动态分析指标的数值,并填入表内的相应格中,

(2)计算2002年—2007年的平均增长量。 需要掌握的时间序列的动态分析指标有: 1. 增长量: (1) 逐期增长量:12312;;;----n n a a a a a a (2) 累积增长量:00201;;;a a a a a a n --- (3) 平均增长量 = 逐期增长量之和/逐期增长量个数 = 累积增长量/(时间序列项数-1) 2. 发展速度与增长速度: (1) 环比发展速度:123 12,,,-n n a a a a a a (2) 定基发展速度: 02 01,,a a a a a a n (3) 增长速度 = 发展速度-1 (4) 平均发展速度 = n n a a 0 (5) 平均增长速度 = 平均发展速度-1 3、某厂生产的三种产品的有关资料如下:

要求: (1)计算三种产品的价格总指数以及由于价格变动使销售总额变动的绝对额 (2)计算三种产品的销售量总指数以及由于销售量变动而使销售总额变动的绝对额 (3)利用指数体系分析说明销售总额(相对程度和绝对额)变动的情况 解:列表计算如下:

(1)三种产品的价格指数: %11515.126100 30100 11 1或== = ∑∑z q z q k z 由于价格变动影响的销售总额绝对额: ∑∑0111-z q z q =30100-26100=4000元 (2)三种产品的销售量总指数: %10303.125350 26100 001或== = ∑∑z q z q k q 由于销售量变动影响的销售总额绝对额: ∑∑0001-z q z q =26100-25350=750元 (3) 销售总额指数: %7.118187.125350 30100 01 1或== = ∑∑z q z q k qz 销售总额的绝对额: ∑∑0011-z q z q =30100-25350=4750元 指数体系:118.7%=115%*103% 4750万元=4000万元+750万元 分析说明:………….….。 4、宁波新四方快餐厅连续3个星期抽查49位顾客,以调查顾客的平 均消费额,得样本平均消费额为25元,并假设总体的标准差为10.5元,要求:

统计学原理期末复习资料(题目及答案)

统计学原理期末复习资料汇总 一、考试题型 单选:12%,每小题2分,共12分,见平时作业手册; 多选:8%,每小题2分,共8分,见平时作业手册; 判断:10%,每小题2分,共10分,见平时作业手册; 简答题:20%,每小题10分,共20分; 计算题:50% 考试时间:90分钟,闭卷,可以带计算器 二、简答题 1、举例说明统计标志与标志表现有何不同? 答:标志是总体中各单位所共同具有的某特征或属性,即标志是说明总体单位属性和特征的名称。标志表现是标志特征在各单位的具体表现,是标志的实际体现者。例如:工人的“工资”是标志,而工资为“1200”分,则是标志表现。 2、一个完整的统计调查方案包括哪些内容? 答:一个完整的统计调查方案包括发下主要内容:(1)确定调查目的;(2)确定调查对象和调查单位;(3)确定调查项目,拟定调查表;(4)确定调查时间和时限;(5)确定调查的组织和实施计划。 3、简述调查对象、调查单位与填报单位的关系并举例说明。 答:调查对象即统计总体,是根据调查目的所确定的研究事物的全体。统计总体这一概念在统计调查阶段称调查对象。调查单位也就是总体单位,它是调查对象的组成要素,即调查对象所包含的具体单位。报告单位也成填报单位,也是调查对象的组成要素,它是提交调查资料的单位,一般是基层企事业组织。调查单位是调查资料的直接承担者,报告单位是调查资料的提交者,二者有时一致,有时不一致。例如对工业企业进行全部设备调查时,工业企业的全部设备是调查对象,每台设备是调查单位,而每个工业企业则是填报单位。 4、某地区对占该地区工业增加值三分之二的10个企业进行调查,你认为这种调查方式是重点调查还是典型调查?为什么? 答:首先,从该题内容可知该地区对工业企业进行的是一种非全面调查;第二,非全面调查包括抽样调查、重点调查额典型调查。这三种非全面调查的主要区别是选择调查单位的方法不同,抽样调查是按随机原则抽选单位,重点调查是根据单位标志总量占总体标志总量的比重来确定调查单位,而典型调查时依据对总体的分析,有意识地选取调查单位。因此,根据本题选择调查单位的方法可判断出该地区对工业企业进行调查,采用的是典型调查方式。 5、简述变量分组的种类及应用条件。 答:变量分组包括单项式分组和组距式分组。离散变量变动幅度小,分组可以选择单项式分组。如果离散变量的变动幅度较大,分组应该选择组距式分组。而对于连续变量只能用组距式分组。 6、单项式分组与组距式分组分别在什么情况下运用? 答:离散型变量如果变量值变动幅度较小,可依次将每个变量值作为一组。采用单项式分组。离散型变量如果变量值变动很大,次数又很多,或是连续性变量,采用组距式分组。 7、简述结构相对指标和比例相对指标有什么不同,并举例说明。 答:结构相对指标是以总体总量为比较标准,计算各组总量占总体总量的比重,来反映总体内部组成情况的综合指标。如:各工种的工人占全部工人的比重。比例相对指标是总体不同部分数量对比的相对数,用以分析总体范围内各个局部之间比例关系和协调平衡状况,如:轻重工业比例。 8、强度相对指标与平均指标的区别?

相关文档
相关文档 最新文档