文档库 最新最全的文档下载
当前位置:文档库 › 统计学基础 第七章 抽样推断

统计学基础 第七章 抽样推断

统计学基础 第七章 抽样推断
统计学基础 第七章 抽样推断

统计学基础第七章抽样推断

【教学目的】

1.理解抽样推断的含义及特点

2.深刻理解抽样误差产生的原因

3.对抽样误差、抽样平均误差、抽样极限误差加以区别

4.了解各种抽样组织形式的特点

5.重点掌握简单随机抽样组织形式的区间估计方法

6.掌握必要样本单位数的确定方法

【教学重点】

1.理解抽样推断中的几个基本概念(总体指标、样本指标、平均数、成数、方差、标准差)。

2.理解抽样误差的概念

3.理解和运用不同抽样方法下计算抽样误差

4.掌握简单随机抽样组织形式的区间估计方法

6.掌握必要样本单位数的确定方法

【教学难点】

1.理解抽样推断中的几个基本概念(总体指标、样本指标、平均数、成数、方差、标准差)。

2.理解抽样误差的概念

3.理解和运用不同抽样方法下计算抽样误差

4.掌握简单随机抽样组织形式的区间估计方法

6.掌握必要样本单位数的确定方法

【教学时数】

教学学时为10课时

【教学内容参考】

第一节抽样推断的意义

一、抽样推断的含义

(一)抽样推断的特点

抽样推断又称为抽样估计,它是在抽样调查的基础上,利用样本实际资料计算样本指标,并据以推算总体相应数量特征的一种统计调查方式。

【案例】

从全国所有股份制企业中,抽取一部分企业,详细调查其生产经营状况,根据这一部分企业的调查资料,来推算所有股份制企业的生产经营状况,这就属于抽样推断。

抽样推断有以下几个特点:

1.按随机原则从总体中抽取调查单位。所谓随机原则是指在抽取调查单位时,总体中每个单位都有同等被抽中的机会,完全排除了人为主观意识的影响,哪个单位抽中与否,纯粹是随机的、偶然的。按随机原则抽取调查单位是进行抽样推论的基本要求。

2.根据被抽取的调查单位,计算各种指标,并对总体的指标作出估计。

3.抽样推断中的抽样误差可以事先计算并加以控制,从而保证抽样推断的结论符合预定的精确度和可靠度要求。

(二)抽样推断的作用

抽样推断的主要作用有:

1.对某些不可能进行全面调查而又需要了解全面情况的社会经济现象,可以采用抽样推断方式。另外,对于无限总体也不可能进行全面调查,只能采用抽样推断方式。

2.对于某些不必要或在经济上不允许经常采用全面调查的社会经济现象,最适宜采用抽样推断方式。

3.对于需要及时了解情况的现象,也经常采用抽样推断方式。因为全面调查浪费人力、物力和财力,资料也不易及时取得,而抽样推断方式不仅节省人力、资金,且时间快,方式灵活,能够及时满足了解情况的需要。

4.对全面调查的资料进行评价和修正。全面调查由于范围广、工作量大、参加的人员多,发生登记性误差的可能性就大。因此,为了保证全面调查资料的准确性,检验全面调查资料的质量,在全面调查之后,一般都要进行抽样推断。在总体中再抽取一部分单位重新调查,然后将两次调查的资料进行比较,计算出差错率,并据此对全面调查的资料加以修正。

5.抽样推断还可以用于工业生产过程中的质量控制。

【能力训练】

下列事项属于抽样推断的有( )。

①为了测定车间的工时损失,对车间中的每三班工人中的第一班工人进行调查。

②为了解某大学食堂卫生状况,对该校的五个食堂进行调查。

③对某城市1%的家庭进行调查,以便研究该城市居民的消费状况。

④对某公司三个分厂中的一个分厂进行调查,以便研究该工厂的能源利用效果。

二、抽样的基本概念

(一)总体和样本

总体又称全及总体。它是根据研究目的,由全部调查单位所组成的集合体。总体的单位数通常都是很大的,甚至是无限的,这样才有必要组织抽样调查,进行抽样推断。总体单位数一般用符号N 表示。

样本又称子样。它是从总体中随机抽取出来的部分调查单位所组成的集合体。样本的单位数是有限的。样本单位数一般用符号n 表示,也称样本容量。

对于某一特定研究问题来说,作为推断对象的总体是确定的,而且是惟一的。但由于从一个总体中可以抽取许多个样本,所以作为观察对象的样本,不是惟一的,而是可变的。明白这一点对于理解抽样推断原理是很重要的。

(二)总体指标和样本指标

总体指标又称参数。它是根据总体各单位的标志表现计算的综合指标。

对于总体中的数量标志,可以计算的总体指标有总体平均数X 、总体方差σ2

(或总体标准差σ)。

设总体变量X 的取值为:X 1,X 2,…N X 则 ∑∑∑==X

XF X N X X 或 ()()∑∑∑-=-=F F X X N X X 2

22

2σσ或 对于总体中的品质标志,由于各单位品质标志不能用数量来表示,因此,可以计算的总体指标有总体成数P X 、总体成数方差P 2σ或总体成数标准差σP )。

设P 表示总体中具有某种性质的单位数在总体单位数中所占的比重,Q 表示总体中不具有某种性质的单位数在总体单位数中所占的比重。在总体N 个单位中,有N 1 个单位具有某种性质,N 0

个单位不具有某种性质,N=N 1 +N 0 。则 P N

N N N N Q N N P -=-===1,101 如果总体中的品质表现只有“是”、“非”两种。例如,产品质量的标志表现为合格和不合格,人口性别的标志表现为男性和女性,则可以把“是”的标志表现表示为1,而“非”的标志表现表示为0。那么成数P 就可以视为(0,1)分布的相对数,并可以计算相应的方差(或标准差)。其计算公式为

P N N N N N N X

XF X P ==+?+?==

∑∑1101010 ()()()()P P Q P PQ P Q Q P N

N Q N P N N N P N P P -=+=+=+=+-+-=1102212021012022σ 在抽样推断中,总体指标的意义和计算方法是明确的,但总体指标的具体数值事先是未知的,需要用样本指标来估计它。

样本指标又称统计量。它是根据样本各单位的标志表现计算的、用来估计总体指标的综合指标。可以计算的样本指标有样本平均数x 、样本方差s 2

和样本成数P 等。 设样本变量x 的取值为x 1,x 2,…x n ,则

∑∑∑==f

xf x n x x 或 ()()∑∑∑-=-=f f x x s n

x x s 2222或 p n

n x p ==1 ()p p s p -=12

在抽样推断中,样本指标的计算方法是确定的,但它的取值随着样本的不同,有不同的样本变量。所以,样本指标本身是随机变量,用它作为总体指标的估计值,有时误差大些,有时误差小些;有时产生正误差,有时产生负误差。

【能力训练】

总体指标和样本指标( )。

①都是随机变量

②都是确定性变量

③前者是惟一确定的,后者是随机变量④前者是随机变量,后者是惟一确定的

三、抽样方法

在抽样调查中,从总体中抽取样本单位的方法有两种:重复抽样和不重复抽样。

(一)重复抽样

重复抽样也称重置抽样、放回抽样、回置抽样等。它是指从总体N 个单位中随机抽取容量为n 的样本时,每次抽取一个单位,把结果登记下来后,重新放回,再从总体中抽取下一个样本单

位。在这种抽样方式中,同一单位可能有被重复抽中的机会。可见,重复抽样的总体单位在各次抽取中都是不变的,每个单位中选的机会在每次抽取中都是均等的。

用重复抽样的方法从总体N 个单位中抽取n 个单位组成样本,可能得到的样本总数为N n 个。

(二)不重复抽样

不重复抽样也称不重置抽样、不放回抽样、不回置抽样等。它是指从总体N 个单位中随机抽取容量为n 的样本时,每次抽取一个单位后,不再放回去,下一次则从剩下的总体单位中继续抽取,如此反复,最终构成一个样本。也就是说,每个总体单位至多只能被抽中一次,所以从总体中每抽取一次,总体就少一个单位。因此,先后抽出来的各个单位被抽中的机会是不相等的。

用不重复抽样的方法从总体N 个单位中抽取n 个单位组成样本,可能得到的样本总数为()!n N N A N n -=!。不考虑顺序的组合数为()!

!!n n N N C N n -=。 可见,在相同样本容量的要求下,不重复抽样可能得到的样本个数比重复抽样可能得到的样本个数少。当采用不重复抽样、而全及总体所包含的单位数又不多时,越到后来,留在总体中的单位就越少,被抽中的机会就越大。不过当全及总体单位数很多、样本总体单位数所占的比重很小时,则对先后抽出来的各个单位被抽中的机会影响不大。由于不重复抽样简便易行,所以在实际工作中经常被采用。

第二节 抽样误差

一、抽样误差的含义

在抽样推断中,用样本指标推断总体指标,总会存在一定的误差,其误差来源主要有两个方面:

(一)登记性误差

即在调查和整理资料的过程中,由于主、客观因素的影响而引起的误差,如在登记的过程中由于疏忽而将3误写为8,将1误写为7;在计算合计的过程中所造成的计算错误等。

(二)代表性误差

即由于样本的结构情况不足以代表总体特征而导致的误差。代表性误差的产生又有两种情况: 一种是违反了抽样推断的随机原则,如调查者有意地多选较好的单位或多选较差的单位来进行调查,这样计算出来的样本指标必然出现偏高或偏低的情况,造成系统性误差,也称为偏差。

另一种情况是遵守了抽样推断的随机原则,但由于从总体中抽取样本时有多种多样的可能,当取得一个样本时,只要被抽中样本的内部结构与被研究总体的结构有所出入,就会出现或大或小的偶然性的代表性误差,也称为随机误差。

系统性误差和登记性误差都是由于抽样工作组织不好而导致的,应该采取预防措施避免发生。而偶然性的代表性误差是无法消除的。抽样误差就是指这种偶然性的代表性误差,即按随机原则抽样时,单纯由于不同的随机样本得出不同的估计量而产生的误差。

抽样误差是抽样推断所固有的,虽然它无法避免,但可以运用大数定律的数学公式加以精确地计算,确定其具体的数量界限,并通过抽样设计加以控制。所以这种抽样误差也称为可控制误差。

【能力训练】

抽样误差是( )。

①样本数目过少引起的

②观察、测量、计算的失误引起的

③抽样过程中的偶然性因素引起的

④抽样推断中产生的系统性误差

二、抽样平均误差

(一)抽样平均误差的含义

抽样误差描述了样本指标与总体指标之间的离差绝对数,在用样本指标估计相应的总体指标时,它可以反映估计的准确程度。但是由于抽样误差是随机变量,具有取值的多样性和不确定性特点,因而就不能以它的某一个样本的具体误差数值来代表所有样本与总体之间的平均误差情况,应该用抽样平均误差来反映抽样误差平均水平。

所谓抽样平均误差,就是所有可能出现的样本指标(平均数或成数)的标准差,也可以理解为所有的样本指标与总体指标之间的平均离差。我们所说的抽样误差可以事先计算和控制,就是针对抽样平均误差而言的。抽样平均误差是用样本指标推断总体指标时,计算误差范围的基础。 抽样平均误差的计算,与抽样方法和抽样组织形式有直接关系,不同的抽样方法和抽样组织形式计算抽样平均误差的公式是不同的。

(二)抽样平均误差的计算

在实际工作中,只求得一个样本指标,无法得到抽样平均误差(即样本指标的标准差),因而常常是根据抽样平均误差和总体标准差的关系来推算。样本平均数的抽样平均误差计算公式如下: ()∑-=f f X x x 2μ

在一般情况下,总体平均数X 是未知的。当样本较多时,可用样本平均数的平均数来代替(这已经得到证明)。而在实际工作中,通常只需从总体中抽取一个样本,这样就可以根据总体标准差和样本单位数的关系来计算。

1.重复抽样条件下抽样平均误差的计算 数理统计可以证明:在重复抽样条件下,抽样平均误差与总体标准差成正比,与样本单位数的平方根成反比。故在已知总体标准差的条件下,可用下面的公式计算样本平均数的抽样平均误差: n x σμ=

在大样本(n>30)下,如果没有总体标准差σ的资料,可用样本标准差s 来代替,其公式如下: n s x =μ

相应地有样本成数的抽样平均误差公式:

()n

P P p -=1μ 同样,在大样本下,如果P 未知,可用样本成数p 来代替,即 ()n p p p -=

1μ 总体成数方差还有一个特点,就是它的最大值是0.5×0.5=0.25,也就是说,当两类总体单位各占一半时,它的变异程度最大,方差为25%,标准差则为50%。因此,在总体成数方差值未知时,可用其最大值来代替,这样会使计算出来的抽样平均误差偏大一些,一般而言这对推断认识

有益而无害。

2.不重复抽样条件下抽样平均误差的计算

对上述重复抽样下的公式作如下修正:

??

? ??-=

N n n x 12σμ ()??

? ??--=N n n p p P 11μ 不重复抽样的平均误差和重复抽样的平均误差公式,两者相差的因子(N

n -1)永远小于1。在不重复抽样下,抽中的单位不再放回,总体单位数逐渐减少,余下的每个单位被抽中的机会就会增大,所以不重复抽样的抽样平均误差小于重复抽样的抽样平均误差,这就是用因子(N n -

1)作为调整系数来修正原式的道理。但在抽中单位占全体单位的比重N

n 很小时,这个因子接近于1,对于计算抽样平均误差所起的作用不大。因而实际工作中不重复抽样有时仍按重复抽样的公式计算。

抽样平均误差的计算,在抽样调查中占有相当重要的地位。抽样调查的优点在于它能计算出抽样平均误差,且以抽样平均误差作为用样本指标推断总体指标的重要补充指标。

三、影响抽样平均误差的因素

影响抽样平均误差的因素主要有:

(一)样本单位数的多少

在其他条件不变的情况下,样本单位数愈多,抽样误差就愈小;反之,样本单位数愈少,则抽样误差就愈大。样本单位数越大,样本就越能反映总体的数量特征,如果样本单位数扩大到接近总体单位数时,抽样调查也就接近于全面调查,抽样误差就缩小到几乎完全消失的程度。

(二)总体被研究标志的变异程度

在其他条件不变的情况下,总体各单位标志值变异程度愈小,则抽样误差也愈小,抽样误差和总体变异程度成正比变化。这是因为总体变异程度小,表示总体各单位标志值之间的差异小,则样本指标与总体指标之间的差异也就小。如果总体各单位标志值相等,则标志变异程度等于0,样本指标就完全等于总体指标,抽样误差也就不存在了。

(三)抽样的组织形式和抽样方法

在其他条件不变的情况下,不重复抽样下的样本比重复抽样下的样本代表性强,其抽样误差相应也要小。在不同的抽样组织形式下,抽样误差也不同。

了解影响抽样误差的因素,对于控制和分析抽样误差十分重要。在上述影响抽样误差的三个因素中,标志变异程度是客观存在的因素,是调查者无法控制的,但样本单位数、抽样方法及抽样的组织形式却是调查者能够选择和控制的。因此,在实际工作中,应当根据研究的目的和具体情况,做好抽样设计和实施工作,以获得经济有效的抽样效果。

四、抽样极限误差

(一)抽样极限误差的含义

抽样极限误差是从另一个角度来考虑抽样误差问题的。用样本指标推断总体指标时,要想达到完全准确和毫无误差,几乎是不可能的。样本指标和总体指标之间总会有一定的差距,所以在估计总体指标时就必须同时考虑误差的大小。我们不希望误差太大,因为这会影响样本资料的价

值。误差愈大,样本资料的价值便愈小,当误差超过一定限度时,样本资料也就毫无价值了。所以在进行抽样推断时,应该根据所研究对象的变异程度和分析任务的需要确定允许的误差范围,在这个范围内的数字就算是有效的。这就是抽样极限误差的问题。

抽样极限误差是指样本指标和总体指标之间抽样误差的可能范围。由于总体指标是一个确定的数,而样本指标则是围绕着总体指标左右变动的量,它与总体指标可能产生正离差,也可能产生负离差,样本指标变动的上限或下限与总体指标之差的绝对值就可以表示抽样误差的可能范围。 设p x ??、分别表示样本平均数的抽样极限误差和样本成数的抽样极限误差,则有:

X x ?≤-

P P p ?≤-

上面的不等式可以变换为下列不等式关系:

x x X x X ?+≤≤?-

p p P p P ?+≤≤?-

上面第一式表明样本平均数 是以总体平均数X 为中心,在至x X ?-至x X ?+之间变动的,区间)),(x x X X ?+?-称为样本平均数的估计区间,区间的长度为2x ?,在这个区间内样本平均数和总体平均数之间的绝对离差不超过x ?。同样,上面第二式表明,样本成数是以总体成数P 为中心,在p P ?-至p P ?+之间变动的,在),(p p P P ?+?-区间内样本成数与总体成数的绝对离差不超过p ?。

由于总体平均数和总体成数是未知的,它需要用实测的样本平均数和样本成数来估计,因而抽样极限误差的实际意义是希望估计区间x x ?±能以一定的可靠程度覆盖总体平均数

X ,p P ?±能以一定的可靠程度覆盖总体成数P ,因而上面的不等式应变换为

x x x X x ?+≤≤?-

p p p P p ?+≤≤?-

(二)抽样极限误差的计算

基于概率估计的要求,抽样极限误差通常需要以抽样平均误差μ或P μ为标准单位来衡量。把抽样极限误差?或p ?分别除以μ或P μ,得相对数t ,它表示误差范围为抽样平均误差的若干倍,t 是测量估计可靠程度的一个参数,称为抽样误差的概率度。

x x x x

x

t X x t μμμ=?-=?=或 p p p p p t P p t μμμ=?-=?=或

抽样估计的概率度是表明样本指标和总体指标的误差不超过一定范围的概率保证程度。由于样本指标随着样本的变动而变动,它本身是一个随机变量,因而样本指标和总体指标的误差仍然是一个随机变量,并不能保证误差不超过一定范围这个事件是必然事件,而只能给以一定程度的概率保证。因此,就有必要计算样本指标落在一定区间范围内的概率,这种概率称为抽样估计的概率保证程度。根据抽样极限误差的基本公式Δ=t ·μ得出,概率度t 的大小要根据对推断结果要求的把握程度来确定,即根据概率保证程度的大小来确定。概率论和数理统计证明,概率度t 与概率保证程度F (t )之间存在着一定的函数关系,给定t 值,就可以计算出F (t )来;相反,给出一定的概率保证程度F (t ),则可以根据总体的分布,获得对应的t 值。

在实际应用中,因为我们所研究的总体大部分为正态总体,对于正态总体而言,为了应用的方便编有《正态概率表》以供使用。根据《正态概率表》,已知概率度t 可查得相应的概率保证程度F (t );相反,已知概率保证程度F (t )也可查得相应的概率度t 。

从抽样极限误差的计算公式来看,抽样极限误差Δ与概率度t 和抽样平均误差μ三者之间存在如下关系:

1.在μ值保持不变的情况下,增大t 值,抽样极限误差Δ也随之扩大,这时估计的精确度将降低;反之,要提高估计的精确度,就得缩小t 值,此时概率保证程度也会相应降低。

2.在t 值保持不变的情况下,如果μ值小,则抽样极限误差Δ就小,估计的精确度就高;反之,如果μ值大,抽样极限误差Δ就大,估计的精确度就低。

由此可见,估计的精确度与概率保证程度是一对矛盾,进行抽样估计时必须在两者之间进行慎重的选择。

【能力训练】

在一定的误差范围要求下( )。

①概率度大,要求可靠性低,样本数目相应要多

②概率度大,要求可靠性高,样本数目相应要多

③概率度小,要求可靠性低,样本数目相应要少

④概率度小,要求可靠性高,样本数目相应要少

⑤概率度小,要求可靠性低,样本数目相应要多

第三节 抽样估计

抽样估计是指利用实际调查的样本指标的数值来估计相应的总体指标的数值的方法。由于总体指标是表明总体数量特征的参数,例如总体平均数、总体成数等,所以抽样估计也称为参数估计。参数估计有点估计和区间估计两种方法。

一、点估计

点估计的基本特点是,根据样本资料计算样本指标,再以样本指标数值直接作为相应的总体指标的估计值。例如,以实际计算的样本平均数作为相应总体平均数的估计值;以实际计算的样本成数作为相应总体成数的估计值等等。设以样本平均数x 作为总体平均数X 的估计值,样本成数p 作为总体成数P 的估计值。

点估计的优点是原理直观,计算简便,在实际工作中经常采用。不足之处是这种估计方法没有考虑到抽样估计的误差,更没有指明误差在一定范围内的概率保证程度。因此,当抽样误差较

小,或抽样误差即使较大也不妨碍对问题的认识和判断时,才可以使用这种方法。

二、区间估计

(一)区间估计的含义

区间估计的基本特点是,根据给定的概率保证程度F (t )的要求,利用实际样本资料,给出总体指标估计值的上限和下限,即指出可能覆盖总体指标的区间范围。也就是说,区间估计要解决两个问题:

第一,根据样本指标和误差范围估计出一个可能包括总体指标的区间,即确定出估计区间的上限和下限。

第二,确定出估计区间覆盖总体未知参数的概率保证程度。区间估计的基本公式有

x x t x x X μ?±=?±= x x t x X t x μμ?+≤≤?-

p p t p p P μ?±=?±= p p t p P t p μμ?+≤≤?- 从而得到总体平均数的估计区间:),(x x t x t x μμ?+?-

总体成数的估计区间:),(p p t p t p μμ?+?-

(二)区间估计的模式

在进行区间估计的时候,根据所给定条件的不同,总体平均数和总体成数的估计有以下两套模式可供选择使用。

1.根据已给定的误差范围,求概率保证程度。具体步骤是: 第一步,抽取样本,计算样本指标,即计算样本平均数x 或样本成数p ,作为总体指标的估计值,并计算样本标准差s 以推算抽样平均误差。

第二步,根据给定的抽样极限误差Δ,估计总体指标的上限和下限。

第三步,将抽样极限误差Δ除以抽样平均误差μ,求出概率度t ,再根据t 值查《正态概率表》求出相应的概率保证程度。

【案例】

对工厂生产设备中某种型号的机械零件进行耐磨性能检验,抽查的样本资料见表7-5,要求耐磨时数的允许误差范围为10小时(?=10)。试估计这批机械零件的平均耐磨时数。 表7-5 某型号机械零件耐磨性能资料

第一步,计算x ,s ,x μ

)(5.1055100

105550小时===∑∑f xf

x ())(91.512小时=-=∑f f x x s )(191.510091.51小时===n x σμ

注意:总体标准差σ以样本标准差s 代替

第二步,根据给定的x ?=10,计算总体平均数的上、下限:

下限=x x ?-=1055.5-10=1045.5(小时)

上限=x x ?+=1055.5+10=1065.5(小时)

第三步,根据93.1191

.510==?=x

t μ,查《正态概率表》得概率保证程度F (t )=94.64%。 推断的结论是:根据要求耐磨时数的允许误差范围为10小时,估计这批机械零件耐磨时数在(1045.5,1065.5)之间,其概率保证程度为94.64%。

【案例】

仍用表7-5中的资料,设该种型号零件质量标准规定,耐磨时数达1000小时以上为合格品,要求合格率估计的允许误差范围不超过4%,试估计该批机械零件的合格率。

第一步,计算p ,2p s ,p μ %91100911===

n n p ()0819.009.091.012=?=-=p p s p ()%86.2100

0819.01==-=n p p p μ 第二步,根据给定的p ?=4%,求总体合格率的上、下限:

下限=p p ?-=91%-4%=87%

上限=p p ?+=91%+4%=95%

第三步,根据p p

t μ?==1.4,查《正态概率表》得概率F (t )=83.85%。

推断的结论是:根据要求,合格率允许误差范围不超过4%,估计这批零件的合格率在(87%,95%)之间,其概率保证程度为83.85%。

2.根据已给定的概率保证程度,求抽样极限误差。具体步骤是:

第一步,抽取样本,计算样本指标,即计算样本平均数x 或样本成数p ,作为总体指标的估计值,并计算样本标准差s 以推算抽样平均误差。

第二步,根据给定的概率保证程度F (t ),查概率表求得概率度t 值。

第三步,根据概率度t 和抽样平均误差μ推算出抽样极限误差Δ,并根据抽样极限误差求出被估计总体指标的上限和下限。

【案例】

对我国某中等城市进行居民家庭年人均旅游消费支出调查,随机抽取400户居民家庭,调查得知居民家庭年人均旅游消费支出额为400元,标准差为100元,要求以95%的概率保证程度,估计该市年人均旅游消费支出额。

第一步,根据已知资料算得 年人均消费支出额x =400(元)

样本标准差s=100(元)

)(5400100

元===n x σμ

注意:总体标准差σ以样本标准差s 代替

第二步,根据给定的概率保证程度F (t )=95%,查《正态概率表》得t=1.96。 第三步,计算x x t μ=?=1.96×5=9.80,则该市居民家庭年人均旅游消费支出额:

下限=x x ?-=400-9.80=390.20(元)

上限=x x ?+=400+9.80=409.80(元)

结论:在95%的概率保证程度下,估计该市居民家庭年人均旅游消费支出额在(390.20,409.80)之间。

【案例】

为了解国内旅游人数情况,在一些地区随机调查5000人,结果发现800人有当年国内旅游计划,要求以95%的概率保证程度,估计国内旅游人数比率的可能范围。

第一步,根据已知资料算得

%1650008001===

n n 样本国内旅游人数比率 ()1344.084.016.012=?=-=p p s p 样本方差 ()%518.05000

1344.01==-=n p p p μ抽样平均误差 注意:P (1-P )用p (1-p )代替

第二步,根据给定的概率保证程度F (t )=95%,查《正态概率表》得概率度t=1.96。第三步,计算p p t μ=?=1.96×0.518%=1.015%则总体比率的上、下限为:

下限=p p ?-=16%-1.015%=14.985%

上限=p p ?+=16%+1.015%=17.015%

结论:在95%的概率保证程度下,估计国内旅游人数的比率在[15%,17%]之间。

第四节 必要样本单位数的确定

一、样本单位数的确定

【引言】

科学地组织抽样调查,保证随机抽样条件的实现,并合理有效地取得各项数据,是抽样设计中一个至关重要的问题。注意相关问题如下:

首先要保证随机原则的实现。

其次,样本单位数确定。

再次,科学选择抽样组织形式。

最后,还必须重视调查费用这个基本因素。

实际上任何一项抽样调查都是在一定费用的限制下进行的。抽样设计应该力求采用调查费用最省的方案。一般地说,提高精确度的要求与节省费用的要求往往有矛盾,抽样误差要求愈小,则调查费用需要愈多。因此,抽样误差最小的方案并非是最好的方案,在许多情况下,允许一定范围的误差仍能够满足分析的要求。我们的任务就是在允许的误差要求下,选择费用最少的抽样设计方案。

综上所述,抽样设计应该掌握两个基本原则:

第一,保证实现抽样的随机原则,即保证总体各单位的相互独立性,以及任何一个单位在每次抽样中被抽中机会的均等性。

第二,保证实现最大的抽样效果原则,即在一定的调查费用下,选取抽样误差最小的方案;或在给定调查精确度的要求下,选取调查费用最省的方案。

(一)根据平均数的抽样极限误差确定样本单位数

影响抽样误差的因素之一,是样本单位数的多少。在抽样调查中,事先确定必要的样本单位数,是一项重要的工作。由于样本单位数n 是抽样极限误差公式的组成部分,所以可以根据抽样极限误差公式推导出样本单位数。以简单随机抽样为例,测定总体平均数所必需的样本单位数n 。

1.重复抽样条件下: x

x t n 22

2?=σ 2.不重复抽样条件下: 2222

σt N N t n x x +?= (二)根据成数的抽样极限误差确定样本单位数

1.重复抽样条件下

()P

p P P t n 221?-= 2.不重复抽样条件下

()()

P P t N P NP t n P p -+?-=11222 x n 或p n 是指在抽样误差不超过预先规定的数值,即满足抽样极限误差小于等于x ?或p ?的

条件下,至少应抽取的样本单位数。

(三)确定必要样本单位数应注意的问题

在确定必要样本单位数的过程中,可能会遇到一些应用性问题,主要应注意以下几个方面:

1.总体指标未知的问题。公式中涉及到总体标准差与总体成数资料时,一般可利用以前的经验数据或样本数据来代替。若遇到有不止一个经验数据或样本数据时,宜选择最大的一个。若总体成数未知,可选取使成数方差达到最大(0.25)或接近最大的P 值代入。

2.估计对象导致数目不相等的问题。对于同一资料既要估计平均数又要估计成数时,根据这两种估计所求的必要样本单位数可能不相等,这时应选择其中样本单位数较大的进行抽样,以保证抽样推断的精确性和可靠性。

3.抽样方式导致数目不相等的问题。按重复抽样公式计算的必要样本单位数要比按不重复抽样公式确定的必要样本单位数大。在条件允许的情况下,为保证抽样推断的精确度和可靠程度,原则上,一切抽样调查在计算必要样本单位数时,都可采用重复抽样公式计算。

二、影响样本单位数的因素

影响样本单位数的因素主要有以下几个:

(一)总体标准差

在其他条件不变的情况下,总体标准差与样本单位数成正比。总体标准差大,说明总体差异程度高,总体各单位标志值较平均数的离散程度高,则样本单位数就多;反之,总体标准差小,则样本单位数就少。

(二)抽样极限误差

在其他条件不变的情况下,抽样极限误差与样本单位数成反比。如果允许的误差范围越大,对抽样估计的精确度要求越低,则样本单位数就越少;反之,若允许的误差范围越小,对精确度的要求越高,则样本单位数就越多。

(三)抽样方法及抽样的组织形式

抽样方法和抽样组织形式不同,样本单位数的多少也不同。在其他条件不变的情况下,重复抽样条件下的样本单位数多于不重复抽样条件下的样本单位数;在适宜的条件下,类型抽样比简单重复抽样的样本单位数少。

此外,样本单位数的多少,一方面要考虑耗费的人力、财力、物力和时间的允许条件;另一方面要考虑能否达到研究的预期目的。一般而言,样本单位数越多,抽样误差越小,样本的代表性越大。但是,样本单位数越多,耗费的人力、物力、财力和时间也越多,从而又导致研究结果的时效性差。因此,在确定样本单位数时,还要考虑到这个方面的需要与可能。

【案例】

仍利用表7-5中的资料,确定必要样本单位数。根据表7-5中的已知资料计算得到

x =1055.5小时,s=51.91小时,x ?=10小时,t=1.93,p=90%(耐磨时数达1000小时以上比重),p ?=4%.

按样本平均数的重复抽样公式,确定必要样本单位数为

4.10010

91.5193.122

2222=?≈?=x x t n σ 按样本成数的重复抽样公式,确定必要样本单位数为

()()5.20904

.09.019.093.112222=-?≈?-=P p P P t n

根据计算结果,进行抽样调查时所确定的必要样本单位数应为210个。

第五节抽样的组织形式

一、简单随机抽样

简单随机抽样又称纯随机抽样。它是对总体中的所有单位不进行任何分组、排队,而是完全随机地直接从总体N个单位中抽取n个单位,作为一个样本进行调查。在抽样中保证总体中每个单位都有同等的被抽中的机会。

简单随机抽样是抽样中最基本、最单纯的组织形式,它适用于均匀总体,即具有某种特征的单位均匀地分布于总体的各个部分,使总体的各个部分都是同等分布的。

获得简单随机样本的具体做法主要有两种:

1.抽签法。抽签法就是将总体各单位编号,以抽签的方式从中任意抽取所需样本单位的方法。

2.查随机数表法。所谓随机数表是指含有一系列组别的随机数字的表格。表中数字的出现及其排列是随机的。查随机数表时,可以竖查、横查、顺查、逆查;可以用每组数字左边的头几位数,也可以用其右边的后几位数,还可以用中间的某几位数字。这些都需要事先定好。但一经决定采用某一种具体做法,就必须保证对整个样本的抽取完全遵从同一规则。

简单随机抽样在理论上最符合随机原则,但在实际应用中有很大的局限性:

第一,无论用抽签法还是用查随机数表法取样,均需对总体各个单位逐一编号。而抽样推断中的总体单位数很多,编号查号的工作量很大。

第二,当总体各单位标志变异程度较大时,简单随机抽样的代表性就比较差。

第三,对某些事物根本无法进行简单随机抽样,如对正在连续生产的大量产品进行质量检验,就不可能对全部产品进行编号抽检。

所以简单随机抽样适用于所调查的总体单位数不多、且各单位标志变异程度较小的情况。

二、类型抽样

类型抽样亦称分类抽样或分层抽样。它是先将总体各单位按主要相关标志分组(或分类),然后在各组(或各类)中再按随机原则抽取样本单位的组织形式。例如,在进行城市职工家庭旅游消费支出抽样调查时,首先把职工按所属国民经济部门分类,然后再在各部门中抽取若干个调查户;再如,进行星级宾馆入住情况调查时,先将各宾馆按星级标准分为五星、四星、三星、二星和一星五类,然后再在各类宾馆中抽取若干个调查单位。

类型抽样实质上是分组法和随机抽样法相结合的产物。先划分出性质不同的各个组,以减少组内标志值之间的变异程度;然后按照随机原则,从各组中抽取调查单位。所以,类型抽样所抽取的样本代表性较高,抽样误差小,能够以较少的样本单位数获得比较准确的推断结果。特别是当总体各单位标志值相差很大,各组间标志值变异程度很大时,类型抽样则更为优越。

经过划类分组后,确定各类型组样本单位数一般有两种方法:

第一,不等比例抽样。即各类型组所抽取的单位数,按各类型组标志值的变异程度来确定,变异程度大则多抽一些单位,变异程度小则少抽一些单位。这种方法又称为类型适宜抽样或称一般抽样。

第二,等比例抽样。即按各类型组的单位数占总体单位数的比重进行抽样。

在实际工作中,由于事先很难了解各组的标志变异程度,因此,大多数类型抽样采用等比例抽样法。

类型抽样的特点是,样本单位数不是从整个总体,而是从各类中分别抽取,且彼此独立。

三、等距抽样

等距抽样亦称机械抽样。它是先把总体各单位按照某一标志排队,然后按相等的距离抽取样本单位的组织形式。排队的标志可以是与调查标志无关的,也可以是与调查标志有关的。

按无关标志排队,是指排队时采用与调查项目无关的标志进行。例如,按姓氏笔画多少排队、按地名笔画排队、按人名册、户口簿及按地图上的地理位置排队等。也可以按时间顺序排队,例

如,检查产品质量,确定按10%的比率抽检,这时即可按时间顺序在每10个产品中抽取一个进行质量检查,直至将规定的样本单位数抽满为止。

按有关标志排队,是指排队时采用与调查项目有关的标志进行。例如,进行我国粮食产量抽样调查,由省抽县,县抽乡,乡抽村,都是按前三年的粮食平均亩产量排队的;进行我国城市职工家计抽样调查,是按职工平均工资排队的。按有关标志排队,能使被研究对象标志值的变动均匀地分布在总体中,保证样本具有较高的代表性。

等距抽样除考虑排队的标志外,还需要考虑抽样距离的问题。设N为全及总体单位数,n为样本单位数,k为抽样距离,则k=N/n。

等距抽样的随机性表现在抽取的第一个样本单位上,当第一个样本单位确定后,其余的各个样本单位也就确定了。就是说,第一个样本单位确定后,每加一个抽样距离就是下一个被抽取的样本单位,直至抽满规定的样本单位数为止。例如,进行工业产品质量检查,当确定按5%的比率抽取样本单位时,可以按时间顺序每隔5件抽取一件产品进行登记,一直达到预定的样本单位数为止。又如,进行粮食产量抽样调查时,抽取样本单位是先按最近三年粮食平均亩产量排队,再根据累计播种面积和预定抽取的样本单位数计算抽样距离,第一个样本单位在1/2抽样距离处,以后每加一个抽样距离就是下一个被抽取的样本单位,直至抽满规定的样本单位数为止。

等距抽样在按无关标志排队、等距抽取样本单位时,实质上仍是简单随机抽样,其抽样平均误差的计算公式与简单随机抽样相同。在按有关标志排队、等距抽取样本单位时,实质上就成为类型抽样的特例。因此,抽样平均误差的公式与类型抽样公式相同。但按有关标志排队的等距抽样与类型抽样略有不同,等距抽样只在各组中抽取一个单位,而类型抽样是在各组中抽取若干个单位。

四、整群抽样

整群抽样亦称成组抽样。前面介绍的三种抽样组织形式,都是一个一个地抽取样本单位,故称为个体抽样。整群抽样则是一批一批地抽取样本单位,每抽取一批时,对其中所有的单位都进行登记调查。抽取的形式,既可用简单随机抽样形式,也可以用等距抽样形式,一般常用后者。例如,要按10%的比例对饭店餐具进行卫生检验,即可每隔5小时从已消毒的餐具中抽取一次消毒过的全部产品作为一群,然后按比例要求抽满群数组成样本,并对每群进行逐个登记。

整群抽样容易组织,多用于进行产品的质量检查。缺点是由于样本在总体中太集中,分布不均匀,与其他几种抽样方式比较,误差较大,代表性较差。但是如果群内差异大而群间差异小,即群内方差大,群间方差小,则可使样本代表性提高,使抽样误差减少。考虑到编制名单和抽取样本的工作比其他各种组织形式简便易行,调查也集中方便,这时整群抽样又是有益的。

【能力训练】

(1)先将总体各单位按某一标志排列,再依固定顺序和间隔来抽取样本单位数的抽样组织形式,被称为()。

①纯随机抽样②机械抽样③分层抽样④整群抽样

(2)先将总体各单位按主要标志分组,再从各组中随机抽取一定单位组成样本,这种抽样组织形式,被称为()。

①纯随机抽样②机械抽样③分层抽样④整群抽样

(3)先将总体各单位划分成若干群,再以群为单位从中按随机原则抽取一些群,对抽中的群的所有单位进行全面调查,这种抽样组织形式,被称为()。

①纯随机抽样②机械抽样③分层抽样④整群抽样

(4)没有重复抽样的抽样组织形式为()。

①纯随机抽样②机械抽样③分层抽样④整群抽样

(5)某工厂产品是连续性生产,为检查产品质量,在24小时中每隔30分钟,取下一分钟的产品进行全部检查,这是()。

①纯随机抽样②机械抽样③分层抽样④整群抽样

附录应用Excel求置信区间

单元实训抽样调查方法的具体应用

【实训目的】

抽样调查是在统计资料搜集和分析中应用十分广泛的一种统计方法。本实训目的是使学生在掌握抽样调查概念的基础上,熟练地运用各种抽样调查方法,并能够根据实际情况,选择合适的抽样方法。

【实训资料】

消费者对新产品接受程度的市场调查

具体详尽资料参见本章单元实训

【实训要求】

1.以上述案例说明抽样调查具有哪些特点和作用?

2.在抽样调查的两个阶段中都使用了哪些抽样的组织形式?

【实训形式】

实训形式为分组讨论。

【实训时间】

教学学时1学时,在完成第七章的理论教学后进行。

【实训地点】

实训地点为教室或多媒体教室。

项目实战

统计分析四运用抽样推断进行抽样估计

【实战目的】

由于全面调查的范围广,工作量大,需要耗费大量的人力、物力和财力,而且有时也不需要或不可能进行全面调查,但又要了解客观现象的总体情况,就可以采用抽样调查的方式取得调查资料。因此,通过本项目实战训练,使学生掌握应用统计软件(EXCEL)操作手段将项目调查取得的项目资料运用抽样推断原理对全及总体进行抽样估计的技能。

【实战要求】

结合第7章抽样推断教学内容的学习,以项目小组为单位,首先将统计整理后的项目资料计算样本均值指标,然后判断抽样误差状况,再在确定抽样极限误差的基础上,对全及总体进行抽样估计。

【实战资料】

通过“整理项目资料”实战训练,各项目小组已经得到本组项目课题的电子信息资料。现需要应用统计软件(Excel)操作功能,将统计整理后的项目资料运用抽样推断原理对全及总体进行抽样估计。

【实战学时】

需用2学时来完成“运用抽样推断进行抽样估计”的项目实战训练。

【实战地点】

在电子实训室完成“运用抽样推断进行抽样估计”的项目实战训练。

【实战操作步骤】

1.根据样本数据计算样本均值或样本成数。

2.根据样本均值或样本成数计算样本标准差。

3.根据样本标准差计算抽样平均误差。

4.在确定抽样极限误差的基础上,对全及总体进行抽样估计,以说明总体现象的一般规律或水平。

第五章+统计学教案(假设检验)

第五章+统计学教案(假设检验)参数估计和假设检验是统计推断的两个组成部分,它们分别从不同的角度利用样本信息对总体参数 进行推断。前者讨论的是在一定的总体分布形式下,借助样本构造的统计量,对总体未知参数作出估计 的问题;后者讨论的是如何运用样本信息对总体未知参数的取值或总体行为所做的事先假定进行验证, 从而作出真假判断。通俗地、简单地说,前者是利用样本信息估计总体参数将落在什么范围里;而后者 则是利用样本信息回答总体参数是不是会落在事先假定的某一个范围里。 通过本章学习,要求学生在充分理解有关抽样分布理论的基础上,理解掌握假设检验的有关基本概 念;明确在假设检验中可能犯的两种错误,以及这两种错误之间的联系;熟练掌握总体均值和总体成数 的检验方法,主要是 Z 检验和 t 检验;对于非参数的检验,也应有所了解,包括符号检验、秩和检验与游程检验等。 2 一、假设检验概述与基本概念 1、假设检验概述 2、假设检验的有关基本概念 二、总体参数检验 1、总体平均数的检验 2、总体成数的检验

3、总体方差的检验 三、总体非参数检验 1、符号检验 2、秩和检验 3、游程检验 一、假设检验的有关基本概念; 二、总体平均数与总体成数的检验; 三、非参数检验; 一、假设检验的基本思路与有关概念; 二、两类错误的理解及其关系; 一、假设检验概述 假设检验:利用统计方法检验一个事先所作出的假设的真伪,这一假设称为统计假设,对这一假设 所作出的检验就是假设检验。 基本思路:首先,对总体参数作出某种假设,并假定它是成立的。然后,根据样本得到的信息(统 计量),考虑接受这个假设后是否会导致不合理的结果,如果合理就接受这个假设,不合理就拒绝这个 假设。 所谓合理性,就是看是否在一次的观察中出现了小概率事件。 小概率原理:就是指概率很小的事件,在一次试验中实际上是几乎不可能出现。这种事件可以称其 为“实际不可能事件”。 二、假设检验的基本概念

《统计学》 第六章 统计指数(补充例题)

第六章 统计指数 (3)由于每种商品和全部商品价格变动试该试居民增加支出的金额。 解:(1)各商品零售物价的个体指数见下表: (2)四种商品物价总指数%2.111598 .55840 .611 011== = ∑∑q p q p 四种商品销售量总指数%8.116595 .47598 .550 01 == = ∑∑p q p q (3)由于全部商品价格变动使该市居民增加支出为61.840-55.598=6.242(万元) 其中 蔬菜价格的变动占4.680-4160=0.520万元; 猪肉价格的变动占38.640-35.328=3.312万元; 蛋价格的变动占5.520-5.060=0.460万元; 水产品价格的变动占13.000-11.050=1.950万元。 通过分析可看出,猪肉价格变动影响最大,占居民增加支出金额的53.1%,其次是水产品,占居民增加支出金额的31.2%。 例2、某工业企业生产甲、乙两种产品,基期和报告期的产量、单位产品成本和出厂价格资

试计算: (1)以单位成本为同度量因素的产量总指数 (2)以出厂价格为同度量因素的产量总指数 (3)单位成本总指数 (4)出厂价格总指数 (1)以单位成本为同度量因素的产量总指数%7.11931000 37100 001== =∑∑z q z q (2)以出厂价格为同度量因素的产量总指数 %6.1155500063600 01== = ∑∑p q p q (3)单位成本总指数%2.14837100 55000 1 011== = ∑∑q z q z (4)出厂价格总指数%8.9963600 63500 1 011== = ∑∑q p q p 例3、试根据例2的资料,从相对数和绝对数方面分析: (1)总成本变动受产量和单位成本变动的影响程度 (2)销售额变动受产量和出厂价格变动的影响程度 解:(1)总成本变动: 总成本指数%4.17731000 55000 01 1== = ∑∑q z q z 增加总成本 ∑∑=-=-2400031000550000 01 1q z q z (元) 其中由于产量变动的影响: 产量指数%7.11931000 37100 001== = ∑∑z q z q

统计学第五章课后题及答案解析

第五章 一、单项选择题 1.抽样推断的目的在于() A.对样本进行全面调查 B.了解样本的基本情况 C.了解总体的基本情况 D.推断总体指标 2.在重复抽样条件下纯随机抽样的平均误差取决于() A.样本单位数 B.总体方差 C.抽样比例 D.样本单位数和总体方差 3.根据重复抽样的资料,一年级优秀生比重为10%,二年级为20%,若抽样人数相等时,优秀生比重的抽样误差() A.一年级较大 B.二年级较大 C.误差相同 D.无法判断 4.用重复抽样的抽样平均误差公式计算不重复抽样的抽样平均误差结果将()A.高估误差 B.低估误差 C.恰好相等 D.高估或低估 5.在其他条件不变的情况下,如果允许误差缩小为原来的1/2,则样本容量()A.扩大到原来的2倍 B.扩大到原来的4倍 C.缩小到原来的1/4 D.缩小到原来的1/2 6.当总体单位不很多且差异较小时宜采用() A.整群抽样 B.纯随机抽样 C.分层抽样 D.等距抽样 7.在分层抽样中影响抽样平均误差的方差是() A.层间方差 B.层内方差 C.总方差 D.允许误差 二、多项选择题 1.抽样推断的特点有() A.建立在随机抽样原则基础上 B.深入研究复杂的专门问题 C.用样本指标来推断总体指标 D.抽样误差可以事先计算 E.抽样误差可以事先控制 2.影响抽样误差的因素有() A.样本容量的大小 B.是有限总体还是无限总体 C.总体单位的标志变动度 D.抽样方法 E.抽样组织方式 3.抽样方法根据取样的方式不同分为() A.重复抽样 B.等距抽样 C.整群抽样 D.分层抽样 E.不重复抽样 4.抽样推断的优良标准是() A.无偏性 B.同质性 C.一致性 D.随机性 E.有效性 5.影响必要样本容量的主要因素有() A.总体方差的大小 B.抽样方法

统计学第一章练习题19785

第一题:单项选择题 1.同质性、大量性、差异性() A只有有限总体具有 B只有无限总体具有 C有限总体和无限总体都具有 D有限总体和无限总体都不具有 2.”统计”的基本含义是() A统计调查、统计整理、统计分析 B统计分析、统计推断、统计描述 C统计工作、统计资料、统计学 D统计分组、统计指标、统计分析 3.研究生招生目录中,201为英语、202为俄语、203为日语。这里语种属于() A定类数据 B定序数据 C定距数据 D定比数据 4.电视观众对收费频道是否应该插入广告的态度为不应该、应该、无所谓。这里“不应该、应该、无所谓”是() A定类数据 B定序数据 C定距数据 D定比数据 5.学生的智商等级是() A定类数据 B定序数据 C定距数据 D定比数据 6.下列表述正确的是() A定序数据包含定类数据和定距数据的全部数据 B定类数据包含定序数据的全部信息 C定序数据与定类数据是平行的 D定比数据包含了定类数据、定序数据和定距数据的全部信息 7.用部分数据去估计总体数据的理论和方法,属于() A理论统计学 B应用统计学 C描述统计学 D推断统计学 8.了解学生的学习情况,要调查足够多的学生,这个方法称为() A大量观察法 B统计分组法 C综合指标法 D相关分析法 9.了解居民的消费支出情况,则() A所有居民的消费支出额是总体单位 B所有居民是总体 C某个居民的消费支出额是总体

D所有居民是总体单位 10.统计学的数量性特点表现在它是() A一种纯数量的研究 B利用大量的数字资料建立数学模型 C在质与量的联系中来研究现象总体的数量特征 D以数学公式为基础的定量研究 11.统计学的总体性特点是指() A研究现象各个个体的数量特征 B研究由大量个别事物构成的现象整体的数量特征 C从认识总体入手开始研究现象的数量特征 D从现象量的研究开始来认识现象的性质和规律 12.统计研究中的大量观察法是指() A一种具体的调查研究方法 B对总体中的所有个体进行观察和研究的方法 C收集大量总体资料的方法 D要认识总体的数量特征就必须对全部或足够多个体进行观察和研究13.对全市工业企业职工的生活状况进行调查,调查对象是() A该市全部工业企业 B该市全部工业企业的职工 C该市每一个工业企业 D该市工业企业的每一个职业 14.某年全国汽车总产量是() A随机变量 B连续变量 C离散变量 D任意变量 15.要反映我国工业企业的整体业绩水平,总体单位是() A我国每一家工业企业 B我国所有工业企业 C我国工业企业总数 D我国工业企业的利润总额16.统计总体的特点是() A同质性、大量性、可比性 B同质性、大量性、差异性 C数量性、总体性、差异性 D数量性、综合性、同质性 第二题:多项选择题

统计学基础_第五章_动态数列分析

统计学基础第五章动态数列分析 【教学目的】 1.区分不同种类的动态数列 2.熟练掌握计算平均发展水平的各种方法 3.掌握发展速度、增长速度的种类,运用它们之间的数量关系进行动态指标的相互推算 4.理解趋势的意义,运用长期趋势测定方法对长期趋势进行测定 5.计算季节比率,并且深刻理解季节比率的经济含义 【教学重点】 1.总量指标动态数列的种类和特点 2.动态比较指标和动态平均指标的计算 3.动态数列的分析方法 【教学难点】 1.绝对数时间数列中的时点数列平均指标的计算 2.相对数、平均数时间数列动态平均指标的计算 3.动态数列分析方法中的季节变动分析方法 【教学时数】 教学学时为12课时 【教学容参考】 第一节动态数列的意义和种类 一、动态数列的概念 将某一个统计指标在不同时间上的各个数值,按时间先后顺序排列,就形成了一个动态数列,也叫做时间数列。动态数列一般由两个基本要素构成:一是被研究现象所属的时间;二是反映该现象的统计指标数值。 通过编制和分析动态数列,首先可以从现象的量变过程中反映其发展变化的方向、程度和趋势,研究其质量变化的规律性。 其次,通过对动态数列资料的研究,可以对某些社会经济现象进行预测。 第三,利用动态数列,可以在不同地区或国家之间进行对比分析。 编制和分析动态数列具有非常重要的作用,这种方法已成为对社会经济现象进行统计分析的一种重要方法。 【案例】 下面图表列举了我国2004~2007年若干经济指标的动态数列。 表5-1 我国2004-2007年若干经济指标 二、动态数列的种类 按照构成动态数列的基本要素———统计指标的表现形式不同,动态数列可分为绝对数动态数列、相对数动态数列和平均数动态数列三种类型。其中绝对数动态数列是基本的数列,相对数和平均数动态数列是派生数列。

统计学第七章、第八章课后题答案

统计学复习笔记 第七章参数估计 一、思考题 1.解释估计量和估计值 在参数估计中,用来估计总体参数的统计量称为估计量。估计量也是随机变量。如样本均值,样本比例、样本方差等。 根据一个具体的样本计算出来的估计量的数值称为估计值。 2.简述评价估计量好坏的标准 (1)无偏性:是指估计量抽样分布的期望值等于被估计的总体参数。 (2)有效性:是指估计量的方差尽可能小。对同一总体参数的两个无偏估计量,有更小方差的估计量更有效。 (3)一致性:是指随着样本量的增大,点估计量的值越来越接近被估总体的参数。 3.怎样理解置信区间 在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间。置信区间的论述是由区间和置信度两部分组成。有些新闻媒体报道一些调查结果只给出百分比和误差(即置信区间),并不说明置信度,也不给出被调查的人数,这是不负责的表现。因为降低置信度可以使置信区间变窄(显得“精确”),有误导读者之嫌。在公布调查结果时给出被调查人数是负责任的表现。这样则可以由此推算出置信度(由后面给出的公式),反之亦然。 4.解释95%的置信区间的含义是什么 置信区间95%仅仅描述用来构造该区间上下界的统计量(是随机的)覆盖总体参数的概率。也就是说,无穷次重复抽样所得到的所有区间中有95%(的区间)包含参数。 不要认为由某一样本数据得到总体参数的某一个95%置信区间,就以为该区间以的概率覆盖总体参数。 5.简述样本量与置信水平、总体方差、估计误差的关系。 1. 估计总体均值时样本量n 为 (z 2 )2 2其中: E z n n E22 其中: E z 2 n 2. 样本量n 与置信水平1- α、总体方差、估计误差E之间的关系为与置信水平 成正比,在其他条件不变的情况下,置信水平越大,所

统计学基础 第一章 统计概述

第一章统计概述 【教学目的】 1.明确统计的含义、方法及职能 2.能够灵活运用统计资料反映社会经济现象的数量方面 3.重点理解统计的基本概念及各概念之间的区别与联系 【教学重点】 1.能够运用统计资料反映社会经济现象的数量方面 2.重点理解统计的基本概念及各概念之间的区别与联系 【教学难点】 难点为理解统计的基本概念及各概念之间的区别与联系 【教学时数】 教学学时为4课时 【教学内容参考】 第一节统计的研究对象 一、统计的含义 【引言】 当我们跨入新世纪的时候,人们已经对这个时代的特征作了概括性的描述,这就是信息时代。面对来自方方面面的各种信息,我们只有利用统计这一工具,才能理解世界的精彩,了解世界宏微观的经济运行状况。为了管理好国家,搞好企业的生产经营,政府和企业都设立了专门的统计机构,或专门成立企业营销组织、营销策划等机构,由专门的统计人员或营销策划人员负责国民经济各行各业的信息搜集、整理、分析工作,为国家和企业进行各项决策提供可靠、及时的统计信息。 【案例】 据统计,2008年国内生产总值300670亿元,比上年增长9.0%。分产业看,第一产业增加值34000亿元,增长5.5%;第二产业增加值146183亿元,增长9.3%;第三产业增加值120487亿元,增长9.5%。第一产业增加值占国内生产总值的比重为11.3%,比上年上升0.2个百分点;第二产业增加值比重为48.6%,上升0.1个百分点;第三产业增加值比重为40.1%,下降0.3个百分点。年末全国就业人员77480万人,比上年末增加490万人。其中城镇就业人员30210万人,净增加860万人,新增加1113万人。年末城镇登记失业率为4.2%,比上年末上升0.2个百分点。这些都是统计信息的基本表现形式。 因此,我们将统计的含义概括为统计资料、统计工作和统计学。 反映社会经济现象情况和特征的数字及文字材料,称为统计资料; 对统计资料的搜集、整理、分析的工作总称,称为统计工作(或统计活动)。 统计过程包括统计设计、统计调查、统计整理与统计分析; 系统论述统计工作的学科,称为统计学。 三者之间的关系比较密切。统计资料是统计工作的成果,统计学与统计工作是理论与实践的辩证关系。了解和掌握统计学的基本理论和方法,是做好统计工作、取得有效统计资料的基础。 二、统计的研究对象 社会经济统计的研究对象是社会经济现象的总体数量方面,即以统计资料为依据具体说明社会经济现象总体的数量特征、数量关系及数量界限。下面举例说明如何根据统计资料说明社会经济现象的数量特征、数量关系及数量界限。 【案例】

统计学 第五章 抽样推断课后答案

第五章 抽样推断 一、单项选择题 1 2 3 4 5 6 7 8 9 10 C B A D B D C B A C 11 12 13 14 15 16 17 18 19 20 A D C A D C A C B D 二、多项选择题 1 2 3 4 5 ABCE ABDE BCE ABCE ABDE 6 7 8 9 10 ACE ADE ACD ABE CDE 11 12 13 14 15 BDE CD BC ABCD ABCDE 16 17 18 19 20 AD AC BCE ABDE ACE 三、判断题 1 2 3 4 5 6 7 8 9 10 × × × √ √ × √ √ × × 四、填空题 1、变量 属性 2、正 反 3、重复抽样 不重复抽样 4、抽样总体 样本 5、大于 N n - 1 N n 6、标准差 7、样本 总体 抽样平均误差 抽样平均误差 △x = Z x σ 8、合适的样本估计量 一定的概率保证程度 允许的极限误差范围 9、随机抽样 统计分组 10、增大 增大 降低 11、大数定律 中心极限定理 12、样本容量不小(不小于30个单位) 13、大 0.5

14、缩小 3 3 (即0.5774) 扩大 1.1180 15、估计量(或统计量) 参数 五、简答题(略) 六、计算题 1、已知条件:P = 0.5 ,n = 100 且重复抽样 求:p ≤0.45的概率 解: Z = 1100 ) 5.01(5.05.045.0)1(=-?-= --n P P P p 则F (Z = 1) = 0.6827 所以p ≤0.45的概率为: 2 6827 .01-= 0.15865 2、解 E (x 1) = E (0.5X 1 + 0.3X 2 + 0.2X 3) = 0.5 E (X ) + 0.3 E (X ) + 0.2E (X ) = E (X ) = X E (x 2) = E (0.5X 1 + 0.25X 2 + 0.25X 3) = 0.5 E (X ) + 0.25 E (X ) + 0.25E (X ) = E (X ) = X E (x 3) = E (0.4X 1 + 0.3X 2 + 0.3X 3) = 0.4 E (X ) + 0.3 E (X ) + 0.3E (X ) = E (X ) = X 所以x 1、x 2、x 3都是X 的无偏估计量。 D (x 1) = D (0.5X 1 + 0.3X 2 + 0.2X 3) = 0.25 D (X ) + 0.09 D (X ) + 0.04D (X ) = 0.38 D (x 2) = D (0.5X 1 + 0.25X 2 + 0.25X 3)

统计学第五章 练习

第五章 一、填空题: 1、时间序列的构成要素包括 和 。 2、绝对数时间序列可以分为 和 两种,序列中不同时间数值相加有实际的意义的是 。 3、设i=1,2,…n , i a 为第i 期发展水平,则1a 称为 ,n a 称为 ,/i a 1 i a 是 , /i a 1a 是 。 4、计算间断时点序列平均发展水平,一般有两个假设条件:假设上期末水平 本期初水平,其二是假设现象在间断期内数量 变化。 5、时间序列的波动可以分解为 、 、循环变动和不规则变动。 6、报告期粮食总产量增加12%,粮食播种面积增加9%,则粮食每亩产量提高 。 二、单项选择题 1、时间序列与变量数列( )。 A 、都是根据时间顺序排列的 B 、都是根据变量值大小排列的 C 、前者根据时间顺序排列的,后者根据变量值大小排列的 D 、前者根据变量值大小排列的,后者根据时间顺序排列的 2、时间序列中,数值大小与时间长短有直接关系的是( )。 A 、时点序列 B 、时期序列 C 、平均数时间序列 D 、相对数序列 3.对时间数列进行动态比较分析和动态平均分析的基础指标是( )。 A 、发展水平 B 、发展速度 C 、平均发展水平 D 、平均发展速度 4、发展速度属于( )。 A 、比例相对数 B 、动态相对数 C 、比较相对数 D 、强度相对数 5、一个动态数列的多个环比增长速度分别为4%、6%、9%,该数列的定基增长速度为( )。 A 、4%×6%×9% B 、 104%×106%×109% C 、(4%×6%×9%)-1 D 、(104%×106%×109%)-1 6、 若各年环比增长速度保持不变,则各年的增长量( )。 A 、逐年增加 B 、逐年减少 C 、保持不变 D 、无法判断

统计学第一章课后习题及答案

第一章 练习题 一、单项选择题 1.统计的含义有三种,其中的基础是() A.统计学B.统计方法 C.统计工作D.统计资料 2.对30名职工的工资收入进行调查,则总体单位是() A.30名职工B.30名职工的工资总额 C.每一名职工D.每一名职工的工资 3.下列属于品质标志的是() A.某人的年龄B.某人的性别 C.某人的体重D.某人的收入 4.商业企业的职工人数,商品销售额是() A.连续变量B.离散变量 C.前者是连续变量,后者是离散变量D.前者是离散变量,后者是连续变量5.了解某地区工业企业职工的情况,下列哪个是统计指标() A.该地区每名职工的工资额B.该地区职工的文化程度 C.该地区职工的工资总额D.该地区职工从事的工种 二、多项选择题 1.社会经济统计的特点,可概括为() A.数量性B.同质性 C.总体性D.具体性 E.社会性 2.统计学的研究方法是() A.大量观察法B.归纳推断法 C.统计模型法D.综合分析法 E.直接观察法 3.下列标志哪些属于品质标志() A.学生年龄B教师职称C企业规模D企业产值 4.下列哪些属于离散型变量 A年龄B机器台数C人口数D学生成绩 5.总体,总体单位,标志,指标这几个概念间的相互关系表现为() A.没有总体单位就没有总体,总体单位也离不开总体而独立存在 B.总体单位是标志的承担者 C.统计指标的数值来源于标志 D.指标是说明统计总体特征的,标志是说明总体单位特征的 E.指标和标志都能用数值表现 6.指标和标志之间存在着变换关系,是指() A.在同一研究目的下,指标和标志可以对调 B.在研究目的发生变化时,指标有可能成为标志

统计学第四版第七章课后题最全答案

第七章 练习题参考答案 7.1 (1)已知σ=5,n=40,x =25,α=0.05, z 05.0=1.96 样本均值的抽样标准差 σ x =n σ= 79.040 5 = (2)估计误差(也称为边际误差)E= z 2 α n σ =1.96*0.79=1.55 7.2(1)已知σ=15,n=49,x =120,α=0.05, z 05.0=1.96 (2)样本均值的抽样标准差 σ x =n σ= =4915 2.14 估计误差E= z 2 α n σ=1.96* =4915 4.2 (3)由于总体标准差已知,所以总体均值μ的95%的置信区间为: n x z σ α ± =120±1.96*2.14=120±4.2,即(115.8,124.2) 7.3(1)已知σ=85414,n=100,x =104560,α=0.05, z 05.0=1.96 由于总体标准差已知,所以总体均值μ的95%的置信区间为: n x z σ α ± =104560±1.96* =100 85414104560±16741.144即(87818.856,121301.144) 7.4(1)已知n=100,x =81,s=12, α=0.1, z 2 1.0=1.645 由于n=100为大样本,所以总体均值μ的90%的置信区间为: n s x z 2 α±=81±1.645* =100 1281±1.974,即(79.026,82.974) (2)已知α=0.05, z 2 05.0=1.96 由于n=100为大样本,所以总体均值μ的95%的置信区间为: n s x z 2 α±=81±1.96* =100 1281±2.352,即(78.648,83.352) (3)已知α=0.01, z 2 01.0=2.58 由于n=100为大样本,所以总体均值μ的99%的置信区间为:

统计学答案解析最新版本

统计学课本课后作业题(全) 题目: 第1章:P11 6,7 第2章:P52 练习题3、9、10、11 第3章:P116思考题12、14 练习题16、25 第4章:P114 思考题6,练习题2、4、6、13 第5章:P179 思考题4、练习题3、4、6、11 第6章:P209 思考题4、练习题1、3、6 第7章:P246思考题1、练习题1、7 第8章:P287 思考题4、10 练习题2、3 第一章 6..一家大型油漆零售商收到了客户关于油漆罐分量不足的许多抱怨。因此,他们开始检查供货商的集装箱,有问题的将其退回。最近的一个集装箱装的是2 440加仑的油漆罐。这家零售商抽查了50罐油漆,每一罐的质量精确到4位小数。装满的油漆罐应为4.536 kg。要求: (1)描述总体;最近的一个集装箱内的全部油漆; (2)描述研究变量;装满的油漆罐的质量; (3)描述样本;最近的一个集装箱内的50罐油漆; (4)描述推断。50罐油漆的质量应为4.536×50=226.8 kg。 7.“可乐战”是描述市场上“可口可乐”与“百事可乐”激烈竞争的一个流行术语。这场战役因影视明星、运动员的参与以及消费者对品尝试验优先权的抱怨而颇具特色。假定作为百事可乐营销战役的一部分,选择了1000名消费者进行匿名性质的品尝试验(即在品尝试验中,两个品牌不做外观标记),请每一名被测试者说出A品牌或B品牌中哪个口味更好。要求:答:(1)总体:市场上的“可口可乐”与“百事可乐” (2)研究变量:更好口味的品牌名称; (3)样本:1000名消费者品尝的两个品牌 (4)推断:两个品牌中哪个口味更好。 第二章 3.某百货公司连续40天的商品销售额如下(单位:万元):

统计学基础

一、单项选择题(共10道小题,共100.0分) 1.在下列调查中.调查单位与填报单位一致的是( )。 A. 公司设备调查 B. 农村耕地调查 C. 学生学习情况调查 D. 汽车养护情况调查 2. 3.在统计调查中,调查标志的承担者是( )。 A. 调查对象 B. 调查单位 C. 填报单位 D. 调查表 4. 5.填报单位( )。 A. 是调查标志的承担者 B. 是负责向上报告调查内容的单位 C. 是构成调查对象的每一单位 D. 即是总体单位 6. 7.变量数列中各组频率之和是( )。 A. 不等于l B. 大于1 C. 小于1 D. 等于l

8. 9. 统计表的结构,从其外形看,是由( )。 A. 标题和数字资料两部分构成 B. 标题、横行、纵栏标目三部分构成 C. 横行和纵栏数字资料构成 D. 标题、横纵、纵栏、数字资料等部分构成 10. 11.有20个工人看管机器台数资料如下:2、5、4、4、3、4、3、4、4、2、2、 4、3、4、6、3、4、 5、2、4,按以上资料编制分配数列,应采用( )。 A. 单项式分组 B. 等距分组 C. 不等距分组 D. 以上几种分组均可 12. 13.某厂劳动生产率计划在去年的基础上提高8%,执行结果仅比去年提高4%, 则劳动生产率的计划完成相对数算式为( )。 A. 4%÷8% B. 8%÷4% C. (100%+4%)÷(100%+8%) D. (1+8%÷1+4%) 14. 15. (错误) 下面属于结构相对指标的是( )。

A. 招生录取率 B. 人均钢产量 C. 轻重工业比例 D. 人均国民收入 16.对全市科技人员进行调查,每位科技人员是总体单位,科技人员的职称是 ( )。 A. 品质标志 B. 变量 C. 变量值 D. 标志值 17. 18.某学生某门课成绩为80分,则该成绩是( )。 A. 品质标志 B. 数量标志 C. 变量 D. 指标 1.设2000~2004年各年的环比增长速度为6%、7%、8%、9%和10%,则平均增长速度为 ( )。 A. B. C.

统计学习题第五章_抽样与抽样估计答案

一、填空题 1、在实际工作中,人们通常把 n≥30 的样本称为大样本,而把 n<30 的样本称为小样本。 2、在抽样估计中,常见的样本统计量有样本均值、样本比例、样本标准差或样本方差以及它们的函数。 3、在研究目的一定的条件下,抽样总体是唯一确定的,而样本则有许多个。 4、在抽样调查中,登记性误差和系统性误差都可以尽量避免,而抽样误差则是不可避免的,但可以计算并加以控制。 5、在抽样估计中,抽样估计量是指用于估计总体参数的样本指标(统计量),评价估计量优劣的标准有无偏性、有效性和一致性。 二、选择题 单选题: 1、在其它条件不变的情况下,要使抽样平均误差为原来的1/3,则样本单位数必须 ((2)) (1)增加到原来的3倍(2)增加到原来的9倍 (3)增加到原来的6倍(4)也是原来的1/3 2、在总体内部情况复杂,且各单位之间差异程度大,单位数又多的情况下,宜采用 ((3)) (1)简单随机抽样(2)等距抽样(3)分层抽样(4)整群抽样 3、某厂产品质量检查,确定按5%的比率抽取,按连续生产时间顺序每20小时抽1 小时的全部产进行检验,这种方式是((4)) (1)简单随机抽样(2)等距抽样(3)分层抽样(4)整群抽样 4、其它条件一定,抽样推断的把握程度提高,抽样推断的准确性就会((2)) (1)提高(2)降低(3)不变(4)不一定降低 5、在城市电话网的100次通话中,通话持续平均时间为3分钟,均方差为分钟,则概率为时,通话平均持续时间的抽样极限误差为((2)) (1)(2)(3)(4)

6、假定11亿人口大国和100万人口小国的居民年龄变异程度相同,现在各自用重复抽样方法抽取本国人口的1%计算平均年龄,则平均年龄抽样平均误差((3))(1)两者相等(2)前者比后者大(3)前者比后者小(4)不能确定大小 多选题: 1、降低抽样误差,可以通过下列那些途径((2)(4)(5)) (1)降低总体方差(2)增加样本容量。 (3)减少样本容量(4)改重复抽样为不重复抽样 (5)改简单随机抽样为类型抽样 2、抽样推断中的抽样误差((1)(5)) (1)是不可避免要产生的 (2)是可以通过改进调查方法来消除的 (3)只有调查后才能计算 (4)即不能减少,也不能消除 (5)其大小是可以控制的 3、抽样极限误差((1)(2)(4)) (1)是所有可能的样本指标与总体指标之间的误差范围 (2)也叫允许误差(3)与所做估计的概率保证程度成反比 (4)通常用来表示抽样结果的精确度 4、影响样本容量的因素有((1)(2)(3)(4)(5)) (1)总体方差 (2)所要求的概率保证程度 (3)抽样方法 (4)抽样的组织形式 (5)允许误差法范围的大小 5、不重复抽样的抽样平均误差((2)(4)) (1)总是大于重复抽样的抽样平均误差

统计学基本知识第七章课后知识题及答案解析

第七章 相关和回归 一、单项选择题 1.相关关系中,用于判断两个变量之间相关关系类型的图形是( )。 (1)直方图 (2)散点图 (3)次数分布多边形图 (4)累计频率曲线图 2.两个相关变量呈反方向变化,则其相关系数r( )。 (1)小于0 (2)大于0 (3)等于0 (4)等于1 3.在正态分布条件下,以2yx S (提示:yx S 为估计标准误差)为距离作平行于回归直线的两条直线,在这两条平行直线中,包括的观察值的数目大约为全部观察值的( )。 (1)68.27% (2)90.11% (3)95.45% (4)99.73% 4.合理施肥量与农作物亩产量之间的关系是( )。 (1)函数关系 (2)单向因果关系 (3)互为因果关系 (4)严格的依存关系 5.相关关系是指变量之间( )。 (1)严格的关系 (2)不严格的关系 (3)任意两个变量之间关系 (4)有内在关系的但不严格的数量依存关系 6.已知变量X 与y 之间的关系,如下图所示: 其相关系数计算出来放在四个备选答案之中,它是( )。 (1)0.29 (2)-0.88 (3)1.03 (4)0.99 7.如果变量z 和变量Y 之间的相关系数为-1,这说明两个变量之间是( )。 (1)低度相关关系 (2)完全相关关系 (3)高度相关关系 (4)完全不相关 8.若已知 2()x x -∑是2()y y -∑的2倍,()()x x y y --∑是2 ()y y -∑的1.2倍, 则相关系数r=( )。 (1) 21.22 (3)0.92 (4)0.65 9.当两个相关变量之问只有配合一条回归直线的可能,那么这两个变量之间的关系是( )。 (1)明显因果关系 (2)自身相关关系 (3)完全相关关系 (4)不存在明显因果关系而存在相互联系 10.在计算相关系数之前,首先应对两个变量进行( )。 (1)定性分析 (2)定量分析 (3)回归分析 (4)因素分析 11.用来说明因变量估计值代表性高低的分析指标是( )。 (1)相关系数 (2)回归系数 (3)回归参数 (4)估计标准误差 12.确定回归方程时,对相关的两个变量要求( )。 (1)都是随机变量 (2)都不是随机变量

统计学第五章课后题及答案解析

第五章 练习题 一、单项选择题 1.抽样推断的目的在于() A.对样本进行全面调查B.了解样本的基本情况 C.了解总体的基本情况D.推断总体指标2.在重复抽样条件下纯随机抽样的平均误差取决于() A.样本单位数B.总体方差 C.抽样比例D.样本单位数和总体方差 3.根据重复抽样的资料,一年级优秀生比重为10%,二年级为20%,若抽样人数相等时,优秀生比重的抽样误差() A.一年级较大B.二年级较大 C.误差相同D.无法判断 4.用重复抽样的抽样平均误差公式计算不重复抽样的抽样平均误差结果将()A.高估误差B.低估误差 C.恰好相等D.高估或低估 5.在其他条件不变的情况下,如果允许误差缩小为原来的1/2 ,则样本容量() A.扩大到原来的2倍B.扩大到原来的4倍 C.缩小到原来的1/4D .缩小到原来的1/2 6.当总体单位不很多且差异较小时宜采用() A.整群抽样B.纯随机抽样 C.分层抽样D.等距抽样 7.在分层抽样中影响抽样平均误差的方差是() A.层间方差B.层内方差 C.总方差D.允许误差二、多项选择题 1.抽样推断的特点有() A .建立在随机抽样原则基础 上 B.深入研究复杂的专门问 题 C .用样本指标来推断总体指 标 D.抽样误差可以事先计算 E .抽样误差可以事先控制 2.影响抽样误差的因素有() A .样本容量的大小B.是有限总体还是无限总 体 C .总体单位的标志变动度D.抽样方法 E .抽样组织方式 3.抽样方法根据取样的方式不同分为() A .重复抽样 B .等距抽样 C .整群抽样 D .分层抽样 E .不重复抽样 4.抽样推断的优良标准是() A .无偏性 B .同质性 C .一致性 D .随机性 E .有效性 5.影响必要样本容量的主要因素有() A . 总体方差的大小B.抽样方法

大学统计学第七章练习题及答案概要

第7章 参数估计 练习题 7.1 从一个标准差为5的总体中抽出一个样本量为40的样本,样本均值为25。 (1) 样本均值的抽样标准差x σ等于多少? (2) 在95%的置信水平下,边际误差是多少? 解:⑴已知25,40,5===x n σ 样本均值的抽样标准差79.04 10 40 5≈= = = n x σ σ ⑵已知5=σ,40=n ,25=x ,4 10 = x σ,%951=-α 96.1025.02==∴Z Z α 边际误差55.14 10 * 96.12 ≈==n Z E σ α 7.2 某快餐店想要估计每位顾客午餐的平均花费金额,在为期3周的时间里选取49名顾客 组成了一个简单随机样本。 (1) 假定总体标准差为15元,求样本均值的抽样标准误差; (2) 在95%的置信水平下,求边际误差; (3) 如果样本均值为120元,求总体均值μ的95%的置信区间。 解.已知.根据查表得2/αz =1.96 (1)标准误差:14.249 15== =n X σ σ (2).已知2/αz =1.96 所以边际误差=2/αz * =n s 1.96* 49 15=4.2 (3)置信区间:)(2.124,8.11596.149 151202 =*± =±n s Z x α

7.3 从一个总体中随机抽取100=n 的随机样本,得到104560=x ,假定总体标准差 85414=σ,构建总体均值μ的95%的置信区间。 96.12 =?Z 144.16741100 85414* 96.12 ==? ?n Z σ 856.87818144.16741104560. 2 =-=-?n Z x σ 144.121301144.16741104560. 2 =+=+?n Z x σ 置信区间:(87818.856,121301.144) 7.4 从总体中抽取一个100=n 的简单随机样本,得到81=x ,12=s 。 (1) 构建μ的90%的置信区间。 (2) 构建μ的95%的置信区间。 (3) 构建μ的99%的置信区间。 解;由题意知100=n , 81=x ,12=s . (1)置信水平为%901=-α,则645.12 =αZ . 由公式n s z x ? ±2 α974.181100 12645.181±=? ±= 即(),974.82,026.79974.181=± 则的的%90μ置信区间为79.026~82.974 (2)置信水平为%951=-α, 96.12 =αz 由公式得n s z x ? ±2 α=81352.281100 12 96.1±=? ± 即81352.2±=(78.648,83.352), 则μ的95%的置信区间为78.648~83.352 (3)置信水平为%991=-α,则576.22 =αZ .

统计学 第五章习题

第五章思考与练习 1. 要求: (1)计算样本平均数和样本标准差,并推算抽样平均误差; (2)以95.45%的概率保证,估计该厂工人的月平均工资和工资总额的区间。 2.从某餐厅连续三个星期抽查49名顾客,调查顾客的平均消费额,得样本平均消费额为 25.5元。要求: (1)假设总体标准差为10.5元,求抽样平均误差。 (2)以95%的概率保证,抽样极限误差是多少? (3)估计总体消费额的置信区间。 3.某加油站想了解司机在该加油站加油的习惯,一周内随机抽取了100名司机,得出如下 结果:平均加油量等于13.5升,样本标准差为3.2升,有19人购买无铅汽油,试问:(1)以0.05的显著性水平,是否有证据说明平均加油量为12升。 (2)以0.05的显著性水平,是否有证据说明购买无铅汽油的司机少于20。 4 设干燥时间总体服从正态分布,现在要求置信度为95%时估计这种漆的平均干燥时间。 (1)根据经验知总体标准差为0.6小时: (2)总体标准差未知。 5.采用简单随机重置抽样从2000件产品中抽查200件产品,其中合格产品190件,要求: (1)计算该产品的合格率及其抽样平均误差; (2)以95.45%的概率,对产品合格率和产品合格数量进行区间估计; (3)如果合格品率的极限误差为2.31%,其概率保证程度是多少?

6.某电子产品的使用寿命在3000小时以下为次品,现在从5000件产品中抽取100件测得 要求: (1)分别按重置抽样和不重置抽样计算该产品平均寿命的抽样平均误差; (2)分别按重置抽样和不重置抽样计算该产品次品率的抽样平均误差; (3)以90%的概率保证,对该产品的平均使用寿命进行区间估计; (4)以90%的概率保证,对该产品的次品率进行区间估计。 7.某医院欲估计一名医生花在每个病人身上的平均时间,根据以往经验看病时间的标准差 为6分钟。若要求置信度为95%,允许误差范围为2分钟。试问随机抽样中需要多大的样本? 8.某公司新推出一种营养型豆奶,为了解该豆奶的受欢迎程度,并使置信度为95%,估计 误差不超过5%,下列情况下,你建议样本容量为多少? (1)初步估计60%的顾客喜欢此豆奶 (2)没有任何顾客资料 9.为调查某地区人口综合素质,在该地区150 000户家庭中以不重置抽样方式随机抽取30 要求: (1)试以95.45%的概率保证程度,推断该地区的人口总数 (2)若要求人口总数的极限误差不超过3300人,应至少抽取多少户作为样本? 10.某电视台为了了解某电视节目的收视率,随机抽取500户居民作为样本。从调查结果来 看,有160户收看该节目。以95%的概率保证推断: (1)该电视节目的收视率 (2)如果收视率的极限误差缩小为原来的1/2,则样本容量应为原来的多少户? 11.从某县的100个村中,抽取10个村进行各村的全面调查,算得每户平均饲养家畜35头, 各村平均的方差为16,要求: (1)以90%的概率估计全县平均每户饲养家畜的头数 (2)若极限误差为2412头,则计算其概率保证程度。

统计学第四版第七章答案

第四章 抽样分布与参数估计 7.2 某快餐店想要估计每位顾客午餐的平均花费金额。在为期 3 周的时间里选取 49 名顾客 组成了一个简单随机样本。 (1) 假定总体标准差为 15 元,求样本均值的抽样标准误差。 15 x =2.143 n 49 (2) 在 95%的置信水平下,求边际误差。 x t x ,由于是大样本抽样, 因此样本均值服从正态分布, 因此概率度 t= z 2 因此, x t x z 2 x z 0.025 x =1.96 × 2.143=4.2 (3) 如果样本均值为 120 元,求总体均值 的 95%的置信区间。 置信区间为: x x , x x = 120 4.2,120 4.2 =( 115.8, 124.2) 7.4 从总体中抽取一个 n=100 的简单随机样本 ,得到 x =81 , s=12。 要求: 2 2 大样本,样本均值服从正态分布: x N , 或 x N s n , n 置信区间为: x z 2 s z 2 s , s = 12 =1.2 , x n n n 100 (1) 构建 的 90%的置信区间。 z 2 = z 0.05 =1.645 ,置信区间为: 81 1.645 1.2, 81 1.645 1.2 =( 79.03, 8 2.97) (2) 构建 的 95%的置信区间。 z 2 = z 0.025 =1.96 ,置信区间为: 81 1.96 1.2, 81 1.96 1.2 =( 78.65,83.35) (3) 构建 的 99%的置信区间。 z 2 = z 0.005 =2.576 ,置信区间为: 81 2.576 1.2, 81 2.576 1.2 =( 77.91, 84.09) 7.7 某大学为了解学生每天上网的时间, 在全校 7 500 名学生中采取重复抽样方法随机抽取 36 人,调查他们每天上网的时间,得到下面的数据 (单位:小时 ): 3.3 3.1 6.2 5.8 2.3 4.1 5.4 4.5 3.2 4.4 2.0 5.4 2.6 6.4 1.8 3.5 5.7 2.3 2.1 1.9 1.2 5.1 4.3 4.2 3.6 0.8 1.5 4.7 1.4 1.2 2.9 3.5 2.4 0.5 3.6 2.5 求该校大学生平均上网时间的置信区间,置信水平分别为 90%, 95%和 99%。 解:

统计学第六章习题

第六章统计指数 一、单项选择题 1、社会经济统计中的指数是指< )。 ①总指数②广义的指数 ③狭义的指数④广义和狭义指数 2、根据指数所包括的范围不同,可把它分为< )。 ①个体指数和总指数②综合指数和平均指数 ③数量指数和质量指数④动态指数和静态指数 3、编制综合指数时对资料的要求是须掌握< )。 ①总体的全面调查资料②总体的非全面调查资料 ③代表产品的资料④同度量因素的资料 4、设P表示商品的价格,q表示商品的销售量,说明了< )。 ①在报告期销售量条件下,价格综合变动的程度 ②在基期销售量条件下,价格综合变动的程度 ③在报告期价格水平下,销售量综合变动的程度 ④在基期价格水平下,销售量综合变动的程度 5、根据指数所反映现象的数量特征不同,可把它分为< )。 ①拉氏指数和帕氏指数②综合指数和平均指数 ③数量指数和质量指数④动态指数和静态指数 6、拉氏指数所选取的同度量因素是固定在< )。 ①报告期②基期③假定期④任意时期

7、帕氏指数所选取的同度量因素是固定在< )。 ①报告期②基期③假定期④任意时期 8、设P表示商品的价格,q表示商品的销售量,帕氏价格指数的公式 是< )。 ①②③④ 9、设P表示商品的价格,q表示商品的销售量,拉氏销售量指数的公 式是< )。 ①②③④ 10、编制数量指标综合指数时,一般是采用< )作同度量因素。 ①报告期数量指标②基期数量指标 ③报告期质量指标④基期质量指标 11、编制质量指标综合指数的一般是采用< )作同度量因素。 ①报告期数量指标②基期数量指标 ③报告期质量指标④基期质量指标 12、某地区职工工资水平本年比上年提高了5%,职工人数增加了2%, 则工资总额增加了< )。 ①7% ②7.1% ③10% ④11%b5E2RGbCAP 13、单位产品成本报告期比基期下降5%,产量增加5%,则生产费用 < )。 ①增加②降低③不变④难以判断

相关文档
相关文档 最新文档