文档库 最新最全的文档下载
当前位置:文档库 › 统计学大题及答案附期末复习纲要

统计学大题及答案附期末复习纲要

统计学大题及答案附期末复习纲要
统计学大题及答案附期末复习纲要

命题形式:单选(20%)、多选(20%)、判断(10%)、计算(50%)

第一章总论

(1)统计的三种含义。即统计工作、统计资料、统计学。(2)统计学的研究对象、特点(3)统计学中的几个基本概念。即统计总体与总体单位、变量与数据等概念;并明确有关概念的区别和联系。(4)统计学的分科。

第二章统计资料的收集

(1)统计调查的意义、种类和方法。特别是明确普查、重点调查、抽样调查和典型调查的概念;明确统计报表与普查的区别、重点调查、典型调查与抽样调查的区别。(2)调查方案计的有关问题。如调查单位与填报单位的区别、调查时间与期限的区别等。(3)统计调查误差的含义及分类。

第三章统计数据的整理与显示

(1)统计分组的概念、作用、种类、方法。(2)变量数列的编制方法。(3)统计表的结构、种类和制表规则。

第四章总量指标与相对指标

(1)综合指标的概念、分类(2)总量指标的意义、作用和分类。特别是时期指标和时点指标的不同特点。(2)相对指标的概念和种类、计算。特别是计划完成相对指标和强度相对指标的计算。

第五章分布的数值特征

(1)平均指标的概念、特点,掌握各种平均数的计算方法、数学性质及特点。分组数列众数及中位数的计算不作考试要求(2)标志变动度的概念、种类和作用及与平均指标的区别。其中重点是标准差与离散系数的计算,以及如何正确运用标准差和离散系数来判别社会经济现象的稳定性与平均指标的代表性。偏度与峰度不作考试要求。

第六章时间数列

(1)动态数列的4种水平分析指标的涵义及计算。重点是根据绝对数动态数列计算的平均发展水平(序时平均数)。(2)动态数列的4种速度分析指标的涵义及计算。重点是平均发展速度的计算方法(水平法)及应用。方程式法不作考试要求(3)影响时间数列的主要因素及含义,长期趋势及季节变动测定不作考试计算要求。

第七章统计指数

(1)指数的概念、作用和种类。注意区分广义指数和狭义指数两种涵义;明确个体指数和总指数、数量指标指数和质量指标指数等的区别。(2)总指数的编制(综合指数和平均指数。)(3)利用指数体系进行因素分析。重点是总量指标的两因素分析。平均指标对比指数的因素分析、多因素分析及第五节统计指数的应用不作考试要求

第八章相关与回归分析

(1)相关关系的特点及种类;判断现象之间有无相关关系的几种常用方法。(2)相关系数的概念极其常用计算公式;相关系数的取值范围及相关关系密切程度的判断标准。(3)相关分析和回归分析的区别之处。(4)熟练应用最小平方法求解一元回归方程,理解回归系数的含义。(5)理解估计标准误差统计分析指标的含义,掌握其计算公式以及这个指标的作用。曲线回归模型不作考试要求

第九章抽样与抽样估计

抽样调查中的基本概念;总体均值与成数的简单估计;必要样本量的计算不作考试要求2012-2013学年度第 1 学期套别:A套(∨)

四、计算题(50分)

1、设两车间工人日产量(件)数据资料如下:(10分)

解:(1)甲x =5

8075706560++++=∑n

x =70 (件)

甲σ=5)7080()7075()7065()7060()

(2

2222

-+-+-+-=

-∑n

x x = (件)

乙x =5

12

9752++++=

∑n

x

=7 (件),

σ=

5

)712()79()75()72()

(2

2222

-+-+-+-=

-∑n

x x =

(

)

(每个算式各1分)

则其离散系数分别为:

70

07.7x =

=

甲σV = (2分) 7

41.3x =

=

乙σV = (2分)

故乙组的离散程度更大。 (2分) 2

计算:(1)第一、第二季度的月平均劳动生产率。 (5分) (2)第一、第二季度的劳动生产率。 (5分) 解:(1)第一季度平均月劳动生产率:

18410031871851803110

10090n

n =

++++==

=∑∑b

a

b

a C =(万元/人) (3分)

同样,第二季度平均月劳动生产率:

190

12331931921853130

124115n

n =

++++==

=∑∑b a

b

a

C =(万元/人) (2分)

(2)第一季度的劳动生产率=3

193

192185110

10090++++=(万元/人) (3分)

第二季度的劳动生产率=

3

193

192185130124115++++=(万元/人) (2分)

3、某企业三种产品的生产费用2012年为万元,比2011年多万元,单位产品成本平均比2011年降低3%,试计算:(10分) (1)生产费用总指数;(4分) (2)产品产量指数;(4分)

(3)由于成本降低而节约的生产费用绝对额。(2分) 解:(1)生产费用总指数=12

9.120

11=

=

∑∑q

p q

p K

pq

=% (4分)

(2)产品产量指数q K =%

31%5.107-=p

pq K K =% (4分)

(3)由于成本降低而节约的生产费用绝对额:

∑∑-1

1

1q

p q p =97

.09.12=(万元) (2分)

4、设x 、y 为存在相关关系的两组数据表如下: (10分)

(1)计算相关系数(2分)

(2)求y 对x 的回归直线方程(以x 为自变量),说明回归系数的含义。(4分) (3)求x 对y 的回归直线方程(以y 为自变量),说明回归系数的含义。(4分) 解:n=8,

∑x =216,∑

y =157,∑xy =4418,∑2x =6052,∑2

y =3391 (1)相关系数:

r =

= (2分)

(2)配置y 对x 的回归直线方程: 2

2

2

84418216157

()

86052216n xy x y

b n x x -?-?==

-?-∑∑∑∑∑= (1分)

8

2169275.08

157?-=?-=x b y a = (1分)

所求y 对x 的回归直线方程为:y

?=+ (1分) 表示x 每增加1个单位,y 平均增加个单位 (1分)

(3)配置x 对y 的回归直线方程:

2

22'157

3319815721644188)

(-??-?=--=∑∑∑∑∑y y n y x yx n b = (1分)

8

157

5777.08216'

'

?

-=

?-=y b x a = (1分) 所求x 对y 的回归直线方程为:x

?=+ (1分) 表示y 每增加1个单位,x 平均增加0. 5777个单位 (1分)

5、某纱厂在某时期生产了100000个单位的纱,按纯随机抽样方式,抽取2000个单位检验,合格品为1900个单位。(10分) (1)试计算样本成数标准差;(5分) (2)求抽样平均误差。(5分) 解:(1)样本合格率:p=1900/2000=95% (2分) 样本成数标准差为: )95.01(95.0)1(-=-=

p p σ= (4分)

(2)抽样平均误差: 按重置抽样计算:

2000

218

.0=

=n p σμ==% (2分)

或按重置抽样计算: 100000200012000

218.01-?=-

=N n n

p

σ

μ==% 2011-2012学年度第 2 学期 套别:A 套(∨)

四、计算题(50分)

1、某企业劳动生产率2011年比2010年增长8%,超额完成计划2%,试确定劳动生产率增长计划数 (10分)

解:已知2011年实际劳动生产率/ 2010年实际劳动生产率=108%,且2011年实际劳动生产率/ 2011年计划劳动生产率=102% (4分)

所以,2011年计划劳动生产率比2010年增长=108%/102%-1=% (5分) 即,2011年劳动生产率增长计划数为% (1分)

解:分析该题是间隔不等的时点数列求序时平均数:

年平均库存量

54

.3212

5.3901290715.171328012

320

602260111211244224422242382221

1

1

1232121≈=++++=?++?++?++?++?+=

++++++=∑-=--n i i

n n

n f f a a f a a f a a a (10分)

即该产品的年平均库存量为件

3

(1)计算销售量指数及由于销售量变化而变化的销售额(5分) (2)计算价格指数及由于价格变化而变化的销售额(5分) 解:(1):销售量指数

%

54.10767000007205000280010002500600300080028001050250065030008800

001

≈=?+?+??+?+?==

∑∑p q

p q

k q (3分)

由于销售量变化而变化的销售额:

∑∑-0

1p

q p q =720=505000(元) (2分)

(2)价格指数

%38.917205000

6584000

280010502500650300088025001050230065028008800

111≈=?+?+??+?+?=

=

∑∑p

q p

q k p (3分)

由于价格上升而增加的销售额

1

1

q p ∑-1

q p

∑=658=-621000(元) (2分)

4、某地6家商店人均销售额和利润率资料如下:(10分)。

要求:(1)计算相关系数,并说明相关的方向和程度(3分) (2)建立直线回归方程,并解释回归系数的实际含义;(3分) (3)若人均月销售额为9千元,估计其利润率。(2分) (4)计算回归估计标准误差。 (2分) 解:

(1)根据资料计算Σy=78,Σx=33,Σy =1130,Σx =199,Σxy=473,代入相关系数公式:

9766.033.270264

696

105264)

7811306)(331996(78

334736)()(222

22

2≈≈?=

-?-??-?=

---=∑∑∑∑∑∑∑y y n x x n y

x xy n r =

说明二者间相关的方向为正相关,相关程度为高度正相关。(3分) (2)5143.2105

26433

199678334736)

(2

22≈=-??-?=--=∑∑∑∑∑x x n y x xy n b (1分) 83.082865

.13136

335143.26

78-≈-=-=-=

∑∑n

x b n

y a (1分)

回归直线为 Y=+

回归系数 b=的含义为人均月销售额每增加1千元,则利润率平均增加%。 (1分)

(3)若人均月销售额为9千元,估计其利润率=+×9≈(%)(2分) (4)计算回归估计标准误差

(2分) 5、某单位随机抽选100名职工进行调查,得家庭人均月收入845元,已知人均月收入抽样平均误差为175元。

(1)求人均月收入的抽样极限误差;(5分)(F (t )=%)

37.18775.14

51.72

647351.2)7883.0(113022≈==-?-?--=---=

∑∑∑n xy b y a y S yx

(2)求以%的置信度的人均月收入的区间估计。(5分)

解:(1)已知人均月收入的抽样平均误差为x s =175元,F (t )=%时,t=2所以,人均月收入的抽样极限误差x x s ?=?2=2×175=350(元) (5分)

(2)已知家庭人均月收入x =845元,由%的置信度,知t=2,所以人均月收入的区间估计为:

x x x X x ?+≤≤?- 即350845350845+≤≤

-X 所以,

以%的置信度的人均月收入的区间估计为(495,1195)元(5分)

2011-2012学年度第 1 学期 套别:A 套(∨) 四、计算题(50分)

1、某企业利润计划2011年比2010年提高5%,实际提高%达到300万元,试计算: (1)该企业2010年利润额和2011年计划利润。(4分) (2)2011年利润计划完成程度超额多少(3分) (3)2011年利润实际比计划提高的百分点。(3分) 解:(1)已知2011年利润额=300万元 则2010年实际利润额=

300

281.431 6.6%

=+(万元) (2

分)

2011年计划利润额= ×(1+5%)=(万元) (2分) (2)2011年利润计划完成程度相对数=11 6.6% 1.015115%

++==++实际提高百分数计划提高百分数

=%

所以,2011年利润计划完成程度超额%(=%-1) (3分)

(3)%—5%=%,即2011年实际利润比计划高出了个百分点。 (3分) 2、2011年12月甲、乙两农贸市场某农产品价格及成交量、成交额的资料如下:

试问哪个市场农产品的平均价格高,并说明原因。(10分) 解:甲乙市场的平均价格分别为:

4

.15

.13

4.18.22.12.13

8.22.1=++++=

=

∑∑x

m m

X 甲元/斤 (4分)

1.22+1.41+1.5 1.5

1.342+1+1.5

i

i

i

X f

X f

???=

=

≈∑∑乙元/斤 (4分)

由于X 甲>X 乙,所以甲市场的农产品的平均价格更高。 (2分) 3、某商店4种商品销售额和价格资料如下:

解:(1)相对数分析: 销售额指数%78.1103060

3390

0011===

∑∑p q p

q k pq

(1分) 销售量指数%32.1053060

7

.32220

0==

=∑∑p

q p q k k

q

q

(2分)

销售价格指数%19.1057

.32223390

1

1

1

11

==

=

=

∑∑∑∑p

q k p q p q

p q k q

p

(2分)

(2)绝对数分析: 增加的总销售额=1

1

q

p ∑-0

q p

∑=330(万元) (1分)

其中:由于销售量上升增加的销售额= 1

q p ∑-0

q p ∑=(万元) (1分)

由于销售价格上升增加的销售额=1

1

q

p

∑ -1

q

p ∑ =(万元) (1分)

(3)总体分析:

%=%×% (1分)

330(万元)=(万元)+(万元) (1分)

4、已知某市2002-2009年城镇居民用于舒适生活的消费支出(改善性住房、汽车、旅游等)y

要求:(1)计算舒适生活消费支出与人均可支配收入之间的简单相关系数;(3分) (2)拟合舒适生活消费支出关于人均可支配收入的回归直线,并解释回归系数的实际含义;(4分)

(3)2010年居民人均可支配收入为27000元,假定2011年人均可支配收入比2010年增长15%左右,试预测2011年居民舒适生活消费支出。(3分) 解:相关与回归分析计算表

(1)根据资料计算Σy=54,Σx=121,Σy =448,Σx =2143,Σxy=978,代入相关系数公式:

∑∑∑∑∑∑∑---=

2

22

2)()(y y n x x n y x xy n r =

说明二者间为高度正相关 (3分)

(2)5154.0121

12121438541219788)

(2

2=?-??-?=--=∑∑∑∑∑x x

n y x xy n b (1分)

05.1-=-=

∑∑n

x

b n

y a (1

分)

回归直线为 Y= + (1分)

回归系数 b=的含义为人均可支配收入增加1千元,则舒适生活消费支出平均增加千元。 (1分)

(3)该市居民2011年收入预计为 27×(1+15%)=(千元) (1分) 则2011年舒适生活消费支出预测值:

2011y

= + *= (2分)

5、某企业采用简单随机重复抽样,在10000件产品中抽查200件,其中不合格品10件。要求:(1)求抽样平均误差;(5分)

(2)以%的置信度对该批产品不合格率进行区间估计。(5分) 解:(1)样本不合格率10

5%200

p == (2分)

抽样平均误差0.0154p s =

== (3分)

(2)由%的置信度,知t=2,

抽样极限误差20.01540.0308p p ts ?==?= (3分) 该批产品不合格率的区间估计为:

p p p P p -?≤≤+?

即 1.92%8.08%P ≤≤ (2分) 2010-2011学年度第 2 学期 套别:A 套(∨) 四、计算题(50分)

1、某农场在不同自然条件下的地段上用同样的管理技术试种两个粮食新品种,二号品种的

具有推广价值 解:

2、某大型商贸集团2011年上半年的销售计划执行情况如下,根据资料计算:

(1)各季度销售完成百分比(4分)

(2)上半年计划完成情况和上半年累计计划进度执行情况。(6分)

解:

3、某日化集团三种主要商品的销售量和销售价格资料如下:

要求:(1)2010年各产品销售量个体指数和销售量总指数(5分)

(2)2010年由于销售量增长而增加的销售额(2分)

(3)2010年的销售额总指数(3分)

解:

4、某企业有1500个工人,用简单随机重复抽样的方法抽出50个工人作为样本,调查其产量水平,资料如下,根据以往经验,标准差为35,要求:

(1)计算样本平均数和抽样平均误差。(5分)

(2)以%的可靠性估计该厂工人的月平均产量的区间。(5分)

解:

5、为研究家庭收入(x)和食品支出(y)的关系,随机抽取了10个家庭的样本,得数据如表(单位:百元):

(1)计算食品支出与家庭收入之间的简单相关系数。(3分)

(2)拟合食品支出与家庭收入的回归直线,并解释回归系数的实际含义。(5分)

(3)估计当家庭收入为4200元时,平均食品支出额是多少(2分)

解:

2009-2010学年度第 2 学期套别:A套(∨)

四、计算题(60分)

1、某企业利润计划2009年比2008年提高5%,实际提高%达到300万元,试计算:

(1)该企业2008年利润额和2009年计划利润。(4分)

(2)2009年利润计划完成程度超额多少(3分)

(3)2009年利润实际比计划提高的百分点。(3分)

解:(1)2008年利润额=

300

281.43

1 6.6%

=

+

(万元) (2分)

2009年计划利润额= ×(1+5%)=(万元) (2分)

(2)利润计划完成程度相对指标=11 6.6%

1.015

115%

++

==

++

实际提高百分数

计划提高百分数

(3分)

则计划完成程度超额%。

(3)%-5%=%,即2009年实际利润比计划高出了个百分点。(3分) 阅卷说明:由于第(2)和第(3)问雷同,所以只要得到%都算对。 2、某企业2009年各月末商品库存额资料如下表:(10分)

又知1月1日商品库存额为62万元,2009年全年的商品销售额为200万元。 计算:(1)上半年的平均商品库存额;(4分) (2)下半年的平均商品库存额;(4分) (3)2009年的商品流转次数。(2分)

解:(1)上半年平均库存额=6250

6055484340226

++++++=(万元)(4分)

(2)下半年平均库存额=504545606068

2312226

+++?+?+?=(万元) (4分)

(3)2009年商品流转次数=商品销售额平均库存额=200

50.3352.75

3.882

+=(次) (2分)

3、甲、乙两个工人班组,每班组有8个工人,两个班组每个工人的月产量记录如下:(10

分)

甲班组:20、40、60、70、80、100、120、70 乙班组:67、68、69、70、71、 72、 73

、70 (1)计算甲、乙两组工人平均每人产量;

(1分)

(2)计算甲、乙两组的全距、平均差、标准差、标准差系数;(8分) (3)比较甲、乙两组的平均每人产量的代表性。(1分) 解:(1)甲班组平均每人产量70x x n

==∑件

乙班组平均每人产量70x x n

==∑件 (1分)

(2)甲班组:

全距max min 12020R X X =-=-=100件 (1分)

平均差18022.58

x x

A D n

-?==

=∑件 (1分)

标准差29.6σ=

=

=件 (1分) 标准差系数29.642.29%70

V x

σσ=== (1分)

乙班组:

全距max min 73676R X X =-=-=件 (1分)

平均差12 1.58

x x A D n

-?==

=∑

件 (1分)

标准差 1.87σ=

=件 (1分) 标准差系数 1.87 2.67%70

V x

σσ=== (1分)

(3)从甲、乙两组计算结果看出,尽管两组的平均每人产量相同,但乙班组的标志变异指标值均小于甲班组,所以乙班组的人均产量的代表性较好。 (1分) 4、已知某商品市场三种商品2009年比2008年的价格变动率及销售额资料如下表所示:(10分)

根据表中2009年与2008年的数据对比,计算: (1)销售额指数;(3分) (2)价格指数;(3分)

(1)销售量总指数,并对该市场商品销售额的变动进行因素分析。(4分) 解:(1)销售额总指数=

11

00

8970

112.125%8000

p q

p q

=

=∑∑

11

00

89708000970p q p q

-=-=∑∑(万元) (3分)

(2)价格总指数=

11110

1

11

1

p

p q p q p q

p q

K =

∑∑∑∑

=378035701620

37803570

1620105%102%108%

++++

=89708600

=%

11

01

89708600370p q p q

-=-=∑∑(万元) (3分)

(3)销售量总指数=010

p q p q

∑∑=8600/8000=%

01

00

86008000600p q p q

-=-=∑∑(万元) (3分)

该地2009年比2008年商品销售额增长了%,增加了970万元,其中价格上涨了%,影响销售额增加了370万元,销售量增长了%,影响销售额增加了600万元。(1分)。

5、某鱼塘共养鱼10万尾,现用纯随机抽样方式捕捞其中100尾,其中有鲤鱼30尾。试对整个鱼塘中鲤鱼的数目进行点估计,并以的置信概率求区间估计。(10分)

解:依题意:N=100000,t=,30

0.3100

p =

= (2分)

0.0458p u =

== (2分) 阅卷说明:学生计算时,分母取n 和n-1的都算对。同时,采用重复抽样和不重复抽样公式

计算的也都算正确。

1.640.04580.075p p tu ?==?= (2分) 点估计:1000000.330000N p =?=(尾) (1分) 区间估计:由p p P p p ?+≤≤?-得≤P ≤ (1分)

()()N p p N p N p p -?≤≤+?得:

100000(0.30.075)100000(0.30.075)22500()37500N p N p ?-≤≤+≤≤尾(尾)

(2分)

6、已知:n=6,∑x=21,∑y=426,∑x 2

=79,∑y 2

=30268,∑xy=1481 求:(1)计算相关系数;(4分) (2)建立回归直线方程;(4分) (3)计算回归估计标准误差。(2分) 解:(1)

()()n xy x y r -=

=

60

0.915.744611.4891

-=-? (4分)

(2)77.37 1.82y x =- (4分)

(3)y

S ∧=

(2分)

2008-2009学年第一学期《统计学》全校教考分离A 卷 四、计算题(50分)

1、根据下表中重庆市2002-2006年地区生产总值数列,计算: (1)各年的环比发展速度及以2002年为基期的定基发展速度;(6分) (2)这5年间重庆生产总值的年平均发展速度和年平均增长率。(4分)。

解:(1)

(各年的环比发展速度和定基发展速度各3分)

(2)年平均发展速度:

%

09.1151990

3492

%

75.113%114%48.118%22.1144

4

1

==

???=

=∏-n

i i

Y Y

R (3分)。

年平均增长速度:%-100%=% (1分)

2

(1)计算销售量指数及由于销售量变化而增加的销售额;(5分) (2)计算价格指数及由于价格变化而变化的销售额。(5分)解:根据已知数据,列出计算表如下:

(1)销售量指数 %1.113168

190

001==

=

∑∑p q p q K q (3分)

由于销售量变化而增加的销售额为;

∑q 1p 0-∑q 0p 0=190-168=22(千元) (2分) (2)价格指数:

%

63.92190

176

111==

=

∑∑p q p q K p (3分)

由于价格变化而变化的销售额为:

∑q 1p 1-∑q 1p 0=176-190=-14(千元) (2分)

3、某煤矿甲、乙两个工人班组,每班组有8个工人,每个班组每个工人的月产量(单位:

要求:(1)计算甲、乙两组工人各自的平均每人产量;(2分) (2)计算甲、乙两组工人产量标准差和标准差系数;(6分) (3)比较甲、乙两组工人的平均每人产量的代表性;(2分) 解:(1)平均每人产量 甲班组:平均每人产量70==

∑n

x

x 件 (1分)

乙班组:平均每人产量70==∑n

x

x 件 (1分)

(2)标准差 甲班组:6

.298

7000

)(2

==

-

=

∑n

x x σ件 (分)

乙班组:9.18

28

)(2

==

-

=

∑n

x x σ件 (分)

标准差系数 甲班组:%29.4270

6

.29==

=x

V σ

σ (分) 乙班组:%71.270

9

.1==

=

x

V σ

σ (分) (3)分析说明:从甲、乙两组的计算结果看,尽管两组的平均每人产量相同,但乙组的标志变异指标值均小于甲组,所以,乙组的人均产量的代表性较好。(2分)

4、某公司采用简单随机重复抽样的方法在20000件产品中抽取200件,其中不合格品10件。 要求:(1)计算样本不合格品率及其抽样平均误差;(5分) (2)以%的置信度对该批产品不合格品率进行区间估计。(5分) 解:(1)样本不合格品率p=10/200=5% (2分) 抽样平均误差%54.1200

05

.095.0)

1(=?=

-=

n

p p u p (3分)

(2)以%的置信度,则t=2。该批产品不合格品率的估计区间为 5%-2×%≤P ≤5%+2×% (3分) 即 %≤P ≤% (1分) 5、已知某市1999-2006年城镇居民住房消费支出y 和人均可支配收入x 的统计数据(单位:

千元),计算得∑y=54,∑x=121,∑y 2=448,∑x 2

=2143,∑xy=978,要求:

(1)计算住房支出与人均可支配收入之间的简单相关系数。(3分)

(2)拟合住房支出关于人均可支配收入的回归直线,并解释回归系数的实际含义。(5分)

(3)假定2007年该市居民人均可支配收入比2006年增长20%左右,试预测2007年居民住房消费支出。(2分) 解:(1)相关系数 9976.0)

()())((2

2=-

---=

=

∑∑∑y y x x y y x x r y

x x y

σσσ (3分)

(2)已知∑y=54,∑x=121,∑y 2

=448,∑x 2

=2143,∑xy=978,因此 5154.0121

2143854

1219788)(2

2

2=-??-?=

--=

∑∑∑∑∑x x n y x xy n b (2分) 05.18

121

5154.0854-=?-=

-=

∑∑n

x

b

n

y

a (1分) 回归直线为y=+ (1分)

回归系数b=的含义是:人均可支配收入每增加1千元,则住房消费支出平均增加千元 (1分)

(3)2007年该市居民人均可支配收入预计为25*(1+20%)=30千元 (1分) 则2007年居民住房消费支出的预测值为

y 2007=+*30=(千元) (1分)

医学统计学 名词解释+问答题-1

医学统计学 1、应用相对数时应注意的事项 ①计算相对数时分母不能太小; ②分析时不能以构成比代替率; ③当各分组的观察单位数不等时,总率(平均率)的计算不能直接将各分组的率相加求其平均; ④对比时应注意资料的可比性:两个率要在相同的条件下进行,即要求研究方法相同、研究对象同质、观察时间相等以及地区、民族、年龄、性别等客观条件一致,其他影响因素在各组的内部构成应相近; ⑤进行假设检验时,要遵循随机抽样原则,以进行差别的显著性检验。 2、正态分布的特点及其应用 性质:①两头低中间高,略呈钟形; ②只有一个高峰,在X=μ,总体中位数亦为μ; ③以均数为中心,左右对称; ④μ为位置参数,当σ恒定时,μ越大,曲线沿横轴越向右移动; σ为变异度参数,当μ恒定时,σ越大,表示数据越分散,曲线越矮胖,反之,曲线越瘦高; ⑤对于任何服从正态分布N(μ,σ2)的随机变量X作的线性变换,都会变换成u 服从于均数为0,方差为1的正态分布,即标准正态分布。 应用:①概括估计变量值的频数分布; ②制定参考值范围; ③质量控制; ④是许多统计方法的理论基础。 3、确定参考值范围的一般原则和步骤、方法 一般原则和步骤:①抽取足够例数的正常人样本作为观察对象; ②对选定的正常人进行准确而统一的测定,以控制系统误差; ③判断是否需要分组测定; ④决定取单侧范围值还是双侧范围值; ⑤选定适当的百分范围; ⑥选用适当的计算方法来确定或估计界值。 方法:①正态分布法:②百分位数法(偏态分布) 4、总体均数的可信区间与参考值范围的区别 概念:可信区间是按预先给定的概率来确定的未知参数μ的可能范围。 参考值范围是绝大多数正常人的某指标范围。所谓正常人,是指排除了影响所研究指标的疾病和有关因素的人;所谓绝大多数,是指范围,习惯上指正常人的95%。 计算公式:可信区间① ② ③ 参考值范围①正态分布 ②偏态分布 用途:可信区间用于总体均数的区间估计 参考值范围用于表示绝大多数观察对象某项指标的分布范围

统计学原理计算题试题及答案(最新整理)

电大专科统计学原理计算题试题及答案 计算题 1某单位40名职工业务考核成绩分别为 68 89 8884 86 87 75 73 72 68 75 82 9758 81 54 79 76 95 76 71 60 9065 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 81 单位规定:60分以下为不及格,60 — 70分为及格,70 — 80分为中,80 — 90 分为良,90 — 100分为优。 要求: (1)将参加考试的职工按考核成绩分为不及格、及格、中、良、优五组并编制一张考核成绩次数分配表; (2)指出分组标志及类型及采用的分组方法; (3)分析本单位职工业务考核情况。 解:(1) (2)分组标志为”成绩",其类型为" 的开放组距式分组,组限表示方法是重叠组限; (3)本单位的职工考核成绩的分布呈两头小,中间大的”正态分布”的形态, 说明大多数职工对业务知识的掌握达到了该单位的要求。 2.2004年某月份甲、乙两农贸市场农产品价格和成交量、成交额资料如下 价格(元/斤) 甲市场成交额(万元) 乙市场成交量(万斤) 品种

试问哪一个市场农产品的平均价格较高?并说明原因 解:先分别计算两个市场的平均价格如下: 甲市场平均价格 X m 5.5 1.375 (元 /斤) m/x 4 乙市场平均价格 X xf 5.3 1.325 (元 / 斤) f 4 说明:两个市场销售单价是相同的,销售总量也是相同的,影响到两个市场 平均价格高低不同的原因就在于各种价格的农产品在两个市场的成交量不同 3. 某车间有甲、乙两个生产组,甲组平均每个工人的日产量为 36件, 标准差为9.6件;乙组工人日产量资料如下:

统计学简答题参考答案讲解学习

统计学简答题参考答 案

统计学简答题参考答案 第一章绪论 1.什么是统计学?怎样理解统计学与统计数据的关系? 答:统计学是一门收集、整理、显示和分析统计数据的科学。统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。 2.简要说明统计数据的来源。 答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。 3.简要说明抽样误差和非抽样误差。 答:统计调查误差可分为非抽样误差和抽样误差。非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。 4.解释描述统计和推断统计的概念?(P5) 答:描述统计是用图形、表格和概括性的数字对数据进行描述的统计方法。推断统计是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。 第二章统计数据的描述 1描述次数分配表的编制过程。 答:分二个步骤:

(1)按照统计研究的目的,将数据按分组标志进行分组。 按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。 按数量标志进行分组,可分为单项式分组与组距式分组 单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。 统计分组应遵循“不重不漏”原则 (2)将数据分配到各个组,统计各组的次数,编制次数分配表。 2. 一组数据的分布特征可以从哪几个方面进行测度? 答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。常用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和峰度系数。 3.怎样理解均值在统计中的地位? 答:均值是对所有数据平均后计算的一般水平的代表值,数据信息提取得最充分, 具有良好的数学性质,是数据误差相互抵消后的客观事物必然性数量特征的一种反映,在统计推断中显示出优良特性,由此均值在统计中起到非常重要的基础地位。受极端数值的影响是其使用时存在的问题。 4. 简述众数、中位数和均值的特点和应用场合。 答:众数、中位数和均值是分布集中趋势的三个主要测度,众数和中位数是从数据分布形状及位置角度来考虑的,而均值是对所有数据计算后得到的。众数容易计算,但不是总是存在,应用场合较少;中位数直观,不受极端数据的影

统计学试题库含答案

统计学试题库含答案 Modified by JEEP on December 26th, 2020.

《统计学》试题库 第一章:统计基本理论和基本概念 一、填空题 1、统计是统计工作、统计学和统计资料的统一体,统计资料 是统计工作的成果,统计学是统计工作的经验总结和理论概括。 2、统计研究的具体方法主要有大量观察法、统计分组法、统计推断法和综合指标法。 3、统计工作可划分为设计、调查、整理和分析四个阶段。 4、随着研究目的的改变,总体和个体是可以相互转化的。 5、标志是说明个体特征的名称,指标是说明总体数量特征的概念及其数值。 6、可变的数量标志和所有的统计指标称为变量,变量的具体数值称为变量值。 7、变量按其数值变化是否连续分,可分为连续变量和离散变量,职工人 数、企业数属于离散变量;变量按所受影响因素不同分,可分为确定性变量和随机变量。 8、社会经济统计具有数量性、总体性、社会性、具体性等特点。 9、一个完整的统计指标应包括指标名称和指标数值两个基本部分。 10、统计标志按是否可用数值表示分为品质标志和数量标志;按在 各个单位上的具体表现是否相同分为可变标志和不变标志。 11、说明个体特征的名称叫标志,说明总体特征的名称叫指标。 12、数量指标用绝对数表示,质量指标用相对数或平均数表示。 13、在统计中,把可变的数量标志和统计指标统称为变量。 14、由于统计研究目的和任务的变更,原来的总体变成总体单位, 那么原来的指标就相应地变成标志,两者变动方向相同。 二、是非题 1、统计学和统计工作的研究对象是完全一致的。(×) 2、运用大量观察法,必须对研究对象的所有或足够多的单位进行观察调查。(√) 3、统计学是对统计实践活动的经验总结和理论概括。(√)

教育统计学试题库

教育统计学 一、选择题 1、当一组数据用中位数来反映集中趋势时,这组数据最好用哪种统计量来表示离散程度?( B ) A. 全距( 差异量) B. 四分位距(差异量) C. 方差(差异量) D. 标准差(差异量) 2、总体不呈正态分布,从该总体中随机抽取容量为1000 的一切可能样本的平均数的分布接近于:( D ) A. 二项分布 B.F 分布 C. t 分布 D. 正态分布 3、检验某个频数分布是否服从正态分布时需采用:( C ) A. Z检验 B. t 检验 C. X 2检验 D. F 检验 4、对两组平均数进行差异的显著性检验时,在下面哪种情况下不需要进行方差齐性检验?( B ) A. 两个独立样本的容量相等且小于30; B. 两个独立样本的容量相等且大于30; C. 两个独立样本的容量不等,n1小于30, n2大于30; D. 两个独立样本的容量不等,n1大于30, n2小于30。 5、下列说法中哪一个是正确的?( C ) A. 若r1=0.40 , r2=0.20,那么r1 就是r2 的2 倍;

B. 如果r=0.80 ,那么就表明两个变量之间的关联程度达到80%; C. 相关系数不可能是2; D. 相关系数不可能是-1 。 6、当两列变量均为二分变量时,应计算哪一种相关?( B ) A. 积差相关(两个连续型变量) B. ?相关 C. 点二列相关(一个是连续型变量,另一个是真正的二分名义变量) D. 二列相关(两个连续型变量,其中之一被人为地划分成二分变量。) 7、对多组平均数的差异进行显著性检验时需计算:( A ) A.F值 B. t 值 C. x 2 值 D.Z 值 8、比较不同单位资料的差异程度,可以采用何种差异量?( A ) A. 差异系数 B. 方差 C. 全距 D. 标准差 二、名词解释 1. 分层抽样:按与研究内容有关的因素或指标先将总体划分成几个部分,然后从各部分(即各层)中进行单纯随机抽样或机械抽样,这种抽样方法称为分层抽样。 2. 描述统计:对已获得的数据进行整理、概括,显现其分布特征的统计方法称为描述统计。 3. 集中量:集中量是代表一组数据典型水平或集中趋势的量。它能反映频数分

统计学简答题及答案

统计学简答题及参考答案 1.简述描述统计学的概念、研究容与目的。 概念:它是研究数据收集、整理和描述的统计学分支。 研究容:搜集数据、整理数据、展示数据和描述性分析的理论与方法。 研究目的:描述数据的特征;找出数据的基本数量规律。 2.简述推断统计学的概念、研究容与目的。 概念:它是研究如何利用样本数据来推断总体特征的统计学分支。 研究容:参数估计和假设检验的理论与方法。 研究目的:对总体特征作出统计推断。 3.什么是总体和样本? 总体是指所研究的全部个体(数据)的集合,其中的每一个元素称为个体(也称为总体单位)。 可分为有限总体和无限总体: ?有限总体的围能够明确确定,且元素的数目是有限的,可数的。 ?无限总体所包括的元素数目是无限的,不可数的。 总体单位数可用N表示。 样本就是从总体中抽取的一部分元素的集合。构成样本的元素的数目称为样本容量,记为n。 4.什么是普查?它有哪些特点? 普查就是为了特定的研究目的,而专门组织的、非经常性的全面调查。它有以下的特点: 1)通常是一次性或周期性的 2)一般需要规定统一的标准调查时间 3)数据的规化程度较高 4)应用围比较狭窄。 5.什么是抽样调查?它有哪些特点? 抽样调查是指从总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体特征的数据搜集方法和统计推断方法。 它具有经济性好、时效性强、适应面广、准确性高等特点。 6.简述统计调查方案的概念及应包括的基本容。 答:统计调查方案就是统计调查前所制订的实施计划,它是指导整个调查过程的纲领性文件,是保证调查工作有计划、有组织、有系统地进行的计划书。 它应包括的基本容有: 〈1〉明确调查目的; 〈2〉确定调查对象和调查单位; 〈3〉设计调查项目; 〈4〉设计调查表格和问卷; 〈5〉确定调查时间; 〈6〉组织实施调查计划; 〈7〉调查报告的撰写,等等。 7.简述统计分组的概念、原则和具体方法。 答:(1)概念

统计学试题库及答案

统计学试题库及答案 Document serial number【KKGB-LBS98YT-BS8CB-BSUT-BST108】

《统计学》试题库 知识点一:统计基本理论和基本概念 一、填空题 1、统计是、和的统一体,是统计工作的成果,是统计工作的经验总结和 理论概括。 2、统计研究的具体方法主要有、、和。 3、统计工作可划分为、、和四个阶段。 4、随着的改变,总体和是可以相互转化的。 5、标志是说明,指标是说明。 6、可变的数量标志和所有的统计指标称为,变量的具体数值称为。 7、变量按分,可分为连续变量和离散变量,职工人数、企业数属于变量;变量按分,可 分为确定性变量和随机变量。 8、社会经济统计具有、、、等特点。 9、一个完整的统计指标应包括和两个基本部分。 10、统计标志按是否可用数值表示分为和;按在各个单位上的具体表现是否相同分为 和。 11、说明特征的名称叫标志,说明特征的名称叫指标。 12、数量指标用表示,质量指标用或平均数表示。 13、在统计中,把可变的和统称为变量。 14、由于统计研究目的和任务的变更,原来的变成,那么原来的指标就相应地变成标志,两者 变动方向相同。 二、是非题 1、统计学和统计工作的研究对象是完全一致的。 2、运用大量观察法,必须对研究对象的所有单位进行观察调查。 3、统计学是对统计实践活动的经验总结和理论概括。 4、一般而言,指标总是依附在总体上,而总体单位则是标志的直接承担者。 5、数量指标是由数量标志汇总来的,质量指标是由品质标志汇总来的。 6、某同学计算机考试成绩80分,这是统计指标值。 7、统计资料就是统计调查中获得的各种数据。 8、指标都是用数值表示的,而标志则不能用数值表示。 9、质量指标是反映工作质量等内容的,所以一般不能用数值来表示。 10、总体和总体单位可能随着研究目的的变化而相互转化。 11、女性是品质标志。

【缩印整理版】医学统计学名词解释及问答题

统计学(Statistics):运用概率论、数理统计的原理与方法,研究数据的搜集;分析;解释;表达的科学。 总体(population):大同小异的研究对象全体。更确切的说,总体是指根据研究目的确定的、同质的全部研究单位的观测值。 样本(sample):来自总体的部分个体,更确切的说,应该是部分个体的观察值。样本应该具有代表性,能反映总体的特征。利用样本信息可以对总体特征进行推断。 抽样误差(sampling error)在抽样过程中由于抽样的偶然性而出现的误差。表现为总体参数与样本统计量的差异,以及多个样本统计量之间的差异。可用标准误描述其大小。 标准误(Standard Error) 样本统计量的标准差,反映样本统计量的离散程度,也间接反映了抽样误差的大小。样本均数的标准差称为均数的标准误。均数标准误大小与标准差呈正比,与样本例数的平方根呈反比,故欲降低抽样误差,可增加样本例数 区间估计(interval estimation):将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为置信区间(confidence interval,CI),又称可信区间。 参考值范围描述绝大多数正常人的某项指标所在范围;正态分布法(标准差)、百分位数法,参考值范围用于判断某项指标是否正常 置信区间揭示的是按一定置信度估计总体参数所在的范围。t分布法、正态分布法(标准误)、二项分布法。置信区间估计总体参数所在范围 可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。该范围称为总体参数的可信区间(confidence interval,CI)。它的确切含义是:可信区间包含总体参数的可 能性是1- α ,而不是总体参数落在该范围的可能性为1-α 。 参数统计(parametric statistics) 非参数统计(nonparametric statistics)是指在统计检验中不需要假定总体分布形式和计算参数估计量,直接对比较数据(x)的分布进行统计检验的方法。 变异(variation):对于同质的各观察单位,其某变量值之间的差异 同质(homogeneity):研究对象具有的相同的状况或属性等共性。 回归系数有单位,而相关系数无单位 β为回归直线的斜率(slope)参数,又称回归系数(regression coefficient)。 线性相关系数(linear correlation coefficient):又称Pearson积差相关系数(Pearson product moment coefficient),是定量描述两个变量间线性关系的密切程度与相关方向的统计指标。 参数(parameter):描述总体特征的统计指标。 统计量(statistic):描述样本特征的统计指标。实验设计的基本原则 对照 (control) 对受试对象不施加处理因素的状态。在确定接受处理因素的实验组时,要同时设立对照组 重复 (replication)相同实验条件下进行多次实验或多次观察。整个实验的重复;观察多个受试对象(样本量);同一受试对象重复观察。作用是估计变异大小和降低变异 随机化(randomization) 采用随机的方式,使每个受试对象都有同等的机会被抽取或分配到试验组和对照组。 I类错误(假阳性错误)真实情况为H0是成立的,但检验结果为H0不成立,这样的错误称为I类错误。其发生的概率用α表示。在假设检验中作为检验水准。一般取0.05或0.01。 II类错误(假阴性错误)真实情况为H1是成立的,但检验结果为H1不成立,这样的错误称为II类错误。其发生的概率用β表示。由于其取值取决于H1 ,因此在假设检验中无法确定。 变异指标是用于描述一组观察值围绕中心位置散布的范围,即描述离散趋势的统计指标。数值越大,说明数据越离散,反之越集中。极差 (range);四分位数间距(quartile range);方差(variance);标准差(standard deviation);变异系数(coefficient of variation 平均数指标用于描述一组同质观察值的集中趋势,反映一组观察值的平均水平。算术均数(arithmetic mean);几何均数(geometric mean);中位数(median);众数(mode) 单纯抽样将调查总体的全部观察单位编号,从而形成抽样框架,在抽样框架中随机抽取部分观察单位组成样本。每个观察对象都有相同的机会被抽中系统抽样又称机械抽样。按照某种顺序给总体中的个体编号,然后随机地抽取一个号码作为第一个调查个体,其他的调查个体则按照某种确定的规则“系统”地抽取。最常用的方法是等距抽样 分层抽样先将总体中全部个体按某种特征分成若干“层”,再从每一层内随机抽取一定数量的个体组成样本。分层特征与研究目的有关。按各层比例抽样。为减少抽样误差,要求层内误差最小,层间误 差最大。 整群抽样先将总体分成若干“群”,从中随机抽取 几个群,抽取群内的所有观察单位组成调查样本。 “群”的确定与研究目的无关。为减少抽样误差, 需多抽几个“群”。 方差分析:又称变异数分析或 F检验,适用于对多 个平均值进行总体的假设检验,以检验实验所得的 多个平均值是否来自相同总体。 析因设计(factorial design)实验:凡同时配置两个 或两个以上处理因素,这些因素的各水平又具有完 全组合的实验,统称为析因设计(factorial design) 实验。 随机区组设计(randomized block design)是事先 将全部受试对象按某种可能与实验因素有关的特征 分为若干个区组(block),使每一区组内的受试对 象例数与处理因素的分组数相等,使每个实验组从 每一区组得到一例受试对象。 单向方差分析(one way analysis of variance)是指 处理因素只有一个。这个处理因素包含有多个离散 的水平,分析在不同处理水平上应变量的平均值是 否来自相同总体。 (2)计数资料:将观察单位按某种属性或类别分组, 所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。 其观察值是定性的,表现为互不相容的类别或属性。 如调查某地某时的男、女性人口数;治疗一批患者, 其治疗效果为有效、无效的人数;调查一批少数民 族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性 的不同程度分组,所得各组的观察单位数,称为等 级资料(ordinal data)。等级资料又称有序变量。如 患者的治疗结果可分为治愈、好转、有效、无效或 死亡,各种结果既是分类结果,又有顺序和等级差 别,但这种差别却不能准确测量;一批肾病患者尿 蛋白含量的测定结果分为+、++、+++等。 随机变量(random variable)是指取指不能事先确 定的观察结果。随机变量的具体内容虽然是各式各 样的,但共同的特点是不能用一个常数来表示,而 且,理论上讲,每个变量的取值服从特定的概率分 布。 变异系数(coefficient of variation)用于观察指标单 位不同或均数相差较大时两组资料变异程度的比 较。用CV 表示。计算:标准差/均数*100% 直线回归(linear regression)建立一个描述应变量 依自变量变化而变化的直线方程, 并要求各点与该直线纵向距离的平方和为最小。直 线回归是回归分析中最基本、最简单的一种,故又 称简单回归(simple regression)。 回归系数(regression coefficient )即直线的斜率 (slope),在直线回归方程中用b 表示,b 的统计意 义为X每增(减)一个单位时,Y平均改变b 个单 位。 相关系数r:用以描述两个随机变量之间线性相关 关系的密切程度与相关方向的统计指标。 秩次:变量值按照从小到大顺序所编的秩序号称为 秩次(rank)。 秩和:各组秩次的合计称为秩和(rank sum),是非 参数检验的基本统计量。 方差(variance):方差表示一组数据的平均离散情 况,由离均差的平方和除以样本个数得到。 检验效能:1- β称为检验效能(power of test),它是 指当两总体确有差别,按规定的检验水准a 所能发 现该差异的能力。 百分位数(percentile)是将n 个观察值从小到大依 次排列,再把它们的位次 依次转化为百分位。百分位数的另一个重要用途是 确定医学参考值范围 随机误差(random error)又称偶然误差,是指排 除了系统误差后尚存的误差。它受多种因素的影响, 使观察值不按方向性和系统性而随机的变化。误差 变量一般服从正态分布。随机误差可以通过统计处 理来估计。 一、统计表有哪些要素构成的?制表的注意事项有 哪些? 一般来说,统计表由标题、标目、线条和数字、备 注五部分组成。但备注并不是必需的内容,可以根 据需要出现。 1简明扼要,重点突出:最好一张表突出一个中心, 不易太多中心,如果需要说明多个中心,可分成多 张统计表。 2合理安排主语和谓语的位置:对于表中任意一行, 从左至右,通过简短的连接词,可连成成一句通顺 的句子。 3表中数据要认真核对,保证准确可靠 二、为什么不宜用t 检验对多组均数进行比较? 如果用t检验进行多个样本均数的两两比较,则会 增加犯I 类错误的概率。 经检验得到拒绝H0 ,认为两组之间有差别的结论 可能犯I类错误的概率为α,不犯I类错误的概率为 1- α.每次判断均不犯I类错误的概率为(1- α)k, k为比较的次数,上例α=0.05, k=3,则均不犯错误 的概率为( 1- 0.05)3 =0.86. 至少有一次判断犯I 类错误的概率为1-(1- α)k 三、方差分析的基本思想是什么? 按实验设计的类型,将全部观察值间的变异分解成 两个或多个组成部分,然后将各部分的变异与随机 误差进行比较(每个部分的变异可由某因素的作用 来解释),以判断各部分的变异是否具有统计学意 义,从而推断不同样本所代表的总体均数是否相同。 五、简述直线相关与回归的区别与联系 区别:1.回归说明依存关系,直线回归用于说明两 变量间数量依存变化的关系,描述y如何依赖于x 而变化;相关说明相关关系,直线相关用于说明两 变量间的直线相关关系,此时两变量的关系是平等 的 2.r与b有区别:r说明具有直线关系的两个 变量间相关的密切程度与相关方向; b表示x每改 变一个单位,y平均增(减)多少个单位; 3.资料要求不同:直线回归要求应变量 y是来自正态总体的随机变量,而x可以是来自正 态总体的随机变量,也可以是严密控制、精确测量 的变量,相关分析则要求x,y是来自双变量正态分 布总体的随机变量。 4.取值范围:-∞

统计学简答题答案资料讲解

1、什么是统计学,有哪些特点? 统计学是收集、整理、分析、解释数据并从数据中得到结论的学科。 特点:客观性~~相关性~~实用性~~科学性~~严谨性~~逻辑性~~~ 2、何谓标志,按能否用数量表示可以分为哪两种类型,分别举例说明 标志是指说明总体单位属性或特征的名称。可以分为数量标志和质量标志 品质标志:说明总体单位属性特征的名称,用文字描述。Ex:性别,名族,工种,籍贯数量标志:说明总体单位数量特征的名称,用数量表示。数量标志的具体表现称标志值。 Ex:工人的年龄,工资,工龄 3、什么是离散型变量,连续性变量?举例说明 变量:可变的数量标志和指标; 离散型变量:指变量的数值只能以计数的方法取得,(变量值只能取整数); 连续型变量:指变量的取值连续不断,(变量值能取小数)。 4、简述品质标志和数量标志的区别,并举例说明。 区别:数量标志说明的是总体的数量特征,而品质标志说明的是总体的属性特征。 5、什么是数量指标和质量指标?二者有何关系? 统计指标:反映总体数量特征的科学概念和具体数值。 注意:从理论上讲,一个完整的统计指标由两部分构成:指标名称+指标数值 例如:某地区2009年完成利税总额(指标名称)为1500(指标数值)亿元。 数量指标:用来反映现象的总规模、总水平、或工作总量的指标。其数值大小随总体的研究范围的大小而增减。 质量指标:反映客观现象的劳动效果或工作质量等事物内部数量关系的指标,其数值的大小与总体的研究范围大小无直接联系。 6、统计标志和统计指标有和联系与区别? 区别:1、标志是反映总体单位特征;指标反映总体特征。 2、指标都能用数量表示,标志只有数量标志能用数量表示; 3、标志是一个理论概念,实际应用中只有指标。 联系:1、标志与指标可以相互转化,随研究目的的转化而改变; 2、指标值一般是标志值汇总来的; 3、标志的名称常常就是指标名称。 7、制定一份完整的统计调查方案,应包括哪些内容? 1)明确调查的目的和任务 2)确定调查的对象和调查单位、 3)确定带调查项目、设计调查表或问卷 4)确定调查时间、调查地点和调查方式方法 5)制定调查的组织实施计划 8、举例说明重点调查的概念和特点 重点调查:是在调查对象范围内部选择部分重点调查单位进行的调查。 特点:调查单位少、适用于调查对象的标志值比较集中于某些单位的场合、重点调查的调查方式主要采取专门调查的组织形式(一种是专门组织的一次性调查;另一种是利用定期统计报表经常性地对一些重点单位进行调查。);有点在于花费较少的人力物力和时间就可以获得总体的基本情况资料。 9、简述重点调查、典型调查、抽样调查的联系与区别P31 抽样调查是一种非全面调查,它是按照随机的原则,从总体中抽取一部分单位作为样本来进行观测研究,以抽样样本的指标去推算总体指标的一种调查。

统计学经典题库与答案

2. 数据筛选的主要目的是( A 、发现数据的错误 C 、找出所需要的某类数据 3. 为了调查某校学生的购书费用支出, B 、对数据进行排序 D 纠正数据中的错误 将全校学生的名单按拼音顺序排列后,每 ) A H 0:二=0.15;二-0.15 B H o :二二 0.15;二=0.15 C H 0: 一 - 0.15;二:: 0.15 D H 0:二乞 0.15;二 0.15 9. 若甲单位的平均数比乙单位的平均数小, 大,则( )。 A 、甲单位的平均数代表性比较大 C 甲单位的平均数代表性比较小 10. 某组的向上累计次数表明( A 、 大于该组上限的次数是多少 B 、 小于该组下限的次数是多少 但甲单位的标准差比乙单位的标准差 B 、两单位的平均数一样大 D 、无法判断 1.当正态总体方差未知时,在大样本条件下,估计总体均值使用的分布是 ( A )。 z 分布 B 、t 分布 F 分布 D 、 2 分布 A 、比平均数高出2个标准差 C 等于2倍的平均数 D 5.峰态通常是与标准正态分布相比较而言的。 则峰态系数的值( )。 B 比平均数低2个标准差 等于2倍的标准差 如果一组数据服从标准正态分布, A =3 C 、v 3 6. 若相关系数r=0,则表明两个变量之间( A 、相关程度很低 C 不存在任何关系 7. 如果所有变量值的频数都减少为原来的 1/3, 均数( )。 A 、不变 B C 减少为原来的1/3 D > 3, =0 )。 不存在线性相关关系 存在非线性相关关系 而变量值仍然不变,那么算术平 扩大到原来的3倍 不能预测其变化 8. 某贫困地区所估计营养不良的人高达 15%然而有人认为这个比例实际上还要 高,要检验该说法是否正确,则假设形式为( )。 隔50名学生抽取一名进行调查,这种调查方式是( A 、简单随机抽样 B 、分层抽样 C 、系统抽样 D 、整群抽样 4. 如果一组数据标准分数是(-2 ),表明该数据( )。

医学统计学题库

第一章 绪论习题 一、选择题 1.统计工作和统计研究的全过程可分为以下步骤:(D ) A . 调查、录入数据、分析资料、撰写论文 B . 实验、录入数据、分析资料、撰写论文 C . 调查或实验、整理资料、分析资料 D. 设计、收集资料、整理资料、分析资料 E. 收集资料、整理资料、分析资料 2.在统计学中,习惯上把(B )的事件称为小概率事件。 A.10.0≤P B. 05.0≤P 或01.0≤P C. 005.0≤P D.05.0≤P E. 01.0≤P 3~8 A.计数资料 B.等级资料 C.计量资料 D.名义资料 E.角度资料 3.某偏僻农村144名妇女生育情况如下:0胎5人、1胎25人、2胎70人、3胎30人、4胎14人。该资料的类型是( A )。 4.分别用两种不同成分的培养基(A 与B )培养鼠疫杆菌,重复实验单元数均为5个,记录48小时各实验单元上生长的活菌数如下,A :48、84、90、123、171;B :90、116、124、225、84。该资料的类型是(C )。 5.空腹血糖测量值,属于( C )资料。 6.用某种新疗法治疗某病患者41人,治疗结果如下:治愈8人、显效23人、好转6人、恶化3人、死亡1人。该资料的类型是(B )。 7.某血库提供6094例ABO 血型分布资料如下:O 型1823、A 型1598、B 型2032、AB 型641。该资料的类型是(D )。 8. 100名18岁男生的身高数据属于(C )。 二、问答题 1.举例说明总体与样本的概念. 答:统计学家用总体这个术语表示大同小异的对象全体,通常称为目标总体,而资料常来源于目标总体的一个较小总体,称为研究总体。实际中由于研究总体的个体众多,甚至无限多,因此科学的办法是从中抽取一部分具有代表性的个体,称为样本。例如,关于吸烟与肺癌的研究以英国成年男子为总体目标,1951年英国全部注册医生作为研究总体,按照实验设计随机抽取的一定量的个体则组成了研究的样本。 2.举例说明同质与变异的概念 答:同质与变异是两个相对的概念。对于总体来说,同质是指该总体的共同特征,即该总体区别于其他总体的特征;变异是指该总体内部的差异,即个体的特异性。例如,某地同性别同年龄的小学生具有同质性,其身高、体重等存在变异。 3.简要阐述统计设计与统计分析的关系 答:统计设计与统计分析是科学研究中两个不可分割的重要方面。一般的,统计设计在前,然而一定的统计设计必然考虑其统计分析方法,因而统计分析又寓于统计设计之中;统计分析是在统计设计的基础上,根据设计的不同特点,选择相应的统计分析方法对资料进行分析

统计学试题及答案

统计学试题及答案文件排版存档编号:[UYTR-OUPT28-KBNTL98-UYNN208]

统计学试题及答案 一.单选题(每题2分,共20分) 1.在对工业企业的生产设备进行普查时,调查对象是 A 所有工业企业 B 每一个工业企业 C 工业企业的所有生产设备 D 工业企业的每台生产设备 2.一组数据的均值为20, 离散系数为, 则该组数据的标准差为 A 50 B 8 C D 4 3.某连续变量数列,其末组为“500以上”。又知其邻组的组中值为480,则末组的组中值为 A 520 B 510 C 530 D 540 4.已知一个数列的各环比增长速度依次为5%、7%、9%,则最后一期的定基增长速度为 A.5%×7%×9% B. 105%×107%×109% C.(105%×107%×109%)-1 D. 5.某地区今年同去年相比,用同样多的人民币可多购买5%的商品,则物价增(减)变化的百分比为 A. –5% B. –% C. –% D. % 6.对不同年份的产品成本配合的直线方程为 , 回归系数b= -表示 A. 时间每增加一个单位,产品成本平均增加个单位 B. 时间每增加一个单位,产品成本平均下降个单位 C. 产品成本每变动一个单位,平均需要年时间

7.某乡播种早稻5000亩,其中20%使用改良品种,亩产为600 公斤,其余亩产为500 公斤,则该乡全部早稻亩产为 A. 520公斤 B. 530公斤 C. 540公斤 D. 550公斤 8.甲乙两个车间工人日加工零件数的均值和标准差如下: 甲车间: =70件, =件乙车间: =90件, =件 哪个车间日加工零件的离散程度较大: A甲车间 B. 乙车间 C.两个车间相同 D. 无法作比较 9. 根据各年的环比增长速度计算年平均增长速度的方法是 A 用各年的环比增长速度连乘然后开方 B 用各年的环比增长速度连加然后除以年数 C 先计算年平均发展速度然后减“1” D 以上三种方法都是错误的 10. 如果相关系数r=0,则表明两个变量之间 A. 相关程度很低 B.不存在任何相关关系 C. 不存在线性相关关系 D.存在非线性相关关系 二. 多选题 (每题2分,共14分) 1. 下列数据中属于时点数的有 A. 流动资金平均余额20万元 B. 储蓄存款余额500万元 C. 商品销售额80万元 D. 固定资产300万元 E. 企业职工人数2000人 2. 在数据的集中趋势的测量值中,不受极端数值影响的测度值是

统计学简答题参考答案

统计学简答题参考答案 第一章绪论 1.什么是统计学?怎样理解统计学与统计数据的关系? 答:统计学是一门收集、整理、显示和分析统计数据的科学。统计学与统计数据存在密切关系,统计学阐述的统计方法来源于对统计数据的研究,目的也在于对统计数据的研究,离开了统计数据,统计方法以致于统计学就失去了其存在意义。2.简要说明统计数据的来源。 答:统计数据来源于两个方面:直接的数据:源于直接组织的调查、观察和科学实验,在社会经济管理领域,主要通过统计调查方式来获得,如普查和抽样调查。间接的数据:从报纸、图书杂志、统计年鉴、网络等渠道获得。 3.简要说明抽样误差和非抽样误差。 答:统计调查误差可分为非抽样误差和抽样误差。非抽样误差是由于调查过程中各环节工作失误造成的,从理论上看,这类误差是可以避免的。抽样误差是利用样本推断总体时所产生的误差,它是不可避免的,但可以控制的。 4.解释描述统计和推断统计的概念?(P5) 答:描述统计是用图形、表格和概括性的数字对数据进行描述的统计方法。推断统计是根据样本信息对总体进行估计、假设检验、预测或其他推断的统计方法。第二章统计数据的描述 1描述次数分配表的编制过程。 答:分二个步骤: (1)按照统计研究的目的,将数据按分组标志进行分组。 按品质标志进行分组时,可将其每个具体的表现作为一个组,或者几个表现合并成一个组,这取决于分组的粗细。 按数量标志进行分组,可分为单项式分组与组距式分组 单项式分组将每个变量值作为一个组;组距式分组将变量的取值范围(区间)作为一个组。 统计分组应遵循“不重不漏”原则 (2)将数据分配到各个组,统计各组的次数,编制次数分配表。 2. 一组数据的分布特征可以从哪几个方面进行测度? 答:数据分布特征一般可从集中趋势、离散程度、偏态和峰度几方面来测度。常用的指标有均值、中位数、众数、极差、方差、标准差、离散系数、偏态系数和峰度系数。 3.怎样理解均值在统计中的地位? 答:均值是对所有数据平均后计算的一般水平的代表值,数据信息提取得最充分,具有良好的数学性质,是数据误差相互抵消后的客观事物必然性数量特征的一种反映,在统计推断中显示出优良特性,由此均值在统计中起到非常重要的基础地位。受极端数值的影响是其使用时存在的问题。 4. 简述众数、中位数和均值的特点和应用场合。 答:众数、中位数和均值是分布集中趋势的三个主要测度,众数和中位数是从数据分布形状及位置角度来考虑的,而均值是对所有数据计算后得到的。众数容易计算,但不是总是存在,应用场合较少;中位数直观,不受极端数据的影响,但数据信息利用不够充分;均值数据提取的信息最充分,但受极端数据的影响。5.为什么要计算离散系数?

统计学题库及题库详细答案

统计学题库及题库详细答案

————————————————————————————————作者:————————————————————————————————日期:

统计学题库及题库答案 题库1 一、单项选择题(每题2分,共20分) 1、调查时间是指( ) A 、调查资料所属的时间 B 、进行调查的时间 C 、调查工作的期限 D 、调查资料报送的时间 2、对某城市工业企业未安装设备进行普查,总体单位是( )。 A 、工业企业全部未安装设备 B 、企业每一台未安装设备 C 、每个工业企业的未安装设备 D 、每一个工业企业 3、对比分析不同性质的变量数列之间的变异程度时,应使用( )。 A 、全距 B 、平均差 C 、标准差 D 、变异系数 4、在简单随机重复抽样条件下,若要求允许误差为原来的2/3,则样本容量( ) A 、扩大为原来的3倍 B 、扩大为原来的2/3倍 C 、扩大为原来的4/9倍 D 、扩大为原来的2.25倍 5、某地区组织职工家庭生活抽样调查,已知职工家庭平均每月每人生活费收入的标准差为12元,要求抽样调查的可靠程度为0.9545,极限误差为1元,在简单重复抽样条件下,应抽选( )。 A 、576户 B 、144户 C 、100户 D 、288户 6、当一组数据属于左偏分布时,则( ) A 、平均数、中位数与众数是合而为一的 B 、众数在左边、平均数在右边 C 、众数的数值较小,平均数的数值较大 D 、众数在右边、平均数在左边 7、某连续变量数列,其末组组限为500以上,又知其邻组组中值为480,则末组的组中值为( )。 A 、520 B 、 510 C 、 500 D 、490 8、用组中值代表组内变量值的一般水平有一定的假定性,即( ) A 、各组的次数必须相等 B 、变量值在本组内的分布是均匀的 C 、组中值能取整数 D 、各组必须是封闭组 9、 n X X X ,,,21 是来自总体 ),(2 N 的样本,样本均值X 服从( )分布 A 、),(2 N B.、)1,0(N C.、 ),(2 n n N D 、) , (2 n N 10、测定变量之间相关密切程度的指标是( ) A 、估计标准误 B 、两个变量的协方差 C 、相关系数 D 、两个变量的标准差 二、多项选择题(每题2分,共10分)

最新医学统计学问答题(含答案)

简答题 0. 算术均数、几何均数和中位数各有什么适用条件? 答:(1)算术均数:适用对称分布,特别是正态或近似正态分布的数值变量资料。 (2)几何均数:适用于频数分布呈正偏态的资料,或者经对数变换后服从正态分布(对数正态分布)的资料,以及等比数列资料。 (3)中位数:适用各种类型的资料,尤其以下情况: A 资料分布呈明显偏态; B 资料一端或两端存在不确定数值(开口资料或无界资料); C 资料分布不明。 1.对于一组近似正态分布的资料,除样本含量n 外,还可计算 S X ,和S X 96.1±,问各说明什么? (1)X 为算数均数,说明正态分布或近似正态分布资料的集中趋势 (2)S 为标准差,说明正态分布或近似正态分布的离散趋势 (3)S X 96.1±可估计正态指标的95%的医学参考值范围,即此范围在理论上应包含95%的个体值。 2.试述正态分布、标准正态分布的联系和区别。 正态分布 标准正态分布 原始值X 无需转换 作u=(X-μ)/σ转换 分布类型 对称 对称 集中趋势 μ μ=0 均数与中位数的关系 μ=M μ=M 参考:标准正态分布的均数为0,标准差为1;正态分布的均数则为μ,标准差为σ(μ为任意数,而σ为大于0的任意数)。标准正态分布的曲线只有一条,而正态分布曲线是一簇。任何正态分布都可以通过标准正态变换转换成标准正态分布。标准正态分布是正态分布的特例。 3.说明频数分布表的用途。 1)描述频数分布的类型 2)描述频数分布的特征 3)便于发现一些特大或特小的可疑值 4)便于进一步做统计分析和处理 4.变异系数的用途是什么? 多用于观察指标单位不同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿童身高与成人身高变异程度的比较。 5.试述正态分布的面积分布规律。 (1)X 轴与正态曲线所夹的面积恒等于1或100%; (2)区间μ±σ的面积为68.27%,区间μ±1.96σ的面积为95.00%,区间μ±2.58σ的面积为99.00%。 6.试举例说明均数的标准差与标准误的区别与联系。 7.标准正态分布(u 分布)与t 分布有何不同?

相关文档
相关文档 最新文档