文档库 最新最全的文档下载
当前位置:文档库 › 统计学原理,苏继伟,解答

统计学原理,苏继伟,解答

统计学原理,苏继伟,解答
统计学原理,苏继伟,解答

第一章总论

一、单项选择题

BBBCA DDAAA

二、多项选择题

BCD BCD ABD BDE ACD

ACD ADE ABE ACE ACD

三、判断题

×√×××√×√×√

第二章统计资料的收集

一、单项选择题

BDBDD CAADC

二、多项选择题

ADE BCDE BDE ADE ABD

三、判断题

×××××××√××

第三章统计数据的整理与显示

一、单项选择题

CABBD ACACD

二、多项选择题

AD ACE ABC DC ABCD

三、判断题

√×√√×√×××√

第四章思考与练习答案

一、单项选择题

1.就业人数增减量指标属于( C )

A、相对指标;

B、平均指标;

C、总量指标;

D、变异指标

2.下面指标中,属于时期指标的是( C )

A、某地区人口数;

B、商品库存量;

C、产品产量;

D、中小企业数

3. 男女性别比是一个( B )

A、结构相对指标;

B、比例相对指标;

C、比较相对指标;

D、强度相对指标

4.指标值随研究范围的大小而增减的综合指标是( C )

A、相对指标;

B、平均指标;

C、总量指标;

D、质量指标

5.人均粮食产量是( C )

A、总量指标;

B、平均指标;

C、相对指标;

D、数量指标

6.下面属于时点指标的是( B )。

A.商品销售额 B.营业员人数 C.商品价格 D.商品销售量

7.将不同地区、部门、单位之间同类指标进行对比所得的综合指标称为( D )A.动态相对指标 B.结构相对指标 C.比例相对指标 D.比较相对指标8.第五次人口普查结果显示,我国每10万人口中有大学文化程度的为6311人。该数字是( D )

A.绝对指标 B.比较相对指标 C.强度相对指标 D.结构相对指标

9.下列属于比例相对指标的是( B )

A.工人出勤率 B.一、二、三产业的产值比

C.每百元产值利税额 D.净产值占总产值的比重

10.计算计划完成情况相对指标时,分子和分母的数值( D )。

A.只能是绝对指标 B.只能是相对指标 C.只能是平均指标

D.既可以是绝对指标,也可以是相对指标或平均指标

11.结构相对指标是( C )。

A.报告期水平与基期水平之比 B.实际数与计划数之比

C.总体部分数值与总体全部数值之比 D.甲单位水平与乙单位水平之比

12.某商场2003年彩色电视机的销售量为8800台,年末库存量有1500台,这两个总量指标是( B )。

A.时期指标 B.前者是时期指标,后者是时点指标

C.时点指标 D.前者是时点指标,后者是时期指标

13.对甲、乙两个工厂生产的饮料进行质量检查,不合格率分别为5%和8%,则甲、乙两厂饮料的不合格品数量( D )。

A.甲>乙 B.甲<乙 C.甲=乙 D.无法判断

14.某商场计划6月份销售利润比5月份提高2%,实际却下降了3%,则销售利润计划完成程度为( B )。

A.66.7% B.95.1% C.105.1% D.99.0%

15.某地区有10万人口,共有80个医院。平均每个医院要服务1250人,这个指标是( B )。

A、平均指标

B、强度相对指标

C、总量指标

D、发展水平指标

二、多项选择题

1.总量指标的计量单位主要有( ACE )

A、实物单位;

B、度量衡单位;

C、货币单位;

D、自然单位;

E、劳动单位

2.在相对指标中,分子和分母可以互换位置的有( BC )。

A.结构相对指标 B.比例相对指标 C.比较相对指标

D.动态相对指标 E.计划完成相对指标

3.时点指标的特点是( BD )。

A.不同时间数值可以相加B.不同时间数值不可以相加

C.调查资料需连续登记 D.指标数值大小与时期长短无直接关系

E.指标数值大小与时期长短直接相关

4.在相对指标中,属于不同总体数值对比的指标有( CDE )

A.结构相对指标 B.比例相对指标 C.比较相对指标

D.动态相对指标 E.强度相对指标

5.在检查长期计划执行情况时,常使用的方法有( BD )

A.平均法 B水平法 C.综合法 D累计法 C.比例法

三、判断分析题

1.一个总量指标究竟应属于总体单位总量还是总体标志总量,应随着研究目的的不同和研究对象的变化而定。(对)

2.男女性别比为107.98 : 100,这说明以男性为100,女性人口是男性人口数的1.0798倍。(错。说明是以女性为100,男性人口是女性人口数的1.0798倍。)

3.强度相对数与平均数不同,因为它不是同质总体的标志总量与总体单位数之比。(对)

4.所有的强度相对指标都有正、逆指标之分。(错。有的强度相对指标有正、逆指标之分。)

5.甲企业完成产值50万元,刚好完成计划;乙企业完成产值88万元,超额完成10%,则甲乙两企业共超额完成50%。(错。甲乙两企业共超额完成

6.15%(=(50+88)/(50+80)-1)。)

四、简答题

1.简述时期指标与时点指标的区别。

答:(1)时期指标的数值是连续登记取得的,它的每个数值表示现象在一定时期内发生

的总量;而时点指标的数值是间断计数取得的,它的每个数值表示现象发展到一定时点上所处的水平。(2)时期指标具有累加性,即各时期数值相加可以说明现象在较长时期内发生的总量;而时点指标不具有累加性,即各时期数值相加是没有意义的。(3)时期指标数值的大小要受时期长短的制约;而时点指标数值的大小与时点的间隔无直接关系。

2.简述计算和应用相对指标的原则。

答:(1)可比性原则。即要注意对比的分子、分母在内容、范围、计算方法、计算价格

和计量单位等方面是可比的;(2)相对指标要与总量指标结合应用原则;(3)多种相对指标结合运用的原则。

3.强度相对指标与平均指标有何区别?

答:(1)强度相对数是由两个不同质但有联系的总体的指标数值对比求得的;而平均数

是在同质总体内进行计算的。(2)强度相对数的分子与分母不存在一一对应关系;而平均数的分子与分母是一一对应的,分母是分子(标志值)的承担者。(3)强度相对数反映的是两个有联系的总体之间的数量联系;而平均数反映的是某个同质总体的一般水平或集中趋势。

4.总体单位总量和总体标志总量如何区别?

答:总体单位总量是指总体单位的数目,即总体个数(单位数);总体标志总量是指总体各单位标志值的总和。前者是后者的承担者;后者是前者的标志值,二者具有一一对应关系。

5.分析长期计划执行情况时累计法和水平法有什么特点?

答:累计法的特点是关注计划期内的累计水平,即看实际累计数是否达到了计划规定的累计数,如果达到了就表示完成了计划。水平法的特点是关注计划期最末一年应达到的水平。只要计划期内连续12月(可跨日历年度)达到了计划规定的最末一年的水平,则认为计划完成。 五、计算题

1.某地区2005年的劳动生产率计划比上年提高8%,实际执行结果是比上年提高了9%,问该地区劳动生产率的计划完成程度是多少?解:

%

81%

91++=109%/108%=100.93%(超额0.93%完成计划)

2、某工厂今年计划单位产品成本与去年相比降低5%,实际降低了4.5%,问该厂单位成本的计划完成程度是多少? 解:

%53.100%

95%

5.95%51%5.41==--(差0.53%完成计划)

3.根据下表计算相对指标并填空。

世界总计

3187+3037.7+2297.6+2303+178304+856.4=13465.1

630146 630476/13465.1=46.8

亚 洲 3187.0 382339 120

中国 960.0 129227 129227/960=134.6 日本 37.8 12765 12765/37.8=46.7 印度 328.7

106546 106546/328.7=324.1

非 洲 85056/28=3037.7

85056

28 欧 洲 2297.6

2297.6*32=73523.2

32 北 美 洲 50667/22=2303.0

50667

22 南 美 洲 1783.4 1783.4*20=35668

20 大 洋 洲

856.4

3223

4

资料来源:联合国粮农组织数据库

4.某厂生产情况如下: (单位:万元)

第五章思考与练习答案

一、单项选择题

1. A(算术平均数)、H(调和平均数)和G(几何平均数)的关系是:( D )

A、A≤G≤H;

B、G≤H≤A;

C、H≤A≤G;

D、H≤G≤A

2.位置平均数包括( D )

A、算术平均数;

B、调和平均数;

C、几何平均数;

D、中位数、众数

3.若标志总量是由各单位标志值直接总和得来的,则计算平均指标的形式是( A )

A、算术平均数;

B、调和平均数;

C、几何平均数;

D、中位数

4.平均数的含义是指( A )

A、总体各单位不同标志值的一般水平;

B、总体各单位某一标志值的一般水平;

C、总体某一单位不同标志值的一般水平;

D、总体某一单位某一标志值的一般水平

5.计算和应用平均数的基本原则是( C )

A、可比性;

B、目的性;

C、同质性;

D、统一性

6.由组距数列计算算术平均数时,用组中值代表组内变量值的一般水平,假定条件是( C )。

A.各组的次数相等 B.组中值取整数

C.各组内变量值不同的总体单位在组内是均匀分布的

D.同一组内不同的总体单位的变量值相等

7.已知3个水果店香蕉的单价和销售额,则计算3个水果店香蕉的平均价格应采用( C )

A.简单算术平均数 B.加权算术平均数 C.加权调和平均数 D.几何平均数

8.如果统计资料经过分组,并形成了组距分配数列,则全距的计算方法是( D )

A.全距=最大组中值—最小组中值

B.全距=最大变量值—最小变量值

C.全距=最大标志值—最小标志值

D.全距=最大组上限—最小组下限

9.已知两个总体平均数不等,但标准差相等,则( A )。

A.平均数大的,代表性大 B.平均数小的,代表性大

C.平均数大的,代表性小 D.以上都不对

10.某企业2006年职工平均工资为5000元,标准差为100元,2007年平均工资增长了20%,标准差增大到150元。职工平均工资的相对变异( A )。

A、增大

B、减小

C、不变

D、不能比较

二、多项选择题

1.不受极值影响的平均指标有( BC )

A、算术平均数;

B、众数;

C、中位数;

D、调和平均数;

E、几何平均数

2.标志变动度( BCDE )

A、是反映总体各单位标志值差别大小程度的指标;

B、是评价平均数代表性高低的依据;

C、是反映社会生产的均衡性或协调性的指标;

D、是反映社会经济活动过程的均衡性或协调性的指标;

E、可以用来反映产品质量的稳定程度。

3.调和平均数的特点( ABE)

A、如果数列中有一个标志值等于零,则无法计算调和平均数;

B、它受所有标志值大小的影响;

C、它受极小值的影响要大于受极大值的影响;

D、它受极大值的影响要大于受极小值的影响;

E、它受极小值和极大值的影响要比算术平均数小

4.平均数分数值平均数与位置平均数两类,其中数值平均数有(ABC )

A.算术平均数 B.调和平均数 C.几何平均数 D.众数 E.中位数

5.下列现象应采用算术平均数计算的有( ACE )。

A.已知粮食总产量和播种面积,求平均亩产

B.已知计划完成百分比和实际产值,求平均计划完成百分比

C.已知计划完成百分比和计划产值,求平均计划完成百分比

D.已知某厂1999年-2003年的产值,求产值的平均发展速度

E.已知不同级别工人的月工资和人数,求所有工人的月平均工资

6.第一批产品废品率为1%,第二批产品废品率为1.5%,第三批产品废品率为2%。第一批产品数量占总数的35%,第二批产品数量占总数的40%。则平均废品率为( B )。

A、1.5%

B、1.45%

C、4.5%

D、0.94%

7.平均指标与标志变异系数的关系是( BC )。

A.标志变异系数越大,平均数代表性越大

B.标志变异系数越大,平均数代表性越小

C.标志变异系数越小,平均数代表性越大

D.标志变异系数越小,平均数代表性越小

E.标志变异系数大小与平均数代表性大小无关

三、判断分析题

1.平均指标将各单位的数量差异抽象化了,所以平均指标数值大小与个别标志值大小无关系。(错。平均指标数值大小要受各标志值大小的影响。)

2.所有分位数都属于数值平均数。(错。所有分位数都属于位置平均数)

3.当总体各单位的标志值都不相同时,众数不存在。(对)

4.中位数和众数都属于平均数,因此它们数值的大小受到总体内各单位标志值大小的影响(错。中位数和众数都是位置平均数,因此它们数值的大小不受极端值的影响)。

5.是非标志的标准差是总体中两个成数的几何平均数。(对。)

四、简答题

1.几何平均数有哪些特点?

答:(1)如果数列中有标志值为0或负值,则无法计算几何平均数;(2)几何平均数受极端值的影响较算术平均数和调和平均数小;(3)几何平均数适用于反映特定现象的平均水平,即现象的总标志值是各单位标志值的连乘积。

2.什么是平均指标?它的特点和作用。

答:平均指标又称平均数,是指同类现象在一定时间、地点、条件下所达到的一般水平。其特点包括数量抽象性和集中趋势的代表性。平均指标的作用是将一个同质总体各单位之间量的差异抽象化,用一个指标来代表总体各单位的一般水平,是对总体分布集中趋势或中心位置的度量。

3.什么是众数和中位数?在实际应用中是如何确定的?

答:众数是一组数据中出现次数最多的变量值。中位数是指一组数据按大小排列后,处于正中间位置上的变量值。实际运用中对未分组资料求众数采用直接观察法,对分组资料需用公式近似计算;未分组资料求中位数要先排序再找中间位置的那个标志值,对分组资料也

需要用公式近似计算。

4.什么是标志变异指标?它有哪些作用?

答:标志变异指标是反映同质总体各单位标志值的差异程度的,即数列的离散趋势。标

志变异指标的作用主要可来衡量平均指标的代表性;可以反映社会经济活动的均衡程度;同时也是统计分析的一个基本指标。

5.什么是标准差系数?为什么要计算标准差系数?

答:标准差系数是标准差与平均数的比值,是最常用的一个标志变异指标。

由于标准差是反映标志值离散程度的绝对指标,是带有计量单位的有名数。因而对不同水平、不同性质或不同计量单位的总体进行比较时就会面临不可比的情况。这就需要将标准差与对应的平均数进行对比,转化为相对数后,才能进行比较。

五、计算题

(1)简单算术平均数;=

(元)53

4

56=++

(2)加权算术平均数;=(4000*6+6000*5+10000*4)/20000=4.7元

(3)加权调和平均数。=94000/(24000/6+30000/5+40000/4)= 4.7元

解:甲市场蔬菜平均价格=(元)3219.0160

5

.514540754536.04032.07530.0==++?+?+?

乙市场蔬菜平均价格=

(元)3265.05

.16205

.5345805.374536.08032.05.3730.0==++?+?+?

乙市场蔬菜平均价格高一点。

试比较哪个地区平均价格高?为什么?

解:甲地商品平均价格=(13+24+11)/(13/1.3+24/1.2+11/1.1)=1.2(元)

乙地商品平均价格=(13+18+16.5)/(13/1.3+18/1.2+16.5/1.1)=1.1875(元) 甲地商品平均价格高一点。

4.以下资料是某大学管理系学生月均生活费开支。

要求:计算表中数据的平均数、众数和中位数。

解:平均数(月均生活费)65.500

=x ;

中位数5

.512100104

2182315002/1=?-+=?-+=-∑d f S f X M m

m L e

众数38.552100)

84104()82104()

82104(5002110=?-+--+=??+??+

=d X M L

5.某地20个国有商店,2004年第四季度的统计资料如下表所示:

试计算该地区20个商店平均完成销售计划指标。

解:20个商店平均完成销售计划程度=实际完成的销售额/计划应完成的销售额*100%=243/240.76*100%=100.93%

6.已知,甲、乙两班学生在某次考试中各科目的成绩如下表所示

甲、乙两班学生成绩表

试计算(1)甲、乙两班学生的平均成绩和标准差系数;(2)衡量平均指标的代表性。

解:(1)806

8595=++=∑=

n x x 甲806

75

110=++=∑= n x x 乙

n

x x 2

)

(-=

∑δ 93.188.10=,=

乙甲σσ (2)由于甲乙两个班的平均成绩相同,所以可以直接比较标准差,根据93.188.10==乙甲σσ<,说明甲班平均成绩的代表性高于乙班的。

同时,还可以计算标准差系数:

由于%=%=乙甲66.235.13V V <,仍然说明甲班平均成绩的代表性高于乙班的。

7.两个不同品牌水稻分别在四块田上试种,其产量资料如下:

100%=?V X

σ标准差系数计算公式为:

假设生产条件相同,试分析哪个品牌的收获率的稳定性较高?

解:根据公式

计算得42.638=甲x 11.499=乙x ;3.255.312=,=乙甲σσ

%=%,=乙甲07.595.48V V 。由于%=%=乙甲07.595.48V V >

所以,乙品种虽然平均亩产低于甲品种,但乙品种的稳定性比甲好,因此更具有推广价值。

要求:计算50名工人日加工零件的平均数和标准差(结果保留两位小数)。

解:根据公式 计算50名工人日加工零件的平均数=3900/50=78(件) 标准差=12.53(件)

9. 某煤矿有甲、乙两个生产班组,每班组有8个工人,各班组每个工人的月产量(单位:吨)记录如下:

要求:(1)计算甲、乙两组工人的人均日产量;

(2)计算甲、乙两组工人日产量的标准差和标准差系数; (3)比较甲、乙两组人均日产量的代表性。 解:(1)甲、乙两组工人的人均日产量都为70(吨) (2)甲组工人日产量的标准差=83.67(吨) 乙组工人日产量的标准差=5.29(吨)

∑∑-=

f f X X 2

)(σi i i f f x x ∑∑=100%=?V X

σ标准差系数计算公式为:∑∑-=f f X X 2)(σi

i i f f x x ∑∑=

甲组工人日产量的标准差系数=1.195 乙组工人日产量的标准差系数=0.076 (3)乙组比甲组的人均日产量的代表性高。

解:全距=600-100=500(元);平均值=132000/400=330(元)

平均差=84(元) 标准差=102.96(元)

标准差系数=102.96/330=0.312

(1)是非标志的平均数; (2)是非标志的标准差。 解:(1)是非标志的平均数=p=52%

(2)是非标志的标准差=(0.52*0.48)^(1/2)=0.4996 (1)计算120家企业利润的众数、中位数和均值; (2)计算分布的偏态系数和峰度系数。

解:(1)众数=1012

(4230)400100433.33(4230)(4218)

L M X d ?-=+?=+?=?+?-+-(万元)

中位数=1/26049400100426.1942

m e L m

f S M X d f ---=+?=+?=∑(万元)

均值=426.67(万元),标准差=116(万元) (2)分布的偏态系数SKp=0

426.67433.33

0.0574116

x M σ

--=

=-

峰度系数=441

44

4

1

()425728680.4/ 2.3513

116n

i i i

i X

X f

m f

σσ

==-=

=

=∑∑

第六章、时间序列

一、单项选择题

答案:C B B D A D B A B A B A A C B 二、多项选择题

答案:ABC 、BCDE 、ACE 、ACDE 、ACD 、ABCD 、CE 、ABCD 、AC 、CD 三、判断题

答案:√ √ × × √ √ × × √ × 四、简答题 1、答:

编制和分析时间数列具有以下作用:

(1)可以反映现象发展变化的过程和结果;

(2)可以研究现象发展变化的方向、水平、速度和趋势:

(3)通过对时间数列的分析,可以进—步对现象的发展变化进行预测;

(4)通过对比相关联的时间数列,可以发现同一空间不同现象之间或不向空间同一现象之间在发展变化过程中的相互关系。

2、答:

共同点:它们都属于绝对数时间数列。 不同点:(1)时期数列中各时间上的指标值可以直接相加,相加的结果反映现象在更长时间内的总量水平;而时点数列中各时间上的指标值直接相加是没有实际意义的。(2)时期数列的指标数值大小与所属时期长短有直接关系,对于指标值非负的时期数列,其时期长度越长,指标数值越大;反之,指标数值越小。而时点数列的指标值大小与时点间隔无直接关系,如年末人口数就不一定比季末人口数大。(3)时期数列中各指标值表明了现象在一段时间内发展变化的总量;而时点数列中各指标值表明了现象在某一时刻上的总量水平。

3、答:

平均增长速度是反映现象在一定时期内逐期平均增长程度的指标,它与平均发展速度的关系是:

1=-平均增长速度平均发展速度

4、答:

移动平均法是以时间数列的第一项数值开始,按一定项数求出第一个序时平均数,然后按数列顺序依次逐项移动,边移动边平均的方法。

5、答:

测定季节变动要剔除长期趋势影响的原因是:(1)由于长期趋势影响月(季)平均数,时间数列中后期各月平均数会比前期各月平均数产生较大影响;(2)月(季)平均数包含着

长期趋势的季节变动就需先剔除长期趋势再测定季节变动。

五、计算题

平均发展水平

285327.5391.2413.82562.8580.82561.12

426.8566

+++++=

==(万元)

平均增长量42.563.722.62148.9818295.8

59.1655++++=

==(万元) 平均发展速度115.3%== 平均增长速度115.3%115.3%=-=

2、解:第一季度月平均劳动生产率

(90124143)/3119

1.91945866

62(6064)/322

++=

==+++(万元/人)

。 3、解:注意,翻一番即为原来的两倍,也就是目标产值为1000万元。 (1)此时,平均增长速度11107.18%17.18%===-=; (2)设后八年的平均发展速度为x ,则有28

1.052x =,即107.73%x =

= (3)平均发展速度109.05%=

== 设趋势方程为y a bx =+,则由最小二乘法,得

22

2

55328151728720

14.4()5551550

n xy x y b n x x -?-?=

=

==-?-∑∑∑∑∑ 17281514.4302.45

5

y x a b n

n

=-=-?=∑∑

因此,所求趋势方程为:302.414.4y x =+

2009年(即x=7)水稻产量的预测值302.414.47403.2=+?=(万吨)

要求;(1)按月平均法计算季节指数;

(2)按移动平均趋势剔除法计算季节指数。 5、(1)计算结果见下表:

季节指数计算表1

调整季节指数4=?∑季节指数

季节指数

第七章 统计指数练习题参考答案

一、单项选择

1—5 BBBCD 6—10 BCACD 11—15ABDDB 二、多项选择

1.BCE

2.BC

3.A B

4.ABE

5.ABE 三、判断题

1—5√ × × √ √ 6—10×× × × ×

四.简答题 略。

五、综合题 1、解:(1)个体产量指数和个体单位成本指数见计算表

(2)产量总指数%21.130144

5

.1870

01

==

=

∑∑p

q p q k q

单位成本总指数%87.1055

.1875

.1980

1

11==

=∑∑p

q p q k p (3)总成本的变动分析

总成本指数%85.137144

5

.1980

11==

=

∑∑p

q p q k pq 总成本增加额=198.5-144=54.5(万元) 137.85%=130.21%×105.87% 54.5万元=43.5万元+11万元

其中:由于产量增加42.98%使总成本增加43.5万元,单位成本上升使总成本增加11万元。 2、(1)销售量总指数%32.1053060

7

.32220

0==

=

∑∑p

q p

q k q

q

销售价格总指数%19.1057

.32223390

1

1

1

10

111==

=

=

∑∑∑∑p

q k p q p

q p q k q p

(2)销售额的总变动分析

销售额指数%78.1103060

33900

11

===

∑∑p q p q k pq

增加的销售额=1

1

q p ∑-0

q p ∑=330(万元)

其中:销售量变化对销售额的影响

100

q q p K q p

=

∑∑=105.32%

由于销售量上升增加的销售额= 1

q p ∑-0

q p

∑ =162.7(万元)

分析价格变化对销售额的影响

1

11

p

q p K q p

=∑∑

=105.19%

由于价格上升增加的销售额=

1

1

q p ∑ -1

q p

∑ =167.3(万元)

3、(1)价格指数%10282

.558570

1

1

11==

=

∑∑p

p

k

p q p q k (11.18万元)

(2)成交量指数%42.1160

01==

∑∑p

q p q k q (78.82万元)

(3)成交额指数

%75.118480

570

11

==

∑∑p

q p q (90万元) 118.75%=102%×1116.42%

90万元=11.18万元+78.82万元 4、设用q 、p 分别表示销售量、价格

万元)

(8001

1

=∑p

q 万元)

(70010080000

=-=∑p q

%1150

01

==

∑∑p

q p

q q 则万元)

(80515.170001=?=∑p q (1)销售额指数=

%29.114700800

11==

∑∑p

q p q (2)价格指数%38.99805

800

1

11==

=

∑∑p

q p q k p (3)价格变动而变动的销售额=

50

1

1

1

-=-∑∑p

q p q (万元)

5、销售额指数%56.1133540004020000

1

1

===∑

∑p q p q k pq

增加的销售额=1

1

q p ∑-0

q p ∑=48000(元)

其中:销售量变化对销售额的影响

1

00

q

q p K q p

=∑∑

=119.19%

由于销售量上升增加的销售额= 1

q p ∑-0

q p

∑ =67920(元)

分析价格变化对销售额的影响

1

11

p

q p K q p

=∑∑

=95.28%

由于价格上升增加的销售额=

1

1

q p ∑ -1

q p

∑ =-19920(元)

113.56%=119.19%×95.28%

48000元=67920元+(-19920元) 6、细粮小类指数%73.106100604.36.3405.27.2=?÷+?÷==∑

∑w kw p

粮食中类指数为%35.107100355.1086573.106=?+?==

∑∑w

kw k p

食品物价指数为:%55.113==∑

∑w kw k p

7、设用x 、f 分别表示平均工资、人数,由题知:

x

1

=∑∑f

f x 11

1=

1000

300

780400900?+?=828

x 0=∑∑f

f x

00

0=732

x n

=∑∑f x 1

1

0= 708

(1)总平均工资的变动为:

可变构成指数=

x

x 0

1=

732

828

= 113.11%,即总平均工资上升了13.11% 由此增加的总平均工资为: (

x 1

- x

)=828-732=96(元/人)

(2)、其中:

①受各组工人人数比重变化的影响为: 结构变动指数=

x

x n 0

=

732

708

= 96.72% 即由于技术工人的比重下降使总平均工资降低了3.28% 由此增加的总平均工资为: (

x

n

- x 0)=-24(元/人)

②受各组工人平均工资水平变动的影响为: 固定构成指数=

x

x n

1= 116.95%

即由于各组工人工资水平上升使总平均工资提高了16.95% 由此增加的总平均工资为: (

x 1

- x

n

)=120(元/人)

综合分析:关系式为: 113.11%= 96.72%×116.95% 96 = -24 + 120

即该工厂工人的工资报告期相对基期,由于技术工人的比重下降使总平均工资减少24元,由于各组工人工资上升使总平均工资增加120元,两者共同作用,最终使总平均工资增加了13.11%,平均每人增加96元。 8、略。

第八章 相关与回归参考答案

一、单项选择题

1-5:D C D C B 6-10:A B B C B 11-15:B B C C C

卫生统计学公式

相对数 公式(3.1) 公式(3.2) 公式(3.3) χ2检验 公式(3.4)理论频数 公式(3.5)χ2基本公式 公式(3.6)χ2自由度ν=(R-1)(C-1)公式(3.7)χ2校正的基本公式 公式(3.8)四格表专用公式 公式(3.9)四格表校正公式 公式(3.10)2×k表专用公式 公式(3.11)

公式(3.12)R×C表通用公式 中位数 公式(4.1)当n为奇数时 公式(4.2)当n为偶数时 公式(4.3)频数表上计算 公式(4.4) 百分位数 公式(4.5)频数表上计算 算术均数 公式(4.6)χ=(1/n)∑X 公式(4.7)χ=C+(1/n)(Xi-C) 公式(4.8)χa=Xa-1+(1/n)(Xa-Xa-1) 公式(4.9)χ=(1/n)∑fX 几何均数 公式(4.10)

公式(4.11) 四分位数间距 公式(4.12)Q=P75-P25 均差 公式(4.13) 标准差 公式(4.14)样本标准差 公式(4.15)递推计算 公式(4.16)直接计算 公式(4.17) 变异系数 公式(4.18)CV=S/X×100%, X>0 正态曲线 公式(5.1)正态曲线方程

(5.2)正态离差 (5.3)标准正态曲线 (5.4)正常值围X±uαs 标准误 (6.1)理论标准误 (6.2)样本均数的标准误 (6.3)率的标准误 (6.4) t分布 (6.5) 总体均数的估计 (6.6) 95%可信区间X-t0.05,νSχ<μ (6.9) 99%可信区间P-2.58Sp<π

医学统计学名词解释及问答题

1、总体(population):是根据研究目的确定的同质研究对象的全体。 2、样本(sample):从总体中抽取的一部分有代表性的个体。 3、同质(homogeneity):是指所研究的观察对象具有某些相同的性质或特征。 4、变异(variation):指同质个体的某项指标之间的差异。 5、参数(parameter):反映总体特征的指标称为参数。 6、统计量(statistic):通过样本资料计算出来的相应指标称为统计量。 7、抽样误差(sampling error):由随机抽样造成的样本指标与总体指标之间、样本指标与样本指标之间的差异。 8、概率(probability):某事件发生的可能性大小。 9、正态分布(normal distribution):高峰位于均数处,中间高两边低,左右完全对称地下降,但永远不与横轴相交的钟形曲线。 10、平均数(average):是描述一组同质变量值的平均水平或集中趋势的指标。 11、中位数(median):将一组数据由小到大排列,位于中间位置的观测值。 12、医学参考值范围(medical reference range):又称正常值范围,医学上常将包括绝大多数正常人的某项指标的波动范围称为该指标的正常值范围。 13、方差(variance):是各个数据与平均数之差的平方的平均数。 14、标准差(standard deviation):是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。 15、标准误(standard error):样本均数的标准差,等于原变量总体标准差除以例数的平方根,用以说明均数抽样误差的大小。 16、均数的抽样误差(sampling error of mean):由个体差异和抽样所导致的样本均数与样本均数之间,样本均数与总体均数之间的差异。 17、假设检验(hypothesis testing):先对总体做出某种假设,然后根据样本信息来推断其是否成立的一类统计方法的总称。 18、统计推断(statistical inference):是根据已知的样本信息来推断未知的总体,是统计分析的目的,包括参数估计和假设检验。 19、Ⅰ型错误(type Ⅰ error):拒绝了实际上成立的H0,这类弃真错误,发生的概率为α,为已知。 20、Ⅱ型错误(type Ⅱ error):不拒绝实际上不成立的H0,这类存伪错误,发生的概率为β,未知。 21、检验效能(power of test):又称把握度,为1-β,其意义是两总体确有差别,按α水准能发现它们有差别的能力。 22、可信区间(confidence interval):指总体参数可能所在的范围。 23、率(rate):说明某现象发生的频率或强度。 24、构成比(constituent ratio):表示某事物内部各组成部分所占的比重或分布,常以百分数表示。 25、相对比(relative ratio):表示两个有关事物指标之比,常以百分数和倍数表示,用以说明一个指标是另一个指标的几倍或百分之几。 26、标准化率(standardized rate):亦称调整率,是采用统一的标准对内部构成不同的各组频率进行调整和对比的方法。 27、参数检验(parametric test):一类依赖于总体分布的具体形式的统计推断方法。 28、非参数检验(non parametric test):一类不依赖总体分布类型的检验,在应用中可以不考虑被研究对象为何种分布以及分布是否已知,检验假设中没有包括总体参数的统计方法。

医学统计学试题和答案解析

第一套试卷及参考答案 一、选择题 (40分) 1、根据某医院对急性白血病患者构成调查所获得得资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数与标准差可全面描述 D 资料得特征 A 所有分布形式B负偏态分布 C 正偏态分布D正态分布与近似正态分布 3、要评价某市一名5岁男孩得身高就是否偏高或偏矮,其统计方法就是( A ) A 用该市五岁男孩得身高得95%或99%正常值范围来评价 B用身高差别得假设检验来评价 C用身高均数得95%或99%得可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A变异系数 B 方差C标准差 D 四分位间距 5、产生均数有抽样误差得根本原因就是( A ) A、个体差异B、群体差异C、样本均数不同D、总体均数不同 6、男性吸烟率就是女性得10倍,该指标为( A ) (A)相对比(B) 构成比(C)定基比 (D)率 7、统计推断得内容为( D ) A、用样本指标估计相应得总体指标B、检验统计上得“检验假设”C、A与B均不就是D、A与B均就是 8、两样本均数比较用t检验,其目得就是检验( C ) A两样本均数就是否不同B两总体均数就是否不同C两个总体均数就是否相同 D两个样本均数就是否相同 9、有两个独立随机得样本,样本含量分别为n1与n2,在进行成组设计资料得t检验时,自由度就是( D ) (A) n1+ n2 (B) n1+ n2–1(C) n1+ n2 +1 (D)n1+ n2-2 10、标准误反映( A ) A 抽样误差得大小 B总体参数得波动大小 C 重复实验准确度得高低 D 数据得离散程度 11、最小二乘法就是指各实测点到回归直线得(C) A垂直距离得平方与最小 B垂直距离最小 C纵向距离得平方与最小D纵向距离最小 12、对含有两个随机变量得同一批资料,既作直线回归分析,又作直线相关分析。令对相关系数检验得t值为tr,对回归系数检验得t值为tb,二者之间具有什么关系?(C) A t r>t b B t r〈t b C t r= tb D二者大小关系不能肯定 13、设配对资料得变量值为x1与x2,则配对资料得秩与检验(D ) A分别按x1与x2从小到大编秩 B把x1与x2综合从小到大编秩 C把x1与x2综合按绝对值从小到大编秩 D把x1与x2得差数按绝对值从小到大编秩 14、四个样本率作比较,χ2>χ20、05,ν可认为( A ) A各总体率不同或不全相同 B各总体率均不相同 C各样本率均不相同D各样本率不同或不全相同 15、某学院抽样调查两个年级学生得乙型肝炎表面抗原,其中甲年级调查35人,阳性人数4人;乙年级调查40人,阳性人数8人。该资料宜选用得统计方法为( A ) A.四格表检验 B、四格表校正检验 C t检验 D U检验 16、为调查我国城市女婴出生体重:北方n1=5385,均数为3、08kg,标准差为0、53kg;南方n2=4896,均数为3、10kg,标准差为0、34kg,经统计学检验,p=0、0034〈0、01,这意味着( D )

卫生统计学简答题汇总

统计学简答汇总 第一章:绪论(无) 第二章:定量变量的统计描述 1.均数﹑几何均数和中位数的适用范围有何异同? 答:相同点,均表示计量资料集中趋势的指标。 不同点:表2-5. 表2-5 均数,几何均数和中位数的相异点 平均数意义应用场合 均数平均数量水平应用甚广,最适用于对称分布,特别是正态分布 几何均数平均增减倍数①等比资料;②对数正态分布资料 中位数位次居中的观①偏态资料;②分布不明资料;③分布一端或两 察值水平端出现不确定值 2.中位数与百分位数在意义上﹑计算和应用上有何区别与联系? 答: 1)意义:中位数是百分位中的第50分位数,常用于描述偏态分布资料的集中位置,反映位次居中的观察值水平。百分位数是用于描述样本或总体观察值序列在某百分位置的水平,最常用的百分位是P50即中位数。多个百分位数结合使用,可更全面地描述总体或样本的分布特征。 (2)计算:中位数和百分位数均可用同一公式计算,即 Px=L+(i/f x)(n·x%-Σf L) 可根据研究目的选择不同的百分位数代入公式进行计算分析。 (3)应用:中位数常用于描述偏态分布资料的集中趋势;百分位数常用于医学参考值范围的确定。中位数常和其它分位数结合起来描述分布的特征,在实际工作中 更为常用。百分位数还可以用来描述变量值的离散趋势(四分位数间距)。 3.同一资料的标准差是否一定小于均数? 答:不一定。同一资料的标准差的大小与均数无关,主要与本资料的变异度有关。 变异大,标准差就大,有时比均数大;变异小,标准差小。 4.测得一组资料,如身高或体重等,从统计上讲,影响其标准差大小的因素有哪些? (1)样本含量的大小,样本含量越大,标准差越稳定。 (2)分组的多少 (3)分布形状的影响,偏态分布的标准差较近似正态分布大 (4)随机测量误差大小的影响 (5)研究总体中观察值之间变异程度大小 5.标准差与变异系数的异同点有哪些? 答:标准差:是以算数平均数为中心,反映各观测值离散程度的一个绝对指标.当需要对同一总体不同时期或对不同总体进行对比时,缺乏可比性.当总体平均水平不同或计量单位不同时,用标准差是无法实现两组数据离散程度大小对比的. 变异系数:标准差与平均数的比值称为变异系数,记为C·V.变异系数可以消除单位和(或)平均数不同对两个或多个资料变异程度比较的影响。 6.如何表达一批计量数据的基本特征? 答:从集中趋势和离散趋势两方面回答。 7. 描述计量资料离散程度(差别大小)的指标有哪些,各适用于什么情况? 答:常见的几种描述离散程度的指标:极差或全距,四分位数差距,方差与标准差,变异系

统计学原理计算题及答案

2 ?采用简单重复抽样的方法从一批零件中抽取 200件进行检查,其中合格品 188件。要求: (1) 计算该批零件合格率的抽样平均误差; (2) 按95.45%的可靠程度(t=2,就是我们现在的Z )对该批零件的合格率作出区间估计。 解:n =200,n =188 (1)合格率 = 1?^ = 94% n 200 合格率的抽样平均误差 p(1 — p) 「0.94 x 0.06 J0.0564 . ---------- 0.000282 = 0.01679 = 1.679%(2)按95.45%的可靠程度对该批零件的 p i n , 200 \ 200 合格率作出区间估计 二Z 」p =2 1.68% =3.36% p - :p =94% -3.36% =90.64% p :P =94% 3.36% =97.36% 该批零件合格率区间为: 990.64%乞P 乞97.36% 要求: (1) 试计算各年的环比发展速度及年平均增长量。 (2) 如果从2006年起该地区的粮食生产以 10%的增长速度发展,预计到 2010年该地区的粮食产量将达到什么水平? 2006年起该地区的粮食生产以 10%的增长速度发展 x =1 10% =110% 71 预计到2010年该地区的粮食产量将达到 解: (1) 各年的环比发展速度 472 二 108.76% a 0 434 a 2 516 109.32 % 472 a g 584 a 2 516 = 113.18% 618 =105.82% a 4 年平均增长量 累计增长量 累计增长个数 …=618一434」84=46 4 4 4 (2)如果从

医学统计学 名词解释+问答题-1

医学统计学 1、应用相对数时应注意的事项 ①计算相对数时分母不能太小; ②分析时不能以构成比代替率; ③当各分组的观察单位数不等时,总率(平均率)的计算不能直接将各分组的率相加求其平均; ④对比时应注意资料的可比性:两个率要在相同的条件下进行,即要求研究方法相同、研究对象同质、观察时间相等以及地区、民族、年龄、性别等客观条件一致,其他影响因素在各组的内部构成应相近; ⑤进行假设检验时,要遵循随机抽样原则,以进行差别的显著性检验。 2、正态分布的特点及其应用 性质:①两头低中间高,略呈钟形; ②只有一个高峰,在X=μ,总体中位数亦为μ; ③以均数为中心,左右对称; ④μ为位置参数,当σ恒定时,μ越大,曲线沿横轴越向右移动; σ为变异度参数,当μ恒定时,σ越大,表示数据越分散,曲线越矮胖,反之,曲线越瘦高; ⑤对于任何服从正态分布N(μ,σ2)的随机变量X作的线性变换,都会变换成u 服从于均数为0,方差为1的正态分布,即标准正态分布。 应用:①概括估计变量值的频数分布; ②制定参考值范围; ③质量控制; ④是许多统计方法的理论基础。 3、确定参考值范围的一般原则和步骤、方法 一般原则和步骤:①抽取足够例数的正常人样本作为观察对象; ②对选定的正常人进行准确而统一的测定,以控制系统误差; ③判断是否需要分组测定; ④决定取单侧范围值还是双侧范围值; ⑤选定适当的百分范围; ⑥选用适当的计算方法来确定或估计界值。 方法:①正态分布法:②百分位数法(偏态分布) 4、总体均数的可信区间与参考值范围的区别 概念:可信区间是按预先给定的概率来确定的未知参数μ的可能范围。 参考值范围是绝大多数正常人的某指标范围。所谓正常人,是指排除了影响所研究指标的疾病和有关因素的人;所谓绝大多数,是指范围,习惯上指正常人的95%。 计算公式:可信区间① ② ③ 参考值范围①正态分布 ②偏态分布 用途:可信区间用于总体均数的区间估计 参考值范围用于表示绝大多数观察对象某项指标的分布范围

医学统计学试题及答案

《医学统计学》课程考试试题(A卷) (评卷总分:100分,考试时间:120分钟,考核方式:□开卷 V 闭卷) 一、选择题(每题1分,共62分,只选一个正确答案) 1、医学科研设计包括( D ) A.物力和财力设计 B.数据与方法设计 C.理论和资料设计 D.专业与统计设计 2、医学统计资料的分析包括( D ) A.数据分析与结果分析 B.资料分析与统计分析 C.变量分析与变量值分析 D.统计描述与统计推断 3、医学资料的同质性指的是( D ) A.个体之间没有差异 B.对比组间没有差异 C.变量值之间没有差异 D.研究事物存在的共性 4、离散型定量变量的测量值指的是( D ) A.可取某区间内的任何值 B、可取某区间内的个别值 C.测量值只取小数的情况 D.测量值只取整数的情况5、变量的观察结果表现为相互对立的两种情况是( A ) A.无序二分类变量 B、定量变量. C.等级变量 D.无序多分类变量 6、计量资料编制频数表时,组距的选择( D ) A.越大越好 B.越小越好 C.与变量值的个数无关 D.与变量值的个数有关

7、比较一组男大学生白细胞数与血红蛋白含量的变异度应选( D )A.极差 B.方差 C.标准差 D.变异系数 8、若要用方差描述一组资料的离散趋势,对资料的要求是( D )A.未知分布类型的资料 B.等级资料 C.呈倍数关系的资料 D.正态分布资料 9、频数分布两端没有超限值时,描述其集中趋势的指标也可用( D ) A.标准差 B.几何均数 C.相关系数 D.中位数 10、医学统计工作的步骤是( A ) A、研究设计、收集资料、整理资料和分析资料 B、计量资料、计数资料、等级资料和统计推断 C、研究设计、统计分析,统计描述和统计推断 D、选择对象、计算均数、参数估计和假设检验 11、下列关于变异系数的说法,其正确的是( A ) A.没有度量衡单位的系数 B.描述多组资料的离散趋势 C.其度量衡单位与变量值的度量衡单位一致 D、其度量衡单位与方差的度量衡单位一致 12、10名食物中毒的病人潜伏时间(小时)分别为3, 4,5,3,2,5.5,2.5,6,6.5, 7,其中位数是( B ) A.4 B.4.5 C.3 D.2 13、调查一组正常成年女性的血红蛋白,如果资料属于正态分布,描

统计学原理计算题试题及答案

电大专科统计学原理计算题试题及答案 计算题 1.某单位40名职工业务考核成绩分别为: 68 89 88 84 86 87 75 73 72 68 75 82 97 58 81 54 79 76 95 76 71 60 90 65 76 72 76 85 89 92 64 57 83 81 78 77 72 61 70 81 单位规定:60分以下为不及格,60─70分为及格,70─80分为中,80─90 分为良,90─100分为优。 要求: (1)将参加考试的职工按考核成绩分为不及格、及格、中、良、优五组并 编制一张考核成绩次数分配表; (2)指出分组标志及类型及采用的分组方法; (3)分析本单位职工业务考核情况。 解:(1) (2)分组标志为"成绩",其类型为"数量标志";分组方法为:变量分组中 的开放组距式分组,组限表示方法是重叠组限; (3)本单位的职工考核成绩的分布呈两头小, 中间大的" 正态分布"的形态, 说明大多数职工对业务知识的掌握达到了该单位的要求。 2.2004年某月份甲、乙两农贸市场农产品价格和成交量、成交额资料如下

试问哪一个市场农产品的平均价格较高?并说明原因。 解: 解:先分别计算两个市场的平均价格如下: 甲市场平均价格()375.145 .5/==∑∑=x m m X (元/斤) 乙市场平均价格325.14 3 .5==∑∑= f xf X (元/斤) 说明:两个市场销售单价是相同的,销售总量也是相同的,影响到两个市场 平均价格高低不同的原因就在于各种价格的农产品在两个市场的成交量不同。 3.某车间有甲、乙两个生产组,甲组平均每个工人的日产量为36件, 标准差为9.6件;乙组工人日产量资料如下: 要求:⑴计算乙组平均每个工人的日产量和标准差; ⑵比较甲、乙两生产小组哪个组的日产量更有代表性? 解:(1)

医学统计学简答题

医学统计学简答题 1.简述标准差、标准误的区别与联系? 区别:(1)含义不同:标准差S表示观察值的变异程度,描述个体变量值(x)之间的变异度大小,S越大,变量值(x)越分散;反之变量值越集中,均数的代表性越强。标准误..估计均数的抽样误差的大小,是描述样本均数之间的变异度大小,标准误越大,样本均数与总体均数间差异越大,抽样误差越大;反之,样本均数越接近总体均数,抽样误差越小。 (2)与n的关系不同: n增大时,S趋于σ(恒定),标准误减少并趋于0(不存在抽样误差)。 (3)用途不同:标准差表示x的变异度大小、计算变异系数、确定医学参考值范围、计算标准误等,标准误用于估计总体均数可信区间和假设检验。 联系:二者均为变异度指标,样本均数的标准差即为标准误,标准差与标准误成正比。 2.简述假设检验的基本步骤。 1.建立假设,确定检验水准。 2.选择适当的假设检验方法,计算相应的检验统计量。 3.确定P值,下结论 3.正态分布的特点和应用:? 特点:?1、集中性:正态曲线的高峰位于正中央,即均数所在的位置;? 2、对称性:正态分布曲线位于直角坐标系上方,以x=u为中心,左右对称,曲线两端永远不与横轴相交; 3、均匀变动性:正态曲线由均数所在处开始,分别向左右两侧逐渐均匀下降;?

4、正态分布有两个参数,即均数μ和标准差σ,可记作N(μ,σ):均数μ决定正态曲线的中心位置;标准差σ决定正态曲线的陡峭或扁平程度。σ越小,曲线越陡峭;σ越大,曲线越扁平; ?5、u变换:为了便于描述和应用,常将正态变量作数据转换;?? 应用:?1.估计医学参考值范围?2.质量控制?3.正态分布是许多统计方法的理论基础 4.简述参考值范围与均数的可信区间的区别和联系 可信区间与参考值范围的意义、计算公式和用途均不同。 ?1.从意义来看?95%参考值范围是指同质总体内包括95%个体值的估计范围,而总体均数95%可信区间是指?95%可信度估计的总体均数的所在范围? 2.从计算公式看?若指标服从正态分布,95%参考值范围的公式是:±1.96s。?总体均数95%可信区间的公式是:??前者用标准差,后者用标准误。前者用1.96,后者用α为0.05,自由度为v的t界值。 5.频数表的用途和基本步骤。 用途:(1)揭示资料的分布特征和分布类型;(2)便于进一步计算指标和分析处理;(3)便于发现某些特大或特小可疑值。 基本步骤:(1)求出极差;(2)确定组段,一般设8~15个组段;(3)确定组距;组距=R/组段数,但一般取一方便计算的数字;(4)列出各个组段并确定每一组段频数。 6.非参数统计检验的适用条件。 (1)资料不符合参数统计法的应用条件(总体为正态分布、且方差相等)或总体分布类型未知;(2)等级资料;(3)分布呈明显偏态又无适当的变量转换方法使之满足参数统计条件;(4)在资料满足参数检验的要求时,应首选参数法,以免降低检验效能 7.线性回归的主要用途。

卫生统计学名词解释

1.总体:总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 2.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。 3.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。 4.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等 计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为 +、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 5.概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。0﹤P(A)﹤1。频率:在相同的条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现的频率(freqency)。当试验重复很多次时P(A)= m/n。 2.概率是描述随机事件发生可能性大小的数值,常用P表示。随机事件概率的大小在0与1之间,P越接近1,表示某事件发生的可能性越大;P越接近0,表示某事件发生的可能性越小。习惯上将P≤0.05的事件,称为小概率事件,表示在一次实验或观察中该事件发生的可能性很小,可视为不发生。 6. 随机误差:随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的差。它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 7.系统误差:系统误差(systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计和完善技术措施来消除或使之减少。 8.随机变量:随机变量(random variable)是指取指不能事先确定的观察结果。随机量的具体内容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且,理论上讲,每个变量的取值服从特定的概率分布。 9.参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。 10.统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 11.频数表(frequency table)用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2…个病人的天数。对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。 12.算术均数(arithmetic mean)描述一组数据在数量上的平均水平。总体均数用μ表示,样本均数用X 表示。 13.几何均数(geometric mean)用以描述对数正态分布或数据呈倍数变化资料的水平。记为G。 14.中位数(median)Md将一组观察值由小到大排列,n 为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。反映一批观察值在位次上的平均水平。 15.极差(range)亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。 16.百分位数(percentile)是将n 个观察值从小到大依次排列,再把它们的位次依次转化为百分位。百分位数的另一个重要用途是确定医学参考值范围。

统计学原理计算题及参考答案

"

}

| 1、某生产车间30名工人日加工零件数(件)如下: 30 26 42 41 36 44 40 37 37 25 45 29 43 31 36 36 49 34 47 33 43 38 42 32 34 38 46 43 39 35 要求:(1)根据以上资料分成如下几组:25—30,30—35,35—40,40—45,45—50,计算各组的频数和频率,编制次数分布表; (2) 根据整理表计算工人平均日产零件数。(20分) 解:(1)根据以上资料编制次数分布表如下:

则工人平均劳动生产率为: 17.3830 1145 == = ∑∑f xf x # 要求:(1)建立以产量为自变量的直线回归方程,指出产量每增加1000件时单位成本的平均变动是多少 、 (2)当产量为10000件时,预测单位成本为多少元(15分) x bx a y n x b n y a x x n y x xy n b c 5.28080 10703 125.232105.2615 1441502520250512503210128353)(2 2 2-=+==+=?+=-=-=-=--=-??-?= --= ∑∑∑∑∑∑∑因为,5.2-=b ,所以产量每增加1000件时, 即x 增加1单位时,单位成本的平均变动是:平均减少元 (2)当产量为10000件时,即10=x 时,单位成本为 — 55105.280=?-=c y 元

>课程的测试,甲班平均成绩为81分,标准差为分;乙班的成绩分组资料如下: 计算乙班学生的平均成绩,并比较甲.乙两班哪个班的平均成绩更有代表性 解:乙班学生的平均成绩∑∑=f xf x ,所需的计算数据见下表:

医学统计学部分试题及答案解析

第一章绪论 1.下列关于概率的说法,错误的是 A. 通常用P表示 B. 大小在0%与100%之间 C. 某事件发生的频率即概率 D. 在实际工作中,概率是难以获得的 E. 某事件发生的概率很小,在单次研究或观察中时,称为小概率事件 [参考答案] C. 某事件发生的频率即概率 2.下列有关个人基本信息的指标中,属于有序分类变量的是 A. 学历 B. 民族 C. 血型 D. 职业 E. 身高 [参考答案] A. 学历3.下列有关个人基本信息的指标,其中属于定量变量的是 A. 性别 B. 民族 C. 职业 D. 血型 E. 身高 [参考答案] E. 身高 4.下列关于总体和样本的说法,不正确的是 A. 个体间的同质性是构成总体的必备条件 B. 总体是根据研究目的所确定的观察单位的集合 C. 总体通常有无限总体和有限总体之分 D. 一般而言,参数难以测定,仅能根据样本估计 E. 从总体中抽取的样本一定能代表该总体

[参考答案] E. 从总体中抽取的样本一定能代表该总体 5.在有关2007年成都市居民糖尿病患病率的调查研究中,总体是 A. 所有糖尿病患者 B. 所有成都市居民 C. 2007年所有成都市居民 D. 2007年成都市居民中的糖尿病患者 E. 2007年成都市居民中的非糖尿病患者[参考答案] C. 2007年所有成都市居民 6.简述小概率事件原理。 答:当某事件发生的概率很小,习惯上认为小于或等于0.05时,统计学上称该事件为小概率事件,其含义是该事件发生的可能性很小,进而认为它在一次抽样中不可能发生,这就是所谓小概率事件原理,它是进行统计推断的重要基础。 7.举例说明参数和统计量的概念答:某项研究通常想知道关于总体的某些数值特征,这些数值特征称为参数,如整个城市的高血压患病率。根据样本算得的某些数值特征称为统计量,如根据几百人的抽样调查数据所算得的样本人群高血压患病率。统计量是研究人员能够知道的,而参数是他们想知道的。一般情况下,这些参数是难以测定的,仅能根据样本估计。显然,只有当样本代表了总体时,根据样本统计量估计的总体参数才是合理的 8.举例说明总体和样本的概念 答:研究人员通常需要了解和研究某一类个体,这个类就是总体。总体是根据研究目的所确定的观察单位的集合,通常有无限总体和有限总体之分,前者指总体中的个体数是无限的,如研究药物疗效,某病患者就是无限总体,后者指总体中的个体数是有限的,它是指特定时间、空间中有限个研究个体。但是,研究整个总体一般并不实际,通常能研究的只是它的一部分,这个部分就是样本。例如在一项关于2007

卫生统计学公式解析(doc 11页)

卫生统计学公式解析(doc 11页) 部门: xxx 时间: xxx 整理范文,仅供参考,可下载自行编辑

相对数 公式(3.1) 公式(3.2) 公式(3.3) χ2检验 公式(3.4)理论频数 公式(3.5)χ2基本公式 公式(3.6)χ2自由度ν=(R-1)(C-1)

公式(3.7)χ2校正的基本公式公式(3.8)四格表专用公式 公式(3.9)四格表校正公式 公式(3.10)2×k表专用公式公式(3.11) 公式(3.12)R×C表通用公式中位数 公式(4.1)当n为奇数时 公式(4.2)当n为偶数时 公式(4.3)频数表上计算 公式(4.4) 百分位数

公式(4.5)频数表上计算 算术均数 公式(4.6)χ=(1/n)∑X 公式(4.7)χ=C+(1/n)(Xi-C) 公式(4.8)χa=Xa-1+(1/n)(Xa-Xa-1) 公式(4.9)χ=(1/n)∑fX 几何均数 公式(4.10) 公式(4.11) 四分位数间距 公式(4.12)Q=P75-P25 均差 公式(4.13) 标准差 公式(4.14)样本标准差 公式(4.15)递推计算

公式(4.16)直接计算 公式(4.17) 变异系数 公式(4.18)CV=S/X×100%, X>0 正态曲线 公式(5.1)正态曲线方程 (5.2)正态离差 (5.3)标准正态曲线 (5.4)正常值范围X±uαs 标准误 (6.1)理论标准误 (6.2)样本均数的标准误 (6.3)率的标准误

(6.4) t分布 (6.5) 总体均数的估计 (6.6) 95%可信区间X-t0.05,νSχ<μ (6.9) 99%可信区间P-2.58Sp<π t检验 公式(6.5)样本均数与总体均数比较 公式(7.1) 两样本均数比较的自由度ν=n1+n2-2 公式(7.2) 合并方差 公式(7.3) 两均数相差的标准误 公式(7.4) t检验 u检验

00974统计学原理练习题

00974统计学原理 一、单选 1、下列调查中,调查单位与填报单位一致的是( D )。 A. 企业设备调查 B. 人口普查 C. 农村耕地调查 D. 工业企业现状调查 2、每一吨铸铁成本(元)倚铸件废品率(%)变动的回归方程为: y c = 56 + 8x,这意味着( C ) 3、 A. 废品率每增加1%,成本每吨增加64元 B. 废品率每增加1%,成本每吨增加8% 4、 C. 废品率每增加1%,成本每吨增加8元 D. 废品率每增加1%,则每吨成本为56元 3、2005年某地区下岗职工已安置了万人,安置率达%,安置率是( D )。 A.总量指标 B.变异指标 C.平均指标 D.相对指标 4、下面现象间的关系属于相关关系的是( C )。 A. 圆的周长和它的半径之间的关系 B. 价格不变条件下,商品销售额与销售量之间的关系 C. 家庭收入愈多,其消费支出也有增长的趋势 D. 正方形面积和它的边长之间的关系 5、分配数列各组标志值和每组次数均增加15%,加权算术平均数的数值( B )。 A.减少15% B.增加15% C.不变化 D.判断不出 6、次数分配数列是( D)。 A.按数量标志分组形成的数列 B.按品质标志分组形成的数列 C.按统计指标分组所形成的数列 D.按数量标志和品质标志分组所形成的数列 7、对于不同水平的总体不能直接用标准差比较其标志变异度,这时需分别计算各自的 ( A )来比较。 A.标准差系数 B.平均差 C.全距 D.均方差 8、企业按资产总额分组( B ) A.只能使用单项式分组 B.只能使用组距式分组 C.可以单项式分组,也可以用组距式分组 D.无法分组 9、某企业的职工工资水平比上年提高5%,职工人数增加2%,则企业工资总额增长( B )。 A. 10% B. % C. 7% D. 11% 10、在进行分组时,凡是遇到某单位的标志值刚好等于相邻两组上下限数值时,一般是 ( B )。

最新医学统计学问答题(含答案)

简答题 0. 算术均数、几何均数和中位数各有什么适用条件? 答:(1)算术均数:适用对称分布,特别是正态或近似正态分布的数值变量资料。 (2)几何均数:适用于频数分布呈正偏态的资料,或者经对数变换后服从正态分布(对数正态分布)的资料,以及等比数列资料。 (3)中位数:适用各种类型的资料,尤其以下情况: A 资料分布呈明显偏态; B 资料一端或两端存在不确定数值(开口资料或无界资料); C 资料分布不明。 1.对于一组近似正态分布的资料,除样本含量n 外,还可计算 S X ,和S X 96.1±,问各说明什么? (1)X 为算数均数,说明正态分布或近似正态分布资料的集中趋势 (2)S 为标准差,说明正态分布或近似正态分布的离散趋势 (3)S X 96.1±可估计正态指标的95%的医学参考值范围,即此范围在理论上应包含95%的个体值。 2.试述正态分布、标准正态分布的联系和区别。 正态分布 标准正态分布 原始值X 无需转换 作u=(X-μ)/σ转换 分布类型 对称 对称 集中趋势 μ μ=0 均数与中位数的关系 μ=M μ=M 参考:标准正态分布的均数为0,标准差为1;正态分布的均数则为μ,标准差为σ(μ为任意数,而σ为大于0的任意数)。标准正态分布的曲线只有一条,而正态分布曲线是一簇。任何正态分布都可以通过标准正态变换转换成标准正态分布。标准正态分布是正态分布的特例。 3.说明频数分布表的用途。 1)描述频数分布的类型 2)描述频数分布的特征 3)便于发现一些特大或特小的可疑值 4)便于进一步做统计分析和处理 4.变异系数的用途是什么? 多用于观察指标单位不同时,如身高与体重的变异程度的比较;或均数相差较大时,如儿童身高与成人身高变异程度的比较。 5.试述正态分布的面积分布规律。 (1)X 轴与正态曲线所夹的面积恒等于1或100%; (2)区间μ±σ的面积为68.27%,区间μ±1.96σ的面积为95.00%,区间μ±2.58σ的面积为99.00%。 6.试举例说明均数的标准差与标准误的区别与联系。 7.标准正态分布(u 分布)与t 分布有何不同?

医学统计学试题和答案.doc

医学统计学试题和答案

(一)单项选择题 3.抽样的目的是( b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 D. 研究总体统计量 C.研究典型案例研究误差 4.参数是指( b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的(a)。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A. 均数不变,标准差改变 B. 均数改变,标准差不变 C. 两者均不变 D. 两者均改变 7. 比较身高和体重两组数据变异度大小宜采用(a )。 A. 变异系数 B. 差 C. 极差 D.标准差 8. 以下指标中(d)可用来描述计量资料的离散程度。 A. 算术均数 B. 几何均数 C. 中位数 D.标准差 9. 偏态分布宜用(c)描述其分布的集中趋势。 A. 算术均数 B. 标准差 C. 中位数 D. 四分位数间距 10. 各观察值同乘以一个不等于 0 的常数后,(b)不变。 A.算术均数 B. 标准差 C. 几何均数 D.中位数 11.( a)分布的资料,均数等于中位数。 A. 对称 B. 左偏态 C. 右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A. 正态 B. 近似正态 C. 左偏态 D.右偏态 13. 最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A. 均数 B. 标准差 C. 中位数 D.四分位数间距 14.( c)小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B. 标准差 C. 标准误 D. 极差 15. 血清学滴度资料最常用来表示其平均水平的指标是(c )。 A. 算术平均数 B. 中位数 C. 几何均数 D. 平均数

卫生统计学知识点总结

卫生统计学知识点总结-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

卫生统计学 统计工作基本步骤:统计设计(调查设计和实验设计)、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断(参数估计和假设检验)】。 ★统计推断:是利用样本所提供的信息来推断总体特征,包括:参数估计和假设检验。a参数估计是指利用样本信息来估计总体参数,主要有点估计(把样本统计量直接作为总体参数估计值)和区间估计【按预先设定的可信度(1-α),来确定总体均数的所在范围】。b假设检验:是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。 变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化,通常是由高级向低级转化。 资料按性质可分为计量资料、计数资料和等级资料。 定量资料的统计描述 1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。 2频率分布表(图)的用途:①描述资料的分布类型;②描述分布的集中趋势和离散趋势;③便于发现一些特大和特小的可疑值;④便于进一步的统计分析和处理;⑤当样本含量足够大时,以频率作为概率的估计值。 ★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。 (1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。 (2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。 标准差的应用:①表示变量分布的离散程度;②结合均数计算变异系数、描述对称分布资料;③结合样本含量计算标准误。 定性资料的统计描述 1定性资料的基础数据是绝对数。描述一组定性资料的数据特征,通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。 2 指标频率型指标强度型指标相对比型指标 概念近似反映某一时间出现概率单位时间内某现象的发生 率 两个有关联的指标A和B之比 计算 公式 A/B 有无 量纲 无有可有、可无 取值 范围 【0,1】可大于1无限制 本质大样本时作为概率近似值分子式分母的一部分频率强度,即概率强度的 似 值 表示相对于B的一个单位,A有多少 位 A和B可以是绝对数、相对数和平均

相关文档
相关文档 最新文档