当前位置：文档库 › 《卫生统计学》考试题及答案

《卫生统计学》考试题及答案

《卫生统计学》

一、名词解释

1.计量资料

2.计数资料

3.等级资料

4.总体

5.样本

6.抽样误差

7.频数表

8.算术均数

9.中位数

10.极差

11.方差

12.标准差

13.变异系数

14.正态分布

15.标准正态分布

16.统计推断

17.抽样误差

18.标准误

19.可信区间

20.参数估计

21.假设检验中P的含义

22.I型和II型错误

23.检验效能

24.检验水准

25.方差分析

26.随机区组设计

27.相对数

28.标准化法

29.二项分布

30.Yates校正

31.非参数统计

32.直线回归

33.直线相关

34.相关系数

35.回归系数

36.人口总数

37.老年人口系数

38.围产儿死亡率

39.新生儿死亡率

40.婴儿死亡率

41.孕产妇死亡率

42.死因顺位

43.人口金字塔

二、单项选择题

1．观察单位为研究中的( D )。

A．样本B．全部对象

C．影响因素D．个体

2．总体是由（C ）。

A．个体组成B．研究对象组成

C．同质个体组成D．研究指标组成

3．抽样的目的是（B ）。

A．研究样本统计量B．由样本统计量推断总体参数C．研究典型案例研究误差D．研究总体统计量

4．参数是指（ B ）。

A．参与个体数B．总体的统计指标

C．样本的统计指标D．样本的总和

5．关于随机抽样，下列那一项说法是正确的（A ）。

A ．抽样时应使得总体中的每一个个体都有同等的机会被抽取

B ．研究者在抽样时应精心挑选个体，以使样本更能代表总体

C ．随机抽样即随意抽取个体

D ．为确保样本具有更好的代表性，样本量应越大越好 6．各观察值均加（或减）同一数后（ B ）。

A ．均数不变，标准差改变

B ．均数改变，标准差不变

C ．两者均不变

D ．两者均改变 7．比较身高和体重两组数据变异度大小宜采用（ A ）。 A ．变异系数 B ．方差 C ．极差 D ．标准差

8．以下指标中（ D ）可用来描述计量资料的离散程度。 A ．算术均数 B ．几何均数 C ．中位数 D ．标准差

9．血清学滴度资料最常用来表示其平均水平的指标是（ C ）。 A ．算术平均数 B ．中位数 C ．几何均数 D ．平均数 10．两样本均数的比较，可用（ C ）。 A ．方差分析 B ．t 检验 C ．两者均可 D ．方差齐性检验 11．配伍组设计的方差分析中，ν配伍

等于（ D ）。

A ．ν总

-ν

误差 B ．

ν总-ν

处理

C ．ν

总

-ν处理

+ν

误差

D ．ν

总

-ν处理

-ν

误差

12．在均数为μ，标准差为σ的正态总体中随机抽样，≥-||μX （ B ）的概率为5%。

A ．1.96σ

B ．1.96X σ

C ．0.052,t s ν D.

0.052,X t S ν

13．完全随机设计方差分析的检验假设是（ D ）。

A ．各处理组样本均数相等

B ．各处理组总体均数相等

C ．各处理组样本均数不相等

D ．各处理组总体均数不全相等

14．已知男性的钩虫感染率高于女性。今欲比较甲乙两乡居民的钩虫感染率，但甲乡人口女多于男，而乙乡男多于女，适当的比较方法是（ D ）。 A ．分别进行比较 B ．两个率比较的χ2检验

C ．不具备可比性，不能比较

D ．对性别进行标准化后再比较 15．率的标准误的计算公式是（ D ）。 A ．)1(p p - B ．

p p )

1(- Ｃ．1-n p Ｄ．

p p )

1(- 16．非参数统计应用条件是（ C ）。 A ．总体是正态分布

B ．若两组比较，要求两组的总体方差相等

C ．不依赖于总体分布

D ．要求样本例数很大

17．下述哪些不是非参数统计的特点（ D ）。

A ．不受总体分布的限定

B ．多数非参数统计方法简单，易于掌握

C ．适用于等级资料

D ．检验效能总是低于参数检验 18．设配对设计资料的变量值为X 1和X 2，则配对资料的秩和检验（ A ）。 A ．把X 1与X 2的差数绝对值从小到大编秩 B ．把X 1和X 2综合从小到大编秩 C ．把X 1和X 2综合按绝对值从小到大编秩 D ．把X 1与X 2的差数从小到大编秩

19．秩和检验和t 检验相比，其优点是（ A ）。 A ．计算简便，不受分布限制 B ．公式更为合理 C ．检验效能高 D ．抽样误差小

20．对两样本均数作比较时，已知n 1、n 2均小于30，总体方差不齐且分布呈偏态，宜用（ C ）。 A ．t 检验 B ．u 检验 C ．秩和检验 D ．F 检验 21．等级资料的比较宜用（ B ）。

A ．t 检验

B ．秩和检验

C ．F 检验

D ．四格表X 2检验 22．两个小样本比较的假设检验，应首先考虑（ D ）。 A ．t 检验 B ．秩和检验

C ．任选一种检验方法

D ．资料符合哪种检验的条件 23．对于配对比较的秩和检验，其检验假设为（ B ）。 A ．样本的差数应来自均数为0的正态总体

B ．样本的差数应来自均数为0的非正态总体

C ．样本的差数来自中位数为0的总体

D ．样本的差数来自方差齐性和正态分布的总体

24．用最小二乘法确定直线回归方程的原则是各观察点( B )。 A ．距直线的纵向距离相等 B ．距直线的纵向距离的平方和最小 C ．与直线的垂直距离相等

D ．与直线的垂直距离的平方和最小 25．实验设计的三个基本要素是D ）。

A ．受试对象、实验效应、观察指标

B ．随机化、重复、设置对照

C ．齐同对比、均衡性、随机化

D ．处理因素、受试对象、实验效应 26．实验设计的基本原则（ D ）。

A ．随机化、盲法、设置对照

B ．重复、随机化、配对

C ．随机化、盲法、配对

D ．随机化、重复、设置对照 27．实验设计和调查设计的根本区别是（ D ）。

A ．实验设计以动物为对象

B ．调查设计以人为对象

C ．实验设计可随机分组

D ．实验设计可人为设置处理因素 28. 标准正态分布的均数与标准差分别为( A )。 A ．0与1 B ．1与0 C ．0与0 D ．1与1

29．正态分布有两个参数μ与σ，( C )相应的正态曲线的形状越扁平。 A ．μ越大 B ．μ越小 C ．σ越大 D ．σ越小

30．若X 服从以μ，σ为均数和标准差的正态分布，则X 的第95百分位数等于( B )。 A ．σμ64.1- B ．σμ64.1+ C ．σμ96.1+ D ．σμ58.2+ 三、简答题

1. 某年级甲班、乙班各有男生50人。从两个班各抽取10人测量身高，并求其平均身高。

如果甲班的平均身高大于乙班，能否推论甲班所有同学的平均身高大于乙班？为什么？ 2. 简述医学中参考值范围的涵义及制定参考值范围的一般步骤。 3. 假设检验时，当0.05P ≤，则拒绝0H ，理论依据是什么？ 4. t 检验和方差分析的应用条件？

5. 应用相对数时应注意哪些问题？

6. 为什么不能以构成比代率？请联系实际加以说明。

7. 应用直线回归和相关分析时应注意哪些问题？

8. 统计表有哪些要素构成？制表的注意事项有哪些？

9. 调查设计包含哪些内容？ 10. 实验设计的基本内容和步骤。

11. 诊断试验的设计主要包括哪些程序和内容？四、分析计算题

1. 假定正常成年女性红细胞数)/10(12L ?近似服从均值为4.18，标准差为0.29的正态分布。令X 代表随机抽取的一名正常成年女性的红细胞数，求：（1）变量X 落在区间（4.00，4.50）内的概率；（2）正常成年女性的红细胞数95%参考值范围。

2．某医生研究脑缺氧对脑组织中生化指标的影响，将出生状况相近的乳猪按出生体重配成7对；随机接受两种处理，一组设为对照组，一组设为脑缺氧模型组，实验结果见表1第（1）、（2）、（3）栏。试比较两组猪脑组织钙泵的含量有无差别。

表1 两组乳猪脑组织钙泵含量(μ g/g)

乳猪号

(1) 对照组

(2) 试验组 (3) 差值d (4)=(2)-(3) 1 0.3550 0.2755 0.0795 2 0.2000 0.2545 -0.0545 3 0.3130 0.1800 0.1330 4 0.3630 0.3230 0.0400 5 0.3544 0.3113 0.0431 6 0.3450 0.2955 0.0495 7 0.3050

0.2870

0.0180 合计

0.3086

3．某医院比较几种疗法对慢性胃炎病人的疗效：单纯西药组治疗79例，有效63例；单纯中药组治疗54例，有效47例；中西医结合组治疗68例，有效65例。问：①该资料属何种资料？实验设计属何种设计？②欲比较3种疗法的疗效的差别，宜选用何种假设检验方法？③写出该种检验方法的0H 与1H ；④若求得的检验统计量为8.143，相应于0.05α=的检验统计量的临界值为 5.99，你如何做出结论？⑤根据你的结论，你可能犯哪一类统计错

误？

4．为比较胃舒氨与西咪替丁治疗消化性溃疡的疗效，以纤维胃镜检查结果作为判断标准，选20名患者，以病人的年龄、性别、病型和病情等条件进行配对，在纤维胃镜下观察每一患者的溃疡面积减少百分率，面积减少百分率为40%以上者为治疗有效。问：(1) 如何将病人分组？(2) 如何对结果进行统计分析处理？

5．试就表2资料分析比较甲、乙两医院乳腺癌手术后的5年生存率。

表2 甲、乙两医院乳腺癌手术后的5年生存率（%）

腋下淋巴结转移

甲医院乙医院

病例数生存数生存率病例数生存数生存率

无45 35 77.77 300 215 71.67

有710 450 68.38 83 42 50.60

合计755 485 64.24 383 257 67.10

6．某年某单位报告了果胶驱铅的疗效观察，30名铅中毒工人脱离现场后住院治疗，治疗前测得尿铅均数为0.116（mg/L），血铅均数为1.81（mg/L）。服用果胶20天后再测，尿铅均数降为0.087（mg/L），血铅均数降为0.73（mg/L），说明果胶驱铅的效果较好。请评述以上研究。

参考答案

一、名词解释 1.

计量资料：对每个观察单位用定量的方法测定某项指标量的大小，所得的资料称为计量资料（measurement data ）。计量资料亦称定量资料、测量资料。．其变量值是定量的，表现为数值大小，一般有度量衡单位。 2.

计数资料：将观察单位按某种属性或类别分组，所得的观察单位数称为计数资料（count data ）。计数资料亦称定性资料或分类资料。其观察值是定性的，表现为互不相容的类别或属性。 3.

等级资料：将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察单位数，称为等级资料（ordinal data ）。等级资料又称有序变量。 4. 总体：总体（population ）指特定研究对象中所有观察单位的测量值。

5. 样本：从总体中随机抽取部分观察单位，其测量结果的集合称为样本（sample ）。

抽样误差：抽样误差（sampling error ）是指样本统计量与总体参数的差别。在总体确定的情况下，总体参数是固定的常数，统计量是在总体参数附近波动的随机变量。 7. 频数表：用来表示一批数据各观察值在不同取值区间出现的频繁程度（频数）。 8.

算术均数：描述一组数据在数量上的平均水平。总体均数用μ表示，样本均数用X 表示。 9.

中位数：将一组观察值由小到大排列，位次居中的那个数。

10. 极差：亦称全距，即最大值与最小值之差，用于资料的粗略分析，其计算简便但稳

定性较差。

11. 方差：方差表示一组数据的平均离散情况，由离均差的平方和除以样本个数得到。 12. 标准差：是方差的正平方根，使用的量纲与原量纲相同，适用于近似正态分布的资

料，大样本、小样本均可，最为常用。

13. 变异系数：用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。 14. 正态分布：若资料X 的频率曲线对应于数学上的正态曲线，则称该资料服从正态分

布。通常用记号),(2

σμN 表示均数为μ，标准差为σ的正态分布。

15. 标准正态分布:均数为0、标准差为1的正态分布被称为标准正态分布，通常记为

2(0,1)N 。

16.统计推断：通过样本指标来说明总体特征，这种通过样本获取有关总体信息的过程

称为统计推断。

17.抽样误差：由个体变异产生的，由于抽样造成的样本统计量与总体参数的差异，称

为抽样误差。

18.标准误：通常将样本统计量的标准差称为标准误。

19.可信区间：按预先给定的概率确定的包含未知总体参数的可能范围。

20.参数估计：指用样本统计量估计总体参数。参数估计有两种方法：点估计和区间估

计。

21.假设检验中P的含义：指从H0规定的总体随机抽得等于及大于（或等于及小于）现

有样本获得的检验统计量值的概率。

22.I型和II型错误：I型错误指拒绝了实际上成立的H0，这类“弃真”的错误称为I型

错误，其概率大小用α表示；II型错误，指接受了实际上不成立的H0，这类“存伪”

的错误称为II型错误，其概率大小用β表示。

23.检验效能：1-β称为检验效能，它是指当两总体确有差别，按规定的检验水准α所

能发现该差异的能力。

24.检验水准：是预先规定的，当假设检验结果拒绝H0，接受H1，下“有差别”的结论

时犯错误的概率称为检验水准，记为α。

25.方差分析：就是根据资料的设计类型，即变异的不同来源将全部观察值总的离均差

平方和与自由度分解为两个或多个部分，除随机误差外，其余每个部分的变异可由某个因素的作用（或某几个因素的交互作用）加以解释。通过各变异来源的均方与误差均方比值的大小，借助F分布作出统计推断，判断各因素对观测指标有无影响。

26.随机区组设计：事先将全部受试对象按自然属性分为若干区组，原则是各区组内的

受试对象的特征相同或相近，且受试对象数与处理因素的水平数相等。然后再将每个区组内的观察对象随机地分配到各处理组，这种设计叫做随机区组设计。

27.相对数：是两个有联系的指标之比，是分类变量常用的描述性统计指标，常用相对

数有率、构成比、相对比。

28.标准化法是常用于内部构成不同的两个或多个总率比较的一种方法。标准化法的基

本思想就是选定一个统一“标准”（标准人口构成比或标准人口数），然后按选定“标准”计算调整率，使之具备可比性以后再比较，以消除由于内部构成不同对总率比较带来的影响。

29. 二项分布：若一个随机变量X ，它的可能取值是0,1,…,n ，且相应的取值概率为

n k n k

k X P --==)1()()(ππ, 则称此随机变量X 服从以n 、π为参数的二项分布。 30. Yates 校正：英国统计学家Yates F 认为，由于2χ分布理论上是一连续性分布，而分

类资料是间断性的，由此计算出的2χ值不连续，尤其是自由度为1的四格表，求出的概率P 值可能偏小，此时需对2χ值作连续性校正（correction of continuity ），这一校正即所谓的Yates 校正（Yates’ correction ）。

31. 非参数统计：针对某些资料的总体分布难以用某种函数式来表达，或者资料的总体

分布的函数式是未知的，只知道总体分布是连续型的或离散型的，用于解决这类问题需要一种不依赖总体分布的具体形式的统计分析方法。由于这类方法不受总体参数的限制，故称非参数统计法（non-parametric statistics ），或称为不拘分布（distribution-free statistics ）的统计分析方法，又称为无分布型式假定（assumption free statistics ）的统计分析方法。

32. 直线回归：建立一个描述应变量依自变量变化而变化的直线方程，并要求各点与该

直线纵向距离的平方和为最小。直线回归是回归分析中最基本、最简单的一种，故又称简单回归。

33. 直线相关:是用来描述具有直线关系的两变量x 、y 间的相互关系。

34. 相关系数：又称积差相关系数，以符号r 表示样本相关系数，ρ表示总体相关系数。

它是说明具有直线关系的两个变量间，相关关系的密切程度与相关方向的指标。 35. 回归系数: 为直线的斜率，其统计学意义是自变量x 改变一个单位时，应变量y 平

均变化b 个单位。

36. 人口总数：人口总数(population)是指一个国家或地区在某特定时间点上存活人口的

总和。国际上统计人口数有两种办法：① 实际制(de facto)：即只统计标准时刻某地实际存在的人口数(包括临时在该地的人)。② 法定制(de jure)：只统计某地的常住人口。

37. 老年人口系数：是指65岁及以上老年人口数占总人口数的比重。

65100%=

?岁及以上的人口数

老年人口系数人口总数

。老年人口系数用于表明一个

国家或地区的人口老龄化程度，其大小受社会经济发展水平、生活水平、卫生保健

水平等因素的影响。

38. 围产儿死亡率：围产期是指胎儿体重达到1000克及以上、或孕期满28周，至出生

后7天以内的时期。在此期间的死亡称为围产儿死亡。计算式为：

％

产数＋活产数某年围产期死胎数＋死天内的新生儿死亡数

产数＋出生同年围产期死胎数＋死围产儿死亡率＝10007? 。围产儿死亡率是衡量孕期、产前、产后保健工作质量的敏感指标，它不能从出生报告及死亡报告直接计算，需要利用妇产科病例资料分析计算。

39. 新生儿死亡率：新生儿死亡率(neonatal mortality rate, NMR) 指某地平均每千名活产

数中未满28天的新生儿死亡数。计算式：

100028?=

某年活产总数

天的新生儿死亡数

同年未满新生儿死亡率‰

新生儿死亡在婴儿死亡中占很大的比重。死亡主要原因是早产、先天发育不良、畸形、分娩外伤、破伤风等难于控制的疾病。

40. 婴儿死亡率：指某年平均每千名活产中不满1周岁(婴儿)的死亡数。计算式为：

10001?=

某年活产总数

岁婴儿死亡数

同年未满婴儿死亡率‰

41. 孕产妇死亡率：指某年由于怀孕和分娩及并发症造成的孕产妇死亡人数与同年出生

活产数之比，常以万分率或十万分率表示，计算式为：

1000010=

?同年孕产妇死亡数

孕产妇死亡率（或万）

某年活产数

42. 死因顺位：指按各类死因构成比从高到低排列的位次，说明死因的重要性，反映了

各种死亡原因导致死亡的严重程度。

43. 人口金字塔：将人口的性别、年龄分组数据，以年龄(或出生年份)为纵轴，以人口数

或年龄构成比为横轴，按男左女右绘制的直方图，其形态如金字塔，故称为人口金字塔。人口金字塔是对人口年龄、性别构成综合反映的特殊统计图，指示了不同时期人口年龄、性别构成的变化情况，是长期人口出生、死亡、迁入、迁出而形成的，反映了历史的痕迹和变动的趋势。二、单项选择题

1．D 2．C 3．B 4．B 5．A 6．B 7．A 8．D 9．C 10．C 11．D 12．B 13．D 14．D 15．D 16．C

17．D

18．A

19．A

20．C

21．B 22．D 23．B 24．B 25．D

26．D 27．D 28．A 29．C 30．B

四、简答题

1．答题要点：：不能。因为，从甲、乙两班分别抽取的10人，测量其身高，得到的分别是甲、乙两班的一个样本。样本的平均身高只是甲、乙两班所有同学平均身高的一个点估计值。既使是按随机化原则进行抽样，由于存在抽样误差，样本均数与总体均数一般很难恰好相等。因此，不能仅凭两个样本均数高低就作出两总体均数熟高熟低的判断，而应通过统计分析，进行统计推断，才能作出判断。

2．答题要点：

医学中常把绝大多数正常人的某资料范围称为该资料的参考值范围，也叫正常值范围。所谓“正常人”不是指完全健康的人，而是指排除了所研究资料的疾病和有关因素的同质人群。制定参考值范围的一般步骤：

（1）定义“正常人”，不同的资料“正常人”的定义也不同。

（2）选定足够数量的正常人作为研究对象。

（3）用统一和准确的方法测定相应的资料。

（4）根据不同的用途选定适当的百分界限，常用95%。

（5）根据此资料的实际意义，决定用单侧范围还是双侧范围。

（6）根据此资料的分布决定计算方法，常用的计算方法：正态分布法、百分位数法。

3．答题要点：P值系由H0所规定的总体做随机抽样，获得等于及大于（或等于及小于）依据现有样本信息所计算得的检验统计量的概率。当P≤0．05时，说明在H0成立的条件下，得到现有检验结果的概率小于α，因为小概率事件几乎不可能在一次试验中发生，所以拒绝H0。同时，下“有差别”的结论的同时，我们能够知道可能犯错误的概率不会大于α，也就是说，有了概率保证。

4．答题要点：t检验和方差分析均要求各样本来自相互独立的正态总体且各总体方差齐。

5．答题要点：应用相对数时应注意的事项有：

⑴计算相对数的分母一般不宜过小。

⑵分析时不能以构成比代替率。

⑶不能用构成比的动态分析代替率的动态分析。

⑷对观察单位数不等的几个率，不能直接相加求其总率。

⑸在比较相对数时应注意可比性。

⑹对样本率（或构成比）的比较应随机抽样，并做假设检验。

6．答题要点：率和构成比所说明的问题不同，因而绝不能以构成比代率。构成比只能说明各组成部分的比重或分布，而不能说明某现象发生的频率或强度。例如：以男性各年龄组高血压分布为例，50～60岁年龄组的高血压病例占52.24%，所占比重最大，60～岁组则只占到6.74%。这是因为60～岁以上受检人数少，造成患病数低于50～60岁组，因而构成比相对较低。但不能认为年龄在50～60岁组的高血压患病率最严重，而60岁以上反而有所减轻。若要比较高血压的患病率，应该计算患病率指标。

7．答题要点：注意以下五个问题

⑴作回归分析和相关分析时要有实际意义，不能把毫无关联的两种现象作回归、相关分析，必须对两种现象间的内在联系有所认识。

⑵在进行回归分析和相关分析之前，应绘制散点图。但观察点的分布有直线趋势时，才适宜作回归、相关分析。如果散点图呈明显曲线趋势，应使之直线化再行分析。散点图还能提示资料有无可疑异常点。

⑶直线回归方程的应用范围一般以自变量的取值范围为限。若无充分理由证明超过自变量取值范围外还是直线，应避免外延。

⑷双变量的小样本经t检验只能推断两变量间有无直线关系，而不能推断相关的紧密程度，要推断相关的紧密程度，样本含量必须很大。

⑸相关或回归关系不一定是因果关系，也可能是伴随关系，有相关或回归关系不能证明事物间确有内在联系。

8．答题要点：一般说来，统计表由标题、标目、线条、数字四部分构成（有时附有备注）。编制统计表的注意事项：

(1) 标题概括表的内容，写于表的上方，通常需注明时间与地点。

(2) 标目以横、纵标目分别说明主语与谓语，文字简明，层次清楚。

(3) 线条不宜过多，通常采用三条半线表示，即顶线、底线、纵标目下的横隔线及合计上的半条线。

(4) 表内一律采用阿拉伯数字。同一指标小数点位数要一致，数次要对齐。表内不留空格。

(5) 备注不要列于表内，如有必要，可在表内用“* ”号标记，并在表外加以说明。

9．一个完整的调查设计应包括以下内容：确定明确的调查目的；确定调查对象和观察单位；确定调查方法；确定调查指标和变量；确定调查工具和设计调查表；确定样本含量；调查员的选择和培训；调查的组织计划；涉及伦理道德方面问题的处理。

10．答题要点：实验设计的基本内容和步骤

（1）建立研究假设：在选题时应当考虑题目的科学性、新颖性、可行性以及所选课题是否是当前社会需要解决的主要问题。根据研究目的确定本研究需要解决的主要问题及相应的辅助问题。

（2）明确研究范围：审慎考虑规定适当的纳入标准和排除标准，选择适宜本次实验的受试对象。

（3）确立处理因素：分清处理因素和非处理因素，并注意处理因素的标准化。

（4）明确观察指标：选用客观性较强，易于量化，灵敏性和特异性均较高的指标。（5）控制误差和偏倚：采取各种有效措施控制误差（error）和偏倚（bias），使处理措施的效果能够真正的体现出来。

11.答题要点：诊断试验的设计主要包括哪些程序和内容：

(1)确定金标准：诊断试验的金标准是指目前公认的最可靠、最准确、最好的诊断方法，

也称标准诊断方法，用来衡量新的诊断试验是否符合真实情况。临床上常用的金标准有组织病理学检查(活检、尸检)、手术发现、影像诊断(CT、核磁共振、彩色B超)、细菌培养以及长期随访所得的结论。（2）选择研究对象：诊断试验的研究对象应包括两组：一组是用金标准确定为有某病的病例组，另一组是用金标准证实为无该病的患者或人群，作为对照组。病例组应包括各种病例，如症状典型和非典型的，病程早、中、晚期的，病情轻、中、重型的，年龄不同层次的等，以便能反映该病的全部特征。对照组应包括确实无本病而患有易与本病相混淆疾病的病例，这样的对照才具有临床鉴别诊断价值。（3）同步盲法测试：经金标准确定的病例与对照两组中的受试者同步接受新诊断试验方法的测定，将测定结果与金标准判定的结果进行比较，计算新诊断试验与金标准符合和差异程度的统计学指标，再根据这些指标对新诊断试验进行评价。

在试验操作的全过程和判定试验结果时，采用盲法(尽可能用双盲法)是保证诊断试验结果真实可靠的关键，即观察者(和受试者)不能预先知道何为金标准确定的病例或对照，以免发生人为偏差，过高或过低估计新诊断试验与金标准的符合程度。

四、分析计算题

1．解：

(1)根据题意，变量X 近似服从正态分布，求变量X 落在区间（4.00，4.50）内的概率，即是求此区间内正态曲线下的面积问题，因此，可以把变量X 进行标准化变换后，借助标准正态分布表求其面积，具体做法如下： 4.00 4.18 4.50 4.18

(4.00 4.50)(

)0.290.29

X P X P μσ---<<=<<

)10.162.0(<<-=u P )62.0()10.1(1-Φ--Φ-= 2676.01357.01--= 5967.0= 变量X 落在区间(4.00,4.50)内的概率为0.5967。

(2)因为正常成年女性红细胞数近似服从正态分布，可以直接用正态分布法求参考值范围，又因该资料过高、过低都不正常，所以应求双侧参考值范围，具体做法如下：

下限为： 1.96 4.18 1.96(0.29)X σ-=-=)/10(61.312L ? 上限为： 1.96 4.18 1.96(0.29)X σ+=+=)/10(75.412L ? 95%的正常成年女性红细胞数所在的范围是)/10(75.4~61.312L ?。

2．解：本例属异体配对设计，所得数据为配对计量资料，用配对t 检验进行处理。（1）建立检验假设，确定检验水准 H 0：μd ＝0 H 1：μd ≠0

α =0.05。

（2）计算检验统计量

n =7，)/(0441.073086.0g g n d d μ===∑

()

)/(05716.01

2g g n n

d d S d μ=--

∑∑

0412.27

05716.00441.0==

S d t d

（3）确定P 值，作出推断结论

按ν= n -1=7-1=6查t 界值表，得t 0.025,6=2.447，t 0.05，按α =0.05水准不

拒绝H 0，差别无统计学意义，即按现有样本不足以说明脑缺氧乳猪钙泵平均含量与对照组不同。

3．解：

① 该资料属计数资料，实验设计属完全随机设计； ② 宜选用R ×C 表的2χ检验方法； ③ 0H ：3种疗法的总体有效率相等

1H ：3种疗法的总体有效率不全相等

④ 在0.05α=的水准上，拒绝0H ，接受1H ，差别有统计学意义，可认为3种疗法的总体有效率不全相等，即3种疗法对慢性胃炎病人的疗效有差别。 ⑤ 可能犯I 型错误。

4．解：(1) 根据题意，该设计为配对设计，首先将20例病人按年龄、性别、病型和病情等条件进行配对后，将10对患者从1到10编号，再任意指定随机排列表中的任一行，比如第8行，舍去10～20，将随机数排列如下，规定逢单数者每对中的第1号试验对象进入胃舒氨组(A)，第2号对象进入西米替丁组(B)，逢双数者则相反。分组情况如下所示：

表1 20例病人配对入组情况

病人号 1.1 2.1 3.1 4.1 5.1 6.1 7.1 8.1 9.1 10.1 1.2 2.2 3.2 4.2 5.2 6.2 7.2 8.2 9.2 10.2 随机数字 3 2 6 1 8 0 9 5 4 7 入组情况 A B B A B B A A B A

(2) 首先以溃疡面积减少百分率40%为界限，将每位患者的治疗情况分为有效和无效两类，并整理成配对四格表的形式（见表2）。本试验的目的在于比较胃舒氨与西米替丁治疗消化性胃溃疡有效率的差别，故选用配对四格表的McNemar 检验进行统计分析。

表2 20位患者治疗情况

西米替丁

胃舒氨

合计

有效

无效有效

a+b

无效 c d c+d 合计 a+c

b+d

5．解：两医院乳腺癌患者的病情构成不同，比较两医院的标准化率，计算过程见表3。

表3 甲、乙两医院乳腺癌手术后的5年生存率的标化（以甲乙两医院合计为标准）腋下淋巴结转移

⑴ 标准病例数 N i ⑵ 甲医院

乙医院

原生存率

p i ⑶ 预期生存人数

N i p i ⑷=⑵⑶

原生存率

P i ⑸ 预期生存人数

N i p i ⑹=⑵⑸

无 345 77.77 268 71.67 247 有合计

793 68.38 503 50.60 401 1138（∑N i ）

64.24

771（∑N i p i ）

67.10

648（∑N i p i ）

甲医院乳腺癌手术后的5年生存率的标化生存率：乙医院乳腺癌手术后的五年生存率标化生存率：因为甲、乙两医院有无腋下淋巴结转移的病情构成不同，故标化后，甲医院乳腺癌手术后的5年生存率高于乙医院，校正了标化前甲医院低于乙医院的情况。

6．解：人体有自行排铅的功能，应设对照组，并进行假设检验后才能下结论。

%75.67%1001138

771%100'=?=?=∑

N P N p i i %94.56%1001138

648%100'=?=?=∑N P N p i i

卫生统计学考试试题及答案

卫生统计学试题及答案（一） 1.用某地6～16岁学生近视情况的调查资料制作统计图，以反映患者的年龄分布，可用图形种类为______. A.普通线图 B.半对数线图 C.直方图 D.直条图 E.复式直条图【答案】C（6——16岁为连续变量，得到的是连续变量的频数分布）直方图（适用于数值变量，连续性资料的频数表变量）直条图（适用于彼此独立的资料） 2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布，可采用______. A.直方图 B.普通线图 C.半对数线图 D.直条图 E.复式直条图(一个检测指标，两个分组变量) 【答案】E 3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况，可采用______. A.直方图 B.普通线图（适用于随时间变化的连续性资料，用线段的升降表示某事物在时间上的发展变化趋势） C.半对数线图（适用于随时间变化的连续性资料，尤其比较数值相差悬殊的多组资料时采用，线段的升降用来表示某事物的发展速度） D.直条图 E.复式直条图【答案】E 4.调查某疫苗在儿童中接种后的预防效果，在某地全部1000名易感儿童中进行接种，经一定时间后从中随机抽取300名儿童做效果测定，得阳性人数228名。若要研究该疫苗在该地儿童中的接种效果，则______. A.该研究的样本是1000名易感儿童 B.该研究的样本是228名阳性儿童 C.该研究的总体是300名易感儿童 D.该研究的总体是1000名易感儿童 E.该研究的总体是228名阳性儿童【答案】D 5.若要通过样本作统计推断，样本应是__________. A.总体中典型的一部分 B.总体中任一部分 C.总体中随机抽取的一部分 D.总体中选取的有意义的一部分 E.总体中信息明确的一部分【答案】C 6.下面关于均数的正确的说法是______.

卫生统计学选择题及答案

t分布与标准正态分布有一定的关系，下述错误的叙述是_____ A.参数数目不同 B.t分布中的自由度趋于无穷大时，曲线逼近标准正态分布 C.为单峰分布 D.对称轴位置在0 E.曲线下面积的分布规律相同在抽样研究中，当样本例数逐渐增多时_____. A.标准误逐渐加大 B.标准差逐渐加大 C.标准差逐渐减小 D.标准误逐渐减小 E.标准差趋近于0 抽样误差是指。 A.不同样本指标之间的差别 B.样本指标与总体指标之间由于抽样产生的差别（参数与统计量之间由于抽样而产生的差别） C.样本中每个个体之间的差别 D.由于抽样产生的观测值之间的差别 E.测量误差与过失误差的总称下面说法中不正确的是_____. A.没有个体差异就不会有抽样误差 B.抽样误差的大小一般用标准误来表示 C.好的抽样设计方法，可避免抽样误差的产生 D.医学统计资料主要来自统计报表、医疗工作记录、专题调查或实验等 E.抽样误差是由抽样造成的样本统计量与总体参数间的差别及样本统计量间的差别 t分布与正态分布存在如下哪一种关系。 A.二者均以0为中心，左右对称 B.曲线下中间95%面积对应的分位点均为±1.96 C.当样本含量无限大时，二都分布一致 D.当样本含量无限大时，t分布与标准正态分布一致 E.当总体均数增大时，分布曲线的中心位置均向右移抽样研究中，适当增加观察单位数，可（） A.减小Ⅰ型错误 B.减小Ⅱ型错误 C.减小抽样误差 D.提高检验效能 E.以上均正确

说明两个有关联的同类指标之比为。 A.率 B.构成比 C.频率 D.相对比 E.频数构成比用来反映。 A.某现象发生的强度 B.表示两个同类指标的比 C.反映某事物内部各部分占全部的比重 D.表示某一现象在时间顺序的排列 E.上述A与C都对以下属于分类变量的是___________. A.IQ得分 B.心率 C.住院天数 D.性别 E.胸围计算麻疹疫苗接种后血清检查的阳转率，分母为______. A.麻疹易感人群 B.麻疹患者数 C.麻疹疫苗接种人数 D.麻疹疫苗接种后的阳转人数 E.麻疹疫苗接种后的阴性人数关于构成比，不正确的是_____. A.构成比中某一部分比重的增减相应地会影响其他部分的比重 B.构成比说明某现象发生的强度大小 C.构成比说明某一事物内部各组成部分所占的分布 D.若内部构成不同，可对率进行标准化 E.构成比之和必为100% 甲乙两地某病的死亡率进行标准化计算时，其标准的选择______. A.不能用甲地的数据 B.不能用乙地的数据 C.不能用甲地和乙地的合并数据 D.可用甲地或乙地的数据 E.以上都不对用均数与标准差可全面描述资料的分布特征（） A.正态分布和近似正态分布 B.正偏态分布 C.负偏态分布 D.任意分布

卫生统计学试题汇总(印)

最佳选择题 1.收集资料的方法是：E A.收集各种报表 B.收集各种工作记录 C.进行专题调查 D.进行科学实验 E.以上都对 2.统计工作的基本步骤是：D A.调查资料、审核资料、整理资料 B.收集资料、审核资料、分析资料 C.调查资料、整理资料、分析资料 D.收集资料、整理资料、分析资料 E.以上都对 3.在抽样研究中样本是：D A.总体中的一部分 B.总体中任意一部分 C.总体中典型部分 D.总体中有代表性的一部分 E.总体中有意义的一部分 4.计量资料、计数资料和等级资料的关系是：C A.计量资料兼有计数资料和等级资料的一些性质 B.计数资料兼有计量资料和等级资料的一些性质 C.等级资料兼有计量资料和计数资料的一些性质 D.计数资料有计量资料的一些性质 E.以上都不是 5.用图形表示某地解放以来三种疾病的发病率在各年度的升降速度，宜绘制D ： A.普通线图 B.直方图 C.构成比直条图 D.半对数线图 E.直条图 6.直方图可用于： A.某现象的内部构成 B.各现象的比较 C.某现象的比较 D.某现象的频数分布 E.某现象的发展速度 7.统计图表的要求是： A.简单明了 B.层次清楚 C.说明问题明确 D.避免臃肿复杂 E.以上都对 8.在列频数表时，分组数目一般为： A.5-10 B.8-15 C.10-30 D.15-20 E.＞20 9.平均数作为一种统计指标是用来分析： A.计数资料 B.计量资料 C.等级分组资料 D.调查资料 E.以上都不对 10.表示变量值变异情况的常用指标是： A.全距 B.标准差 C.方差 D.变异系数 E.以上均是 11.确定正常人某个指标正常值范围时，调查对象是： A.从未患过病的人 B.健康达到了要求的人 C.排除影响被研究指标的疾病和因素的人 D.只患过小病但不影响研究指标的人 E.排除了患过某病或接触过某因素的人 12.标准误： A.与标准差呈反比 B.与标准差呈正比 C.与标准差的平方呈反比 D.与标准差平方呈正比 E.以上都不对 13. x σ是指： A.所有观察值对总体均数的离散程度 B.某一个样本均数的离散程度 C.所有样本均数对总体均数的离散程度 D.某些样本均数对总体均数的离散程度 E.所有含量相同的样本均数对总体均数的离散程度 14. 2.58X X S ±表示： A.95%的正常值范围 B.95%的可信区间 C.99%的正常值范围

《卫生统计学》试卷(3)答案

2001级预防医学专业《卫生统计学》试卷 2004年5月31日专业学号姓名得分一、单项选择题（每题2分，共40分） 1．标准正态分布的中位数为________A A. 0 B. 1 C. 0.5 D. 与标准差有关 2． 2检验能分析 D A.两样本率差异有无统计学意义 B. 多个样本率差异有无统计学意义 C. 两有序分类变量的关联性 D. 以上都对 3．医学试验设计的基本原则是D A. 对照 B. 随机 C. 重复 D. 以上均正确 4．以下关于二项分布的说法，错误的是________ D A. 二项分布要求随机试验仅有两个互相对立的结果，每次试验间是互相独立的； B. 二项分布要求各次随机试验的阳性率是恒定不变的； C. 从一个装有10个白球和10个黑球的口袋中随机摸球，每次摸出一球，记录其颜色后放回袋中，重复10次，作为一次试验。若以摸出白球作为阳性，则每次试验的阳性率服从二项分布； D. 虽然二项分布要求各次随机试验的阳性率是不变的，但在样本含量比较大，且阳性率和阴性率均不太小时，也可以近似利用二项分布的原理来解决阳性率有微弱改变时的有关问题。如从一个装有5000个白球和5000个黑球的口袋中随机摸球，每次摸出一球，记录其颜色后不放回袋中，重复10次，作为一次试验。可以近似利用二项分布的有关原理来解决这样的问题。 5．关于正态分布，以下说法正确的是________ B A．仅仅标准正态分布其曲线下面积才为1； B．在横轴上，从负无限大到1.96所对应的曲线下面积为0.975； C．从服从正态分布的总体中抽样，不管其样本含量有多大，其样本均数均服从正态分布； D．以上都不对。

卫生统计学部分题库

对两个变量进行直线相关分析，r=0.46，P>0.05，说明两变量之间______. A.有相关关系 B.无任何关系 C.无直线相关关系 D.无因果关系 E.有伴随关系若分析肺活量和体重之间的数量关系，拟用体重值预测肺活量，则采用_____. A.直线相关分析 B.秩相关分析 C.直线回归分析 D.方差分析 E.病例对照研究四格表资料的χ2检验应使用校正公式而未使用时，会导致。 A.χ2增大，P值减小 B.χ2减小，P值也减小 C.χ2增大，P值也增大 D.χ2减小，P值增大 E.视数据不同而异配对设计四格表资料比较两个率有无差别的无效假设为。 A.μ1=μ2 B.π1=π2 C.μ1≠μ2 D.π1≠π2 E.b=c 四格表χ2检验的校正公式应用条件为。 A.n＞40且T＞5 B.n＜40且T＞5 C.n＞40且1＜T＜5 D.n＜40且1＜T＜5 E.n＞40且T＜1 两组设计两样本均数比效的t检验公式中，位于分母位置上的是。 A.两样本均数之差 B.两样本均数之差的方差 C.两样本均数之差的标准误 D.两样本均数方差之差

E.两样本均数标准误之差两组数据中的每个变量值减去同一常数后，作两个样本均数比较的假设检验______. A.t值不变 B.t值变小 C.t值变大 D.t值变小或变大 E.不能判断在假设检验中，P值和α的关系为。 A.P值越大，α值就越大 B.P值越大，α值就越小 C.P值和α值均可由研究者事先设定 D.P值和α值都不可以由研究者事先设定 E.P值的大小与α值的大小无关 t分布与正态分布存在如下哪一种关系。 A.二者均以0为中心，左右对称 B.曲线下中间95%面积对应的分位点均为±1.96 C.当样本含量无限大时，二都分布一致 D.当样本含量无限大时，t分布与标准正态分布一致 E.当总体均数增大时，分布曲线的中心位置均向右移下面关于均数的正确的说法是______. A.当样本含量增大时，均数也增大 B.均数总大于中位数 C.均数总大于标准差 D.均数是所有观察值的平均值 E.均数是最大和最小值的平均值从同一正态总体中随机抽取多个样本，用样本均数来估计总体均数的可信区间，下列哪一样本得到的估计精度高。 A.均数大的样本 B.均数小的样本 C.标准差小的样本 D.标准误小的样本 E.标准误大的样以一定概率由样本均数估计总体均数，宜采用。 A.抽样误差估计 B.点估计 C.参考值范围估计 D.区间估计

卫生统计学试卷(含答案)

卫生统计学试卷姓名：__________ 考试时间：_______ ___ (本大题满分40分,每小题1分) 1. 算术均数适用于：( ) A. 偏态分布资料 B. 分布类型不明的资料 C. 对数正态分布资料 D. 以上都不是 E. 正态分布资料 2. 某医生在进行科室病例资料统计时，拟用算术平均数表示平均水平，应当选用什么样的资料：( ) A. 性质不同的变量值 B. 差异相同的变量值 C. 性质相同的变量值 D. 个体差异较大的变量值 E. 个体差异较小的变量值 3. 均数与标准差适用于：( ) A. 正态分布 B. 正偏态分布 C. 不对称分布 D. 偏态分布 E. 负偏态分布 4. 样本含量的估计是( )。 A. 不必估计，调查整个总体最好 B. 保证研究结论具有一定可靠性的前提下确定的最少例数 C. 经济条件允许的情况下，越多越好 D. 时间允许的情况下，越多越好 E. 根据实际情况，能选多少是多少 5. 标化后的总死亡率：( ) A. 它反映了事物实际发生的强度 B. 以上都不对 C. 它反映了实际水平 D. 它不随标准选择的变化而变化 E. 仅仅作为比较的基础，它反映了一种相对水平 6. 下面说法中不正确的是( )。 A. 抽样误差的大小一般用标准误来表示 B. 好的抽样设计方法，可避免抽样误差的产生 C. 没有个体差异就不会有抽样误差 D. 抽样误差是由抽样造成的样本统计量与总体参数间的差别及样本统计量间的差别 E. 医学统计资料主要来自统计报表、医疗工作记录、专题调查或实验等 7. 计算某血清血凝抑制抗体滴度的平均水平，宜用：( ) A. 四分位数 B. 几何均数 C. 相对数 D. 中位数 E. 均数 8. 变异系数是表示资料的：( ) A. 对称分布 B. 平均水平 C. 相对变异 D. 集中趋势 E. 变异数 9. 统计上所说的样本是指：( ) A. 总体中的每一个个体 B. 按照随机原则抽取总体中有代表性部分 C. 按照研究者要求抽取总体中有意义的部分 D. 有意识的抽取总体中有典型部分 E. 随意抽取总体中任意部分 10. 一群7岁男孩身高标准差为5cm，体重标准差为3kg，则二者变异程度比较：( ) A. 身高变异小于体重 B. 身高变异不等于体重 C. 身高变异等于体重

卫生统计学试题6含答案

. 统计试题题库 1. 下列那个是对标化后总死亡率的正确描述？ A A．仅仅作为比较的基础，它反映了一种相对水平 B．它反映了实际水平 C．它不随标准选择的变化而变化 D．它反映了事物实际发生的强度 E．以上都不对 2. 两样本作均数差别的t检验，要求资料分布近似正态，还要求： D A．两样本均数相近，方差相等 B．两样本均数相近 C．两样本方差相等 D．两样本总体方差相等 E．两样本例数相等 3. 四格表资料的卡方检验时无需校正，应满足的条件是: D A．总例数大于40 B．理论数大于5 C．实际数均大于l D．总例数大于40且理论数均大于或等于5 E．总例数小于40 4. 总体应该是由： D

. A．研究对象组成 B．研究变量组成 C．研究目的而定 D．同质个体组成 E．任意个体组成 5. 两样本均数比较的t检验中，结果为P<0.05，有统计意义。P愈小则: E A．说明两样本均数差别愈大 B．说明两总体均数差别愈大 C．说明样本均数与总体均数差别愈大 D．愈有理由认为两样本均数不同 E．愈有理由认为两总体均数不同 6. 抽样误差是指: D A．总体参数与总体参数间的差异 B．个体值与样本统计量间的差异 C．总体参数间的差异 D．样本统计量与总体统计量间的差异 E．以上都不对 7. 抽签的方法属于下列那种抽样： D A．分层抽样 B．系统抽样 C．整群抽样 D．单纯随机抽样 E．分级抽样

8. 以舒张压≥12.7KPa为高血压，测量1000人，结果有990名非高血压患者，有10名高血压患者，该资料属下列那类资料： B A．计算 B．计数 C．计量 D．等级 E．都对 9. 实验设计中要求严格遵守四个基本原则，其目的是为了： D A．便于统计处理 B．严格控制随机误差的影响 C．便于进行试验 D．减少和抵消非实验因素的干扰 E．以上都不对 10. 两个样本作t检验，除样本都应呈正态分布以外，还应具备的条件是： B A．两样本均数接近 B．两S2数值接近 C．两样本均数相差较大 D．两S2相差较大 E．以上都不对 11. 同一总体的两个样本中，以下哪种指标值小的其样本均数估计总体均数更可靠？A A．Sx B．S C．X D．CV

卫生统计学名词解释

1.总体：总体（population）是根据研究目的确定的同质的观察单位的全体，更确切的说，是同质的所有观察单位某种观察值（变量值）的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体，反之为无限总体。样本：从总体中随机抽取部分观察单位，其测量结果的集合称为样本（sample）。样本应具有代表性。所谓有代表性的样本，是指用随机抽样方法获得的样本。 2.随机抽样：随机抽样（random sampling）是指按照随机化的原则（总体中每一个观察单位都有同等的机会被选入到样本中），从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。 3.变异：在自然状态下，个体间测量结果的差异称为变异（variation）。变异是生物医学研究领域普遍存在的现象。严格的说，在自然状态下，任何两个患者或研究群体间都存在差异，其表现为各种生理测量值的参差不齐。 4.计量资料：对每个观察单位用定量的方法测定某项指标量的大小，所得的资料称为计量资料（measurement data）。计量资料亦称定量资料、测量资料。.其变量值是定量的，表现为数值大小，一般有度量衡单位。如某一患者的身高（cm）、体重(kg)、红细胞计数(1012/L)、脉搏（次/分）、血压（KPa）等计数资料：将观察单位按某种属性或类别分组，所得的观察单位数称为计数资料（count data）。计数资料亦称定性资料或分类资料。其观察值是定性的，表现为互不相容的类别或属性。如调查某地某时的男、女性人口数；治疗一批患者，其治疗效果为有效、无效的人数；调查一批少数民族居民的A、B、AB、O 四种血型的人数等。等级资料：将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察单位数，称为等级资料（ordinal data）。等级资料又称有序变量。如患者的治疗结果可分为治愈、好转、有效、无效或死亡，各种结果既是分类结果，又有顺序和等级差别，但这种差别却不能准确测量；一批肾病患者尿蛋白含量的测定结果分为 +、++、+++等。等级资料与计数资料不同：属性分组有程度差别，各组按大小顺序排列。等级资料与计量资料不同：每个观察单位未确切定量，故亦称为半计量资料。 5．概率：概率(probability)又称几率，是度量某一随机事件A发生可能性大小的一个数值，记为P（A），P（A）越大，说明A事件发生的可能性越大。0﹤P（A）﹤1。频率：在相同的条件下，独立重复做n 次试验，事件A 出现了m 次，则比值m/n 称为随机事件A 在n 次试验中出现的频率(freqency)。当试验重复很多次时P（A）= m/n。 2.概率是描述随机事件发生可能性大小的数值，常用P表示。随机事件概率的大小在0与1之间，P越接近1，表示某事件发生的可能性越大；P越接近0，表示某事件发生的可能性越小。习惯上将P≤0.05的事件，称为小概率事件，表示在一次实验或观察中该事件发生的可能性很小，可视为不发生。 6. 随机误差：随机误差（random error）又称偶然误差，是指排除了系统误差后尚存的差。它受多种因素的影响，使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。抽样误差（sampling error ）是指样本统计量与总体参数的差别。在总体确定的情况下，总体参数是固定的常数，统计量是在总体参数附近波动的随机变量。 7．系统误差：系统误差(systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因，使观察值不是分散在真值的两侧，而是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计和完善技术措施来消除或使之减少。 8．随机变量：随机变量（random variable）是指取指不能事先确定的观察结果。随机量的具体内容虽然是各式各样的，但共同的特点是不能用一个常数来表示，而且，理论上讲，每个变量的取值服从特定的概率分布。 9．参数：参数（paramater）是指总体的统计指标，如总体均数、总体率等。总体参数是固定的常数。多数情况下，总体参数是不易知道的，但可通过随机抽样抽取有代表性的样本，用算得的样本统计量估计未知的总体参数。 10．统计量：统计量（statistic）是指样本的统计指标，如样本均数、样本率等。样本统计量可用来估计总体参数。总体参数是固定的常数，统计量是在总体参数附近波动的随机变量。 11.频数表（frequency table）用来表示一批数据各观察值或在不同取值区间的出现的频繁程度（频数）。对于离散数据，每一个观察值即对应一个频数，如某医院某年度一日内死亡0，1，2…个病人的天数。对于散布区间很大的离散数据和连续型数据，数据散布区间由若干组段组成，每个组段对应一个频数。 12.算术均数（arithmetic mean）描述一组数据在数量上的平均水平。总体均数用μ表示，样本均数用X 表示。 13.几何均数（geometric mean）用以描述对数正态分布或数据呈倍数变化资料的水平。记为G。 14.中位数（median）Md将一组观察值由小到大排列，n 为奇数时取位次居中的变量值；为偶数时，取位次居中的两个变量的平均值。反映一批观察值在位次上的平均水平。 15.极差（range）亦称全距，即最大值与最小值之差，用于资料的粗略分析，其计算简便但稳定性较差。 16.百分位数（percentile）是将n 个观察值从小到大依次排列，再把它们的位次依次转化为百分位。百分位数的另一个重要用途是确定医学参考值范围。

卫生统计学试题

卫生统计学习题定量资料的统计描述 1. 1985年某省农村30例6-7岁正常男童胸围（cm）测量结果如下：51.654. 154.056.9 57.755. 558.355. 453.857. 751.353. 857.354. 852.155. 354.854.7 53.457. 153.155. 951.454. 656.161. 859.356. 859.853.9 （1）试编制以上数据的频数表，绘制直方图，概括其分布特征。（2）用合适的统计量描述其集中趋势和离散趋势。（3）对样本进行正态性检验

第三章定性资料的统计描述 1.某地通过卫生服务的基线调查得到如下资料，试作如下分析：（1）计算全人口的性别比；（2）计算育龄妇女（15~49岁）占总人口的百分比；（3）计算总负担系数；（4）计算老年人口系数某地人口构成情况年龄组（岁）男（%）女（%）年龄组（岁）男（%）女（%）0~ 4.24.045~ 2.42.7 5~ 3.23.150~ 2.12.4 10~ 4.44.255~ 1.2 2.2 15~ 5.55.360~ 1.3 2.4 20~

5.15.265~ 1.11.4 25~ 6.06.170~ 0.81.2 30~ 4.34.575~ 0.50.9 35~ 3.23.380~ 0.20.5 40~ 2.32.585~ 0.10.2 第四章常用概率分布 1.假定虚症患者中，气虚型占30%。现随机抽查30名虚症患者，求其中没有1名气虚型的概率、有4名气虚型的概率。 2.某溶液平均1毫升中含有大肠杆菌3个。摇均后，随机抽取1毫升该溶液，内含大肠杆菌2个和低于2个的概率各是多少？ 3.某人群中12岁男童身高的分布近似正态分布，均数为 144.00cm,标准差为 5.77cm，试估计

卫生统计学试卷B含答案

卫生统计学试卷适用范围：__________ 出题教师：__________ 试卷满分 100 分，考试时间 60 分钟；书写要工整、清楚、标点符号使用正确。一、单选题，以下各题有多个选项，其中只有一个选项是正确的，请选择正确答案(本大题满分40分,每小题1分) 1. 某研究属于观察性研究抑或试验性研究是根据确定的。 A. 是否给予研究对象干预措施 B. 是否遵循随机化原则 C. 研究者的工作属性 D. 研究对象所提供的信息 E. 在现场工作，还是在实验室工作 2. 为了反映某地区五年期间鼻咽癌死亡病例的年龄分布，可采用( )。 A. 普通线图 B. 直方图 C. 复式直条图 D. 直条图 E. 半对数线图 3. 统计中所说的总体是指：( ) A. 根据地区划分的研究对象的全体。 B. 据研究目的确定的同质的研究对象的全体。 C. 根据时间划分的研究对象的全体。 D. 随意想象的研究对象的全体。 E. 根据人群划分的研究对象的全体。 4. 对两样本均数作t检验，n1=20，n2=20，其自由度等于：( ) A. 39 B. 40 C. 20 D. 19 E. 38 5. 标化后的总死亡率：( ) A. 它反映了事物实际发生的强度 B. 以上都不对 C. 仅仅作为比较的基础，它反映了一种相对水平 D. 它反映了实际水平

E. 它不随标准选择的变化而变化 6. 计量资料编制频数表时，一般分组数目为：( ) A. 8～15组 B. 15～20组 C. 5～10组 D. 10～15组 E. 随便分几组 7. 均数与标准差适用于：( ) A. 偏态分布 B. 不对称分布 C. 正偏态分布 D. 负偏态分布 E. 正态分布的资料 8. 某地区抽样调查1000名成年人的血压值，此资料属于：( ) A. 有序分类资料 B. 离散型资料 C. 无序分类资料 D. 数值变量资料 E. 集中型资料 9. 120名10岁男孩身高资料是：( ) A. 定量不连续资料 B. 定性连续资料 C. 定性二分类资料 D. 定量连续性资料 10. 偏态分布资料宜用下面那一项描述其分布的集中趋势：( ) A. 标准差 B. 算术均数 C. 四分位数间距 D. 中位数 E. 方差 11. 两样本均数比较时，分别取以下检验水准，以所犯第二类错误最小：( ) A. α=0.02 B. α=0.01 C. α=0.05 D. α=0.15 E. α=0.10

卫生统计学试题6含答案

统计试题题库 1. 下列那个是对标化后总死亡率的正确描述？ A A．仅仅作为比较的基础，它反映了一种相对水平 B．它反映了实际水平 C．它不随标准选择的变化而变化 D．它反映了事物实际发生的强度 E．以上都不对 2. 两样本作均数差别的t检验，要求资料分布近似正态，还要求： D A．两样本均数相近，方差相等 B．两样本均数相近 C．两样本方差相等 D．两样本总体方差相等 E．两样本例数相等 3. 四格表资料的卡方检验时无需校正，应满足的条件是: D A．总例数大于40 B．理论数大于5 C．实际数均大于l D．总例数大于40且理论数均大于或等于5 E．总例数小于40 4. 总体应该是由： D

A．研究对象组成 B．研究变量组成 C．研究目的而定 D．同质个体组成 E．任意个体组成 5. 两样本均数比较的t检验中，结果为P<0.05，有统计意义。P愈小则: E A．说明两样本均数差别愈大 B．说明两总体均数差别愈大 C．说明样本均数与总体均数差别愈大 D．愈有理由认为两样本均数不同 E．愈有理由认为两总体均数不同 6. 抽样误差是指: D A．总体参数与总体参数间的差异 B．个体值与样本统计量间的差异 C．总体参数间的差异 D．样本统计量与总体统计量间的差异 E．以上都不对 7. 抽签的方法属于下列那种抽样： D A．分层抽样 B．系统抽样 C．整群抽样 D．单纯随机抽样 E．分级抽样

卫生统计学知识点总结

卫生统计学知识点总结-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

卫生统计学统计工作基本步骤：统计设计（调查设计和实验设计）、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断（参数估计和假设检验）】。 ★统计推断：是利用样本所提供的信息来推断总体特征，包括：参数估计和假设检验。a参数估计是指利用样本信息来估计总体参数，主要有点估计（把样本统计量直接作为总体参数估计值）和区间估计【按预先设定的可信度（1-α），来确定总体均数的所在范围】。b假设检验：是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化，通常是由高级向低级转化。资料按性质可分为计量资料、计数资料和等级资料。定量资料的统计描述 1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。 2频率分布表（图）的用途：①描述资料的分布类型；②描述分布的集中趋势和离散趋势；③便于发现一些特大和特小的可疑值；④便于进一步的统计分析和处理；⑤当样本含量足够大时，以频率作为概率的估计值。 ★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。（1）描述集中趋势的统计指标：平均数（算术均数、几何均数和中位数）、百分位数（是一种位置参数，用于确定医学参考值范围，P50就是中位数）、众数。算术均数：适用于对称分布资料，特别是正态分布资料或近似正态分布资料；几何均数：对数正态分布资料（频率图一般呈正偏峰分布）、等比数列；中位数：适用于各种分布的资料，特别是偏峰分布资料，也可用于分布末端无确定值得资料。（2）描述离散趋势的指标：极差、四分位数间距、方差、标准差和变异系数。四分位数间距：适用于各种分布的资料，特别是偏峰分布资料，常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差：都适用于对称分布资料，特别对正态分布资料或近似正态分布资料，常把均数和标准差结合起来描述资料的集中趋势和离散趋势；变异系数：主要用于量纲不同时，或均数相差较大时变量间变异程度的比较。标准差的应用：①表示变量分布的离散程度；②结合均数计算变异系数、描述对称分布资料；③结合样本含量计算标准误。定性资料的统计描述 1定性资料的基础数据是绝对数。描述一组定性资料的数据特征，通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。 2 指标频率型指标强度型指标相对比型指标概念近似反映某一时间出现概率单位时间内某现象的发生率两个有关联的指标A和B之比计算公式 A/B 有无量纲无有可有、可无取值范围【0,1】可大于1无限制本质大样本时作为概率近似值分子式分母的一部分频率强度，即概率强度的似值表示相对于B的一个单位，A有多少位 A和B可以是绝对数、相对数和平均

卫生统计学考试重点总结复习

一、绪论 1.总体：根据研究目的确定的同质观察单位的全体，确切的说是同质的所有观察单位某种变量值的集合。 2.样本：从总体中随机抽取部分观察单位所组成的集合。 3.参数：用样本的指标来推算或估计出来的，用来说明总体情况的统计指标。 4.统计量：根据观察值计算出来的量，是用来描述和分析样本的统计指标。 5.变量的类型及其转换： ①定性变量： a.分类变量（计数资料）i.二分类变量 ii.多项无序分类 b.有序变量（等级资料） ②定量变量： a.连续型变量 b.离散型变量变量只能由“高级”向“低级”转化：定量→有序→分类→二值。 6.概率：是描述随机事件发生的可能性大些的数值。 7.卫生统计学的内容包括：统计学是一门处理数据中变异性的科学与艺术，内容包括收集、分析、解释和表达数据，目的是求得可靠的结果。 8.卫生统计学：运用概率论和数理统计的原理和方法并结合医学实践来研究医学资料的搜集、整理、分析与推断的一门学科。 9.卫生统计学的研究对象：有变异的事物。 10.统计工作的一般步骤：设计资料、搜集资料、整理资料、分析资料。 11.同质：指同一总体中个体的性质、影响条件、背景相同或非常相近。 12.变异：同一总体内的个体间存在差异又是绝对的，这种现象称为变异。 13.误差可分为：系统误差、随机测量误差、抽样误差。 14.抽样误差：由于个体差异的存在，从某一总体中随机抽取一个样本，所得样本统计量与总体参数之间可能存在差异，这种差异称为抽样误差。二、定量资料的统计描述 1.频率分布表的编制步骤： ①计算极差R、②确定组段数与组距（一般为8-15组）、③确定各组段的上下限、④列表。 2.频率分布表的用途： ①揭示频数分布的分布特点和分布类型，文献中常将频数表作为陈述资料的形式。 ②便于进一步计算统计指标和进行统计分布处理。 ③便于发现某些特大和特小的可疑值。 ④当样本含量比较大时，可用各组段的频率作为概率的估计值。 3.中位数：指将原始观察值从小到大或从大到小排序后，位次居中的那个数。 4.四分位数间距：表示百分位数P75和百分位数P25之差，定义为Q=P75-P25，恰好包括总体中50%的个体观察值，用来描述偏态分布资料的离散趋势的指标。 5.标准差：即方差的算术平方根，是衡量对称分布资料的离散程度的指标，标准差大，则离散度大，标准差小，则离散度小。 6.变异系数：变异的大小S相对于其平均水平X的百分比，主要用于量纲不同的变量间，或均数差别较大的变量间变异程度的比较。三、定性资料的统计描述 1.构成比：说明一事物内部各组成部分在总体中所占的比重或分布，常用百分数表示。 =某一组成部分的观察单位数/同一事物内部各组成部分的观察单位总数×100% 2.相对数的类型：

卫生统计学试题6含答案

统计试题题库 1、下列那个就是对标化后总死亡率的正确描述？ A A.仅仅作为比较的基础,它反映了一种相对水平 B.它反映了实际水平 C.它不随标准选择的变化而变化 D.它反映了事物实际发生的强度 E.以上都不对 2、两样本作均数差别的t检验,要求资料分布近似正态,还要求: D A.两样本均数相近,方差相等 B.两样本均数相近 C.两样本方差相等 D.两样本总体方差相等 E.两样本例数相等 3、四格表资料的卡方检验时无需校正,应满足的条件就是: D A.总例数大于40 B.理论数大于5 C.实际数均大于l D.总例数大于40且理论数均大于或等于5 E.总例数小于40 4、总体应该就是由: D

A.研究对象组成 B.研究变量组成 C.研究目的而定 D.同质个体组成 E.任意个体组成 5、两样本均数比较的t检验中,结果为P<0、05,有统计意义。P愈小则: E A.说明两样本均数差别愈大 B.说明两总体均数差别愈大 C.说明样本均数与总体均数差别愈大 D.愈有理由认为两样本均数不同 E.愈有理由认为两总体均数不同 6、抽样误差就是指: D A.总体参数与总体参数间的差异 B.个体值与样本统计量间的差异 C.总体参数间的差异 D.样本统计量与总体统计量间的差异 E.以上都不对 7、抽签的方法属于下列那种抽样: D A.分层抽样 B.系统抽样 C.整群抽样 D.单纯随机抽样 E.分级抽样

8、以舒张压≥12、7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属下列那类资料: B A.计算 B.计数 C.计量 D.等级 E.都对 9、实验设计中要求严格遵守四个基本原则,其目的就是为了: D A.便于统计处理 B.严格控制随机误差的影响 C.便于进行试验 D.减少与抵消非实验因素的干扰 E.以上都不对 10、两个样本作t检验,除样本都应呈正态分布以外,还应具备的条件就是: B A.两样本均数接近 B.两S2数值接近 C.两样本均数相差较大 D.两S2相差较大 E.以上都不对 11、同一总体的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠？A A.Sx B.S C.X D.CV E.S2

卫生统计学题库

《卫生统计学》考试题库目录第一章绪论第二章定量资料的统计描述第三章正态分布第四章总体均数的估计和假设检验第五章方差分析第六章分类资料的统计描述第七章二项分布与Poisson分布及其应用第八章χ2检验第九章秩和检验第十章回归与相关第十一章常用统计图表第十二章实验设计第十三章调查设计

第十四章医学人口统计与疾病统计常用指标第十五章寿命表第十六章随访资料的生存分析附录：单项选择题参考答案

第一章绪论一、名词解释 1. 参数(parameter) 2. 统计量(statistic) 3. 总体 (population) 4. 样本(sample) 5. 同质(homogeneity) 6. 变异 (variation) 7. 概率 (probability) 8. 抽样误差 (sampling error) 二、单选题 1．在实际工作中,同质是指: A.被研究指标的影响因素相同 B.研究对象的有关情况一样 C.被研究指标的主要影响因素相同 D.研究对象的个体差异很小 E.以上都对 2. 变异是指: A.各观察单位之间的差异 B.同质基础上,各观察单位之间的差异 C.各观察单位某测定值差异较大 D.各观察单位有关情况不同 E.以上都对3．统计中所说的总体是指: A.根据研究目的而确定的同质的个体之全部 B.根据地区划分的研究对象的全体 C.根据时间划分的研究对象的全体 D.随意想象的研究对象的全体 E.根据人群划分的研究对象的全体 4. 统计中所说的样本是指: A.从总体中随意抽取一部分 B.有意识地选择总体中的典型部分 C.依照研究者的要求选取有意义的一部分 D.从总体中随机抽取有代表性的一部分 E.以上都不是 5．按随机方法抽取的样本特点是:

卫生统计学方法与应用中

1、甲乙两地某病的死亡率进行标准化计算时，其标准选择（） * ? A.不能用甲地数据 ? B.不能用乙地数据 ? C.不能用甲地和乙地的合并数据 ? D.可能用甲地或乙地的数据 ? E.以上都不对 2、实验设计应遵循的基本原则是（） * ? A.随机化、对照、盲法 ? B.随机化、盲法、配对 ? C.随机化、重复、配对 ? D.随机化、齐同、均衡 ? E.随机化、对照、重复 3、对于一组服从双变量正态分布的资料，经直线相关分析得相关系数r=0.9，对该资料拟合回归直线，则其回归系数b值（） * ? A.b>0 ? B.b=0 ? C.b<0 ? D.b=1 ? E.不能确定正负 4、以下属于分类变量的是（） * ? A.IQ得分 ? B.心率 ? C.住院天数 ? D.性别 ? E.胸围 5、抽样调查某市正常成年男性与女性各300人，测得其血红蛋白含量( g/L)。欲比较男性与女性的血红蛋白含量是否有差异，假设男性和女性的血红蛋白含量的总体方差相等，应采用（） *c ? A.样本均数与总体均数比较的t检验 ? B.配对t检验 ? C.成组t检验 ? D.配对设计差值的符号秩和检验 ? E.成组设计两样本比较的秩和检验

6、进行方差分析时，数据应满足（） * ? A.独立性、正态性、大样本 ? B.独立性、正态性、方差齐性 ? C.独立性、方差齐性、大样本 ? D.独立性、正态性、平行性 ? E.正态性、方差齐性、大样本 7、同类定量资料下列指标，反映样本均数对总体均数代表性的是（） *? A.四位分数间距 ? B.标准误 ? C.变异系数 ? D.百位分数 ? E.中位数 8、完全随机设计的方差分析组间变异来自于（） * ? A.个体 ? B.全部观察值 ? C.随机因素 ? D.处理因素 ? E.随机因素和处理因素 9、统计工作的基本步骤是（） * ? A.及时收集完整、准确的资料 ? B.综合资料 ? C.方差分析时要求个样本所在总体的方差相等 ? D.完全随机设计的方差分析时，组内均方就是误差均方 ? E.完全随机设计的方差分析时，F=MS组间/MS组内 10、生存分析中的结果变量是（） *d ? A.生存时间 ? B.寿命表法生存曲线呈阶梯型 ? C.生存率 ? D.生存时间与随访结局 ? E.生存时间与生存率 11、反映血型为AB型的人在人群中所占的比例，宜计算（） * ? A.率 ? B.标准化率

卫生统计学考试题及答案要点

《卫生统计学》一、名词解释 1.计量资料 2.计数资料 3.等级资料 4.总体 5.样本 6.抽样误差 7.频数表 8.算术均数 9.中位数 10.极差 11.方差 12.标准差 13.变异系数 14.正态分布 15.标准正态分布 16.统计推断 17.抽样误差 18.标准误 19.可信区间 20.参数估计 P的含义假设检验中21. 型错误II I型和22. 检验效能23. 24.检验水准方差分析25. 26.随机区组设计27.相对数- 1 - 28.标准化法 29.二项分布 30.Yates校正 31.非参数统计 32.直线回归 33.直线相关 34.相关系数 35.回归系数 36.人口总数 37.老年人口系数 38.围产儿死亡率 39.新生儿死亡率 40.婴儿死亡率 41.孕产妇死亡率 42.死因顺位 43.人口金字塔二、单项选择题

1．观察单位为研究中的( D )。 A．样本B．全部对象 C．影响因素D．个体 2．总体是由（C ）。 A．个体组成B．研究对象组成 C．同质个体组成D．研究指标组成 3．抽样的目的是（B ）。 A．研究样本统计量B．由样本统计量推断总体参数 C．研究典型案例研究误差D．研究总体统计量 4．参数是指（ B ）。 A．参与个体数B．总体的统计指标 C．样本的统计指标D．样本的总和 5．关于随机抽样，下列那一项说法是正确的（A ）。 - 2 - ．抽样时应使得总体中的每一个个体都有同等的机会被抽取A ．研究者在抽样时应精心挑选个体，以使样本更能代表总体B ．随机抽样即随意抽取个体C ．为确保样本具有更好的代表性，样本量应越大越好D B ）。6．各观察值均加（或减）同一数后（．均数改变，标准差不变BA．均数不变，标准差改变．两者均改变 D ．两者均不变C ）。7．比较身高和体重两组数据变异度大小宜采用（A B．方差．变异系数 A D．标准差C．极差 D ）可用来描述计量资料的离散程度。8．以下指标中（．几何均数 B A．算术均数 D．标准差C．中位数）。9．血清学滴度资料最常用来表示其平均水平的指标是（C B．中位数A．算术平均数 D．平均数C．几何均数。）10．两样本均数的比较，可用（C 检验B．t A．方差分析．方差齐性检验 D C．两者均可 ?。D 11．配伍组设计的方差分析中，）等于（配伍???? A．--B．总误差总处理?????? D．---C．+处理总误差总处理误差??|X??|?，的正态总体中随机抽样，）的概率为5% 。12．在均数为标准差为（ B tSst?1.96 C．D. A． B．?1.96??,,X20.0520.05X13．完全随机设计方差分析的检验假设是（D ）。 A．各处理组样本均数相等B．各处理组总体均数相等 C．各处理组样本均数不相等D．各处理组总体均数不全相等 14．已知男性的钩虫感染率高于女性。今欲比较甲乙两乡居民的钩虫感染率，但甲乡人口女多于男，而乙乡男多于女，适当的比较方法是（ D ）。 2检验χB A．分别进行比较．两个率比较的 - 3 -