当前位置：文档库 › 卫生统计学复习题

卫生统计学复习题

第一章绪论

统计学（statistics）：就是收集数据、整理数据、分析数据，并由这些数据得到结论的原则和方法。是一门处理数据中变异性的科学与艺术，内容包括收集、分析、解释和表达数据，目的是求得可靠的结果。

总体（population）：根据研究目的确定的同质研究对象的全体。

样本（sample）：是指从研究总体中抽取的一部分有代表性的个体，这些个体组成样本。

抽样（sampling）：是从研究总体中抽取少量有代表性的个体。

同质(homogeneity)：总体中的个体具有相同的性质，它是进行统计分析的前提。变异(variation)：因个体差异引起的现象。同一总体中不同个体间存在的差异。计数资料：将全体观测单位按照某种性质或特征分组，然后再分别清点各组观察单位的个数。

等级资料：介于计量资料和计数资料之间的一种资料，通过半定量方法测量得到。将观察单位按测量结果的某种属性的不同程度分组，所得各组的观察单位称为等级资料。

统计量（statistic）：在科研工作中，通过对样本中的观察单位的变量值进行统计分析所得到的统计指标。

参数（parameter）：是反映总体特征的统计指标。

概率（probability）：表示一个事件发生的可能性大小的数。（概率的统计定义：在一定条件下，重复做n次试验，nA为n次试验中事件A发生的次数，如果随着n逐渐增大，频率nA/n逐渐稳定在某一数值p附件，则数值p称为事件A在该条件下发生的概率。

第二章定量资料的统计描述

计量资料：通过度量衡的方法，测量每一个观察单位的某项研究指标的量的大小，得到的一系列数据资料。

频数：对一个随机变量做出重复的观察，其中某变量值出现的次数。

频数表：当变量值个数较多时，对各变量值出现的频率列表即为频率分布表（frequency distribution table），简称频率表。

对称分布：频数集中位置在正中，左右两侧频数分布大体对称。

偏峰分布：集中位置偏向一侧，频数分布不对称。峰向左侧偏移的分布为正偏峰分布，而峰向右侧偏移的分布称负偏峰分布。

加权法：当资料中相同观察值较多时，可将相同观察值的个数，即频数f乘以该观察值x，以代替相同观察值逐个相加。各组段的频率称为权重系数。

中位数（median, M）：是将一组观察值从小到大按顺序排列，位次居中的那个数。

百分位数（percentile，P）：是一个数值，它将原始观察值分为两部分，理论上有x%的观测值比Px小，有（100-x）%的观测值比Px大。

离散趋势：即个体值之间的变异程度，数据越分散，变异程度越高。

极差（range，R）：也叫全距，表示一组观察值中最大值与最小值之差，反映个体差异的范围。

方差（variance）：用来度量随机变量和数学期望（即均值）之间的偏离程度，由离均差的平方和除以样本个数得到。

标准差（standard deviation）：也称均方差，是各数据偏离平均数的距离的平均数，是描述反应正态分布计量资料离散程度的指标。是方差的正平方根，使用的量纲与原量纲相同，适用于近似正态分布的资料，大小样本均可，最为常用。变异系数（coefficient of variation）：是衡量资料中各观测值变异程度的一个统计量，用标准差与平均数的比值来表示，用于量纲不同和变量间或均数相差较大的变异程度的比较。

第三章定性资料的统计描述定性资料：观察结果表现为互不相容的类别或属性，资料整理时，按某种属性分类，然后清点每类的数据。定性变量分为多分类和二分类变量。

相对数(relative number)：两个有联系的指标的比。

率(rate)：描述某种现象发生的频率和强度的指标。

构成比(constituent ratio) ：事物内部各组成部分所占整体的比重或分布，常用百分数表示，又称作百分比(percentage)。

相对比(ratio)：两个有关指标的比，描述二者的相对水平，反映一个指标是另一个指标的几倍或几分之几。两个指标可以是绝对数，也可是相对数；可以性质相同或不同。

标准化率：寻找一个统一的分布作为标准组，然后每个比较组均按该分布标准计算相应的率，所得到的率是相对于标准组的，故称为标准化率

标准化法：常用于内部构成不同的两个或多个率比较的一种方法，基本思想是指定一个统计标准，按指定标准计算调制率，使之具有可比性以后再比较，以消除由于内部构成不同对总率比较带来的影响。

标准化死亡比(standard mortality ratio SMR) ：(或发病比、患病比等)，即被标化组实际死亡（发病、患病等）数与预期死亡（发病、患病等）数之比。

期望寿命：指0岁时的预期寿命。一般用“岁”表示。即在某一死亡水平下，已经活到X岁年龄的人们平均还有可能继续存活的年岁数。

实际人口：某一时点，某一地区调查时实际存在的人数（包括临时在该地的人）。法定人口：某一地区常住居民人数。

性别比：男性人口与女性人口的比值。

老龄人口比重：65岁及以上的人口称老龄人口。老龄人口占总人口的比例即为老龄人口比重。

人口金字塔：是一种用几何图形来形象地表示人口性别年龄构成的方法。它以年龄为纵轴，由小到大从基底往上排列，以各年龄组男女人口各占总人口的百分构成（或人口的绝对数）为横轴，男性在左边，女性在右边来绘制的直方图，其图形形如金字塔，故称为人口金字塔。

粗出生率（CBR) ：指某年每千人口中的活产数

总生育率（GFR）：也称普通生育率，是指某年的活产数与同年育龄妇女人口数之比，通常用千分率表示。

年龄别生育率（ASFR)：也称年龄组生育率，是指某年每千名某年龄育龄妇女的活产数。

总和生育率(TFR) ：是一定时期，每岁一组的年龄别生育率总和。

粗死亡率(简记为CDR）：也称普通死亡率，是指某年平均每千名人口中的死亡数。

年龄别死亡率（ASDR）：也称年龄组死亡率，是指一年内某年龄组死亡人数与相应的平均人口数之比。

婴儿死亡率（IMR）：是指某年不满1岁的婴儿死亡数与同年活产数之比。

新生儿死亡率（NMR）：指某地某年活产儿中未满28天的新生儿死亡频数。

某病病死率（CFR）：指在某一年间内（1年）换某病者因该病死亡的百分比。发病率（incidence rate IR) ：表示在观察期内，可能发生某种疾病的一定人群中新发生该病的频率。

患病率（prevalence rate PR）：又称现患率，表示在某时点上受检人数中现患某种疾病的频率。

有效率：接受治疗的病人中治疗有效的频率

动态数列(dynamic series)：是一系列按时间顺序排列起来的统计指标（可以为绝对数，相对数或平均数），用以观察和比较该事物在时间上的变化和发展趋势。绝对增长量：是说明事物在一定时期增长的绝对值,即报告期指标值与基期指标值之差。

平均发展速度：是各环比发展速度的几何平均数，说明某事物在一个较长时期中逐期（如逐年）平均发展的程度。

平均增长速度：是各环比增长速度的平均数，说明某事物在一个较长时期中逐期平均增长的程度。

第四章统计表与统计图

简单表（simple table）：只按单一变量分组，由一组横标目和一组纵标目组成

复合表：又称组合表（combinative table），是将两个或两个以上变量结合起来分组，即由一组横标目和两组及以上纵标目结合起来作为“主语”。

统计图（statistical chart）：是用点的位置、线段的升降、直条的长短、面积的大小等来表达统计数据的一种形式。

第五章常用概率分布

正态分布(normal distribution)：又称高斯分布，是医学和生物界最常见的分布。该分布是以均数为中心，低于均数的频数与高于均数的频数大致相等，越接近均数，频数越多，离均数越远，频数逐渐减少，形成以均数为中心两侧基本对称的钟型分布。用N（μ、σ2）表示。

正态曲线（normal curve）：是一条高峰位于中央，两侧逐渐下降并完全对称，曲线两端永远不与横轴相交的钟形曲线。

标准正态分布（standard normal distribution)：总体均数为0、总体标准差为1的正态分布。

医学参考值范围（reference ranges）：亦称医学正常值范围，是指特定人群“正常人”的解剖、生理、生化及组织代谢产物含量等数据的波动范围。

第六章参数估计基础

总体分布(population distribution)：是总体中各元素的观察值所形成的频数或频率分布通常是未知的，可以假定它服从某种分布。

样本分布(sample distribution)：也称经验分布，是一个样本中各观察值的频数或频率分布。当样本容量n逐渐增大时，样本分布逐渐接近总体的分布

抽样分布(sampling distribution)：是某一样本统计量的全部可能取值的概率分布。

抽样误差（Sampling error ）：由抽样引起的样本统计量与总体参数间的差异

样本均数的标准差：称为样本均数的标准误(standard error of mean ,SE)，简称均数标准误，它反映样本均数之间的离散程度，也反映样本均数抽样误差的大小。

标准误（standard error）：样本均数的标准差，即均数的标准误SEM，用于表示均数抽样误差的指标，反映样本均数之间的离散程度和样本均数抽样误差的大小。

t分布：在实际的工作中，往往σ是未知的，常用s作为σ的估计值，为了与μ变换区别，称为t变换，统计量t值的分布称为t分布

可信区间（CI）：按一定的概率或可信度（1－α）用一个区间来估计总体参数所在的范围，该范围通常称为参数的可信区间或者置信区间。

中心极限定理(central limit theorem)：设从均值为μ，方差为σ2的一个任意总体中抽取容量为n的样本，当n充分大(通常n≥30)时，样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布。

参数估计：是指用样本指标（统计量）来估计总体指标（参数）

点（值）估计（point estimation）：即把样本统计量直接作为总体参数的估计值，如用样本均数来估计总体均数。这种方法虽然很简单，但是未涉及随机误差，而随机误差在抽样研究中是不可忽视的。

区间估计（interval estimation）：即按一定的概率估计总体均数在哪个范围，它把抽样误差引入估计量，确定具有特定概率意义的区间。

参考值范围：指同质总体中大多数个体变量值的分布范围。

95%参考值范围：指同质总体中95%的个体值分布在此范围内。它与标准差有关，各个体值变异越大，该范围越宽，分布也越分散。

准确度(可信度)：反映在可信度1-α的大小，即区间包含总体均数的概率的大小，当然愈接近1愈好；

精度（精确度）：反映在区间的长度，当然长度愈小愈好。

第七章假设检验基础

统计推断（statistical inference）：由样本信息对相应总体的特征进行的特征性进行推断。

假设检验(Hypothesis testing)：亦称显著性检验(signif i cance test)，对所估计的总体首先提出一个假设，然后通过样本数据去推断是否拒绝这一假设。

无效假设：或者叫做零假设(null hypothesis)，假定两总体之间无差异，或者说差异仅由抽样误差造成的。

自由度：n个变量中，可自由取值的变量的个数。

P值：在零假设成立的条件下，出现统计量目前值更不利于零假设数值的概率。检验效能：当所研究的总体与H0确有差别时，按检验水平α能够发现它（拒绝H0）的概率。

检验水准：是预先规定的，当假设检验结果拒绝H0接受H1下有差别的结论时犯错误的概率。

变量变换：对资料数据进行数学变换，使得变换后的资料符合参数方法条件的一种方法。

Ⅰ型错误：如果实际情况与H0一致，仅仅由于抽样的原因，使得统计量的观察值落到拒绝域，拒绝原本正确的H0，导致推断结论错误，称为Ⅰ型错误。

Ⅱ型错误：如果实际情况与H0不一致，仅仅由于抽样的原因，使得统计量的观察值落到接受域，不能拒绝原本错误的H0，导致推断结论错误，称为Ⅱ型错误。

第八章方差分析

方差分析（ANOV A）：又称F检验，是通过对数据变异的分解来判断不同样本所代表的总体均值是否相同，用于比较两个或两个以上均数的差别。

总变异：样本全部实验单位差异，其大小可以用全部观察值的均方表示

组间变异：各处理组间观察值大小不等，这种变异为~，可用组间均方来表示

组内变异：各处理组内部观察值大小不等，这种变异为~，可用组内均方来表示完全随机设计（completely randomized design）：是将同质的受试对象随机地分配到各处理组，再观察其实验效应。

随机区组设计（randomiz ed block design）：又称配伍设计，通常是将受试对象按性质（如动物的窝别、体重等非实验因素）相同或相近者组成b个区组（配伍组），每个区组的受试对象分别分配到k个处理组中去。

析因分析（Factorial Design）：是将两个或多个实验因素的各水平进行全面组合的实验，能够分析各实验因素的单独效应、主效应和因素间的交相呼应。

单独效应（simple e ffect）：其他因素固定时，同一因素不同水平的效应之差。主效应(mail effect)：某一单独效应各水平间的平均值。

交互效应（interaction）：指两个或多个因素间的效应互不独立的情形。指某因素的各单独效应随另一因素变化而变化，则称这两个因素间存在交互效应

重复测量资料（repeated measurement data）：是同一受试对象的同一观察指标在不同时间点上进行多次测量所得的资料，常用来分析该观察指标在不同时间点上的变化特点。

滞留效应（carry-over effect）：前面的处理效应有可能滞留到下一次的处理。

潜隐效应（latent effect）：前面的处理效应有可能激活原本以前不活跃的效应。学习效应（learning effect）：由于逐步熟悉实验，研究对象的反应能力有可能逐步得到了提高。

数据变换：将原始资料变换成为适用于检验方法的资料。

第九章卡方检验

拟合优度检验：是根据样本的频率分布检验其总体分布是否符合某给定的理论

分布。

卡方值(chi-square)：是以理论数为基数的相对误差，它反映了实际数与理论数吻合的程度。

卡方检验：是一种用途较广泛的假设检验方法，即推断两个及多个总体构成比之间有无差别，两种属性或两个变量之间有无关联性，以及频数分布的拟合优度检验等。

第十章基于秩次的非参数检验

参数检验：凡是以特定的总体分布为前提，对未知的总体参数做推断的假设检验方法。

非参数检验：非参数检验对总体分布不作严格限定，不受总体分布的限制，又称任意分布检验，它直接对总体分布作检验。

第十一章两变量关联性分析

自变量(independent variable)：指实验中由于实验者所操纵的因素或条件。

因变量(dependent variable)：指实验中由于实验变量而引起的变化和结果。

相关系数：它又称为积差相关系数，以符号r 来表示相关系数。它是说明两变量间相关关系的密切程度和相关方向。

线性相关系数（linear correlation coefficient）：又称Pearson积距相关系数，是定量描述两个变量间线性关系密切程度和相关方向的统计指标。

线性相关（linear correlation）：又称简单相关，两个变量间呈现线性变化趋势的关系称为线性相关。

样本协方差：离均差乘积在样本中的平均。

总体协方差：离均差乘积在总体样本中的平均。

正相关：散点呈椭圆形分布，Y随X的增加而增加，X随Y的增加而增加，即两变量X、Y同时增大或减小，变化趋势是同向

负相关：散点呈椭圆形分布，Y随X的增加而减少，X随Y的增加而减少，变化趋势是反向的，称为负相关

零相关：无论X增加还是减少，Y不受其影响，反之，X也不受Y的影响。两属性X和Y互相独立（independence)：是指属性X的分布的概率与属性Y 的概率分布无关，否则称这两种属性之间存在关联性。

第十二章简单回归分析

线性回归：是利用数理统计中的回归分析，来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法之一。

秩相关或等级相关：用双变量等级数据作直线相关分析。

回归系数：即直线的斜率，直线回归方程中用b表示，其统计意义为X每增减一个单位，Y平均改变b个的单位。

双变量计量资料：每个个体有两个变量值

直线回归（linear regression）：研究应变量Y对自变量X的数量依存关系。呈直线趋势，但并非所有点子恰好全都在一直线上，此与两变量间严格的直线函数关系不同，称为,其方程叫直线回归方程

残差(residual)：或剩余值，即实测值Y与假定回归线上的估计值的纵向距离

最小二乘法(least sum of squares)：是求解回归方程中参数估计量a和b值所遵循的策略，是回归残差平方和达到最小，直观含义是：使样本数据的各实测点至回归直线的纵向距离

的平方和最小。

参数β的意义是：若自变量X增加一个单位，反应变量Y的平均值便增加β

回归直线的（1-α）置信带（confidence band）：（1-α）置信区间的上下限连起来形成一个弧形区带

预测：就是把预报因子（自变量X）代入回归方程对总体中预报量（应变量Y）的个体值进行估计。决定系数(coefficient of determination)回归平方和与总平方和之比。

残差（residual）：是指观测值Y i与回归模型拟合值之差

残差分析(residual analysis)：旨在通过残差深入了解数据与模型之间的关系，评价实际资料是否符合回归模型假设，识别异常点等。

简答题

第一章绪论

统计学的基本步骤有哪些？

答：研究设计、搜集资料、整理资料、分析资料

研究设计：制定计划，对整个过程进行安排。是整个工作的关键。

搜集资料：根据计划取得可靠、完整的资料。收集资料的方法有三种：统计报表、日常性工作、专题调查。注重资料的真实性。

整理资料：原始资料的整理、清理、核实、查对，使其条理化、系统化便于计算和分析。可借助于计算机（常用软件：EPI、SPSS、SAS）。

分析资料：统计学的关键所在。运用统计学的基本原理和方法，分析计算有关的指标和数据，揭示事物内部的规律。

总体与样本的区别与关系？

答：区别：样本是总体的一部分，联系：如果样本的均衡性较好，就能够代表总体的特征。

抽样误差产生的原因有哪些？可以避免抽样误差吗？

答：一，个体差异引起；二，抽样方法引起。抽样误差不能避免，但可以随着样本含量的增大而减小。

何为概率及小概率事件？

答：概率是指在一定条件下，重复做n次试验，nA为n次试验中事件A发生的次数，如果随着n逐渐增大，频率nA/n逐渐稳定在某一数值p附件，则数值p 称为事件A在该条件下发生的概率。小概率事件是指习惯上将P《=0.05或P 《=0.01称为小概率事件，表示某事件发生的可能性很小。

研究资料的类型

定量变量、数值变量－－－计量资料

定性变量、分类变量－－－计数资料

顺序变量、有序分类变量－等级资料

第二章定量资料的统计描述

频数分布表编制的步骤

1.找出最大值和最小值，计算极差。

2.按极差大小决定组段数、组段和组距。

3.列表划记，统计各组段频数。

4.计算频率与累计频率

频数分布的两个特征

集中趋势和离散趋势是频数分布的两个重要特征，测定其集中趋势和离散趋势就可较全面地分析所研究的事物。

对于一组近似正态分布的资料，除样本含量n外，还可计算，S和，问各说明什么？

答：三个指标分别说明：

(1) 为算术平均数，说明正态分布或近似正态分布资料的集中趋势；

(2)S为标准差，说明正态分布或近似正态分布资料的离散趋势；

(3) 可估计正态指标的95%医学参考值范围，即此范围在理论上应包含总体的95%个体值。

说明频数分布表的用途。

Y Y

2 R

答：频数分布表的用途是：(1)揭示资料的分布类型；(2)描述分布的集中趋势和离散趋势；(3)便于发现某些特大或特小的可疑值；(4)便于进一步计算指标和统计分析。

均数的两个重要特征

1、离均差的总和等于零，即各变量值与均数之差的代数和等于零。

2、各离均差的平方和小于各观察值X与任何数a之差的平方和

（

）。

描述数值变量资料集中趋势的指标有哪些？其适用范围有哪些？

答：常见的包括算术均数、几何均数、中位数。

①均数：用来描述一组变量值的平均水平，具有代表性，因此变量值必须是同质的。适用于呈对称分布的资料，特别是正态分布或者近似正态分布的资料，因为这时均数位于分布的中心，最能反映分布的集中趋势。

②几何均数：常用来反映一组含多个数量级数据的集中位置。适用于可经对数转换为对称分布的资料，如等比级数资料和对数正态分布资料。

③中位数：适用于描述偏态分布或末端无确定数据时资料。

描述数值变量资料离散趋势的指标有哪些？其适用范围有何异同？

答：常见的包括：极差、四分位间距、方差、标准差和变异系数。

①极差：只利用最大值和最小值的信息，易受样本含量的影响，很不稳定。极差大，说明资料的离散程度大

②四分位数间距：适用于各种分布的资料。适用于偏态分布、两端无确定值或分布不明确资料的离散程度。四分位数间距大，说明变异度大；反之，说明变异度小。

③方差和标准差：适用于对称分布，特别是正态分布的资料。全面反映了一组观察值的变异程度。

④变异系数：常用于量纲不同时、或均数相差较大时变量间变异程度的比较。简述频数表的主要用途。

答：(1)通过频数表了解数据的分布特征。①X值分布情况：偏态或正态分布；

②取值情况：变量值取值范围；③集中趋势：变量值集中位置。

(2)便于发现资料中的可疑值。

(3)组段的频率作为概率的估计。

什么是百分位数？写出计算公式。

答：百分位数(percentile)：是一种位置指标，以Px表示，一个百分位数Px 将全部观察值分为两个部分，理论上有x%的观察值小于Px小，有(1-x%)的观察值大于Px。

计算定义：将一组变量值由小到大依次排列，为第x百分位数的秩次，其对应的变量值(x)为第x百分位数，记为Px。

百分位数计算公式：

(1)直接法

将样本值由小到大排队，用nX%确定Px的位次和Px。

当nX%为带有小数位时用公式：

函数trunc(a)：表示对数字取其整数。

(2)频数表法(例数较多)

用公式：

LX ：第X%位数所在组段的下限值

iX ：第X%位数所在组段的组距

fX ：第X%位数所在组段的频数

∑fL ：第X%位数所在组段上个组段的累计频数

第三章定性资料的统计描述请说明频率型指标与强度型指标的主要区别？

答：主要区别：指标的解释不同，频率型指标是表示事物内部某个组成部分所占的比重或分布，或指某现象发生的频率。强度型指标是指单位时间内某现象发生的频率。

构成比的特点

1 分子是分母的一部分，事物内部各组成部分的构成比之和为100%。

2 事物内部某一组分发生改变，其它部分的构成比也相应的发生变化。

常用的相对数有哪几种？简述各种相对数指标的含义，计算方法及特点。

答：有率、构成比、相对比三种。

率的含义：某现象实际发生的例数与可能发生的总例数之比，说明某现象发生的频率或强度。其特点为：说明某现象发生的强度。

构成比的含义：事物内部某一部分的个体数与该事物各部分个体数的总和之比，用来说明各构成部分在总体中所占的比重或分布，通常以100为比例基数，又称百分比。其特点为：①一组构成比的总和应等于100%，即各个分子的总和等于分母；②各构成部分之间是相互影响的，某一部分比重的变化受到两方面因素的影响，其一是这个部分自身数值的变化，其二是受其它部分数值变化的影响。

相对比的含义：是两个有关指标之比，说明两指标间的比例关系。其特点为：两个指标可以是性质相同，也可以是性质不同；两个指标可以是绝对数、相对数或平均数。

率、构成比和相对比是非常相似的指标，但是，三者之间存在着本质的区别：①构成比表示事物内部各组成部分所占整体的比重或比例，而率表示某随机事件发生的频率或强度；

②构成比的分子中的个体一定是分母的一部分，而相对比的分子中的个体不一定是分母的一部分；构成比是同一类事物的数值之比，相对比可以是性质相同或性质不同的数值之比。

应用相对数时的注意事项有哪些？

①计算相对数时的观察单位数不宜过小。一般说来，观察单位（即相对数的分母）越大，计算的相对数越稳定，越能真实可靠的反映事物的真实情况；反之，相对数的波动就大，不够稳定。

②正确区分、应用构成比和率。构成比是事物各组成部分所占的比重或分布，分子是分母的一部分；率说明某种事物出现的强度或频率，分子是发生某种现象的例数。

③正确的计算合计率（平均率）。

④对相对数进行比较时，应当注意资料的可比性。

⑤比较两个或多个相对数时，应进行假设检验。

下列因素可能影响对比组之间的可比性

（1）观察对象是否同质，研究方法是否相同，观察时间是否相等，以及地区、周围环境、风俗习惯和经济条件是否一致或相近等。

（2）观察对象内部结构是否相同，若两组资料的年龄、性别等构成不同，可以分别进行同年龄别、同性别的小组率比较或对总率（合计率）进行标准化后再作比较。

(3)对比不同时期资料应注意客观条件是否相同

什么是两个样本之间的可比性？

答：可比性是指处理组（临床设计中称为治疗组）与对照组之间，除处理因素不同外，其他可能影响实验结果的因素要求基本齐同，也称为齐同对比原则。以实例说明为什么不能以构成比代替率？

答：例如某医生研究已婚育龄妇女在不同情况下放置避孕环与失败率的关系。总失败人数为126人，人工流产后失败人数为78，月经后失败人数为39，哺乳期失败人数为9.由此计算得到人工流产后失败人数的百分数为61.9%，月经后

为31.0%，哺乳期为7.1%，三者比较得出人工流产后最容易发生避孕失败，这个结论是不对的。因为作者只考虑了失败人数，计算得到的指标是构成比，只能说明放置避孕环失败者各占的比例。若要了解失败率，一定要用失败人数除以放环人数。如人工流产后放环255例失败78例，失败率是30.6%；月经后放环87例失败39例，失败率是44.8%；哺乳期内放环17例失败9例，失败率是52.9%，正确结论应该是哺乳期内放环最容易发生避孕失败。

何为标准化法？标准化法的基本思想？简述直接标准化法与间接标准化法的区别。

答：采用某影响因素(如年龄、性别、工龄、病情轻重、病程长短等)的统一标准构成，然后计算标准化率的方法称为标准化法，其目的是消除原样本内部某影响因素构成不同对合计率的影响，使通过标准化后的标准化合计率具有可比性。

采用统一标准构成以消除某因素的内部构成不同对总率的影响，使通过标准化后的标准化率具有可比性。

直接标准化法和间接标准化法的主要区别是：如对死亡率的年龄构成标准化，若已知年龄别死亡率，可采用直接法，选择一个标准年龄人口构成直接计算标准化率；若只有总的死亡数和年龄别人口数而缺乏年龄别死亡率时，宜采用间接法，选择一个标准年龄别死亡率，先计算标准化死亡比(SMR)，再用SMR乘以标准总死亡率得标准化死亡率。

标准化法的基本步骤

★选择方法：常用的计算标准化率的方法有直接法和间接法。直接法的使用条件是已知被观察人群中各年龄组（分组）的患病率（或发病率、死亡率等）资料；若缺乏各分组的率的资料，仅有各分组的观察单位数和总的率，则选用间接法。

★选择标准：一般原则是：①选择一个具有代表性的、内部构成相对稳定的较大人群作标准；②以要比较的两组资料内部各相应分组的观察单位数合并作标准；③以要比较的两组中任选一组的内部构成作标准。

★计算标准化率

应用标准化率进行比较时要注意什么问题？

答：书：(1)标准化法只适用于因两组内部构成不同，并有可能影响两组总率比较的情况。对于因其它条件不同而产生的可比性问题，标准化法不能解决。(2)由于选择的标准人口不同，算出的标准化率也不同。因此，当比较几个标准化率时，应采用同一标准人口。

(3)标准化后的标准化率，已经不再反映当时当地的实际水平，它只是表示相互比较的资料间的相对水平。

(4)两样本标准化率是样本值，存在抽样误差。比较两样本的标准化率，还应作假设检验。

老师课件：①由于选择的标准不同，算得的标准化率就不同，故而在比较几个标准化率时，应采用同一标准②各年龄组率间若出现明显交叉，则不用标准化法，而只能是比较年龄组率③两样本标准化率的比较亦应作假设检验。

人口金字塔分型

①增长型人口：人口金字塔呈上尖下宽，多为出生率大于死亡率，表示人口不断增长。

②静止型人口：除高龄组构成较小外，其它各年龄组构成相近，此类人口出生率基本等于死亡率，人口总数基本稳定。

③缩减型人口：人口金字塔呈现上下两头小，中间大，一般多为死亡率大于出生率，人口总数不断减少。

粗出生率（CBR) 意义：

粗出生率的优点在于资料易获得，计算简单，因而几乎世界所有国家均用这个指标；其主要缺点是受人口年龄性别构成的影响大。若人口中生育年龄的女性多，或人口较年轻，已婚率高的地区则粗出生率会偏高。因此，粗出生率只能粗略地反映一个国家和地区的生育水平。

年龄别生育率（ASFR )意义：

年龄别生育率消除了育龄妇女内部年龄构成对生育水平的影响，故比总生育率又进了一步，它能反映不同年龄（组）育龄妇女的生育水平，不同地区不同时期同一年龄别生育率可以直接比较。通常年龄别生育率多以5岁一个年龄组计算，所以要想得到这一指标，必须要有育龄妇女各年龄组的妇女数和活产数，但在不少发展中国家很难获得这一资料。

总和生育率意义：

是假定同时出生的一批妇女，按照某年的年龄别生育水平度过其一生的生育过程，每个妇女（用?表示则为每千名妇女）可能生育的子女数。它能综合反映各年龄组育龄妇女生育率，能确切地说明人群生育水平。它不受人口性别、年龄构成对生育水平的影响，故不同地区、不同年度的总和生育率可以直接比较，因而应用甚广。它是测量生育水平的最好指标

粗死亡率(简记为CDR）意义

粗死亡率和粗出生率一样，具有资料易获得、计算简单的优点，但其高低受人口年龄构成的影响，故只能粗略地反映人口的死亡水平，不能用来衡量和评价一个国家的卫生文化水平。

年龄别死亡率意义

消除了人口年龄构成不同对死亡水平的影响，故不同地区同一年龄组死亡率可以进行比较。对年龄别死亡率进行分析可以明确卫生工作的重点人群。年龄别死亡率有其自身的规律，一般0岁组死亡率较高，以后随着年龄的增长迅速下降，至10～14岁时（在发达国家为5～9岁）死亡率降至最低值，以后虽略有上升，但在40岁前一直处于低水平，40岁以后，死亡率随年龄的增长而增高。婴儿死亡率（IMR）意义：

婴儿对外界的抵抗能力差，极易患传染病而导致死亡，故婴儿死亡率是衡量一个国家卫生文化水平的敏感指标。不同地区、不同时期的婴儿死亡率可以比较。在人民生活水平高，环境卫生条件和医疗保健服务好的地区，婴儿死亡率较低。反之，婴儿死亡率较高。例如婴儿死亡率在发展中国家可高达200?，而在发达国家则不到15?。在婴儿时期，死亡并非均匀分布，出生第一个月内死亡的婴儿数占婴儿死亡总数的比重大，通常出生后28天以内的死亡率往往比出生后28天至11月的死亡率还高，因此将婴儿死亡率又分为新生儿死亡率与婴儿后期死亡率。

5岁以下儿童死亡率意义：

许多发展中国家，由于婴儿死亡率的资料不易准确，而5岁以下儿童死亡又很高，故联合国儿童基金会常用5岁以下儿童死亡率作为综合反映婴幼儿死亡水平及儿童生存大小的指标。

孕产妇死亡率意义：

国际疾病分类对孕产妇死亡定义为：“妇女在妊娠期至产后42天以内，由于任何与妊娠有关的原因所致的死亡称为孕产妇死亡，但不包括意外事故死亡。”这一定义中“与妊娠有关的原因”可以分为两类：①直接产科原因：包括对妊娠合并症（妊娠期、分娩期及产褥期）的忽视、治疗不正确等。②间接产科原因：妊娠之前已存在的疾病，由于妊娠使病情恶化引起的死亡。孕产妇死亡率不仅可以评价一个国家或地区的妇幼保健工作，而且可以间接反映一个国家的卫生文化水平。

死因别死亡率意义：

死因别死亡率是死因分析的主要指标，它可以反映人群中各类病伤死亡的频率，即反映各类病伤死亡对居民生命的威胁程度。

发病率（incidence rate) 意义：

发病率是反映某病在人群中发生频率大小的指标，常用于衡量疾病的发生，研

究疾病发生的因果关系和评价预防措施的效果。

请比较发病率和患病率的不同。

答：发病率表示一定时期内，在可能发生某病的一定人群活过的总人年中，新发生的某病病历数，其分子是新病历数，分母是总人年数；患病率，又称现患率，指某时点上受检人数中先患某种病的人数，通常用于描述病程较长或发病时间不易明确的疾病的患病情况，其分子包括新旧病例数，分母是受检总人数。在一定的人群和时间内，发病率和患病率有密切关系，两者与病程（D）的关系是：PR=IR×D。

请比较死亡率与病死率的不同。

答：死亡率与病死率的分子是一样的，均表示因某病死亡的人数，但死亡率的分母是总人年数，侧重反映发生的强度，或单位时间内死亡的概率；病死率的分母是患某病的人数，反映疾病死亡的概率。

相对数的动态指标有哪几种？各有何用处？

答：相对数的动态指标即其动态数列分析指标有：绝对增长量、发展速度与增长速度、平均发展速度与平均增长速度。

绝对增长量是说明某相对数在一定时期增长的绝对值；发展速度与增长速度均为相对比，说明某相对数在一定时期的速度变化；平均发展速度是各环比发展速度的几何均数，说明其相对数在一个较长时期中逐期(如逐年)平均发展变化的程度。

动态数列的两个要素：时点或时期、统计指标

可以进行预测的统计指标有哪些？

相对比、动态数列（根据平均发展速度公式计算几年后达到的指标）、线性回归（利用回归方程进行统计预测，预测就是将预报因子（自变量X）代入回归方程对预报量进行估计）

第四章统计表与统计图

统计表的结构

1、标题

2、标目

3、线条

4、数字

5、备注

编制统计表应注意的事项

1、简明扼要，重点突出。

2、合理安排主语和谓语的位置。

3、表内数据要认真核对、准确可靠。

依次写出箱式图中涉及到的各个取值。

答：由大到小的次序为：极大值、P75、中位数、P25和极小值。

直方图中各矩形的高度等于频数（或频数），对吗？

答：对于各组距相等的情形，该说发是对的。若某些组段的组距与多数阻段所取组距不同时，例如前者是后者的k倍，则该不等距组段的高度为频数（频率）除以k。确切地说，组段对应的面积等于频数（频率）。

统计表的列表原则是什么？

答：一是重点突出，简单明了；二是主谓分明，层次清楚，符合逻辑。

线图和半对数线图的主要区别是什么？

答：线图的纵轴尺度为算术尺度，用以表示某指标随时间的变化趋势；半对数线图的纵轴尺度为对数尺度，用以表示某指标随时间的增长或减少速度。

绘制统计表、统计图的原则和基本要点是什么？

答：编制统计表的原则：①重点突出，一张表只表达一个中心内容。不要把过多的内容放在一个庞杂的大表里，宁愿用多个表格表达不同指标和内容。②统计表就如完整的一句话，有其描述的对象(主语)和内容(宾语)。通常主语放在表达左边，作为横标目；宾语放在右边，作为纵标目。由左向右读，构成完整的一句话。③简单明了，文字、数字与线条尽量简洁。

编制统计表的要求：①标题：概括说明表的内容，必要时注明时间和地点，字数一般不超过20个。常见缺点：过于简单；过于繁琐；题意不确切、具体。②标目：简明确切，有单位的要注明单位。常见缺点：标目层次过多；含意不确切；有单位的标目没有注明单位。③线条：④数字：一律用阿拉伯字表示；准确；整齐：同一指标的小数位数应一致；位次对齐。表内不留空格：暂缺或未记录，用…表示；不应出现数字，用“—”表示；数字为零，用“0”表示。

⑤备注：非表中必要的元素，一般不列入表内，必要时可用“*”标出，写在表的下面。

绘制统计图的原则：①标题：放在图的下方。②标目：横标目—说明横轴的内容，通常为分组因素；纵标目—说明纵轴的指标和单位，通常为被描述事物的指标。③刻度：坐标轴的刻度单位。④图例：对统计图中的线条、颜色进行说明，位于右上角或下方中间位置。

绘制统计图的要求：①按资料的性质和分析目的选用适合的图形：间断性资料—条图、圆图、百分条图；连续性资料—线图、直方图。②每一张统计图都要有标题，简明扼要地说明图形要表达的主要内容，必要时应注明资料收集的时间和地点。标题一般位于图的下方。③条图、散点图、线图和直方图都有纵、横坐标轴，要标明尺度，纵轴尺度自下而上，横轴尺度自左而右，数量一律由小到大，并等距标明。条图与直方图纵坐标从0开始，要标明0点位置。纵横坐标长度的比例一般为5 7。④比较不同事物时，宜选用不同的线条或颜色表示，并附图例加以说明。图例一般放在图的右上角的空隙处，也可放在图下方的适当位置。

在统计描述中，统计表和统计图分别起着什么作用？

答：在统计描述过程中，统计表展示统计数据的结构、分布和主要特征，便于在进一步分析中选择和计算统计量。在学术报告和论文中常用统计表代替冗长的文字叙述，表达主要的研究结果、数据、指标和统计量，方便读者作比较和掌握主要研究结果。统计图将统计数据形象化，让读者更易于领会统计资料的核心内容，易于做分析比较，并且可以给读者留下深刻的印象。

常用的统计图有哪几种，各适用于什么类型资料？

答：常用的统计图有直条图、直方图、圆图或构成比直条图、线图和统计地图。直条图适用于比较独立分类组的统计指标，直方图适用于描述频数分布，圆图和构成比直条图适用于描述构成比，线图适用于描述某统计量随时间或另一统计量变化而变化的趋势，统计地图适用于描述统计指标的地理分布。

条图：用等宽直条的长短表示相互独立的各项指标数量的大小。

百分条图：用于表示事物内部各部分的比重或所占比例

圆图：用途与百分条图相同，它用圆的面积表示事物的全部，用各扇形的面积表示各个组成部分所占比例

线图：是用线段的升降表示统计指标的变化趋势，或某现象随另一现象的变迁情况，适用于连续型变量

半对数线图：用于表示事物的发展速度（相对比）。其横轴为算术尺度，使线图上的数量关系变为对数关系。

散点图：用点的密集程度、趋势表示两变量间的相关关系。

直方图：常用于表示连续型变量的频数或频率分布。

统计地图：主要用于表示某种现象在地域空间上的分布

箱式图：用于描述连续变量的分布特征。

统计表与统计图有何联系和区别？

答：统计表和统计图都是清晰地、有条理地展示数据，让读者易于领会统计资料的核心内容，易于做比较分析。统计图将统计数据形象化，可以给读者留下深刻的印象。但统计图只能提供概略的情况，而不能获得确切数值，因此不能完全代替统计表，常需要同时列出统计表作为统计图的数值依据。

统计表和统计图的用途是什么？

统计工作中，用统计表和统计图的形式说明资料在数量方面的大小，变动趋势，分布情况以及相互关系，以代替冗长的文字叙述，使结果一目了然，便于阅读，

便于分析和比较。

第五章常用概率分布

医学参考值范围确定的方法是什么？

答：百分位数法和正态分布法。

正态分布曲线的位置与形状的特点？

答：（1）关于χ=μ对称。（2）在χ=μ处取得该概率密度函数最大值，在χ=μ±σ处有拐点。（3）曲线下面积为1。（4）μ决定曲线在横轴上的位置，μ增大，曲线沿横轴向右移；反之，μ减小，曲线沿横轴向左移。（5）σ决定曲线的形状，当μ恒定时，σ越大，数据越分散，曲线越“矮胖”；σ越小，数据越集中，曲线越“瘦高”

控制图的基本原理。

答：如果某一波动仅仅由个体差异或随机测量误差所致，那么观察结果服从正态分布；依据标准正态分布曲线下面积的分布规律性，确定出现概率非常小的若干情况作为异常标准吗如果出现相应结果则判为异常。

正态分布的特征

1、正态曲线在横轴上方，均数处最高。

2、正态分布以均数为中心，左右对称。

3、正态分布有两个参数：均数μ是位置参数、标准差σ是变异度参数。

4、正态曲线下面积有一定的分布规律。

5、有些指标不服从正态分布，但通过适当的变换(transformation)后服从正态分布

标准正态分布(u分布)与t分布有何异同？

相同点：集中位置都为0，都是单峰分布，是对称分布，标准正态分布是t分布的特例(自由度是无限大时)

不同点：t分布是一簇分布曲线，t 分布的曲线的形状是随自由度的变化而变化，标准正态分布的曲线的形状不变，是固定不变的，因为它的形状参数为1。

t分布为抽样分布，标准正态分布(u分布)为理论分布。t分布比标准正态分布的峰值低，且尾部翘得要高。随着自由度的增大，t分布逐渐趋近于标准正态分布。即当自由度v→∞时，t分布→标准正态分布。

t分布与正态分布的关系

自由度v较小时，t分布与标准正态分布相差较大，并且t分布曲线的尾部面积大于标准正态分布曲线的尾部面积

当自由度时，t分布逼近于标准正态分布。

正态分布的应用

1、估计医学参考值范围

2、质量控制图：利用正态分布规律检查和确认可疑值的性质。正常波动或系统误差。

3、正态分布是很多统计方法的理论基础

(1)估计频数分布，(2)制定参考值范围，(3)质量控制：为了控制实验中的检测误差，常以±2 s作为上、下警戒值，以±3 s作为上、下控制值。(4)统计分析方法的基础。

什么是医学参考值范围？估计医学参考值范围如何正确选用统计方法？

答：医学参考值范围是指所谓“正常人”的解剖、生理、生化等指标的波动范围，亦称正常值范围。如95％的参考值范围包括了95％的观察值，而有5％的观察值不在这一范围内。

估计医学参考值范围确定方法：

(1)正态分布法：适用于正态或近似正态分布的资料

根据正态分布规律，将正态曲线下的百分面积

（相当于正常值范围的百分数）在横轴上的对应点作为正常值范围的界值

(2)百分位数法：该法是利用百分位数计算正常值范围，可用于任何分布资料，尤其偏态分布资料。双侧界值(P2.5, P97.5)；单侧上界P95；单侧上界P5

简述医学参考值范围含义并写出95%双侧医学参考值范围的两种计算方法及公式。

答：医学参考值范围，是指特定健康人群的解剖、生理、生化等各种数据的波动范围。习惯上是确定包括95%的人的界值。95%双侧医学参考值范围的两种计算方法及公式(1)正态分布法：1-α参考值范围公式，双侧：

(2)百分位数法：1-α参考值范围公式，双侧：(P2.5, P97.5) ；单侧：> P5或

< P95。

试述正态分布的面积分布规律。

答：正态分布的面积分布规律是：(1)X轴与正态曲线所夹面积等于1或100%；

(2)区间的面积为68.27%，区间的面积为95.00%，区间的面积为99.00%。

第六章参数估计基础

标准差与标准误有何区别和联系？

区别：(1)含义不同: ①s描述个体变量值（x）之间的变异度大小，s越大，变

量值（x）越分散；反之变量值越集中，均数的代表性越强。②标准误是描述样

本均数之间的变异度大小，标准误越大，样本均数与总体均数间差异越大，

抽样误差越大；反之，样本均数越接近总体均数，抽样误差越小。

(2)与n的关系不同： n增大时，①s→σ（恒定）。②标准误减少并趋于0（不

存在抽样误差）。

(3)用途不同: ①s:表示x的变异度大小，计算cv，估计正常值范围，计算标准

误等②:参数估计和假设检验。

联系：二者均为变异度指标，样本均数的标准差即为标准误，标准差与标准误

成正比。

试比较标准差和标准误的关系与意义。

答：标准差是描述个体值变异程度的指标，为方差的算术平方根，该变异不能

通过统计方法来控制。而标准误则是指样本统计量的标准差，均数的标准误实

质是样本均数的标准差，它反映了样本均数的离散程度，也反映了样本均数与

总体均数的差异，说明了均数的抽样误差。

试举例说明均数的标准差与标准误的区别与联系。

答：例如某医生从某地2000年的正常成年男性中，随机抽取25人，算得其血

红蛋白的均数为138.5g/L，标准差S为5.20g/L，标准误为1.04g/L。在本例

中标准差就是描述25名正常成年男性血红蛋白变异程度的指标，它反映了这25

个数据对其均数的离散情况。因此，标准差是描述个体值变异程度的指标，为

方差的算术平方根，该变异不能通过统计方法来控制。而标准误则是指样本统

计量的标准差，均数的标准误实质是样本均数的标准差，它反映了样本均数的

离散程度，也反映了样本均数与总体均数的差异，说明了均数的抽样误差。本

例均数的标准误，此式将标准差与标准误从数学上有机地联系起来了，同时看

出通过增加样本含量方法可以减少标准误。

t分布图形的特征？

答：（1）单峰分布，以0为中心，左右对称；（2）ν越小，t值越分散，曲线的

峰部越矮，尾部越高；（3）随着ν逐渐增大，t分布逐渐接近标准正态分布；当

ν趋向∞时，t分布趋近标准正态分布。

t分布曲线是单峰的；关于t = 0对称；自由度越大，t值越小

t分布的界值

给定自由度v，t分布曲线的双侧尾部面积为α时对应的t值，记为并称为

：一侧尾部面积为α时对应的t值；对称性得：单侧

双侧曲线下面积；同样的尾部面积，t分布的界值要大于标准正态

总体分布的形态和样本含量对样本均数的抽样分布会产生何种影响？

答：无论原始数据的总体分布形态如何，即对于任意分布而言，在样本含量足

够大时，其样本均数的分布近似于正态分布，且样本均数的均数等于原分布的

均数，样本均数的标准误有公式（6-1）计算。

∞

→

样本均数的标准误的意义是什么？与原变量的标准差有何区别与联系？

答：样本均数的标准误可以反映样本均数之间的离散程度及抽样误差的大小。标准误与标准差的区别：（1）前者表示均数变异的指标，后者是表示观察值变异的指标。（2）用途不同，标准差与均数结合估计参考值范围，计算变异系数，和标准误等；标准误用于估计参数的可信区间，进行假设检验等。(3)它们与样本含量n的关系不同，当样本含量n足够大时，标准差趋向稳定，而标准误随的增大而减小。联系：当样本量n一定时，标准误随标准差的大小而变化。

用同一个样本统计量分别估计总体参数的95%置信区间和99%置信区间，哪一个估计的精度更好？为什么？

答：95%置信区间的精度要好于99%置信区间。因为置信度或置信水平有95%提高到99%时，置信区间由窄变宽，估计的精度下降。

满足什么条件时可以采取正态近似法估计总体概率的置信区间？

答：当n足够大，且样本频率p和1—p均不太小时，如np与n(1—p)均大于5时，可用正态近似法求总体概率的置信区间。

参考值范围与置信区间有何区别？

答：区别：（1）意义不同：参考值范围是指通知总体中包括一定数量（如95%或99%）个体值的估计范围。可信区间是指按一定的可信度来估计总体参数所在范围。（2）计算方法不同。

可信区间：从总体中作随机抽样，每个样本可以算出一个可信区间，如95%可信区间，意味着100次抽样，算得100个可信区间，平均有95个可信区间包括总体均数（估计正确），只有5个可信区间不包括总体均数（估计错误）。5%是小概率事件，实际发生的可能性小，因此，在实际应用中就认为总体均数在算得的置信区间内, 这种估计方法会冒5%犯错误的风险。

参考值范围：指同质总体中大多数个体变量值的分布范围。95%参考值范围指同质总体中95%的个体值分布在此范围内。它与标准差有关，各个体值变异越大，该范围越宽，分布也越分散。

抽样误差的结果

各样本均数不一定等于总体均数；样本均数间存在差异；样本均数的分布规律：围绕总体均数上下波动；样本均数的变异：由样本均数的标准差描述。

抽样误差来源:个体变异；抽样

表现:样本统计量与总体参数间的差异；样本统计量间的差异

何谓抽样误差？分别写出均数的抽样误差和率的抽样误差的描述指标及计算公式。

答：总体中的个体间存在变异，在进行抽样研究时，样本的统计量不等于总体参数，这种误差称为抽样误差。均数的抽样误差：常用样本均数的标准差 (简称标准误)反映均数抽样误差的大小。 (理论值 (估计值)。率

(理论值)，(估计值)。

抽样研究中如何才能控制或减小抽样误差？

答：合理的抽样设计，增大样本含量。

何谓抽样误差？为什么说抽样误差在抽样研究中是不可避免的？

答：由抽样造成的样本统计量与样本统计量，样本统计量与总体参数间的差异

因为个体差异是客观存在的，研究对象又是总体的一部分，因此这部分的结果与总体的结果存在差异彩是不可避免的

什么是可信区间，可信区间有哪两个要素？

答：可信区间：按一定的概率或可信度(1-α)用一个区间估计总体参数所在范围，这个范围称作可信度1-α的可信区间(confidence interval, CI)，又称置信区间。

可信区间的两个要素：①准确性：又称可靠性，反映为可信度1-α的大小，显然可信度愈接近1愈好。②精确性：常用可信区间的长度CL－CU来衡量。当然

长度愈小愈好。精确性与变量的变异程度大小、样本例数和1-α取值有关。在样本例数确定的情况下，二者是矛盾的。一般情况下，在可信度确定的情况下，增加样本例数，可减少区间长度，提高精度。

第七章假设检验基础

何谓假设检验？可以举例说明。

首先建立检验假设，然后在该假设下进行随机抽样，计算得到该统计量及其极端情形的概率，如果概率较小，则拒绝该假设，如果概率不是小概率，则接受该假设，这个过程称为假设检验。

假设检验的理论依据是什么？（或者问基本思想）

答：采用逻辑上的反证法，利用“小概率思想”。小概率思想是是指概率事件（p<0.05或p<0.01）在一次试验中基本上不会发生。反证法思想是先提出假设（检验假设H0），再用适当的统计方法确定假设成立的可能性大小，如可能性小，则认为假设不成立；如可能性大，则还不能认为假设不成立。

假设检验采用小概率反证法的原理，根据研究的目的提出检验假设，根据现有的样本信息，基于小概率事件的推断原理，判断是否有充分的证据支持或否定预先设定的假设

假设检验的一般步骤。

答：(1)根据研究目的建立假设，确定检验水准

(2)根据样本统计量的抽样分布规律，选择适当的统计方法，计算检验统计量

(3)确定P值，做出推断结论

建立检验假设，确定检验水准时应注意什么？

①假设检验总是相对于总体而言②相互对立，缺一不可。③不仅考虑有无差异，

还反映了差异的方向——单双侧。假设检验的单双侧应该结合专业知识进行判断。若无充分的理由选择单侧，应采用双侧检验较为稳妥。

什么是假设检验中的两类错误？什么是检验效能?其大小与哪些因素有关？

答：假设检验中的第一类错误是指“拒绝了实际上成立的H0假设”时所犯的错误，当H0成立时犯第一类错误的概率等于检验水准α。假设检验中的第二类错误是指“不拒绝实际上不成立的H0假设”时所犯的错误，其概率通常用β表示，其大小与抽样误差大小及设定的检验水准α有关。1-β为假设检验的检验效能，也就是两个总体确实有差别时检出该差别的能力。

假设检验的两类错误之间的区别与联系是什么？了解这两类错误有何实际意义？

答：假设检验时，拒绝实际上成立的H0，犯第Ⅰ类错误，俗称“弃真”错误；

不拒绝实际上并不成立的H0，犯第Ⅱ类错误，俗称“存伪”错误。犯第Ⅰ类错误的概率用α表示，假设检验时，根据研究者的要求来确定；犯第二类错误的概率用β表示，它只有与特定的H1结合起来才有意义。对于某一具体的检验来说，当样本含量n一定时，α越小，β越大；α越大，β越小。

了解这两类错误的实际意义在于，若在应用中要重点减少α(如一般的假设检验)，则取α=0.05；若在应用中重点减少β(如方差齐性检验、正态性检验或想用一种方法代替另一种方法的检验等)，则取α=0.10或0.20甚至更高。

减少I型错误的主要方法：假设检验时设定α值

减少II型错误的主要方法：提高检验效能。

提高检验效能的最有效方法：增加样本量。

如何选择合适的样本量：实验设计

试述假设检验中 I 型错误与 II 型错误的意义及关系。

答：拒绝了实际上成立的H0，这类“弃真”的错误称为Ⅰ型错误(typeⅠerror)或第一类错误；不拒绝实际上不成立的H0，这类“存伪”的错误称为Ⅱ型错误(typeⅡerror)或第二类错误。Ⅰ型错误的概率用α表示，是根据研究者的要求在计算检验统计量之前设定的。Ⅱ型错误的概率用β表示，一般地，β的大小和样本例数、α值、两总体的实际差距有关，它只有与特定的H1结合起来才有σ

σ=S=

意义，而通常的检验假设其总是非特定的，所以β值的大小很难确切估计。仅知道样本例数确定时，α越小，β越大，反之，α越大，β越小。所以α和β是相互制约的，可以根据研究要求适当控制。要同时减少α及β，唯一的方法是增加样本例数，当样本例数确定后，可以通过选定α来控制β。若重点减少α，一般取较小的α；若重点减少β，一般取α=0.05，α=0.1或更高，因为虽属未知，但估计比取α=0.01时小些。

假设检验时，一般当P<0.05时，则拒绝H0，理论根据是什么？

答：P值是指从H0规定的总体随机抽得等于及大于(或/和等于及小于)现有样本获得的检验统计量值(如t值或u值)的概率。当P<0.05时，说明在H0成立的条件下，得到现有检验结果的概率小于通常确定的小概率事件标准0.05。因小概率事件在一次试验中几乎不可能发生，现的确发生了，说明现有样本信息不支持H0，所以怀疑原假设H0不成立，故拒绝H0。在下“有差别”的结论的同时，我们能够知道可能犯Ⅰ型错误的概率不会大于0.05(即通常的检验水准)，这在概率上有了保证。

假设检验中α和P的区别何在？

答：α和P均为概率，其中α是指拒绝了实际上成立的H0所犯错误的概率，是进行统计推断时预先设定的一个小概率事件标准。P值是由实际样本获得的，在H0成立的前提条件下，出现等于及大于(或/和等于及小于)现有样本获得的检验统计量值的概率。在假设检验中通常是将P与α对比来得到结论，若P≤α，则拒绝H0，接受H1，有统计学意义，可以认为……不同或不等；若P>α，则不拒绝H0，无统计学意义，还不能认为……不同或不等。

检验假设中P值的意义是什么？

答：如果总体状况与H0一致，统计量获得现有数值以及更不利于H0的数值的概率。

能否说假设检验的p值越小，比较的两个总体指标间差异越大？为什么？

答：不能，因为P值的大小与总体指标间差异大小不完全等同。P值的大小除与总体差异大小有关，更与抽样误差大小有关，同样的总体差异，抽样误差大小不同，所得的P也会不一样，抽样误差大小实际工作中主要反映在样本量大小上。

P值越小，不能说差异越显著或者是差异越大，只能说统计学结论越可靠，发现差异的把握越好。统计学结论值说明总体的参数之间有无差异，以及得出这种结论的可靠程度。具体差异的大小，要经专业判，统计学结论要和专业结论结合起来，才能做出最终的判断。

请你谈谈对假设检验结论的认识。

由于假设检验的结论是依据小概率事件一次试验实际不可能发生的原理进行的，因此当拒绝检验假设时可能犯I型错误，当接受检验假设时可能犯II型错误。

如何确定检验水准？

答：检验水准确定需根据研究设计的类型、研究目的、变量类型及变异水平、样本大小等诸多因素。

怎样正确选用单侧检验和双侧检验？

答：单双侧检验首先应考虑所要解决的问题的目的,根据专业知识来确定。若从专业知识判断一种方法的结果可能低于或高于另一种方法的结果，则用单侧检验；在尚不能从专业知识判断两种结果谁高谁低时，用双侧检验。若研究者对低于或高于两种结果都关心，则用双侧检验；若仅关心其中一种可能，则取单侧检验。一般认为双侧检验较保守和稳妥，单侧检验由于充分利用了另一侧的不可能性，故更易得出有差别的结论，但应慎用。

t检验的应用条件是什么？

答：（1）随机事件，（2）来自正态分布总体，（3）均数比较时，要求两总体方差相等。对单样本t检验要求资料服从正态分布；对配对t检验要求差值服从正态分布；对两样本t检验则要求两组数据均服从正态分布，且两样本对应的两总体方差相等，对两小样本尤其要求方差齐性。

简述t检验的具体步骤，如何进行检验结果判断？

步骤：(1)建立假设和确定检验水准α；(2)计算统计量；(3)确定P值；(4)判断结果。结果的判断：P >α，接受H0，差异无显著性，可认为差异是由抽样误差所致。P ≤α，拒绝H0，差异有显著性，可认为样本间存在差异。

简述假设检验的注意事项。

答：假设检验的注意事项：①假设检验时可能犯两类错误；②选择检验方法要注意符合其应用条件；③正确理解假设检验的结论；④当差别无显著性时，有两种可能；⑤统计学的显著性与否和日常生活中的显著性概念不同；⑥单侧检验与双侧检验

1、严密的研究设计

2、根据设计要求和资料的类型选择适当的检验方法

3、正确理解P值的含义

4、正确理解和解释统计学结果

第八章方差分析

方差分析的基本思想是什么？

答：方差分析的基本思想是把全部观察值间的变异按设计和需要分解成两个或多个组成部分，然后将各个部分的变异与随机误差进行比较，以判断各部分的变异是否具有统计学意义。

方差分析的应用条件是什么？

答：（1）各样本是相互独立的随机样本，（2）都采自正态总体，（3）各个总体方差相等。

方差分析的用途有哪些？

方差分析应用广泛，可用于:①两个或多个样本均数间的比较；②分析两个或多个因素间的交互作用；③回归方程的线性假设检验；④多元线性回归分析中偏回归系数的假设检验等。本章主要介绍完全随机设计资料的方差分析、配伍组设计资料的方差分析及重复测量数据的方差分析。

试比较完全随机设计和随机区组设计资料的方差分析基本思想。

(1)完全随机设计资料的方差分析

完全随机设计(completely random design)：亦称成组设计。该设计仅涉及一个研究因素，k个不同的水平(k个分组)。用单因素方差分析(one-way ANOVA)。三种变异：SS总=SS组间+SS组内

(2)随机区组设计资料的方差分析

随机区组设计(random block design)：又称配伍设计，是配对设计的扩展。

四种变异：SS总= SS处理+ SS区组+ SS误差，ν总=kb-1

在完全随机设计方差分析中SS组间、SS组内各表示什么含义？

答：SS组间表示组间变异，指各处理组样本均数大小不等，是由处理因素作用(如果有)和随机误差造成的；SS组内表示组内变异，指各处理组内变量值大小不等，是由随机误差造成的。

方差分析存在问题

方差分析结果提供了各组均数间差别的总的信息，但尚未提供各组间差别的具体信息，即尚未指出哪几个组均数间的差别具有或不具有统计学意义。为了得到这方面的信息，可进行多个样本间的两两比较。

重复测量设计与随机区组设计的区别

在于重复测量的时点不能随机分配给受试对象，时间因素仅为受试对象的伴随因素；各时点之间的效应指标存在相关关系。而随机区组设计的特征是区组内受试个体同质且彼此独立，只是接受的处理不同。

重复测量设计的优缺点

1、优点：

（1）每一个体作为自身的对照，克服了个体间的变异。分析时可更好地集中于

处理效应。

（2）因重复测量设计的每一个体作为自身的对照，所以研究所需的个体相对较少，因此更加经济。

2、缺点：

（1）滞留效应（carry-over effect）：前面的处理效应有可能滞留到下一次的处理。

（2）潜隐效应（latent effect）：前面的处理效应有可能激活原本以前不活跃的效应。

（3）学习效应（learning effect）：由于逐步熟悉实验，研究对象的反应能力有可能逐步得到了提高。

重复测量资料方差分析的前提条件

1、正态性，处理因素的各处理水平的样本个体之间是相互独立的随机样本，其总体均数服从正态分布（个体内不独立）；

2、方差齐性，相互比较的各处理水平的总体方差相等，即具有方差齐同；

3、各时间点组成的协方差阵(covariance matrix)具有球形性(sphericity/circularity)特征或复合对称性（compound symmetry）。

多个样本均数的两两比较能否用t检验或u检验？

每次犯第一类错误的概率0.05，10次都犯的概率不是0.05，而是：5/45≈0.11远大于0.05，不是小概率事件，会把本来无差别的两个总体均数判断为有差别。应用方差分析

两两比较的方法很多：有多重比较（multiple）、线性对比（linear contrast）、正交对比（orthogonal contrasts）等。常用的是多重比较，进一步又可分为以下两种情况：

（1）探索性研究（exploratory research），涉及每两个均数的比较。可采用SNK（Student-Newman-Keuls）法、Bonfferoni t 检验、……。

（2）证实性研究（confirmatory research），如多个处理组与对照组的比较，某一对或几对在专业上有特殊意义的均数间的比较等。可采用Dunnett-t检验、LSD-t检验（Fisher’s least significant difference t test）等,也可以用Bonfferoni t 检验。

数据变换的目的和方法：

目的：将原始资料变换成适用于检验方法的资料

方法：对数变换、平方根变换、倒数变换等。

为什么在方差分析的结果为拒绝H0、接受H1之后，对多个样本均数的两两比较要用多重比较的方法?

答：方差分析的备择假设H1是g个总体均数不全相等，拒绝H0，接受H1，只说明g个总体均数总的来说有差别，并不说明两两总体均数都有差别。若想进一步了解哪两两总体均数不等，则需进行多个样本均数间的多重比较。

两因素析因设计和随机区组设计的区别。书P151 小结4

对不符合方差分析假定条件的资料的分析方法。书P152 小结8

书P152课后简答：

1、方差分析师用于研究哪种数据的统计方法

2、方差分析的基本思想是什么？总离均差平方和以及总自由度怎样计算？

3、两样本t检验与完全随机设计资料的方差分析有何关系？配对样本t检验与随机区组设计资料的方差分析又有何关系？

4、举例说明何谓交互效应？并绘制交互效应图。

5、SNK-q检验Dunnett-t检验都可用于均数的多重比较，它们有何不同？

6、数据变换在资料处理中有什么作用？

第九章x2检验

完全随机设计的两样本率比较时，如何正确选择统计分析方法（写出相应的计算公式）。(1)当总例数n≥40且所有格子的T≥5时，用x2检验的基本公式或四格表资料x2检验的专用公式；当P ≈α时，改用四格表资料的Fisher确切概率法。公式为：，v=(行数-1)(列数-1)

(2)当n≥40但有1≤T＜5时，用四格表资料x2检验的校正公式；或改用四格表资料的Fisher确切概率法的连续性校正法：，

(3)当n＜40，或T＜1时，用四格表资料的Fisher确切概率法。

x2检验的基本思想是什么？

答：①x2检验的基本思想：其计算公式为，式中A代表实际频数；T代表理论频数；而x2值反映了实际频数与理论频数的吻合程度，其中反映了某个格子实际频数与理论频数的吻合程度。若检验假设H0成立，实际频数与理论频数的差值会小，则x2值也会小；反之，若检验假设H0不成立，实际频数与理论频数的差值会大，则x2值也会大。

说明x2检验的用途。

答：x2检验的用途较广。通常多用于①推断两个总体率或构成比之间有无差别；

②推断多个总体率或构成比之间有无差别；③多个样本率的多重比较；④两个分类变量之间有无关联性；⑤频数分布拟合优度的x2检验。

两样本率比较的u检验与x2检验有何异同？

答：两样本率比较时，若对同一资料同时进行u检验与x2检验，在不校正的情况下，x2=u2；但u检验通常用于大样本，而x2检验可用于大样本或小样本。

对于四格表资料，如何正确选用检验方法？

答：(1)首先应分清是两样本率比较的四格表资料还是配对设计的四格表资料。

(2)对于两样本率比较的四格表资料(独立样本2X2列联表资料)，应根据各格的理论值T和总例数n的大小选择不同的x2计算公式：①当n≥40且所有的T≥5时，用x2检验的基本公式或四格表资料x2检验的专用公式，②n ≥40，且任一理论频数T有1≤T＜5，用四格表资料x2检验的校正公式或（或用四格表资料的Fisher确切概率法）；③当n＜40，或T＜1时，用四格表资料的Fisher确切概率法。

若资料满足两样本率u检验的条件，也可用u检验。

(3)对于配对设计的四格表资料，若检验两种方法的检测结果有无差别时：①(b+c) ≥40, ；②(b+c) ＜40, 。

说明行×列表资料x2检验应注意的事项。（书P164）

答：(1)行×列表中的理论频数不应小于1，或1≤T＜5的格子数不宜超过格子总数的1/5。

(2)多个样本率比较，若所得统计推断为拒绝H0，接受H1时，只能认为各总体率之间总的来说有差别，但不能说明任两个总体率之间皆有差别。要进一步推断哪两个总体率之间有差别，需进一步做多个样本率的x2分割或多重比较。(3)对于有序的R×C表资料不宜用x2检验。对于R×C表的资料要根据其分类类型和研究目的选用恰当的检验方法。

说明R×C表的分类及其检验方法的选择。

答：(1)分类：R×C表可以分为双向无序、单向有序、双向有序属性相同和双向有序属性不同4类。

(2)检验方法的选择：①双向无序R×C表：若研究目的为多个样本率(或构成比)的比较，可用行×列表资料的x2检验；若研究目的为分析两个分类变量之间有无关联性以及关系的密切程度时，可用行×列表资料的x2检验以及Pearson列联系数进行分析。②单向有序R×C表：若R×C表中的分组变量是有序的，而指标变量是无序的，此种单向有序R×C表资料可进行行×列表资料的x2检验分析其构成情况；若R×C表中的分组变量为无序的，而指标变量是有序的，此种单向有序R×C表资料宜用秩和检验分析。③双向有序属性相同的R×C表：宜用一致性检验分析两种检测方法的一致性。④双向有序属性不同的R×C表：若研究目的如为分析不同年龄组患者疗效之间有无差别时，可把它视为单向有序R

×C表资料，选用秩和检验；若研究目的为分析两有序分类变量间是否存在线性变化趋势，宜用有序分组资料的线性趋势检验。

两组或多组等级资料的比较，为什么不能用x2检验，而用秩转换的非参数检验？答:若选行×列表资料的x2检验，只能推断两个或多个总体的等级构成比差别，这一般不是推断目的；而选秩转换的非参数检验，可推断两个或多个总体的等级强度差别，这是推断目的。

课后简答题：

卡方检验的应用条件有哪些？课本P174小结3

比较两个独立样本频率分布的χ2检验，和比较两个配对样本频率分布的χ2检验在设计方法、资料整理、假设检验等方面的差别是什么？

答：前面针对的是“两独立样本”，行合计是事先固定的；而后者实质上是一组样本，及时可以看成两个样本，也是“两个互不独立的样本”，样本含量都是n，是固定的，而行合计与列合计却是事先不确定的。

前者原始数据可以表示为教材中表9-3所示的四格表形式，而后者原始数据表示为表9-9所示的四格表形式。检验统计量，前者用教材中公式9-5和公式9-7，而后者用9-9和9-10。

如果实验效应应用等级资料表示，欲比较两组总体效应间差别是否有统计学意义，为什么不能用χ2检验？请举例说明。

答：关键在于此时χ2检验差别有统计意义，只能推断两频率分布不同，而频率分布不同不能说明两总体平均水平不同。

为什么有些四个表必须要计算确切概率？

第十一章两变量关联性分析

卫生统计学选择题及答案

t分布与标准正态分布有一定的关系，下述错误的叙述是_____ A.参数数目不同 B.t分布中的自由度趋于无穷大时，曲线逼近标准正态分布 C.为单峰分布 D.对称轴位置在0 E.曲线下面积的分布规律相同在抽样研究中，当样本例数逐渐增多时_____. A.标准误逐渐加大 B.标准差逐渐加大 C.标准差逐渐减小 D.标准误逐渐减小 E.标准差趋近于0 抽样误差是指。 A.不同样本指标之间的差别 B.样本指标与总体指标之间由于抽样产生的差别（参数与统计量之间由于抽样而产生的差别） C.样本中每个个体之间的差别 D.由于抽样产生的观测值之间的差别 E.测量误差与过失误差的总称下面说法中不正确的是_____. A.没有个体差异就不会有抽样误差 B.抽样误差的大小一般用标准误来表示 C.好的抽样设计方法，可避免抽样误差的产生 D.医学统计资料主要来自统计报表、医疗工作记录、专题调查或实验等 E.抽样误差是由抽样造成的样本统计量与总体参数间的差别及样本统计量间的差别 t分布与正态分布存在如下哪一种关系。 A.二者均以0为中心，左右对称 B.曲线下中间95%面积对应的分位点均为±1.96 C.当样本含量无限大时，二都分布一致 D.当样本含量无限大时，t分布与标准正态分布一致 E.当总体均数增大时，分布曲线的中心位置均向右移抽样研究中，适当增加观察单位数，可（） A.减小Ⅰ型错误 B.减小Ⅱ型错误 C.减小抽样误差 D.提高检验效能 E.以上均正确

说明两个有关联的同类指标之比为。 A.率 B.构成比 C.频率 D.相对比 E.频数构成比用来反映。 A.某现象发生的强度 B.表示两个同类指标的比 C.反映某事物内部各部分占全部的比重 D.表示某一现象在时间顺序的排列 E.上述A与C都对以下属于分类变量的是___________. A.IQ得分 B.心率 C.住院天数 D.性别 E.胸围计算麻疹疫苗接种后血清检查的阳转率，分母为______. A.麻疹易感人群 B.麻疹患者数 C.麻疹疫苗接种人数 D.麻疹疫苗接种后的阳转人数 E.麻疹疫苗接种后的阴性人数关于构成比，不正确的是_____. A.构成比中某一部分比重的增减相应地会影响其他部分的比重 B.构成比说明某现象发生的强度大小 C.构成比说明某一事物内部各组成部分所占的分布 D.若内部构成不同，可对率进行标准化 E.构成比之和必为100% 甲乙两地某病的死亡率进行标准化计算时，其标准的选择______. A.不能用甲地的数据 B.不能用乙地的数据 C.不能用甲地和乙地的合并数据 D.可用甲地或乙地的数据 E.以上都不对用均数与标准差可全面描述资料的分布特征（） A.正态分布和近似正态分布 B.正偏态分布 C.负偏态分布 D.任意分布

《卫生统计学》考试重点复习资料

《卫生统计学》复习资料 08生物技术曾洋and林阳第一章绪论名词解释统计学:就是一门通过收集、整理与分析数据来认识社会与自然现象数量特征得方法论科学。其目得就是通过研究随机事件得局部外在数量特征与数量关系, 从而探索事件得总体内在规律性,而随机性得数量化,就是通过概率表现出来。总体:总体就是根据研究目得确定得同质得观察单位得全体,更确切得说,就是同质得所有观察单位某种观察值(变量值)得集合。总体可分为有限总体与无限总体。总体中得所有单位都能够标识者为有限总体,反之为无限总体。样本:从总体中随机抽取部分观察单位,其测量结果得集合称为样本(sample)。样本应具有代表性。所谓有代表性得样本,就是指用随机抽样方法获得得样本。抽样:从研究总体中抽取少量有代表性得个体,称为抽样。概率:概率(probability)又称几率,就是度量某一随机事件A发生可能性大小得一个数值,记为P(A),P(A)越大,说明A事件发生得可能性越大。0﹤P(A)﹤1。频率:在相同得条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A 在n次试验中出现得频率(freqency)。当试验重复很多次时P(A)= m/n。变量:表现出个体变异性得任何特征或属性。随机变量:随机变量(random variable)就是指取指不能事先确定得观察结果。随机变量得具体内容虽然就是各式各样得,但共同得特点就是不能用一个常数来表示,而且,理论上讲,每个变量得取值服从特定得概率分布。系统误差:系统误差(systematic error)就是指由于仪器未校正、测量者感官得某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不就是分散在真值得两侧,而就是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计与完善技术措施来消除或使之减少。随机误差:随机误差(random error)又称偶然误差,就是指排除了系统误差后尚存得误差。它受多种因素得影响,使观察值不按方向性与系统性而随机得变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。变异:在自然状态下,个体间测量结果得差异称为变异(variation)。变异就是生物医学研究领域普遍存在得现象。严格得说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值得参差不齐。抽样误差:(消除了系统误差,并将随机测量误差控制在允许范围内)由于个体变异得存在,在抽样过程中产生得样本统计量与总体参数之间得差异。分布:随机现象得规律性通过概率来刻画,而随机事件得所有结局及对应概率得排列称为分布。第二章定量资料得统计描述名词解释算术均数:描述一组数据在数量上得平均水平。总体均数用μ表示,样本均数用X表示。几何均数:用以描述对数正态分布或数据呈倍数变化资料得水平。记为G。中位数:将一组观察值由小到大排列,n为奇数时取位次居中得变量值;为偶数时,取位次居中得两个变量得平均值。

卫生统计学考试重点总结复习

一、绪论 1.总体：根据研究目的确定的同质观察单位的全体，确切的说是同质的所有观察单位某种变量值的集合。 2.样本：从总体中随机抽取部分观察单位所组成的集合。 3.参数：用样本的指标来推算或估计出来的，用来说明总体情况的统计指标。 4.统计量：根据观察值计算出来的量，是用来描述和分析样本的统计指标。 5.变量的类型及其转换： ①定性变量：a.分类变量（计数资料）i.二分类变量 ii.多项无序分类 b.有序变量（等级资料） ②定量变量：a.连续型变量 b.离散型变量变量只能由“高级”向“低级”转化：定量→有序→分类→二值。 6.概率：是描述随机事件发生的可能性大些的数值。 7.卫生统计学的内容包括：统计学是一门处理数据中变异性的科学与艺术，内容包括收集、分析、解释和表达数据，目的是求得可靠的结果。 8.卫生统计学：运用概率论和数理统计的原理和方法并结合医学实践来研究医学资料的搜集、整理、分析与推断的一门学科。 9.卫生统计学的研究对象：有变异的事物。 10.统计工作的一般步骤：设计资料、搜集资料、整理资料、分析资料。 11.同质：指同一总体中个体的性质、影响条件、背景相同或非常相近。 12.变异：同一总体内的个体间存在差异又是绝对的，这种现象称为变异。 13.误差可分为：系统误差、随机测量误差、抽样误差。 14.抽样误差：由于个体差异的存在，从某一总体中随机抽取一个样本，所得样本统计量与总体参数之间可能存在差异，这种差异称为抽样误差。二、定量资料的统计描述 1.频率分布表的编制步骤： ①计算极差R、②确定组段数与组距（一般为8-15组）、③确定各组段的上下限、④列表。 2.频率分布表的用途： ①揭示频数分布的分布特点和分布类型，文献中常将频数表作为陈述资料的形式。 ②便于进一步计算统计指标和进行统计分布处理。 ③便于发现某些特大和特小的可疑值。 ④当样本含量比较大时，可用各组段的频率作为概率的估计值。 3.中位数：指将原始观察值从小到大或从大到小排序后，位次居中的那个数。 4.四分位数间距：表示百分位数P75和百分位数P25之差，定义为Q=P75-P25，恰好包括总体中50%的个体观察值，用来描述偏态分布资料的离散趋势的指标。 5.标准差：即方差的算术平方根，是衡量对称分布资料的离散程度的指标，标准差大，则离散度大，标准差小，则离散度小。 6.变异系数：变异的大小S相对于其平均水平X的百分比，主要用于量纲不同的变量间，或均数差别较大的变量间变异程度的比较。三、定性资料的统计描述 1.构成比：说明一事物内部各组成部分在总体中所占的比重或分布，常用百分数表示。 =某一组成部分的观察单位数/同一事物内部各组成部分的观察单位总数×100% 2.相对数的类型：

卫生统计学部分题库

对两个变量进行直线相关分析，r=0.46，P>0.05，说明两变量之间______. A.有相关关系 B.无任何关系 C.无直线相关关系 D.无因果关系 E.有伴随关系若分析肺活量和体重之间的数量关系，拟用体重值预测肺活量，则采用_____. A.直线相关分析 B.秩相关分析 C.直线回归分析 D.方差分析 E.病例对照研究四格表资料的χ2检验应使用校正公式而未使用时，会导致。 A.χ2增大，P值减小 B.χ2减小，P值也减小 C.χ2增大，P值也增大 D.χ2减小，P值增大 E.视数据不同而异配对设计四格表资料比较两个率有无差别的无效假设为。 A.μ1=μ2 B.π1=π2 C.μ1≠μ2 D.π1≠π2 E.b=c 四格表χ2检验的校正公式应用条件为。 A.n＞40且T＞5 B.n＜40且T＞5 C.n＞40且1＜T＜5 D.n＜40且1＜T＜5 E.n＞40且T＜1 两组设计两样本均数比效的t检验公式中，位于分母位置上的是。 A.两样本均数之差 B.两样本均数之差的方差 C.两样本均数之差的标准误 D.两样本均数方差之差

E.两样本均数标准误之差两组数据中的每个变量值减去同一常数后，作两个样本均数比较的假设检验______. A.t值不变 B.t值变小 C.t值变大 D.t值变小或变大 E.不能判断在假设检验中，P值和α的关系为。 A.P值越大，α值就越大 B.P值越大，α值就越小 C.P值和α值均可由研究者事先设定 D.P值和α值都不可以由研究者事先设定 E.P值的大小与α值的大小无关 t分布与正态分布存在如下哪一种关系。 A.二者均以0为中心，左右对称 B.曲线下中间95%面积对应的分位点均为±1.96 C.当样本含量无限大时，二都分布一致 D.当样本含量无限大时，t分布与标准正态分布一致 E.当总体均数增大时，分布曲线的中心位置均向右移下面关于均数的正确的说法是______. A.当样本含量增大时，均数也增大 B.均数总大于中位数 C.均数总大于标准差 D.均数是所有观察值的平均值 E.均数是最大和最小值的平均值从同一正态总体中随机抽取多个样本，用样本均数来估计总体均数的可信区间，下列哪一样本得到的估计精度高。 A.均数大的样本 B.均数小的样本 C.标准差小的样本 D.标准误小的样本 E.标准误大的样以一定概率由样本均数估计总体均数，宜采用。 A.抽样误差估计 B.点估计 C.参考值范围估计 D.区间估计

卫生统计学复习题5

卫生统计学复习题选择题一、A1型：每一道题下面有A、B、C、D、E五个备选答案，请从中选择一个最佳答案。（1′） 1、统计工作的基本步骤是： A.设计、调查、审核、整理资料 B.收集、审核、整理、分析资料 C.设计、收集、整理、分析资料 D.调查、审核、整理、分析资料 E.以上都不对 2、统计学中所说的样本是指 A.从总体中随意抽取一部分 B.依照研究者的要求选取有意义的一部分 C.有意识地选择总体中的典型部分 D.从总体中随机抽取有代表性的一部分 E.以上都不对 3、统计学上的系统误差、测量误差、抽样误差在实际工作中： A.均不可避免 B.系统误差和测量误差不可避免 C.测量误差和抽样误差不可避免 D.系统误差和抽样误差不可避免 E.只有抽样误差不可避免 4、μ确定后，δ越大，则正态曲线： A.越陡峭 B.形状不变 C.越平缓 D.向左移动 E.向右移动 5、抽样误差指的是： A.个体值和总体参数值之差 B.个体值和样本统计量值之差 C.样本统计量值和总体参数值之差 D.不同的总体参数之差 E.以上都不是 6、治疗效果判定资料属于： A.计量资料 B.技术资料 C.等级资料 D.无序分类资料 E.以上都不是 7、平均数可用于分析下列哪种资料： A.统计资料 B.等级资料 C.计数资料 D.计量资料 E.调查资料 8、一组正态或近似正态分布资料的平均水平用： A.算术均数 B.几何均数 C.中位数 D.平均数 E.以上均是 9、对于同一份正偏峰的资料，求得的几何均数与算术均数： A.几何均数大于算数均数 B. 几何均数小于算数均数 C. 几何均数等于算数均数 D. 几何均数可以大于算数均数，也可以小于算数均数 E. 以上说法都不对 10、原始数据加上一个不为0的常数后： A.x不变，CV变 B. x变或CV变 C. x不变，CV不变 D. x变，CV不变 E. x、CV均改变 11、血清学滴度资料最常计算______以表示其平均水平 A.均数 B.中位数 C.几何均数 D.全距 E.标准差 12、表示变量值变异情况的指标最常用的是： A.四分位数间距 B.全距 C.标准差 D.变异系数 E.方差 13、变异系数CV的数值 A.一定小于1 B.一定大于1 C.可大于1；也可小于1 D.一定不会等于零 E.一定比S小 14、若成年人血铅含量近似对数正态分布，拟用300名正常成人血铅确定99%正常值范围，最好采用下列哪个公式： A. x+2.58S B.lg-1(x lgx+2.58S lgx) C. x±2.58S D.P99=L+i/f99(300*99/100-f L) E. lg-1(x lgx+2.33S lgx) 15、_______小，表示用该样本均数估计总体均数的可靠性大。 A.CV B.S C.σx D.R E.四分位数间距 16、两样本均数比较时，分别取以下检验水准，以_______所对应的第二类错误最小。 A.α=0.01 B.α=0.05 C.α=0.10 D.α=0.20 E.α=0.25 17、方差分析中，当P﹤0.05时，结果_________。 A.可认为各样本均数都不相等 B.可认为各总体均数不等或不全等 C.可认为总体均数都不相等 D.证明总体均数不等或不全相等 E.以上都不对 18、正态性检验中，按α=0.10水准，认为总体服从正态分布，此时若推断有错，此错误的概率为__________。

卫生统计学知识点总结

卫生统计学知识点总结-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

卫生统计学统计工作基本步骤：统计设计（调查设计和实验设计）、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断（参数估计和假设检验）】。 ★统计推断：是利用样本所提供的信息来推断总体特征，包括：参数估计和假设检验。a参数估计是指利用样本信息来估计总体参数，主要有点估计（把样本统计量直接作为总体参数估计值）和区间估计【按预先设定的可信度（1-α），来确定总体均数的所在范围】。b假设检验：是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化，通常是由高级向低级转化。资料按性质可分为计量资料、计数资料和等级资料。定量资料的统计描述 1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。 2频率分布表（图）的用途：①描述资料的分布类型；②描述分布的集中趋势和离散趋势；③便于发现一些特大和特小的可疑值；④便于进一步的统计分析和处理；⑤当样本含量足够大时，以频率作为概率的估计值。 ★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。（1）描述集中趋势的统计指标：平均数（算术均数、几何均数和中位数）、百分位数（是一种位置参数，用于确定医学参考值范围，P50就是中位数）、众数。算术均数：适用于对称分布资料，特别是正态分布资料或近似正态分布资料；几何均数：对数正态分布资料（频率图一般呈正偏峰分布）、等比数列；中位数：适用于各种分布的资料，特别是偏峰分布资料，也可用于分布末端无确定值得资料。（2）描述离散趋势的指标：极差、四分位数间距、方差、标准差和变异系数。四分位数间距：适用于各种分布的资料，特别是偏峰分布资料，常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差：都适用于对称分布资料，特别对正态分布资料或近似正态分布资料，常把均数和标准差结合起来描述资料的集中趋势和离散趋势；变异系数：主要用于量纲不同时，或均数相差较大时变量间变异程度的比较。标准差的应用：①表示变量分布的离散程度；②结合均数计算变异系数、描述对称分布资料；③结合样本含量计算标准误。定性资料的统计描述 1定性资料的基础数据是绝对数。描述一组定性资料的数据特征，通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。 2 指标频率型指标强度型指标相对比型指标概念近似反映某一时间出现概率单位时间内某现象的发生率两个有关联的指标A和B之比计算公式 A/B 有无量纲无有可有、可无取值范围【0,1】可大于1无限制本质大样本时作为概率近似值分子式分母的一部分频率强度，即概率强度的似值表示相对于B的一个单位，A有多少位 A和B可以是绝对数、相对数和平均

卫生统计学考试试题及答案(附解释)题库

卫生统计学试题及答案（一） 1.用某地6～16岁学生近视情况的调查资料制作统计图，以反映患者的年龄分布，可用图形种类为______. A.普通线图 B.半对数线图 C.直方图 D.直条图 E.复式直条图【答案】C（6——16岁为连续变量，得到的是连续变量的频数分布）直方图（适用于数值变量，连续性资料的频数表变量）直条图（适用于彼此独立的资料） 2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布，可采用______. A.直方图 B.普通线图 C.半对数线图 D.直条图 E.复式直条图(一个检测指标，两个分组变量) 【答案】E ? 3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况，可采用______. A.直方图 B.普通线图（适用于随时间变化的连续性资料，用线段的升降表示某事物在时间上的发展变化趋势） C.半对数线图（适用于随时间变化的连续性资料，尤其比较数值相差悬殊的多组资料时采用，线段的升降用来表示某事物的发展速度） D.直条图 E.复式直条图【答案】E 4.调查某疫苗在儿童中接种后的预防效果，在某地全部1000名易感儿童中进行接种，经一定时间后从中随机抽取300名儿童做效果测定，得阳性人数228名。若要研究该疫苗在该地儿童中的接种效果，则______. A.该研究的样本是1000名易感儿童 B.该研究的样本是228名阳性儿童 C.该研究的总体是300名易感儿童 D.该研究的总体是1000名易感儿童 E.该研究的总体是228名阳性儿童【答案】D 5.若要通过样本作统计推断，样本应是__________. A.总体中典型的一部分 B.总体中任一部分 C.总体中随机抽取的一部分 D.总体中选取的有意义的一部分 E.总体中信息明确的一部分【答案】C 6.下面关于均数的正确的说法是______.

卫生统计学知识点

卫生统计学考点整理（一） 2017年11月24日一、绪论： 1、什么是卫生统计学：卫生统计学是运用数理统计的基本原理和方法对预防医学和公共卫生领域中的科学研究进行设计，以及研究资料的收集、整理和分析的一门应用科室。 2、卫生统计学的基本内容包括哪些？ ①卫生统计学的基本理论和方法，包括研究设计和数据分析中的统计理论和方法。 ②健康统计，包括医学人口统计、疾病统计和生长发育统计等。 ③卫生服务统计，包括卫生资源、医疗卫生服务的需求和利用、医疗保健制度和管理等的统计问题。 3、什么是计量资料？用度量衡的方法测定每个观察单位的某项研究指标量的大小，所得到的数据（即测量值）成为计量资料（计量资料含有单位） 4、什么是计数资料？将全体观察单位按照某种性质或类别进行分组，然后分别清点各组中的例数，这样得到的数据成为计数资料（也称分类资料）（不含单位） 5、什么是等级资料？将全体观察单位按照某种性质的不同程度分为若干组，分别清点各组中观察单位的个数。 6、什么是总体？根据研究目的的确定的同质观察单位的全体。（是同质的所有观察单位某种变量值的集合） 7、什么是同质？研究对象具有相同的背景、条件、属性 8、什么是变异？同一性质的事物，其个体观察值（变量值）之间的差异。 9、什么是样本？从总体中随机抽取具有代表性的一部分个体，其测量值（或观察值）的集体成为样本。 10、什么是抽样研究？对从所研究的总体中随机抽取有代表性的一部分个体构成的样本进行研究。 11、抽样研究的目的是什么？通过用样本资料计算的指标去推论总体。 12、什么是参数？参数是指总体指标。（如：总体均数μ、总体率π、总体标准差σ等） 13、什么是统计量？统计量是指样本指标。（如：样本均数、样本率p、样本标准差S等） 14、什么是统计描述？用统计图或计算统计指标的方法表达一个指定群体的某种现象或特征 15、什么是统计推断？根据样本资料的特性对总体的特性作估计或者推论的方法。（常用方法是参数估计和假设检验）16、什么是系统误差？不是偶然机遇造成的，而是某种必然因素所致，具有一定的倾向性。常见情况：①操作方法不正确或对调查问卷理解有误；②医生掌握疗效标准偏高或偏低。③周围环境的改进。④仪器不准或试剂不合格。 17、什么是随机测量误差？偶然机遇所致，无方向性，不可避免的。

卫生统计学试题6含答案

统计试题题库 1. 下列那个是对标化后总死亡率的正确描述？ A A．仅仅作为比较的基础，它反映了一种相对水平 B．它反映了实际水平 C．它不随标准选择的变化而变化 D．它反映了事物实际发生的强度 E．以上都不对 2. 两样本作均数差别的t检验，要求资料分布近似正态，还要求： D A．两样本均数相近，方差相等 B．两样本均数相近 C．两样本方差相等 D．两样本总体方差相等 E．两样本例数相等 3. 四格表资料的卡方检验时无需校正，应满足的条件是: D A．总例数大于40 B．理论数大于5 C．实际数均大于l D．总例数大于40且理论数均大于或等于5 E．总例数小于40 4. 总体应该是由： D

A．研究对象组成 B．研究变量组成 C．研究目的而定 D．同质个体组成 E．任意个体组成 5. 两样本均数比较的t检验中，结果为P<0.05，有统计意义。P愈小则: E A．说明两样本均数差别愈大 B．说明两总体均数差别愈大 C．说明样本均数与总体均数差别愈大 D．愈有理由认为两样本均数不同 E．愈有理由认为两总体均数不同 6. 抽样误差是指: D A．总体参数与总体参数间的差异 B．个体值与样本统计量间的差异 C．总体参数间的差异 D．样本统计量与总体统计量间的差异 E．以上都不对 7. 抽签的方法属于下列那种抽样： D A．分层抽样 B．系统抽样 C．整群抽样 D．单纯随机抽样 E．分级抽样

8. 以舒张压≥12.7KPa为高血压，测量1000人，结果有990名非高血压患者，有10名高血压患者，该资料属下列那类资料： B A．计算 B．计数 C．计量 D．等级 E．都对 9. 实验设计中要求严格遵守四个基本原则，其目的是为了： D A．便于统计处理 B．严格控制随机误差的影响 C．便于进行试验 D．减少和抵消非实验因素的干扰 E．以上都不对 10. 两个样本作t检验，除样本都应呈正态分布以外，还应具备的条件是： B A．两样本均数接近 B．两S2数值接近 C．两样本均数相差较大 D．两S2相差较大 E．以上都不对 11. 同一总体的两个样本中，以下哪种指标值小的其样本均数估计总体均数更可靠？A A．Sx B．S C．X D．CV

卫生统计学1复习参考资料

（一）．单选题（共”题，每题2 分） 1 ，某次研究进行随机抽样，测量得到该市110 名健康成年男子的血清总胆固醉值，则研究总体为（ D ) A ．所有成年男子 B ．该市所有成年男子 C . 110 名该市健康成年男子 D ．该市所有健康成年男子 2 ．关于随机抽样，下面说法正确的是（ D ) A ．抽样时样本量越大越好 B ．选取符合研究者意愿的样本 C ．抽样时应精心挑选个体，使得样本更好地代表总体 D ．抽样时要求总体中每一个个体都有同等机会被抽取 3 ．下列选项中，属于计数资料类型的是( C ) A ．身高资料 B ．舒张压资料 C ．某病患病率资料 D ．血清总胆固醉资料 4 ．要全面描述正态总体分布或近似正态总体分布资料的分布特征，可采用（ A ) A ．均数和标准差 B ．中位数和四分位间距 C ．极差和中位数 D ．均数和变异系数 5 ．均数X 是描述一组同质数值变量数据(A）的统计指标 A ．集中趋势 B ．离散趋势 C ．变化范围 D ．频数分布 6 ．标准差S 是描述一组同质数值变量数据(C）的统计指标 A ．集中趋势 B ．变化范围 C.变异程度 D. 频数分布 7 ．一组观察值15 , 20 , 30 , 50 , 40 , 90 , 20 ,95. 其中位数为( B ) A . 30 B . 35 C ．40 D 70 8 ·某组织资料共15 例，∑X2＝1535, ∑X=45 , 则标准差S 为（ D ） A . 100 . 00 B . 93 . 33 C . 9 . 66 D . 1 0 . 00 9 ．将75 个观测值从小到大排列后，这75 个观测值中有10 ％的观测值比50 小，有90 % 的观测值比50 大，则50 是（ A ）

卫生统计学知识点总结

卫生统计学统计工作基本步骤：统计设计（调查设计和实验设计）、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断（参数估计和假设检验）】。 ★统计推断：是利用样本所提供的信息来推断总体特征，包括：参数估计和假设检验。a参数估计是指利用样本信息来估计总体参数，主要有点估计（把样本统计量直接作为总体参数估计值）和区间估计【按预先设定的可信度（1-α），来确定总体均数的所在范围】。b假设检验：是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化，通常是由高级向低级转化。资料按性质可分为计量资料、计数资料和等级资料。定量资料的统计描述 1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。 2频率分布表（图）的用途：①描述资料的分布类型；②描述分布的集中趋势和离散趋势；③便于发现一些特大和特小的可疑值；④便于进一步的统计分析和处理；⑤当样本含量足够大时，以频率作为概率的估计值。 ★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。（1）描述集中趋势的统计指标：平均数（算术均数、几何均数和中位数）、百分位数（是一种位置参数，用于确定医学参考值范围，P50就是中位数）、众数。算术均数：适用于对称分布资料，特别是正态分布资料或近似正态分布资料；几何均数：对数正态分布资料（频率图一般呈正偏峰分布）、等比数列；中位数：适用于各种分布的资料，特别是偏峰分布资料，也可用于分布末端无确定值得资料。（2）描述离散趋势的指标：极差、四分位数间距、方差、标准差和变异系数。四分位数间距：适用于各种分布的资料，特别是偏峰分布资料，常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差：都适用于对称分布资料，特别对正态分布资料或近似正态分布资料，常把均数和标准差结合起来描述资料的集中趋势和离散趋势；变异系数：主要用于量纲不同时，或均数相差较大时变量间变异程度的比较。标准差的应用：①表示变量分布的离散程度；②结合均数计算变异系数、描述对称分布资料；③结合样本含量计算标准误。定性资料的统计描述 1定性资料的基础数据是绝对数。描述一组定性资料的数据特征，通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。 2常用相对数类型：频率型、强度型和相对比型指标。指标频率型指标强度型指标相对比型指标两个有关联的指标A和B之比概念近似反映某一时间出现概单位时间内某现象的生频率计算 A/B 公式无有可有、可无有无量纲【0,1】可大于1无限制取值范围

卫生统计学题库

《卫生统计学》考试题库目录第一章绪论第二章定量资料的统计描述第三章正态分布第四章总体均数的估计和假设检验第五章方差分析第六章分类资料的统计描述第七章二项分布与Poisson分布及其应用第八章χ2检验第九章秩和检验第十章回归与相关第十一章常用统计图表第十二章实验设计第十三章调查设计

第十四章医学人口统计与疾病统计常用指标第十五章寿命表第十六章随访资料的生存分析附录：单项选择题参考答案

第一章绪论一、名词解释 1. 参数(parameter) 2. 统计量(statistic) 3. 总体 (population) 4. 样本(sample) 5. 同质(homogeneity) 6. 变异 (variation) 7. 概率 (probability) 8. 抽样误差 (sampling error) 二、单选题 1．在实际工作中,同质是指: A.被研究指标的影响因素相同 B.研究对象的有关情况一样 C.被研究指标的主要影响因素相同 D.研究对象的个体差异很小 E.以上都对 2. 变异是指: A.各观察单位之间的差异 B.同质基础上,各观察单位之间的差异 C.各观察单位某测定值差异较大 D.各观察单位有关情况不同 E.以上都对3．统计中所说的总体是指: A.根据研究目的而确定的同质的个体之全部 B.根据地区划分的研究对象的全体 C.根据时间划分的研究对象的全体 D.随意想象的研究对象的全体 E.根据人群划分的研究对象的全体 4. 统计中所说的样本是指: A.从总体中随意抽取一部分 B.有意识地选择总体中的典型部分 C.依照研究者的要求选取有意义的一部分 D.从总体中随机抽取有代表性的一部分 E.以上都不是 5．按随机方法抽取的样本特点是:

卫生统计学试题汇总

医学统计学复习题一、名词解释 1、总体 2、样本 3、随机抽样 4、变异 5、概率 6、随机误差（偶然误差） 7、参数 8、统计量 9、算术均数 10、中位数 11、百分位数 12、频数分布表 13、几何均数 14、四分位数间距 15、方差 16、标准差 17、变异系数 18、标准正态分布 19、医学参考值范围 20、可信区间 21、统计推断 22、参数估计 23、标准误及 24、检验水准 25、检验效能 26、率 27、直线相关 28、直线回归 29、实验研究 30、回归系数二、单项选择 1.观察单位为研究中的（）。 A.样本 B.全部对象 C.影响因素 D.个体 E.观察指标 2.总体是由( )组成。 A.部分个体 B.全部对象 C.全部个体 D.同质个体的所有观察值 E.相同的观察指标 3.抽样的目的是（）。 A.研究样本统计量 B.由样本统计量推断总体参数 C.研究典型案例 D.研究总体统计量 E.研究特殊个体的特征 4.参数是指( ) 。 A.参与个体数 B.总体中研究对象的总和 C.样本的统计指标 D.样本的总和 E.总体的统计指标 5.关于随机抽样，下列哪一项说法是正确的（）。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体，以使样本更能代表总体 C.随机抽样即随机抽取个体 D.为确保样本具有更好的代表性，样本量应越大越好 E.选择符合研究者意愿的样本 6.反映计量资料平均的指标是（）。 A.频数 B.参数 C.百分位数 D.平均数 E.统计量 7.表示总体均数的符号是( ) 。 A.σ B.μ C.X D. S E. M 8.下列指标中，不属于集中趋势指标的是（）。 A.均数 B.中位数 C.百分位数 D.几何均数 E.众数 9. ( )分布的资料，均数等于中位数。 A.对称分布 B.正偏态分布 C.负偏态分布 D.对数正态分布 E.正态分布 10.一组某病患者的潜伏期（天）分别是：2、5、4、6、9、7、10和18，其平均水平的指标该选（）。 A.中位数 B.算术均数 C.几何均数 D.平均数 E.百分位数末端有确定数据

卫生统计学-重点整理资料东大

卫生统计学第一章绪论 1、卫生统计学的概念(P1) 卫生统计学是应用概率论和数理统计学的基本原理和方法，研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学，是卫生及其相关领域研究中不可缺少的分析问题。 2、卫生统计学的4个基本步骤(P3)：设计、收集资料、整理资料、分析资料 3、卫生统计学的几个基本概念(P4)： ⑴同质：在统计学中，若某些观察对象具有相同的特征或属性，我们就称之为同质，或具有同质性。 ⑵变异：同质个体的某项特征或属性的观察值或测量值之间的差异。 ⑶总体：同质的所有观察单位某种特征或属性的观察值或测量值的集合。 ⑷样本：从总体中随机抽取的具有代表性的部分观察单位的集合。样本中包含的观察单位个数成为样本含量。 ⑸参数：反映总体特征的指标，一般是未知的，常用希腊字母表示，如总体均数μ、总体率π等。 ⑹统计量：根据样本观察值计算出来的指标，常用拉丁字母表示，如样本均数x 、样本率等。

⑺变量与资料：对每个观察单位进行观察或测量的某项特征或属性称为变量；变量值的集合成为资料。 ⑻定量资料：亦称计量资料，其变量值是定量的，表现为数值大小，一般有度、量、衡单位。 ⑼定性资料：亦称分类资料，其观察值是定性的，表现为互不相容的类别或属性，一般无度、量、衡单位。可细分为：①计数资料； ②等级资料第二章调查研究设计 ★1、调查研究的特点（P7）： ①不能人为施加干预措施；②不能随机分组； ③很难控制干扰因素；④一般不能下因果结论 2、常用抽样方法（名称、原理）： ⑴单纯随机抽样：先将调查总体的全部观察单位统一编号，然后采用随机数字表、统计软件或抽签方法之一随机抽取n（样本大小）个编号，由这n个编号所对应的n个观察单位构成研究样本。 ⑵系统抽样：又称机械抽样或等距抽样。事先将总体内全部观察单位按某一顺序号等距分成n（样本大小）个部分，每一部分内含m个观察单位；然后从第一部分开始，从中随机抽出第i 号观察单位，依此用相等间隔m机械地在第2部分、第3部分直至第n部分内各抽出一个观察单位组成样本。 ⑶分层抽样：先按对观察指标影响较大的某项或某几项特征，将总体分成若干层，该特征的测定值在层内变异较小，层间变异

《卫生统计学》习题及答案

1.表示均数抽样误差大小的统计指标是( C )。 A)标准差B)方差 C)均数标准误D)变异系数 2.抽样研究中，s为定值，若逐渐增大样本含量，则样本( B )。 A)标准误增大B)标准误减少 C)标准误不改变D)标准误的变化与样本含量无关 3.均数标准误越大，则表示此次抽样得到的样本均数( C )。 A)系统误差越大B)可靠程度越大 C)抽样误差越大D)可比性越差 4.假设已知某地35岁以上正常成年男性的收缩压的总体均数为120.2mmHg，标准差为11.2 mmHg，后者反映的是( A )。 A)个体变异B)抽样误差 C)总体均数不同D)抽样误差或总体均数不同 5.配对计数资料差别的卡方检验，其备择假设是( D )。 A)p1=p2 B)p1≠p2 C)B=C D)B≠C 6.下列关于总体均数可信区间的论述是正确的，除了( C )外。 A)总体均数的区间估计是一种常用的参数估计 B)总体均数可信区间所求的是在一定概率下的总体均数范围 C)求出总体均数可信区间后，即可推断总体均数肯定会在此范围内

D)95%是指此范围包含总体均数在内的可能性是95%，即估计错误的概率是5% 试题来源:【2016公卫执业医师考试宝典免费下载】小编教你如何快速通过公卫执业医师考试查看其他试题，请扫描二维码，立即获得本题库手机版详情咨询 7.总体率可信区间的估计符合下列( C )情况时，可以借用正态近似法处理。 A)样本例数n足够大时B)样本率p不太大时 C)np和n(1-p)大于5时D)p接近1或0时 8.正太近似法估计总体率95%可信区间用( D )。 A)p±1.96s B)p±1.96σ C)p±2.58σD)p±1.96sp 9.统计推断的内容( C )。 A)用样本指标估计相应总体指标B)假设检验 C)A和B答案均是D)估计参考值范围 10.关于假设检验，下列哪个是正确的( A )。 A)检验假设是对总体作的某种假设 B)检验假设是对样本作的某种假设

卫生统计学题库56025

最佳选择题 1. 收集资料的方法是：E A. 收集各种报表 B.收集各种工作记录 C.进行专题调查 D. 进行科学实验 E.以上都对 2. 统计工作的基本步骤是：D A. 调查资料、审核资料、整理资料 B.收集资料、审核资料、分析资料 C. 调查资料、整理资料、分析资料 D.收集资料、整理资料、分析资料 E. 以上都对 3. 在抽样研究中样本是：D A.总体中的一部分 B.总体中任意一部分 C.总体中典型部分 D. 总体中有代表性的一部分 E.总体中有意义的一部分 4. 计量资料、计数资料和等级资料的关系是：C A. 计量资料兼有计数资料和等级资料的一些性质 B. 计数资料兼有计量资料和等级资料的一些性质 C. 等级资料兼有计量资料和计数资料的一些性质 D. 计数资料有计量资料的一些性质 E. 以上都不是 5. 用图形表示某地解放以来三种疾病的发病率在各年度的升降速度，宜绘制 D : A.普通线图 B.直方图 C.构成比直条图 D.半对数线图 E.直条图 6. 直方图可用于： A.某现象的内部构成 B.各现象的比较 C.某现象的比较 D. 某现象的频数分布E某现象的发展速度 7. 统计图表的要求是： A.简单明了 B.层次清楚 C.说明问题明确 D.避免臃肿复杂 E.以上都对 8. 在列频数表时，分组数目一般为： A.5-10 B.8-15 C.10-30 D.15-20 E.> 20 9. 平均数作为一种统计指标是用来分析： A.计数资料 B.计量资料 C.等级分组资料 D.调查资料 E. 以上都不对 10. 表示变量值变异情况的常用指标是： A.全距 B.标准差 C.方差 D.变异系数 E.以上均是 11. 确定正常人某个指标正常值范围时，调查对象是： A.从未患过病的人 B.健康达到了要求的人 C.排除影响被研究指标的疾病和因素的人 D.只患过小病但不影响研究指标的人 E.排除了患过某病或接触过某因素的人 12. 标准误： A.与标准差呈反比 B.与标准差呈正比 C.与标准差的平方呈反比 D.与标准差平方呈正比 E.以上都不对 13. x是指： A.所有观察值对总体均数的离散程度 B.某一个样本均数的离散程度 C. 所有样本均数对总体均数的离散程度 D.某些样本均数对总体均数的离散程度

卫生统计学知识点(笔记)

第一章绪论 1.统计学（statistics）是一门处理数据中变异性的科学与艺术，内容包括收集、分析、解释和表达数据，目的是求得可靠的结果。 2.▲总体（population）用来表示大同小异的对象全体，例如一个国家的所有成年人；某地的所有小学生。可分为目标总体和研究总体。若试图对某个总体下结论，这个总体便称为目标总体（target population）；资料常来源于目标总体中的一个部分，它称为研究总体（study population）。需要谨慎的是，就研究总体所下的结论未必适用于目标总体。 3.▲样本（sample）是指从研究总体中抽取的一部分有代表性的个体。获取样本的过程称为抽样（sampling）。抽样研究的目的是用样本数据推断总体的特征。需要注意的是，统计学的结论从来就不是完全肯定或完全否定的，能不能成功地达到从样本推断总体的目的，关键是抽样的方法、样本的代表性和推断的技术。 4.▲同质（homogeneity）是指同一总体中个体的主要性质相同。 5.▲变异（variation）是指同质的个体之间存在的差异。 6.▲变量的类型二分类变量分类变量或名义变量定性变量多分类变量变量有序变量或等级变量定量变量离散型变量连续型变量变量的转化：只能由“高级”向“低级”转化，即由信息量多的向信息量少的类型转化，如：定量有序分类二值 7.▲参数（parameter）是反映总体特征的指标，参数的大小是客观存在的，是一个常数，不会发生变化，然而往往是未知的，需要通过样本资料来估计，如总

体均数μ，总体标准差σ。 8.▲统计量（statistic）又称样本统计量，是反映样本特征的指标，是由观察资料计算出来的，如样本均数 X，样本标准差S。统计学的任务就是依据样本统计量来推断总体参数。 9.▲概率与频率的区别：概率是参数，频率是统计量；频率总是围绕概率上下波动。当某事件发生的概率≤0.05时，即P≤0.05，统计学习惯上称该事件为小概率事件。 10.▲误差：表示统计量与参数之间的差别或测量值与真值之间的差别。可分为系统误差和随机误差，其中系统误差呈现倾向性偏大或偏小现象，是可以避免的；而随机误差，是非人为偶然因素所致，不可避免，但可通过增大样本量等措施使其减小。 11.因果与联系：存在联系未必有因果关系，需排除虚假关联、间接关联。大多数观察性研究，单靠统计学分析只能考察变量之间的联系，难以证明因果关系。

卫生统计学题库55974

盛年不重来，一日难再晨。及时宜自勉，岁月不待人。最佳选择题 1.收集资料的方法是：E A.收集各种报表 B.收集各种工作记录 C.进行专题调查 D.进行科学实验 E.以上都对 2.统计工作的基本步骤是：D A.调查资料、审核资料、整理资料 B.收集资料、审核资料、分析资料 C.调查资料、整理资料、分析资料 D.收集资料、整理资料、分析资料 E.以上都对 3.在抽样研究中样本是：D A.总体中的一部分 B.总体中任意一部分 C.总体中典型部分 D.总体中有代表性的一部分 E.总体中有意义的一部分 4.计量资料、计数资料和等级资料的关系是：C A.计量资料兼有计数资料和等级资料的一些性质 B.计数资料兼有计量资料和等级资料的一些性质 C.等级资料兼有计量资料和计数资料的一些性质 D.计数资料有计量资料的一些性质 E.以上都不是 5.用图形表示某地解放以来三种疾病的发病率在各年度的升降速度，宜绘制D ： A.普通线图 B.直方图 C.构成比直条图 D.半对数线图 E.直条图 6.直方图可用于： A.某现象的内部构成 B.各现象的比较 C.某现象的比较 D.某现象的频数分布 E.某现象的发展速度 7.统计图表的要求是： A.简单明了 B.层次清楚 C.说明问题明确 D.避免臃肿复杂 E.以上都对 8.在列频数表时，分组数目一般为： A.5-10 B.8-15 C.10-30 D.15-20 E.＞20 9.平均数作为一种统计指标是用来分析： A.计数资料 B.计量资料 C.等级分组资料 D.调查资料 E.以上都不对 10.表示变量值变异情况的常用指标是： A.全距 B.标准差 C.方差 D.变异系数 E.以上均是 11.确定正常人某个指标正常值范围时，调查对象是： A.从未患过病的人 B.健康达到了要求的人 C.排除影响被研究指标的疾病和因素的人 D.只患过小病但不影响研究指标的人 E.排除了患过某病或接触过某因素的人 12.标准误： A.与标准差呈反比 B.与标准差呈正比 C.与标准差的平方呈反比 D.与标准差平方呈正比 E.以上都不对 13.是指： A.所有观察值对总体均数的离散程度 B.某一个样本均数的离散程度 C.所有样本均数对总体均数的离散程度 D.某些样本均数对总体均数的离散程度 E.所有含量相同的样本均数对总体均数的离散程度 x