文档库 最新最全的文档下载
当前位置:文档库 › 卫生统计学

卫生统计学

卫生统计学
卫生统计学

第一章绪论

一,名词解释

1.参数:根据总体分布的特征而计算的总体统计指标。

2. 总体:研究目的确定的同质观察单位的全体。

3. 同质:总体中个体具有相同的性质。

4.变异:同质基础上的个体差异。

5.样本:从总体中随机抽取的有代表性的一部分观察单位,其实测值的集合。

6.统计量:由总体中随机抽取样本而计算的相应样本指标。

概率:描述随机事件发生的可能性大小的数值。(概率的统计定义:在一定条件下,重复做n次试验,nA为n次试验中事件A发生的次数,如果随着n逐渐增大,频率nA/n逐渐稳定在某一数值p附件,则数值p称为事件A在该条件下发生的概率。)

7.抽样误差:由个体变异的存在和抽样引起样本统计量与相应的总体参数间以及各样本统计量之间的差别。

二,问答题。

1.统计学的基本步骤有哪些?

答:统计学是一门处理数据中变异性的科学与艺术,它包括收集数据、分析数据、解释数据,以及表达数据。

2.总体与样本的区别与关系?

答:区别:样本是总体的一部分,联系:如果样本的均衡性较好,就能够代表总体的特征。

3. 抽样误差产生的原因有哪些?可以避免抽样误差吗?

答:一,个体差异引起;二,抽样方法引起。抽样误差不能避免,但可以随着样本含量的增大而减小。

4.何为概率及小概率事件?

答:概率是指在一定条件下,重复做n次试验,nA为n次试验中事件A发生的次数,如果随着n逐渐增大,频率nA/n逐渐稳定在某一数值p附件,则数值p称为事件A在该条件下发生的概率。小概率事件是指习惯上将P<=0.05或P<=0.01称为小概率事件,表示某事件发生的可能性很小。第二章定量资料的统计描述

一、名词解释

1.频数:对一个随机事件进行反复观察,其中某变量值出现的次数被称为频数。

2.方差:用来度量随机变量和数学期望(即均值)之间的偏离程度。

3. 标准差:也称均方差,是各数据偏离平均数的距离的平均数。

4.中位数:是指将原始观察值从小到大或从大到小排序后,位次局中的那个数。

5. 几何均数:变量对数值的算数均数的反对数。

6.四分位数间距:百分位数P75和百分位数P25之差。

7.正偏态分布:偏态分布是相对于正态分布而言的,如果频数分布的高峰向左偏移,长尾向右侧延伸为正偏态分布也叫右偏态分布。

8.负偏态分布:偏态分布是相对于正态分布而言的,如果频数分布的高峰向右偏移,长尾向左延伸则成负偏态分布,也叫左偏态分布。

9.变异系数:是衡量资料中各观测值变异程度的一个统计量,用标准差与平均数的比值来表示。

二、问答题。

描述数值变量资料集中趋势的指标有哪些?其适用范围有哪些?

答:常见的包括算术均数、几何均数、中位数。相同点:算数均数和中位数都适用于正态分布的资料。不同点:几何均数适用于可经对数转换为对称分布的资料;中位数适用于各种分

布的资料,常用于描述偏峰分布的资料。描述数值变量资料离散趋势的指标有哪些?其适用范围有何异同?

答:常见的包括:极差、四分位数间距、方差、标准差和变异系数。适用范围相同点:极差和四分位数间距可用于各种资料的分布;方差和标准差适用于对称分布,特别是正态分布的资料。不同点:极差易受样本含量的影响,很不稳定;四分位数间距特别适用偏峰分布资料;变异系数适用于量纲不同的变量间,或均数差别较大的变量间变异程度的比较。第三章定性资料的统计描述一,名词解释率:指某现象实际发生观察单位数与可能发生该现象的观察单位总数之比,用以说明某现象发生的频率或强度。构成比:是指事物内部某一组成部分观察单位数与该事物内部各组成部分观察单位总数之比,用以说明某一事物内部各组成部分所占的比重或分布,常用百分数表示。

相对比:是指两个有关联的指标之比,用以说明一个指标是另一个指标的几倍或几分之几。人口金字塔:是将人口的性别和年龄资料结合起来,以图形的方式表达人口的性别和年龄构成。它以年龄为纵轴,人口数构成为横轴,左侧为男,右侧为女而绘制的两个相对应的直方图,可以分析过去人口的出生死亡情况以及今后人口的发展趋势。

标准化率:寻找一个统一的分布作为标准组,然后每个比较组均按该分布标准计算相应的率,所得到的率是相对于标准组的,故称为标准化率。标准化死亡比(SMR):实际死亡人数与期望死亡人数之比。

期望寿命:指0岁时的预期寿命。一般用“岁”表示。即在某一死亡水平下,已经活到X 岁年龄的人们平均还有可能继续存活的年岁数。

动态数列:按时间顺序将一系列统计指标(可以为绝对数,相对数或平均数)排列起来,用以观察和比较该事物在时间上的变化和发展趋势。二、问答题

请说明频率型指标与强度型指标的主要区别?

答:主要区别:指标的解释不同,频率型指标是表示事物内部某个组成部分所占的比重或分布,或指某现象发生的频率。强度型指标是指单位时间内某现象发生的频率。标准化法的基本思想?

答:采用统一的标准,以消除重要因素的构成不同对粗率的影响,使通过标准化后的标准化率具有可比性。请比较发病率和患病率的不同。

答:发病率表示一定时期内,在可能发生某病的一定人群活过的总人年数中,新发生的某病病历数,其分子是新病历数,分母是总人年数;患病率,又称现患率,指某时点上受检人数中先患某种病的人数,通常用于描述病程较长或发病时间不易明确的疾病的患病情况,其分子包括新旧病例数,分母是受检总人数。在一定的人群和时间内,发病率和患病率有密切关系,两者与病程(D)的关系是:PR=IR×D。请比较死亡率与病死率的不同。

答:死亡率与病死率的分子是一样的,均表示因某病死亡的人数,但死亡率的分母是

总人年数,侧重反映发生的强度,或单位时间内死亡的概率;病死率的分母是患某病的人数,反映疾病死亡的概率。

应用相对数应注意的事项。

答:1.分析时不能以构成比代替率;2.应用相对数对比分析时,要考虑资料是否具有可比性;

3.计算相对数时分母应有足够数量;

4.对观察单位数不等的几个率,不能直接相加求其平均;

5.样本率要检验。应用标准化的注意事项。

答:1.标准化的应用范围很广,适用于“某事件的发生率”可以是治愈率,也可以是患病率,还可以是发病率、病死率等。当某个分类变量在两组中分布不同时,这个分类变量就成为两组频率比较的混杂因素,标准化法的目的就是消除这个混杂因素的影响。2.标准化后的标准化率,已经不再反映当时当地的实际水平,它只是表示相互比较的资料间的相对水平。3.标准化法的实质是找一个“标准“,使两组得以在一个共同的”平台“上进行比较。4.两样

本标准化率是样本值,存在抽样误差。比较两样本的标准化率,当样本含量较小时,还应作假设检验。

第四章统计表与统计图一、问答题

依次写出箱式图中涉及到的各个取值。

答:由大到小的次序为:极大值、P75、中位数、P25和极小值。直方图中各矩形的高度等于频数(或频数),对吗?

答:对于各组距相等的情形,该说发是对的。若某些组段的组距与多数阻段所取组距不同时,例如前者是后者的k倍,则该不等距组段的高度为频数(频率)除以k。确切地说,组段对应的面积等于频数(频率)。统计表的列表原则是什么?

答:一是重点突出,简单明了;二是主谓分明,层次清楚,符合逻辑。线图和半对数线图的主要区别是什么?

答:线图的纵轴尺度为算术尺度,用以表示某指标随时间的变化趋势;半对数线图的纵轴尺度为对数尺度,用以表示某指标随时间的增长或减少速度。第五章常用概率分布一、名词解释

正态分布:是一种很重要的连续型分布,以均数为中心,左右两侧对称,靠均数两侧的频数较多,离均数越远,频数越少,形成钟形分布。

Poisson分布:是一种离散型分布,用以在单位时间、空间、面积等的罕见时间发生次数的概率分布。二项分布:对只有两种互斥结果的离散型随机事件的规律性进行描述的一种概率分布。医学参考值范围:是指特定的“正常”人群(排除了对所研究指标有影响的疾病和有关因素的特定人群)的解剖、生理、生化指标及组织代谢产物含量等数据中大多数个体的取值所在的范围。人们习惯用该人群中95%的个体某项医学指标的取值范围作为该指标的医学参考值范围。二、问答题

医学参考值范围确定的方法是什么?答:百分位数法和正态分布法。

简述二项分布、Poisson分布、正态分布的区别与联系。

答:区别:二项分布、Poisson分布是离散型概率分布,用概率函数描述其分布状况,而正态分布是连续型概率分布,用密度函数和分布函数描述其分布状况。联系:Poisson分布可以视为n很大而π很小的二项分布。当n很大而π和1—π都不是很小的时候二项分布渐近正态分布,当λ》=20的时候Poisson分布渐近正态分布。控制图的基本原理。

答:如果某一波动仅仅由个体差异或随机测量误差所致,那么观察结果服从正态分布;依据标准正态分布曲线下面积的分布规律性,确定出现概率非常小的若干情况作为异常标准;如果出现相应结果则判为异常。二项分布的特征?

答:二项分布图的高峰在μ=nπ处或附近;π为0.5时,图形是对称的;当π不等于0.5时,分布不对称,且对同一n,π离0.5愈远,对称性愈差。对同一π,随着n的增大,分布趋于对称。当n→∞时,只要π不太靠近0或1,二项分布趋于对称。 Poisson分布的特征?答:(1)Poisson分布的总体均数与总体方差相等,均为λ。(2)当λ较小时,图形呈偏态分布;当λ较大时,图形呈正态分布。(3)Poisson分布的观察结果具有可加性。正态分布曲线的位置与形状的特点?答:(1)关于χ=μ对称。(2)在χ=μ处取得该概率密度函数最大值,在χ=μ±σ处有拐点。(3)曲线下面积为1。(4)μ决定曲线在横轴上的位置,μ增大,曲线沿横轴向右移;反之,μ减小,曲线沿横轴向左移。(5)σ决定曲线的形状,当μ恒定时,σ越大,数据越分散,曲线越“矮胖”;σ越小,数据越集中,曲线越“瘦高”。第六章参数估计基础一、名词解释

统计推断:抽样研究的目的是用样本信息来推断相应总体的特征,这一过程称为统计推断。参数估计:如何由样本统计指标来推断总体相应指标。

假设检验:如何由样本差异来推断总体之间是否可能存在差异。标准误SEM:样本均数的

标准差,即均数的标准误。

置信区间CI:将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为总体参数的置信区间。

t分布:在实际的工作中,往往σ是未知的,常用s作为σ的估计值,为了与μ变换区别,称为t变换,统计量t值的分布称为t分布。二、问答题

t分布图形的特征?答:(1)单峰分布,以0为中心,左右对称;(2)ν越小,t值越分散,曲线的峰部越矮,尾部越高;(3)随着ν逐渐增大,t分布逐渐接近标准正态分布;当ν趋向∞时,t分布趋近标准正态分布。总体分布的形态和样本含量对样本均数的抽样分布会产生何种影响?

答:无论原始数据的总体分布形态如何,即对于任意分布而言,在样本含量足够大时,其样本均数的分布近似于正态分布,且样本均数的均数等于原分布的均数,样本均数的标准误有公式(6-1)计算。样本均数的标准误的意义是什么?与原变量的标准差有何区别与联系?答:样本均数的标准误可以反映样本均数之间的离散程度及抽样误差的大小。标准误与标准差的区别:(1)概念不同,标准差表示样本个体间的变异程度,标准误表示样本均数间的变异程度。(2)用途不同,标准差常用于表示变量值对均数波动的大小,当资料呈正态分布时,与均数结合可估计医学参考值范围,计算变异系数等;标准误常用于表示样本统计值(样本均数、样本率)对总体参数(总体均数、总体率)的波动情况,可估计参数的可信区间,进行假设检验等。(3)它们与样本含量n的关系不同,当样本含量n增大时,标准差趋近于σ,而标准误随n的增大而减小,趋近于0。联系:均是变异指标;当样本量n一定时,标准误与标准差呈正比。用同一个样本统计量分别估计总体参数的95%置信区间和99%置信区间,哪一个估计的精度更好?为什么?答:95%置信区间的精度要好于99%置信区间。因为置信度或置信水平有95%提高到99%时,置信区间由窄变宽,估计的精度下降。

满足什么条件时可以采取正态近似法估计总体概率的置信区间?答:当n足够大,且样本频率p和1—p均不太小时,如np与n(1—p)均大于5时,可用正态近似法求总体概率的置信区间。

参考值范围与置信区间有何区别?答:区别:(1)意义不同:参考值范围是指通知总体中包括一定数量(如95%或99%)个体值的估计范围。可信区间是指按一定的可信度来估计总体参数所在范围。(2)计算方法不同。第七章假设检验基础一、名词解释

检验效能:当所研究的总体与H0确有差别时,按检验水平α能够发现它(拒绝H0)的概率。(当两总体确有差异,按规定检验水准α所能发现该差异的能力。)

变量变换:对资料数据进行数学变换,使得变换后的资料符合参数方法条件的一种方法。第Ⅰ型错误:如果实际情况与H0一致,仅仅由于抽样的原因,使得统计量的观察值落到拒绝域,拒绝原本正确的H0,导致推断结论错误,称为第Ⅰ型错误。

第Ⅱ型错误:如果实际情况与H0不一致,仅仅由于抽样的原因,使得统计量的观察值落到接受域,不能拒绝原本错误的H0,导致推断结论错误,称为第Ⅱ型错误。二、问答题

假设检验的理论依据是什么?(或者问基本思想)答:采用逻辑上的反证法,利用“小概率思想”。小概率思想是是指概率事件(p<0.05或p<0.01)在一次试验中基本上不会发生。反证法思想是先提出假设(检验假设H0),再用适当的统计方法确定假设成立的可能性大小,如可能性小,则认为假设不成立;如可能性大,则还不能认为假设不成立。假设检验的一般步骤。答:(1)根据所讨论的实际问题建立原假设H0及备择假设H1;(2)选择合适的检验统计量,并明确其分布;(3)对预先给定的小概率α,由确定临界值;(4)由样本值具体计算统计量的观察值,并作出判断接受H0还是拒绝H0。

假设检验的两类错误之间的区别与联系是什么?

答:假设检验时,拒绝实际上成立的H0,犯第Ⅰ类错误,俗称“弃真”错误;不拒绝实际

上并不成立的H0,范第Ⅱ类错误,俗称“存伪”错误。犯第Ⅰ类错误错误的概率用α表示,假设检验时,根据研究者的要求来确定;犯第Ⅱ类错误的概率用β表示,它只有与特定的H1结合起来才有意义。对于某一具体的检验来说,当样本含量n一定时,α越小,β越大;α越大,β越小。检验假设中P值的意义是什么?

答:如果总体状况与H0一致,统计量获得现有数值以及更不利于H0的数值的概率。如何确定检验水准?

答:检验水准确定需根据研究设计的类型、研究目的、变量类型及变异水平、样本大小等诸多因素。如何恰当地应用单侧与双侧检验?

答:单侧与双侧检验的应用首先应考虑所要解决问题的目的,根据专业知识来确定。若从专业知识判断一种方法的结果不可能低于或高于另一种方法的结果时,可用单侧检验;在尚不能从专业知识判断两种结果谁高谁低时,则用双侧检验。一般认为双侧检验较保守和稳妥。 t 检验的应用条件是什么?答:(1)随机事件,(2)来自正态分布总体,(3)均数比较时,要求两总体方差相等。应用假设检验需要注意的问题?

答:1.要有严密的研究设计 2.应用检验方法必须符合其适用条件3.适当选择检验水准α 4.正确理解P值的意义5.统计“显著性”与专业“显著性”。第八章方差分析一、名词解释

方差分析:又称F检验,是通过对数据变异的分解来判断不同样本所代表的总体均值是否相同,用于比较两个或两个以上均数的差别。

析因分析:是将两个或多个实验因素的各水平进行全面组合的实验,能够分析各实验因素的单独效应、主效应和因素间的交相呼应。二、问答题

方差分析的基本思想是什么?

答:方差分析的基本思想是把全部观察值间的变异按设计和需要分解成两个或多个组成部分,然后将各个部分的变异与随机误差进行比较,以判断各部分的变异是否具有统计学意义。方差分析的应用条件是什么?答:(1)各样本是相互独立的随机样本,(2)都采自正态总体,(3)各个总体方差相等。第九章卡方检验

卡方检验的应用条件有哪些?答:课本P174小结3 卡方检验的用途。

答:χ2检验常用于分类变量资料的统计阶段。主要包括单样本分布的拟合优度;比较两个或多个独立样本频率或独立样本频率分布;比较配对设计两样本频率和两频率分布。

比较两个独立样本频率分布的χ2检验,和比较两个配对样本频率分布的χ2检验在设计方法、资料整理、假设检验等方面的差别是什么?

答:前面针对的是“两独立样本”,行合计是事先固定的;而后者实质上是一组样本,及时可以看成两个样本,也是“两个互不独立的样本”,样本含量都是n,是固定的,而行合计与列合计却是事先不确定的。

前者原始数据可以表示为教材中表9-3所示的四格表形式,而后者原始数据表示为表9-9所示的四格表形式。检验统计量,前者用教材中公式9-5和公式9-7,而后者用9-9和9-10。如果实验效应应用等级资料表示,欲比较两组总体效应间差别是否有统计学意义,为什么不能用χ2检验?请举例说明。

答:关键在于此时χ2检验差别有统计意义,只能推断两频率分布不同,而频率分布不同不能说明两总体平均水平不同。

第十章基于秩次的非参数检验

一、名词解释

参数检验:凡是以特定的总体分布为前提,对未知的总体参数做推断的假设检验方法。

非参数检验:非参数检验对总体分布不作严格限定,不受总体分布的限制,又称任意分布检验,它直接对总体分布作检验。

二、问答题

非参数检验适用条件?

答:①等级资料。②总体分布类型不明的资料。③分布不对称且无法转化为正态分布的资料。

④对比组间方差不齐,又无适当变换方法达到方差齐性的资料。⑤一端或两端观察值不确切的资料或个别数据偏离过大。秩和检验有哪些优缺点?

答:其主要的优点:①不依赖总体分布类型,也不总体参数进行推断②收集资料方便③简便易于理解和掌握。主要缺点:损失部分信息,降低检验功效。

两组或多组有序分类资料的比较,为什么宜用秩和检验而不是χ2检验?

答:指标为等级资料,宜用多组有序变量资料的秩和检验;若采用列联表χ2检验进行分析,其比较的就不再是实验效应,而是几组资料的间的分布有无差别,即比较几类资料构成比总体上有无不同,所以不能用χ2检验。两独立样本比较的Wilcoxon秩和检验,当n1>10或n2—n1>10时用Z检验,这时检验是属于参数检验还是非参数检验,为什么?

答:属于非参数检验,因为这时的Z检验是比较例数较小组秩和与其总体均数n(N+1)/2的差别。

第十一章两变量关联性分析

一,名词解释

自变量:指实验中由于实验者所操纵的因素或条件。因变量:指实验中由于实验变量而引起的变化和结果。线性相关系数:又称Pearson积距相关系数,是定量描述两个变量间线性关系密切程度和相关方向的统计指标。线性相关:两个变量间呈现线性变化趋势的关系称为线性相关。

二、问答题

线性相关中应注意的问题?答:(1)样本相关系数接近0并不意味着两变量间一定无相关性;(2)变量的数值不能人为选定;(3)出现异常值时慎用相关;(4)相关未必真存在内在联系;(5)分层资料盲目合并易出假象。 Pearson积距相关与Spearman等级相关有何异同?答:Pearson积距相关与Spearman等级相关的应用条件不同,前者要求数据服从二元正态分布,属于参数方法;而后者可不满足正态分布条件,为非参数法;相同点都是用来解决两变量间的线性相关程度的大小,相关系数的含义、单位、取值范围一致,且计算公式相同,不过一个直接用原始的定量数据,另一个则要用等级数据。

比较分类变量的两个样本或多个样本的频数分布所采用的χ2检验与关联性分析的χ2检验有何异同?

答:分类变量的两样本与多个样本频数分布比较的χ2检验是对两样本或多个样本比较,而关联性分析的χ2检验却是探讨一份样本的两种属性所对应的两个变量间的关系,研究的问题不同、设计不同、检验假设不同、意义不同、结论不同;相同的仅是计算统计量的工具。分类变量配对的2×2资料在什么情况下用McNemerχ2检验,什么情况下用Pearson χ2检验?

答:分类变量配对设计的2×2频数资料若是作两组频数比较,则用McNemerχ2检验,若是作两变量间关联性分析则用Pearson χ2检验?

第十二章简单回归分析

一,名词解释

1. 线性回归:是利用数理统计中的回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法之一。

2. 决定系数:回归平方和与总离均差平方和之比称为决定系数。二,问答题

1. 线性回归模型的适用条件:线性、独立、正态、等方差。

2. Ⅰ型回归和Ⅱ型回归的区别与联系?

答:前者要求Y为随机变量,服从正态分布,X可人为取值;后者X,Y均为随机变量,均

服从正态分布。 3. 置信带的意义是什么?

答:在满足线性回归的假设条件下,可以认为真实的回归直线落在两条弧形曲线所形成的区带内,其置信度为1—α。

4. 线性回归分析中应该注意哪些问题?答:(1)作简单线性回归分析要有实际意义,不要把豪无关联的两种现象强加在一起作回归分析。在理论上,任何成对的两组数据都可以获得一个唯一的线性回归方程,并有可能作回归系数的假设检验有统计学意义。(2)在作线性回归分析前,一定要绘制散点图,观察全部数据点的分布趋势,只有存在线性趋势时,才可以进行线性回归分析。(3)线性回归方程的适用范围一般以自变量的取值范围为限,若无充分理由证明超过自变量取值范围仍是直线,应该避免外延。(4)作线性回归分析有统计学意义不等于有实际意义,考察线性回归方程的实际效果用决定系数R2的大小,而不是线性回归分析的假设检验的概率P值。

5. 简述线性相关与线性回归的区别与联系?

答:联系:①r(相关系数)与b(回归系数)可相互换算;②r与b的假设检验等价;③r 与b正负号一致;④回归可解释相关,相关系数的平方r(对称决定系数)是回归平方与总的离均差平方和之比,故回归平方和是引入相关变量后总平方和减少的部分tr=tb=F。区别:①资料要求上相关X,Y正态分布,回归Y正态分布;②应用上:相关说明相关关系,回归说明依存关系。③意义上:r说明两变量关系程度与方向b表示x增

或改变,使Y改变b个单位;㈣计算上:b=Lαy/Lαx, r=Lxy/LxxLyy

;⑤取值范围:-∞<b>+∞,-1≤r≤1;⑥单位:b有单位,r无单位。

卫生统计学名词解释

1.总体:总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 2.随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。 3.变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。 4.计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、脉搏(次/分)、血压(KPa)等 计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为 +、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 5.概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。0﹤P(A)﹤1。频率:在相同的条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现的频率(freqency)。当试验重复很多次时P(A)= m/n。 2.概率是描述随机事件发生可能性大小的数值,常用P表示。随机事件概率的大小在0与1之间,P越接近1,表示某事件发生的可能性越大;P越接近0,表示某事件发生的可能性越小。习惯上将P≤0.05的事件,称为小概率事件,表示在一次实验或观察中该事件发生的可能性很小,可视为不发生。 6. 随机误差:随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的差。它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 7.系统误差:系统误差(systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计和完善技术措施来消除或使之减少。 8.随机变量:随机变量(random variable)是指取指不能事先确定的观察结果。随机量的具体内容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且,理论上讲,每个变量的取值服从特定的概率分布。 9.参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。 10.统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 11.频数表(frequency table)用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。对于离散数据,每一个观察值即对应一个频数,如某医院某年度一日内死亡0,1,2…个病人的天数。对于散布区间很大的离散数据和连续型数据,数据散布区间由若干组段组成,每个组段对应一个频数。 12.算术均数(arithmetic mean)描述一组数据在数量上的平均水平。总体均数用μ表示,样本均数用X 表示。 13.几何均数(geometric mean)用以描述对数正态分布或数据呈倍数变化资料的水平。记为G。 14.中位数(median)Md将一组观察值由小到大排列,n 为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。反映一批观察值在位次上的平均水平。 15.极差(range)亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。 16.百分位数(percentile)是将n 个观察值从小到大依次排列,再把它们的位次依次转化为百分位。百分位数的另一个重要用途是确定医学参考值范围。

卫生统计学考试重点总结复习

一、绪论 1.总体:根据研究目的确定的同质观察单位的全体,确切的说是同质的所有观察单位某种变量值的集合。 2.样本:从总体中随机抽取部分观察单位所组成的集合。 3.参数:用样本的指标来推算或估计出来的,用来说明总体情况的统计指标。 4.统计量:根据观察值计算出来的量,是用来描述和分析样本的统计指标。 5.变量的类型及其转换: ①定性变量:a.分类变量(计数资料)i.二分类变量 ii.多项无序分类 b.有序变量(等级资料) ②定量变量:a.连续型变量 b.离散型变量 变量只能由“高级”向“低级”转化:定量→有序→分类→二值。 6.概率:是描述随机事件发生的可能性大些的数值。 7.卫生统计学的内容包括:统计学是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。 8.卫生统计学:运用概率论和数理统计的原理和方法并结合医学实践来研究医学资料的搜集、整理、分析与推断的一门学科。 9.卫生统计学的研究对象:有变异的事物。 10.统计工作的一般步骤:设计资料、搜集资料、整理资料、分析资料。 11.同质:指同一总体中个体的性质、影响条件、背景相同或非常相近。 12.变异:同一总体内的个体间存在差异又是绝对的,这种现象称为变异。 13.误差可分为:系统误差、随机测量误差、抽样误差。 14.抽样误差:由于个体差异的存在,从某一总体中随机抽取一个样本,所得样本统计量与总体参数之间可能存在差异,这种差异称为抽样误差。 二、定量资料的统计描述 1.频率分布表的编制步骤: ①计算极差R、②确定组段数与组距(一般为8-15组)、③确定各组段的上下限、④列表。 2.频率分布表的用途: ①揭示频数分布的分布特点和分布类型,文献中常将频数表作为陈述资料的形式。 ②便于进一步计算统计指标和进行统计分布处理。 ③便于发现某些特大和特小的可疑值。 ④当样本含量比较大时,可用各组段的频率作为概率的估计值。 3.中位数:指将原始观察值从小到大或从大到小排序后,位次居中的那个数。 4.四分位数间距:表示百分位数P75和百分位数P25之差,定义为Q=P75-P25,恰好包括总体中50%的个体观察值,用来描述偏态分布资料的离散趋势的指标。 5.标准差:即方差的算术平方根,是衡量对称分布资料的离散程度的指标,标准差大,则离散度大,标准差小,则离散度小。 6.变异系数:变异的大小S相对于其平均水平X的百分比,主要用于量纲不同的变量间,或均数差别较大的变量间变异程度的比较。 三、定性资料的统计描述 1.构成比:说明一事物内部各组成部分在总体中所占的比重或分布,常用百分数表示。 =某一组成部分的观察单位数/同一事物内部各组成部分的观察单位总数×100% 2.相对数的类型:

卫生统计学试题汇总(印)

最佳选择题 1.收集资料的方法是:E A.收集各种报表 B.收集各种工作记录 C.进行专题调查 D.进行科学实验 E.以上都对 2.统计工作的基本步骤是:D A.调查资料、审核资料、整理资料 B.收集资料、审核资料、分析资料 C.调查资料、整理资料、分析资料 D.收集资料、整理资料、分析资料 E.以上都对 3.在抽样研究中样本是:D A.总体中的一部分 B.总体中任意一部分 C.总体中典型部分 D.总体中有代表性的一部分 E.总体中有意义的一部分 4.计量资料、计数资料和等级资料的关系是:C A.计量资料兼有计数资料和等级资料的一些性质 B.计数资料兼有计量资料和等级资料的一些性质 C.等级资料兼有计量资料和计数资料的一些性质 D.计数资料有计量资料的一些性质 E.以上都不是 5.用图形表示某地解放以来三种疾病的发病率在各年度的升降速度,宜绘制D : A.普通线图 B.直方图 C.构成比直条图 D.半对数线图 E.直条图 6.直方图可用于: A.某现象的内部构成 B.各现象的比较 C.某现象的比较 D.某现象的频数分布 E.某现象的发展速度 7.统计图表的要求是: A.简单明了 B.层次清楚 C.说明问题明确 D.避免臃肿复杂 E.以上都对 8.在列频数表时,分组数目一般为: A.5-10 B.8-15 C.10-30 D.15-20 E.>20 9.平均数作为一种统计指标是用来分析: A.计数资料 B.计量资料 C.等级分组资料 D.调查资料 E.以上都不对 10.表示变量值变异情况的常用指标是: A.全距 B.标准差 C.方差 D.变异系数 E.以上均是 11.确定正常人某个指标正常值范围时,调查对象是: A.从未患过病的人 B.健康达到了要求的人 C.排除影响被研究指标的疾病和因素的人 D.只患过小病但不影响研究指标的人 E.排除了患过某病或接触过某因素的人 12.标准误: A.与标准差呈反比 B.与标准差呈正比 C.与标准差的平方呈反比 D.与标准差平方呈正比 E.以上都不对 13. x σ是指: A.所有观察值对总体均数的离散程度 B.某一个样本均数的离散程度 C.所有样本均数对总体均数的离散程度 D.某些样本均数对总体均数的离散程度 E.所有含量相同的样本均数对总体均数的离散程度 14. 2.58X X S ±表示: A.95%的正常值范围 B.95%的可信区间 C.99%的正常值范围

最新卫生统计学试题及答案(附解释)资料

卫生统计学试题及答案(一) 1.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______. A.普通线图 B.半对数线图 C.直方图 D.直条图 E.复式直条图 【答案】C(6——16岁为连续变量,得到的是连续变量的频数分布) 2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______. A.直方图 B.普通线图 C.半对数线图 D.直条图 E.复式直条图(一个检测指标,两个分组变量) 【答案】E ? 3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用______. A.直方图 B.普通线图(适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的发展变化趋势) C.半对数线图(适用于随时间变化的连续性资料,尤其比较数值相差悬殊的多组资料时采用,线段的升降用来表示某事物的发展速度) D.直条图 E.复式直条图 【答案】E 4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。若要研究该疫苗在该地儿童中的接种效果,则______. A.该研究的样本是1000名易感儿童 B.该研究的样本是228名阳性儿童 C.该研究的总体是300名易感儿童 D.该研究的总体是1000名易感儿童 E.该研究的总体是228名阳性儿童 【答案】D 5.若要通过样本作统计推断,样本应是__________. A.总体中典型的一部分 B.总体中任一部分 C.总体中随机抽取的一部分 D.总体中选取的有意义的一部分 E.总体中信息明确的一部分 【答案】C 6.下面关于均数的正确的说法是______. A.当样本含量增大时,均数也增大 B.均数总大于中位数 C.均数总大于标准差

10级-卫生统计学-整理资料

卫生统计学 第一章绪论 1、卫生统计学的概念(P1) 卫生统计学是应用概率论和数理统计学的基本原理和方法,研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学,是卫生及其相关领域研究中不可缺少的分析问题。 2、卫生统计学的4个基本步骤(P3): 设计、收集资料、整理资料、分析资料 3、卫生统计学的几个基本概念(P4): ⑴同质:在统计学中,若某些观察对象具有相同的特征或属性,我们就称 之为同质,或具有同质性。 ⑵变异:同质个体的某项特征或属性的观察值或测量值之间的差异。 ⑶总体:同质的所有观察单位某种特征或属性的观察值或测量值的集合。 ⑷样本:从总体中随机抽取的具有代表性的部分观察单位的集合。样本中 包含的观察单位个数成为样本含量。 ⑸参数:反映总体特征的指标,一般是未知的,常用希腊字母表示,如总 体均数μ、总体率π等。 ⑹统计量:根据样本观察值计算出来的指标,常用拉丁字母表示,如样本 均数?x 、样本率ρ等。 ⑺变量与资料:对每个观察单位进行观察或测量的某项特征或属性称为变 量;变量值的集合成为资料。

⑻定量资料:亦称计量资料,其变量值是定量的,表现为数值大小,一般 有度、量、衡单位。 ⑼定性资料:亦称分类资料,其观察值是定性的,表现为互不相容的类别 或属性,一般无度、量、衡单位。可细分为:①计数资料;②等级资料 第二章调查研究设计 ★1、调查研究的特点(P7): ①不能人为施加干预措施;②不能随机分组; ③很难控制干扰因素;④一般不能下因果结论 2、常用抽样方法(名称、原理): ⑴单纯随机抽样:先将调查总体的全部观察单位统一编号,然后采用随机数 字表、统计软件或抽签方法之一随机抽取n(样本大小)个编号,由这n 个编号所对应的n个观察单位构成研究样本。 ⑵系统抽样:又称机械抽样或等距抽样。事先将总体内全部观察单位按某一 顺序号等距分成n(样本大小)个部分,每一部分内含m个观察单位;然后从第一部分开始,从中随机抽出第i号观察单位,依此用相等间隔m机械地在第2部分、第3部分直至第n部分内各抽出一个观察单位组成样本。 ⑶分层抽样:先按对观察指标影响较大的某项或某几项特征,将总体分成若 干层,该特征的测定值在层内变异较小,层间变异较大,然后分别从每一层内随机抽取一定数量的观察单位结合起来组成样本。 ⑷整群抽样:将总体划分为群(初级观察单位),各群由次级观察单位组 成,随机抽取一部分群,调查抽中群的全部次级观察单位。 第三章实验设计 ★1、实验设计的特点(注意与调查研究的特点的区别):

卫生统计学试卷(含答案)

卫生统计学试卷 姓名:__________ 考试时间:_______ ___ (本大题满分40分,每小题1分) 1. 算术均数适用于:( ) A. 偏态分布资料 B. 分布类型不明的资料 C. 对数正态分布资料 D. 以上都不是 E. 正态分布资料 2. 某医生在进行科室病例资料统计时,拟用算术平均数表示平均水平,应当选用什么样的资料:( ) A. 性质不同的变量值 B. 差异相同的变量值 C. 性质相同的变量值 D. 个体差异较大的变量值 E. 个体差异较小的变量值 3. 均数与标准差适用于:( ) A. 正态分布 B. 正偏态分布 C. 不对称分布 D. 偏态分布 E. 负偏态分布 4. 样本含量的估计是( )。 A. 不必估计,调查整个总体最好 B. 保证研究结论具有一定可靠性的前提下确定的最少例数 C. 经济条件允许的情况下,越多越好 D. 时间允许的情况下,越多越好 E. 根据实际情况,能选多少是多少 5. 标化后的总死亡率:( ) A. 它反映了事物实际发生的强度 B. 以上都不对 C. 它反映了实际水平 D. 它不随标准选择的变化而变化 E. 仅仅作为比较的基础,它反映了一种相对水平 6. 下面说法中不正确的是( )。 A. 抽样误差的大小一般用标准误来表示 B. 好的抽样设计方法,可避免抽样误差的产生 C. 没有个体差异就不会有抽样误差 D. 抽样误差是由抽样造成的样本统计量与总体参数间的差别及样本统计量间的差别 E. 医学统计资料主要来自统计报表、医疗工作记录、专题调查或实验等 7. 计算某血清血凝抑制抗体滴度的平均水平,宜用:( ) A. 四分位数 B. 几何均数 C. 相对数 D. 中位数 E. 均数 8. 变异系数是表示资料的:( ) A. 对称分布 B. 平均水平 C. 相对变异 D. 集中趋势 E. 变异数 9. 统计上所说的样本是指:( ) A. 总体中的每一个个体 B. 按照随机原则抽取总体中有代表性部分 C. 按照研究者要求抽取总体中有意义的部分 D. 有意识的抽取总体中有典型部分 E. 随意抽取总体中任意部分 10. 一群7岁男孩身高标准差为5cm,体重标准差为3kg,则二者变异程度比较:( ) A. 身高变异小于体重 B. 身高变异不等于体重 C. 身高变异等于体重

卫生统计学知识点总结

卫生统计学知识点总结-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

卫生统计学 统计工作基本步骤:统计设计(调查设计和实验设计)、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断(参数估计和假设检验)】。 ★统计推断:是利用样本所提供的信息来推断总体特征,包括:参数估计和假设检验。a参数估计是指利用样本信息来估计总体参数,主要有点估计(把样本统计量直接作为总体参数估计值)和区间估计【按预先设定的可信度(1-α),来确定总体均数的所在范围】。b假设检验:是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。 变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化,通常是由高级向低级转化。 资料按性质可分为计量资料、计数资料和等级资料。 定量资料的统计描述 1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。 2频率分布表(图)的用途:①描述资料的分布类型;②描述分布的集中趋势和离散趋势;③便于发现一些特大和特小的可疑值;④便于进一步的统计分析和处理;⑤当样本含量足够大时,以频率作为概率的估计值。 ★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。 (1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。 (2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。 标准差的应用:①表示变量分布的离散程度;②结合均数计算变异系数、描述对称分布资料;③结合样本含量计算标准误。 定性资料的统计描述 1定性资料的基础数据是绝对数。描述一组定性资料的数据特征,通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。 2 指标频率型指标强度型指标相对比型指标 概念近似反映某一时间出现概率单位时间内某现象的发生 率 两个有关联的指标A和B之比 计算 公式 A/B 有无 量纲 无有可有、可无 取值 范围 【0,1】可大于1无限制 本质大样本时作为概率近似值分子式分母的一部分频率强度,即概率强度的 似 值 表示相对于B的一个单位,A有多少 位 A和B可以是绝对数、相对数和平均

卫生统计学-第六版

一、名词解释:' ]6 H0 p3 ?' n- |3 a. { p0 l1 U4 ? 1、总体是根据研究目的确定的同质观察单位的全体。- I7 k$ _, J" @: Y, B" u 2、样本是从总体中随机抽取的部分观察单位。 3、总体参数是根据总体个体值统计算出来的描述总体的特征量。 4、样本统计量是根据样本个体值统计计算出来的描述样本的特征量。% v, |* O: j/ D0 ?2 C 5、变量:对某项变异特征进行测量和观察,得到的指标。 6、计量资料:对某个观察单位用定量的方法测定某项指标量的大小,所得的资料。 7、计数资料:将观察单位按某种属性或类别分组,所得的观察单位数。 8、等级资料:将观察单位按测量结果的某种属性的不同分组,所得的观察单位数。 9、概率:是描述随机事件发生的可能性大小的数值,用P表示。 10、小概率事件:习惯上将≤0.05(1分),称为小概率事件,表示在一次实验或观察中该事件发生的可能性很少,可视为不发生。 11、抽样误差:由抽样造成的样本统计量和总体参数的差别。& b n. D4 Q8 G& h7 q6 r' f 12、频数表:当变量值个数较多时,可将各变量值及其相应的频数列表。- h( F6 D: ^5 ~7 @; _ 13、中位数:一组按大小顺序排列的变量值,位次居中的观察值。 14、极差:又称全距,指所有观察值最大值与最小值的差值。 15、百分位数:是一种按大小顺序排列的变量值分为100份,理论上有x%的变量值比它小,有(100-x)%变量值比它大,对应x%位次的数值。 16、四分位数间距:变量值中上四分位数p75与下四分位数p25的差值。' H6 s7 r; o- n) f$ A2 D m 17、方差:各个变量值的离均差平方和样本例数之比,描述资料的离散趋势。 ?0 y5 c% r2 o y {8 ^7 w' A8 P 18、标准差:方差开方,是描述数据分布离散程度(或变量变化的变异程度)的指标。 19、变异系数:样本标准差与均数之比的百分数,描述资料的离散趋势。 20、标准正态分布:均数为0,标准差为1的正态分布。即N(0,1)6 K. w' E& { c4 R( L7 F* T4 C8 } 21、集中趋势:所有观察值向均数集中靠拢的趋势。 22、卫生统计学:以医学为指导,用统计学的原理和方法研究医学的一门应用科学。它包括三个方面的内容:①卫生统计学的基本原理和方法。②健康统计。③卫生服务统计。9 Y/ [. X1 P' H! o5 B 23、离散趋势:是指观察值的参差不齐或者分散性。- t, R& v; x+ e& P 24、医学参考值范围:也称正常值范围,医学上常把绝大多数正常人(排除了有关疾病和因素对所研究指标有影响的所谓正常人)某项结构、功能、代谢产物指标范围,称为指标的正常值范围。0 u3 r6 E: F& J6 R; U 25、自由度:随机变量能自由取值的个数。7 E; h+ X# k# ?. G5 N0 Y% N" _! r 二、是非题:6 I7 v e# K' d6 } 1、变量值之间呈倍数或等比关系的数据,宜用几何均数表示其平均水平。 2、百分位数应用中提到,分布中间的百分位数相当稳定具有较好的代表性,但靠近两端的的百分位数只有在样本例数足够多时才能比较稳定。 3、为了解数值变量分布规律,可将观察值编制频数表,绘制频数分布图,用于描述资料的分布特征以及分布类型。 4、如果少数几个数据比大部分数据大几百倍一般就不宜计算均数。; I5 z. F) |3 p J5 o 5、原始数据有零,就不能直接计算几何均数。7 s# L) J5 j- I, Z% ~( N9 n; y 6、制定正常值范围应选足够数量正常人作为调查对象,所谓正常人就是排除影响被研究指

卫生统计学知识点

卫生统计学考点整理(一) 2017年11月24日 一、绪论: 1、什么是卫生统计学: 卫生统计学是运用数理统计的基本原理和方法对预防医学和公共卫生领域中的科学研究进行 设计,以及研究资料的收集、整理和分析的一门应用科室。 2、卫生统计学的基本内容包括哪些? ①卫生统计学的基本理论和方法,包括研究设计和数据分析中的统计理论和方法。 ②健康统计,包括医学人口统计、疾病统计和生长发育统计等。 ③卫生服务统计,包括卫生资源、医疗卫生服务的需求和利用、医疗保健制度和管理等的统计 问题。 3、什么是计量资料? 用度量衡的方法测定每个观察单位的某项研究指标量的大小,所得到的数据(即测量值)成为 计量资料(计量资料含有单位) 4、什么是计数资料? 将全体观察单位按照某种性质或类别进行分组,然后分别清点各组中的例数,这样得到的数据 成为计数资料(也称分类资料)(不含单位) 5、什么是等级资料? 将全体观察单位按照某种性质的不同程度分为若干组,分别清点各组中观察单位的个数。 6、什么是总体? 根据研究目的的确定的同质观察单位的全体。(是同质的所有观察单位某种变量值的集合) 7、什么是同质? 研究对象具有相同的背景、条件、属性 8、什么是变异? 同一性质的事物,其个体观察值(变量值)之间的差异。 9、什么是样本? 从总体中随机抽取具有代表性的一部分个体,其测量值(或观察值)的集体成为样本。 10、什么是抽样研究? 对从所研究的总体中随机抽取有代表性的一部分个体构成的样本进行研究。 11、抽样研究的目的是什么? 通过用样本资料计算的指标去推论总体。 12、什么是参数? 参数是指总体指标。(如:总体均数μ、总体率π、总体标准差σ等) 13、什么是统计量? 统计量是指样本指标。(如:样本均数、样本率p、样本标准差S等) 14、什么是统计描述? 用统计图或计算统计指标的方法表达一个指定群体的某种现象或特征 15、什么是统计推断? 根据样本资料的特性对总体的特性作估计或者推论的方法。(常用方法是参数估计和假设检验)16、什么是系统误差? 不是偶然机遇造成的,而是某种必然因素所致,具有一定的倾向性。 常见情况:①操作方法不正确或对调查问卷理解有误;②医生掌握疗效标准偏高或偏低。③周 围环境的改进。④仪器不准或试剂不合格。 17、什么是随机测量误差? 偶然机遇所致,无方向性,不可避免的。

卫生统计学知识点总结

卫生统计学 统计工作基本步骤:统计设计(调查设计和实验设计)、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断(参数估计和假设检验)】。 ★统计推断:是利用样本所提供的信息来推断总体特征,包括:参数估计和假设检验。a参数估计是指利 用样本信息来估计总体参数,主要有点估计(把样本统计量直接作为总体参数估计值)和区间估计【按预先设定的可信度(1-α),来确定总体均数的所在范围】。b假设检验:是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。 变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化,通常是由高级向低级转化。 资料按性质可分为计量资料、计数资料和等级资料。 定量资料的统计描述 1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。 2频率分布表(图)的用途:①描述资料的分布类型;②描述分布的集中趋势和离散趋势;③便于发现一些特大和特小的可疑值;④便于进一步的统计分析和处理;⑤当样本含量足够大时,以频率作为概率的估计值。 ★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。 (1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。 (2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。 标准差的应用:①表示变量分布的离散程度;②结合均数计算变异系数、描述对称分布资料;③结合样本含量计算标准误。 定性资料的统计描述 1定性资料的基础数据是绝对数。描述一组定性资料的数据特征,通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。 2常用相对数类型:频率型、强度型和相对比型指标。 指标频率型指标强度型指标相对比型指标 两个有关联的指标A和B之比概念近似反映某一时间出现概单位时间内某现象的 生频率 计算 A/B 公式 无有可有、可无 有无 量纲 【0,1】可大于1无限制 取值 范围

卫生统计学试题库

《卫生统计学》考试题库 目录 第一章绪论 第二章定量资料的统计描述 第三章正态分布 第四章总体均数的估计和假设检验 第五章方差分析 第六章分类资料的统计描述 第七章二项分布与Poisson分布及其应用 第八章χ2检验 第九章秩和检验 第十章回归与相关 第十一章常用统计图表 第十二章实验设计 第十三章调查设计 第十四章医学人口统计与疾病统计常用指标 第十五章寿命表 第十六章随访资料的生存分析

附录:单项选择题参考答案

第一章绪论 一、名词解释 1. 参数(parameter) 2. 统计量(statistic) 3. 总体(population) 4. 样本(sample) 5. 同质(homogeneity) 6. 变异(variation) 7. 概率(probability) 8. 抽样误差(sampling error) 二、单选题 1.在实际工作中,同质是指: A.被研究指标的影响因素相同 B.研究对象的有关情况一样 C.被研究指标的主要影响因素相同 D.研究对象的个体差异很小 E.以上都对 2. 变异是指: A.各观察单位之间的差异 B.同质基础上,各观察单位之间的差异 C.各观察单位某测定值差异较大 D.各观察单位有关情况不同 E.以上都对3.统计中所说的总体是指: A.根据研究目的而确定的同质的个体之全部 B.根据地区划分的研究对象的全体 C.根据时间划分的研究对象的全体 D.随意想象的研究对象的全体 E.根据人群划分的研究对象的全体 4. 统计中所说的样本是指: A.从总体中随意抽取一部分 B.有意识地选择总体中的典型部分 C.依照研究者的要求选取有意义的一部分 D.从总体中随机抽取有代表性的一部分 E.以上都不是 5.按随机方法抽取的样本特点是: A.能消除系统误差 B.能消除随机测量误差 C.能消除抽样误差 D.能减少样本偏性 E.以上都对 6.统计学上的系统误差、测量误差、抽样误差在实际工作中: A.均不可避免 B.系统误差和测量误差不可避免 C.测量误差和抽样误差不可避免 D.系统误差和抽样误差不可避免 E.只有抽样误差不可避免 7.统计工作的基本步骤是: A.设计、调查、审核、整理资料 B.收集、审核、整理、分析资料 C.设计、搜集、整理、分析资料 D.调查、审核、整理、分析资料 E.以上都不对 8.统计工作的关键步骤是: A.调查或实验设计 B.整理分组 C.收集资料 D.审核资料 E.分析资料

电大实用卫生统计学期末复习材料

《实用卫生统计学》期末复习题一 《实用卫生统计学》期末复习题一 一、名词解释 1、卫生统计学: 2、随机抽样: 3、构成比: 4、频率: 5、非参数检验: 6、概率 7、变异系数 名词解释答案 1. 卫生统计学:是运用数理统计的基本原理和方法,通过数据的收集,整理和分析,研究预防医学和卫生事业管理中随机现象规律性的一门应用科学。 2. 随机抽样:就是按照随机的原则获得样本,保证总体中每个个体都有同等机会被抽取,使样本对总体有较好的代表性。 3. 构成比:又称构成指标,它表示事物内部各组成部分所占比重或分布。常用百分数表示。 4. 频率:若随机事件在n次重复中出现m次,则n/m比值成为随机事件出现的频率。 5.非参数检验:是一种不依赖总体分布类型,也不对总体参数(如总体均数)进行统计推断的假设检验。 6.概率是描述随机事件发生的可能性的大小的数值,常用P表示。7.变异系数常记为CV,它被定义为标准差与算术均数之比。 《实用卫生统计学》期末复习题二 单选题 1.对某样品进行测量时,由于测量仪器事先未校正,造成测量结果普遍偏高,这种错误属于()。 A. 系统误差 B. 随机测量误差 C. 抽样误差 D. 随机误差 2.医学人口统计应属于卫生统计学中的哪部分内容( )。 A. 卫生统计学基本原理 B. 卫生统计学基本方法 C. 健康统计 D.卫生服务统计 3. 原始数据分布不明时,表示其集中趋势易采用 ( ) 。 A. 算数均数 B. 几何均数 C. 中位数 D. 标准差 4.描述一组偏态分布资料的变异度时,最适宜选择的指标是( ) 。  A.极差 B.标准差 C.四分位数间距 D.变异系数

卫生统计学方法与应用中

1、甲乙两地某病的死亡率进行标准化计算时,其标准选择() * ? A.不能用甲地数据 ? B.不能用乙地数据 ? C.不能用甲地和乙地的合并数据 ? D.可能用甲地或乙地的数据 ? E.以上都不对 2、实验设计应遵循的基本原则是() * ? A.随机化、对照、盲法 ? B.随机化、盲法、配对 ? C.随机化、重复、配对 ? D.随机化、齐同、均衡 ? E.随机化、对照、重复 3、对于一组服从双变量正态分布的资料,经直线相关分析得相关系数r=0.9,对该资料拟 合回归直线,则其回归系数b值() * ? A.b>0 ? B.b=0 ? C.b<0 ? D.b=1 ? E.不能确定正负 4、以下属于分类变量的是() * ? A.IQ得分 ? B.心率 ? C.住院天数 ? D.性别 ? E.胸围 5、抽样调查某市正常成年男性与女性各300人,测得其血红蛋白含量( g/L)。欲比较男 性与女性的血红蛋白含量是否有差异,假设男性和女性的血红蛋白含量的总体方差相等,应采用() *c ? A.样本均数与总体均数比较的t检验 ? B.配对t检验 ? C.成组t检验 ? D.配对设计差值的符号秩和检验 ? E.成组设计两样本比较的秩和检验

6、进行方差分析时,数据应满足() * ? A.独立性、正态性、大样本 ? B.独立性、正态性、方差齐性 ? C.独立性、方差齐性、大样本 ? D.独立性、正态性、平行性 ? E.正态性、方差齐性、大样本 7、同类定量资料下列指标,反映样本均数对总体均数代表性的是() *? A.四位分数间距 ? B.标准误 ? C.变异系数 ? D.百位分数 ? E.中位数 8、完全随机设计的方差分析组间变异来自于() * ? A.个体 ? B.全部观察值 ? C.随机因素 ? D.处理因素 ? E.随机因素和处理因素 9、统计工作的基本步骤是() * ? A.及时收集完整、准确的资料 ? B.综合资料 ? C.方差分析时要求个样本所在总体的方差相等 ? D.完全随机设计的方差分析时,组内均方就是误差均方 ? E.完全随机设计的方差分析时,F=MS组间/MS组内 10、生存分析中的结果变量是() *d ? A.生存时间 ? B.寿命表法生存曲线呈阶梯型 ? C.生存率 ? D.生存时间与随访结局 ? E.生存时间与生存率 11、反映血型为AB型的人在人群中所占的比例,宜计算() * ? A.率 ? B.标准化率

卫生统计学复习笔记

卫生统计学复习笔记 一、概述 1、卫生统计学的概念(熟练掌握) 统计学是研究数据的收集、整理和分析的一门科学,帮助人们分析所占有的信息,达到去伪存真、去粗取精、正确认识世界的一种重要手段。 卫生统计学是应用数统计学的原理与方法研究居民健康状况以及卫生服务领域中数据的收集、整理和分析的一门科学。 由此看出:统计学是处理资料中变异性的科学和艺术,是在收集、归类、分析和解释大量数据的过程中获取可靠结果的一门学科。这里强调了“过程”,但在实际工作中,许多人往往是忽略了设计、收集和归类(整理),到了分析数据时才想到统计学,此时难免发生“悔之晚矣”的憾事。作为统计学的应用者应充分认识到这一点。 卫生统计学的内容(了解): 1)健康统计:医学人口统计、疾病统计和生长发育统计等; 2)卫生服务统计:包括卫生资源利用、医疗卫生服务的需求、医疗保健体制改革等方面的统计学问题。 2、卫生统计学的工作步骤(熟练掌握) 统计学对统计工作的全过程起指导作用,任何统计工作和统计研究的全过程都可分为以下四个步骤: 1)、设计:在进行统计工作和研究工作之前必须有一个周密的设计。设计是在广泛查阅文献、全面了解现状、充分征询意见的基础上,对将要进行的研究工作所做的全面设想。其内容包括:明确研究目的和研究假说,确定观察对象、观察单位、样本含量和抽样方法,拟定研究方案、预期分析指标、误差控制措施、进度与费用等。设计是整个研究工作中最关键的一环,也是指导以后工作的依据 2)、收集资料:遵循统计学原理采取必要措施得到准确可靠的原始资料。及时、准确、完整是收集统计资料的基本原则。卫生工作中的统计资料主要来自以下三个方面:①统计报表:是由国家统一设计,有关医疗卫生机构定期逐级上报,提供居民健康状况和医疗卫生机构工作的主要数据,是制定卫生工作计划与措施、检查与总结工作的依据。如法定传染病报表,职业病报表,医院工作报表等。②经常性工作记录:如卫生监测记录、健康检查记录等。③专题调查或实验。 3)、整理资料:收集来的资料在整理之前称为原始资料,原始资料通常是一堆杂乱无章的数据。整理资料的目的就是通过科学的分组和归纳,使原始资料系统化、条理化,便于进一步计算统计指标和分析。其过程是:首先对原始资料进行准确性审查(逻辑审查与技术审查)和完整性审查;再拟定整理表,按照“同质者合并,非同质者分开”的原则对资料进行质量分组,并在同质基础上根据数值大小进行数量分组;最后汇总归纳。 4)、分析资料:其目的是计算有关指标,反映数据的综合特征,阐明事物的内在联系和规律。统计分析包括统计描述和统计推断。前者是用统计指标与统计图(表)等方法对样本资料的数量特征及其分布规律进行

《卫生统计学》考试重点复习资料

《卫生统计学》复习资料 08生物技术曾洋and林阳第一章绪论 名词解释 统计学:是一门通过收集、整理和分析数据来认识社会和自然现象数量特征的方法论科学。其目的是通过研究随机事件的局部外在数量特征和数量关系, 从而探索事件的总体内在规律性,而随机性的数量化,是通过概率表现出来。 总体:总体是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 抽样:从研究总体中抽取少量有代表性的个体,称为抽样。 概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。0﹤P(A)﹤1。 频率:在相同的条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A在n次试验中出现的频率(freqency)。当试验重复很多次时P(A)= m/n。 变量:表现出个体变异性的任何特征或属性。 随机变量:随机变量(random variable)是指取指不能事先确定的观察结果。随机变量的具体内容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且,理论上讲,每个变量的取值服从特定的概率分布。 系统误差:系统误差(systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计和完善技术措施来消除或使之减少。 随机误差:随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的误差。它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。 变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。 抽样误差:(消除了系统误差,并将随机测量误差控制在允许范围内)由于个体变异的存在,在抽样过程中产生的样本统计量与总体参数之间的差异。 分布:随机现象的规律性通过概率来刻画,而随机事件的所有结局及对应概率的排列称为分布。 第二章定量资料的统计描述 名词解释 算术均数:描述一组数据在数量上的平均水平。总体均数用μ表示,样本均数用X表示。 几何均数:用以描述对数正态分布或数据呈倍数变化资料的水平。记为G。 中位数:将一组观察值由小到大排列,n为奇数时取位次居中的变量值;为偶数时,取位次

卫生统计学知识点(笔记)

第一章绪论 1.统计学(statistics)是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。 2.▲总体(population)用来表示大同小异的对象全体,例如一个国家的所有成年人;某地的所有小学生。可分为目标总体和研究总体。若试图对某个总体下结论,这个总体便称为目标总体(target population);资料常来源于目标总体中的一个部分,它称为研究总体(study population)。需要谨慎的是,就研究总体所下的结论未必适用于目标总体。 3.▲样本(sample)是指从研究总体中抽取的一部分有代表性的个体。获取样本的过程称为抽样(sampling)。抽样研究的目的是用样本数据推断总体的特征。需要注意的是,统计学的结论从来就不是完全肯定或完全否定的,能不能成功地达到从样本推断总体的目的,关键是抽样的方法、样本的代表性和推断的技术。 4.▲同质(homogeneity)是指同一总体中个体的主要性质相同。 5.▲变异(variation)是指同质的个体之间存在的差异。 6.▲变量的类型 二分类变量 分类变量或名义变量 定性变量多分类变量 变量有序变量或等级变量 定量变量离散型变量 连续型变量 变量的转化:只能由“高级”向“低级”转化,即由信息量多的向信息量少的类型转化,如:定量有序分类二值 7.▲参数(parameter)是反映总体特征的指标,参数的大小是客观存在的,是一个常数,不会发生变化,然而往往是未知的,需要通过样本资料来估计,如总

体均数μ,总体标准差σ。 8.▲统计量(statistic)又称样本统计量,是反映样本特征的指标,是由观察资料计算出来的,如样本均数 X,样本标准差S。 统计学的任务就是依据样本统计量来推断总体参数。 9.▲概率与频率的区别:概率是参数,频率是统计量;频率总是围绕概率上下波动。当某事件发生的概率≤0.05时,即P≤0.05,统计学习惯上称该事件为小概率事件。 10.▲误差:表示统计量与参数之间的差别或测量值与真值之间的差别。可分为系统误差和随机误差,其中系统误差呈现倾向性偏大或偏小现象,是可以避免的;而随机误差,是非人为偶然因素所致,不可避免,但可通过增大样本量等措施使其减小。 11.因果与联系:存在联系未必有因果关系,需排除虚假关联、间接关联。大多数观察性研究,单靠统计学分析只能考察变量之间的联系,难以证明因果关系。

相关文档
相关文档 最新文档