当前位置：文档库 › 卫生统计学复习资料

卫生统计学复习资料

科研方法

第三章

实验设计的基本要素：

实验设计的基本要素包括处理因素、受试对象和实验效应三个组成部分。

实验设计的四原则：

对照原则

均衡原则

随机原则

重复原则

随机原则：

使实验组和对照组非处理因素趋于一致或均衡的主要手段是随机化。

随机化的方法有多种，最常使用的是利用随机数字表和随机排列表(或称随机化分组表)。

拉丁方设计：

用r个拉丁字母排成r行r列的方阵，使每行及每列中每个字母都只出现一次，这样的方阵称为r阶拉丁方，或r×r拉丁方

正交设计

正交设计：

正交设计是一种高效、快速的多因素试验方法。它是利用一套规格化的正交表，使每次试验的因素及水平得到合理安排，通过试验结果的分析，获得有用的信息。除了分析主因素外，还可分析交互作用。

非条件logistic回归的公式，目的，用途

统计学

第一章

统计学家用总体这个术语来表示大同小异的对象全体。我们试图就某个总体下结论，这个总体便称为目标总体。资料常来源于目标总体中的一个部分，它称为研究总体。

科学的办法是从研究总体中抽取少量有代表性的个体，称为抽样。

一些个体处于同一总体，就是指他们大同小异，具有同质性。

同一总体内的个体间存在差异又是绝对的，这种现象称为变异。

本书把变量分成定性与定量两种类型。定性变量中最常见的是分类变量或名义变量。最

简单也最常用的分类变量是二分类变量。另一类定性变量是有序变量或等级变量。定量变量可以分为两种类型，离散型变量和连续型变量。离散型变量只能取整数值。连续型变量可以取实数轴上的任何数值。

变量只能由“高级”向“低级”转化：定量→有序→分类→二值；不能作相反方向的转化。在定量变量中，离散型变量常常通过适当的变换或连续性校正后借用连续型变量的方法来分析。

理论上，正态分布有两个参数：总体均数和总体方差。

这种由观察资料计算出来的量称为统计量。

第二章

对连续型定量变量，频率分布表的编制步骤如下：

（1）计算极差(R)，也称为全距，即数据最大值与最小值之差。

（2）确定组段数与组距，变量值个数较多时，组段数一般取10左右。每个组段的起点称为组段的下限，终点称为组段的上限，组距为上下限之差，按“组距≈R/预计的组段数”来估计。

（3）确定各组段的上、下限，分组时，第一组段应包含最小值，为了计算方便，组段下限一般取较整齐的数值。最后一个组段应包含最大值，在确定各组段的上下限，注意各组段要连续但不能重叠，故除最后一个组段外，其余组段应包含其下限值，不包含其上限值。

（4）列表

直方图（频率直方图），其横轴为血清铁含量，纵轴为频率密度，即频率/组距（直条面积等于相应组段的频率）。在组距相等时，直方图中矩形直条的高度与相应组段的频率成正比。可以看到，直方图的面积之和等于1,。

其值的分布具有对称的特点，这类分布常被称为对称分布。

频率分布是不对称的，这类分布称为偏峰分布。

一般称这种峰向左侧偏移的分布为正偏峰分布。而峰向右侧偏移的分布称为负偏峰分布。

集中趋势与离散趋势，集中趋势与离散趋势同时存在，是总体分布的两个重要特征，描述集中趋势和离散趋势可较全面的反映所研究的变量。

1.算术均数（mean），算术均数简称均数，总体均数用希腊字母μ表示，样本均数用表示。

（1）直接法：计算公式为：

其中n为样本含量，X1，X2，…，Xn为观察值。大写的希腊字母Σ（读作sigma）。

（2）频率表法：计算公式为：

其中f为各组段的频数，X0为各组段的组中值，X0=（组段上限+组段下限）/2。各组段的频数在这里起了“权数”的作用，各组段的频率（f/n）称为权重系数。故频率表法也称加权法。

2.几何均数G，几何均数适用于原始观察值分布不对称，但经对数转换后呈对称分布的资料，如对数正态分布资料。

（1）直接法：计算公式为：

（2）频率表法：

3.中位数（M），中位数是指将原始观察值从小到大或从大到小排序后，位次居中的那个数。

（1）直接法：

样本量n为奇数时

n为偶数时

其中表示将n例观察值从小到大排列后的第i个顺位的观察值。

百分位数（Px）是一个数值，它将原始观察值分成两部分，理论上有x%的观察值小于Px，有1—x%的观察值大于Px。百分位数P50就是中位数。

对频率表资料，百分位数Px的计算公式为：

其中L为欲求的百分位数所在组段的下限，i为该组段的组距，为截止至L的累计频数，为截止至L+i的累计频数，—为该组段内的频数，n为总频数。

4.众数，众数原指总体中出现机会最高的数值。

同一总体中不同个体间存在的差异称为变异。

1.极差（R），也称全距，定义为最大值与最小值之差，极差越大意味着数据越离散，或

者说数据间变异越大。

2.四分位数间距（Q），百分位数P75和百分位数P25分别称为上四分位数和下四分位数。四分位数间距表示百分位数P75和百分位数P25之差，定义为Q=P75-P25。同类资料比较，Q越大意味着数据间变异越大。四分位数间距可用于各种分布的资料，特别对偏锋分布资料，常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。

3.方差，又称为均方差，总体方差用Var(X)或表示，其计算公式为：

其中μ为总体均数，N为总体中个体例数。称为离均差平方和，其意义是总体内所有观察值与总体均数差值的平方之和。同类资料比较时，方差越大意味着数据间离散程度越大，或者说资料的变异度越大。

样本方差用表示，其计算公式为：

其中为样本均数，n为样本含量。

任何统计量的自由度v=n—限制条件的个数。

4.标准差，在统计应用中更常用的变异度指标是方差的计算平方根，称为标准差。标准差越大意味着观察值的离散程度越大，或者说变异度越大。方差和标准差都适用于对称分布的资料。总体标准差常用表示，样本标准差用S表示，其计算公式为：

5.变异系数（CV）,变异系数主要用于量纲不同的变量间，或均数差别较大的变量间变异程度的比较。其计算公式为：

变异系数越大，意味着相对于均数而言，变异程度越大。

1.偏度系数（SKEW），计算公式为：

其中n为样本含量，为样本均数；S为样本标准差。理论上总体偏度系数为0时，分布是对称的；取正值时，分布为正偏峰；取负值时，分布为负偏峰。

2.峰度系数（KURT），计算公式为：

其中n为样本含量，为样本均数；S为样本标准差。理论上，正态分布的总体峰度系数为0；取负值时，其分布较正态分布的峰平阔；取正值时，其分布较正态分布的峰尖峭。

为了解定量变量的分布规律，可编制频率表并绘制频率表分布图，用于描述资料的分布特征（集中趋势与离散趋势），以及分布类型（对称或偏峰）。

第三章

定性变量分为多分类变量和二分类变量，这些变量均可以通过频率分布表描述其分布特征。

强度型指标是指单位时间内某现象发生的频率。计算公式为：

其中，K可以是100%，或1000/1000，或 / 等。

相对比型指标是指两个有关联的指标A与B之比，实际应用中简称比。

发病率（IR）表示一定时期内，在可能发生某病的一定人群中新发生某病的强度。

患病率（PR）又称为现患率，指某时点上受检人数中现患某种疾病的频率，通常用于描述病程较长或发病时间不易明确的疾病的患病情况，如慢性病在某一时间横断面的患病情况。

治愈率表示受治病人中治愈的频率。

生存率指病人能活到某一时点的概率。

标准化法的关键是选择一个“标准”，在这个共同的“平台”上比较两组资料。“标准”的选择，通常有三种做法：①选定两组之一，将其作为“标准”；②两组合并，作为“标准”；

③在两组之外另选一个群体，如采用全国、全省或全地区的对象，将其作为“标准”。

一般地，设有一个重要的分类变量，它在两组个体（j=1，2）中分布不同；已知第j组每个类别中发生某事件的频率，i=1,2, …。

（1）选定“标准入口”，每个类别中的个体数记为，i=1,2, …。

（2）分别计算“标准入口”的预期治愈人数之和，j=1,2。

（3）分别计算两种治疗法的标准化治愈率

第五章

正态曲线是一条高峰位于中央，两侧逐渐下降并完全对称，曲线两端永远不与横轴相交的钟形曲线。该曲线的函数表达式称为正态分布密度函数，

其中，μ为总体均数，σ为总体标准差。

正态概率密度曲线的位置与形状具有如下特点：

（1）关于x=μ对称。

（2）在x=μ处取得该概率密度函数的最大值，在x=μ+σ处有拐点。

（3）曲线下面积为1.

（4）μ决定曲线在横轴上的位置，μ增大，曲线沿横轴向右移；反之，μ减小，曲线沿横轴向左移。

（5）σ决定曲线的形状，当μ恒定时，σ越大，数据越分散，曲线越“矮胖”；σ越小，数据越集中，曲线越“瘦高”。

习惯上用N（μ，）表示均数为μ、标准差为σ的正态分布。

Z变换与标准正态分布，对任意一个服从正态分布N（μ，）的随机变量，可作如下的标准化变换，也称Z变换，

经此变换得到的变量Z的密度函数为：

变换后的Z值仍然服从正态分布，且其总体均数为0、总体标准差为1。我们称此正态分布为标准正态分布。

表内所列数据表示Z取不同值时Z值左侧标准正态曲线下面积，记作Φ（z）。Φ（z）称为标准正态分布的分布函数。

故Z取值于（-1.96，1.96）的概率为1-2×0.025=0.95，即X取值在区间μ+1.96σ内的概率为0.95.

即大约在116.9cm与129.2cm之间。

正态分布的应用

1.确定医学参考值范围

（1）百分位数法

（2）正态分布法

2.质量控制图

3.二项分布

第六章

根据数理统计学原理，若随机变量X的均数为μ，方差为，则样本均数的均数仍为μ，

样本均数的标准差，即均数的标准误为：

又根据正态分布原理，若随机变量X服从正态分布，则样本均数也服从正态分布，因此，若随机变量X~N（μ，）。则样本均数X~N（μ，）。

根据二项分布原理，若随机变量X~B（n，π），则样本频率P= 的总体概率为π，标准误为：

频率的标准误愈小，用样本频率估计总体概率的可靠性愈好；反之，频率的标准误愈大，用样本频率估计总体概率的可靠性愈差。

t值服从自由度v=n-1的t分布，即

t分布，又称Student t分布，记作t~t(v)。 t分布十分有用，它是总体均数的区间估计和假设检验的理论基础。

t值的分布与自由度v有关。t分布只有一个参数，即v。t分布有如下特征：①单峰分布，以0为中心，左右对称；②v越小，t值越分散，曲线的峰部越矮，尾部越高；③随着v逐渐增大，t分布逐渐接近标准正态分布；当v趋向∞时，t分布趋近标准正态分布，故标准正态分布是t分布的特例。

用同一个样本统计量分别估计总体参数的95%置信区间和99%置信区间，哪一个估计的精度更好？为什么？

答：95%置信区间精度更好.因为精确度是指区间范围的宽窄，范围越宽精确度越差，反之，范围越窄，精确度越高。95%置信区间和99%置信区间所描述的是准确度，其是指说对的可能性大小，其由（1-α）算出，例如95%置信区间是指说错的可能性是5%，其范围宽度要小于99%置信区间。所以95%置信区间精确度更高。

为了解中年男性高血压患病情况，有人在某市城区随机调查了2660名45~54岁的男性居民，检出高血压患者775例，试估计该市45~54岁男子高血压患病率的95%置信区间。

答：分析每个患病患者可以记为1，无病的记为0.且n=2660>100，故该题服从u分布。

x（均值）≈0.291，α=0.05（双侧），uα=1.96， S=0.454, n=2660

=(0.274~0.308)

即该市45~54岁男子高血压患病率的95%置信区间为0.274~0.308。

卫生统计学整理笔记

如何绘制频数表？求组距确定各组段的两个端点归组计数频数分布表与分布图作用 1.揭示变量分布形态 2.揭示变量分布趋势 3.便于发现特大的或特小的极端值 4.便于进一步计算统计指标和分析 5.作为一种数据陈述的形式算数应用条件：对称分布，尤其正态分布几何应用条件： 1.对数对称分布、等比资料 2.变量值中不能有0；不能同时有正值和负值；若全是负值，计算时可先把负号去掉，得出结果后再加上负号。中位数条件：所有分布、尤其偏态分布： 1.变量值中出现个别特小或特大的数值 2.资料的分布呈明显偏态 3.含有不确定数值 4.资料的分布不清极差应用条件：所有分布、尤其偏态分布不足：不能全面的反映所有值的偏离程度不稳定、小样本小于大样本、样本小于总体四分位数间距应用条件所有分布、尤其偏态分布： 1.变量值中出现个别特小或特大的数值 2.资料的分布呈明显偏态 3.含有不确定数值 4.资料的分布不清方差应用条件：对称分布，尤其正态分布变异系数应用 1.量纲不一致

散点图作用观察两组数据的总体趋势和明显偏离趋势的观察点判断两组数据的关联形式、方向和密切程度相关分类线性相关秩相关分类变量相关线性相关意义 r>0表示正相关，r=1表示完全正相关；r<0表示负相关，r=-1表示完全负相关。 |r|→0表示相关性越弱，|r|→1表示相关性越强。 r=0表示没有线性相关，不代表没有相关。如何判断线性相关画散点图计算线性相关系数假设检验如何进行秩相关编秩次计算秩相关系数假设检验回归分析：利用样本信息，找到变量间数量依存关系。线性回归分析：利用样本信息，找到变量间线性数量依存关系。决定系数：反映回归贡献的相对程度，即Y的变异被X解释的比例。如何进行分类变量的相关分析交叉表的制作，计算各种概率计算列联系数假设检验相关分析的条件线性相关系数：二元正态分布的定量变量秩相关系数：非二元正态分布的定量变量、有序分类变量列联系数：无序分类变量轶闻数据：由坊间流传或各种媒体报道的一些个案数据，由于其特殊性往往给公众留下突出和深刻的印象。特点：缺乏代表性，常诱导人们进行简单的推论，得到一些具有倾向性的结论。可得数据：为了某些特定目的已收集或积累的数据。如：各类监测数据、统计年鉴等。

卫生统计学考试重点总结复习

一、绪论 1.总体：根据研究目的确定的同质观察单位的全体，确切的说是同质的所有观察单位某种变量值的集合。 2.样本：从总体中随机抽取部分观察单位所组成的集合。 3.参数：用样本的指标来推算或估计出来的，用来说明总体情况的统计指标。 4.统计量：根据观察值计算出来的量，是用来描述和分析样本的统计指标。 5.变量的类型及其转换： ①定性变量：a.分类变量（计数资料）i.二分类变量 ii.多项无序分类 b.有序变量（等级资料） ②定量变量：a.连续型变量 b.离散型变量变量只能由“高级”向“低级”转化：定量→有序→分类→二值。 6.概率：是描述随机事件发生的可能性大些的数值。 7.卫生统计学的内容包括：统计学是一门处理数据中变异性的科学与艺术，内容包括收集、分析、解释和表达数据，目的是求得可靠的结果。 8.卫生统计学：运用概率论和数理统计的原理和方法并结合医学实践来研究医学资料的搜集、整理、分析与推断的一门学科。 9.卫生统计学的研究对象：有变异的事物。 10.统计工作的一般步骤：设计资料、搜集资料、整理资料、分析资料。 11.同质：指同一总体中个体的性质、影响条件、背景相同或非常相近。 12.变异：同一总体内的个体间存在差异又是绝对的，这种现象称为变异。 13.误差可分为：系统误差、随机测量误差、抽样误差。 14.抽样误差：由于个体差异的存在，从某一总体中随机抽取一个样本，所得样本统计量与总体参数之间可能存在差异，这种差异称为抽样误差。二、定量资料的统计描述 1.频率分布表的编制步骤： ①计算极差R、②确定组段数与组距（一般为8-15组）、③确定各组段的上下限、④列表。 2.频率分布表的用途： ①揭示频数分布的分布特点和分布类型，文献中常将频数表作为陈述资料的形式。 ②便于进一步计算统计指标和进行统计分布处理。 ③便于发现某些特大和特小的可疑值。 ④当样本含量比较大时，可用各组段的频率作为概率的估计值。 3.中位数：指将原始观察值从小到大或从大到小排序后，位次居中的那个数。 4.四分位数间距：表示百分位数P75和百分位数P25之差，定义为Q=P75-P25，恰好包括总体中50%的个体观察值，用来描述偏态分布资料的离散趋势的指标。 5.标准差：即方差的算术平方根，是衡量对称分布资料的离散程度的指标，标准差大，则离散度大，标准差小，则离散度小。 6.变异系数：变异的大小S相对于其平均水平X的百分比，主要用于量纲不同的变量间，或均数差别较大的变量间变异程度的比较。三、定性资料的统计描述 1.构成比：说明一事物内部各组成部分在总体中所占的比重或分布，常用百分数表示。 =某一组成部分的观察单位数/同一事物内部各组成部分的观察单位总数×100% 2.相对数的类型：

《卫生统计学》考试重点复习资料

《卫生统计学》复习资料 08生物技术曾洋and林阳第一章绪论名词解释统计学:就是一门通过收集、整理与分析数据来认识社会与自然现象数量特征得方法论科学。其目得就是通过研究随机事件得局部外在数量特征与数量关系, 从而探索事件得总体内在规律性,而随机性得数量化,就是通过概率表现出来。总体:总体就是根据研究目得确定得同质得观察单位得全体,更确切得说,就是同质得所有观察单位某种观察值(变量值)得集合。总体可分为有限总体与无限总体。总体中得所有单位都能够标识者为有限总体,反之为无限总体。样本:从总体中随机抽取部分观察单位,其测量结果得集合称为样本(sample)。样本应具有代表性。所谓有代表性得样本,就是指用随机抽样方法获得得样本。抽样:从研究总体中抽取少量有代表性得个体,称为抽样。概率:概率(probability)又称几率,就是度量某一随机事件A发生可能性大小得一个数值,记为P(A),P(A)越大,说明A事件发生得可能性越大。0﹤P(A)﹤1。频率:在相同得条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A 在n次试验中出现得频率(freqency)。当试验重复很多次时P(A)= m/n。变量:表现出个体变异性得任何特征或属性。随机变量:随机变量(random variable)就是指取指不能事先确定得观察结果。随机变量得具体内容虽然就是各式各样得,但共同得特点就是不能用一个常数来表示,而且,理论上讲,每个变量得取值服从特定得概率分布。系统误差:系统误差(systematic error)就是指由于仪器未校正、测量者感官得某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不就是分散在真值得两侧,而就是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计与完善技术措施来消除或使之减少。随机误差:随机误差(random error)又称偶然误差,就是指排除了系统误差后尚存得误差。它受多种因素得影响,使观察值不按方向性与系统性而随机得变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。变异:在自然状态下,个体间测量结果得差异称为变异(variation)。变异就是生物医学研究领域普遍存在得现象。严格得说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值得参差不齐。抽样误差:(消除了系统误差,并将随机测量误差控制在允许范围内)由于个体变异得存在,在抽样过程中产生得样本统计量与总体参数之间得差异。分布:随机现象得规律性通过概率来刻画,而随机事件得所有结局及对应概率得排列称为分布。第二章定量资料得统计描述名词解释算术均数:描述一组数据在数量上得平均水平。总体均数用μ表示,样本均数用X表示。几何均数:用以描述对数正态分布或数据呈倍数变化资料得水平。记为G。中位数:将一组观察值由小到大排列,n为奇数时取位次居中得变量值;为偶数时,取位次居中得两个变量得平均值。

10级-卫生统计学-整理资料

卫生统计学第一章绪论 1、卫生统计学的概念(P1) 卫生统计学是应用概率论和数理统计学的基本原理和方法，研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学，是卫生及其相关领域研究中不可缺少的分析问题。 2、卫生统计学的4个基本步骤(P3)：设计、收集资料、整理资料、分析资料 3、卫生统计学的几个基本概念(P4)： ⑴同质：在统计学中，若某些观察对象具有相同的特征或属性，我们就称之为同质，或具有同质性。 ⑵变异：同质个体的某项特征或属性的观察值或测量值之间的差异。 ⑶总体：同质的所有观察单位某种特征或属性的观察值或测量值的集合。 ⑷样本：从总体中随机抽取的具有代表性的部分观察单位的集合。样本中包含的观察单位个数成为样本含量。 ⑸参数：反映总体特征的指标，一般是未知的，常用希腊字母表示，如总体均数μ、总体率π等。 ⑹统计量：根据样本观察值计算出来的指标，常用拉丁字母表示，如样本均数?x 、样本率ρ等。 ⑺变量与资料：对每个观察单位进行观察或测量的某项特征或属性称为变量；变量值的集合成为资料。

⑻定量资料：亦称计量资料，其变量值是定量的，表现为数值大小，一般有度、量、衡单位。 ⑼定性资料：亦称分类资料，其观察值是定性的，表现为互不相容的类别或属性，一般无度、量、衡单位。可细分为：①计数资料；②等级资料第二章调查研究设计 ★1、调查研究的特点（P7）： ①不能人为施加干预措施；②不能随机分组； ③很难控制干扰因素；④一般不能下因果结论 2、常用抽样方法（名称、原理）： ⑴单纯随机抽样：先将调查总体的全部观察单位统一编号，然后采用随机数字表、统计软件或抽签方法之一随机抽取n（样本大小）个编号，由这n 个编号所对应的n个观察单位构成研究样本。 ⑵系统抽样：又称机械抽样或等距抽样。事先将总体内全部观察单位按某一顺序号等距分成n（样本大小）个部分，每一部分内含m个观察单位；然后从第一部分开始，从中随机抽出第i号观察单位，依此用相等间隔m机械地在第2部分、第3部分直至第n部分内各抽出一个观察单位组成样本。 ⑶分层抽样：先按对观察指标影响较大的某项或某几项特征，将总体分成若干层，该特征的测定值在层内变异较小，层间变异较大，然后分别从每一层内随机抽取一定数量的观察单位结合起来组成样本。 ⑷整群抽样：将总体划分为群（初级观察单位），各群由次级观察单位组成，随机抽取一部分群，调查抽中群的全部次级观察单位。第三章实验设计 ★1、实验设计的特点（注意与调查研究的特点的区别）：

卫生统计学重点笔记之令狐文艳创作

医师资格考试蓝宝书-预防医学令狐文艳医学统计学方法第一节基本概念和基本步骤（非常重要）一、统计工作的基本步骤设计（最关键、决定成败）、搜集资料、整理资料、分析资料。总体：根据研究目的决定的同质研究对象的全体，确切地说，是性质相同的所有观察单位某一变量值的集合。总体的指标为参数。实际工作中，经常是从总体中随机抽取一定数量的个体，作为样本，用样本信息来推断总体特征。样本的指标为统计量。由于总体中存在个体变异，抽样研究中所抽取的样本，只包含总体中一部分个体，这种由抽样引起的差异称为抽样误差。抽样误差愈小，用样本推断总体的精确度愈高；反之，其精确度愈低。某事件发生的可能性大小称为概率，用P表示，在0～1之间，0和1为肯定不发生和肯定发生，介于之间为偶然事件，<0.05或0.01为小概率事件。

二、变量的分类变量：观察单位的特征，分数值变量和分类变量。第二节数值变量数据的统计描述（重要考点）一、描述计量资料的集中趋势的指标有 1.均数均数是算术均数的简称，适用于正态或近似正态分布。 2.几何均数适用于等比资料，尤其是对数正态分布的计量资料。对数正态分布即原始数据呈偏态分布，经对数变换后（用原始数据的对数值lgX代替X）服从正态分布，观察值不能为0，同时有正和负。 3.中位数一组按大小顺序排列的观察值中位次居中的数值。可用于描述任何分布，特别是偏态分布资料的集中位置，以及分布不明或分布末端无确定数据资料的中心位置。不能求均数和几何均数，但可求中位数。百分位数是个界值，将全部观察值分为两部分，有X％比小，剩下的比大，可用于计算正常值范围。二、描述计量资料的离散趋势的指标 1.全距和四分位数间距。 2.方差和标准差最为常用，适于正态分布，既考虑了离均差（观察值和总体均数之差），又考虑了观察值个数，方差使原来的单位变成了平方，所以开方为标准差。均为数值越小，观察值的变异度越小。 3.变异系数多组间单位不同或均数相差较大的情况。变

卫生统计学试题6含答案

统计试题题库 1. 下列那个是对标化后总死亡率的正确描述？ A A．仅仅作为比较的基础，它反映了一种相对水平 B．它反映了实际水平 C．它不随标准选择的变化而变化 D．它反映了事物实际发生的强度 E．以上都不对 2. 两样本作均数差别的t检验，要求资料分布近似正态，还要求： D A．两样本均数相近，方差相等 B．两样本均数相近 C．两样本方差相等 D．两样本总体方差相等 E．两样本例数相等 3. 四格表资料的卡方检验时无需校正，应满足的条件是: D A．总例数大于40 B．理论数大于5 C．实际数均大于l D．总例数大于40且理论数均大于或等于5 E．总例数小于40 4. 总体应该是由： D

A．研究对象组成 B．研究变量组成 C．研究目的而定 D．同质个体组成 E．任意个体组成 5. 两样本均数比较的t检验中，结果为P<0.05，有统计意义。P愈小则: E A．说明两样本均数差别愈大 B．说明两总体均数差别愈大 C．说明样本均数与总体均数差别愈大 D．愈有理由认为两样本均数不同 E．愈有理由认为两总体均数不同 6. 抽样误差是指: D A．总体参数与总体参数间的差异 B．个体值与样本统计量间的差异 C．总体参数间的差异 D．样本统计量与总体统计量间的差异 E．以上都不对 7. 抽签的方法属于下列那种抽样： D A．分层抽样 B．系统抽样 C．整群抽样 D．单纯随机抽样 E．分级抽样

8. 以舒张压≥12.7KPa为高血压，测量1000人，结果有990名非高血压患者，有10名高血压患者，该资料属下列那类资料： B A．计算 B．计数 C．计量 D．等级 E．都对 9. 实验设计中要求严格遵守四个基本原则，其目的是为了： D A．便于统计处理 B．严格控制随机误差的影响 C．便于进行试验 D．减少和抵消非实验因素的干扰 E．以上都不对 10. 两个样本作t检验，除样本都应呈正态分布以外，还应具备的条件是： B A．两样本均数接近 B．两S2数值接近 C．两样本均数相差较大 D．两S2相差较大 E．以上都不对 11. 同一总体的两个样本中，以下哪种指标值小的其样本均数估计总体均数更可靠？A A．Sx B．S C．X D．CV

9住院医师规培考试卫生统计学方法与应用(下)

1、某地进行甲型病毒性肝炎的调查中，共发现病人231例。其中男性158例占68.40%，女性73例占31.60%，提示（）* ? A.男性因在外就餐机会多发病机会就高 ? B.男性病人比例高于女性病人 ? C.男性发病率高 ? D.男性患病率高 ? E.不能说明任何问题 2、甲乙两地某病的死亡率进行标准化计算时，其标准选择（）* ? A.不能用甲地数据 ? B.不能用乙地数据 ? C.不能用甲地和乙地的合并数据 ? D.可能用甲地或乙地的数据 ? E.以上都不对 3、若已知该省成年男性血红蛋白平均水平，欲了解某县正常成年男性的血红蛋白含量是否高于该省正常水平，应采用（）* ? A.样本均数与总体均数比较的t检验 ? B.配对t检验 ? C.成组t检验 ? D.配对设计差值的符号秩和检验 ? E.成组设计两样本比较的秩和检验 4、对于一组服从双变量正态分布的资料，经直线相关分析得相关系数r=0.9，对该资料拟合回归直线，则其回归系数b值（）*

? A.b>0 ? B.b=0 ? C.b<0 ? D.b=1 ? E.不能确定正负 5、对原始统计资料的要求是（）* ? A.及时收集完整、准确的资料 ? B.综合资料 ? C.方差分析时要求个样本所在总体的方差相等 ? D.完全随机设计的方差分析时，组内均方就是误差均方 ? E.完全随机设计的方差分析时，F=MS组间/MS组内 6、实验设计应遵循的基本原则是（）* ? A.随机化、对照、盲法 ? B.随机化、盲法、配对 ? C.随机化、重复、配对 ? D.随机化、齐同、均衡 ? E.随机化、对照、重复 7、作符号秩和检验时，统计量T为较小的秩和，则正确的是（）* ? A.T值越大越有理由拒绝HO ? B.T值越大越有理由拒绝HO ? C.P值与T值毫无关系

卫生统计学知识点(笔记)

第一章绪论 1.统计学（statistics）是一门处理数据中变异性的科学与艺术，内容包括收集、分析、解释和表达数据，目的是求得可靠的结果。 2.▲总体（population）用来表示大同小异的对象全体，例如一个国家的所有成年人；某地的所有小学生。可分为目标总体和研究总体。若试图对某个总体下结论，这个总体便称为目标总体（target population）；资料常来源于目标总体中的一个部分，它称为研究总体（study population）。需要谨慎的是，就研究总体所下的结论未必适用于目标总体。 3.▲样本（sample）是指从研究总体中抽取的一部分有代表性的个体。获取样本的过程称为抽样（sampling）。抽样研究的目的是用样本数据推断总体的特征。需要注意的是，统计学的结论从来就不是完全肯定或完全否定的，能不能成功地达到从样本推断总体的目的，关键是抽样的方法、样本的代表性和推断的技术。 4.▲同质（homogeneity）是指同一总体中个体的主要性质相同。 5.▲变异（variation）是指同质的个体之间存在的差异。 6.▲变量的类型二分类变量分类变量或名义变量定性变量多分类变量变量有序变量或等级变量定量变量离散型变量连续型变量变量的转化：只能由“高级”向“低级”转化，即由信息量多的向信息量少的类型转化，如：定量有序分类二值 7.▲参数（parameter）是反映总体特征的指标，参数的大小是客观存在的，是一个常数，不会发生变化，然而往往是未知的，需要通过样本资料来估计，如总

体均数μ，总体标准差σ。 8.▲统计量（statistic）又称样本统计量，是反映样本特征的指标，是由观察资料计算出来的，如样本均数 X，样本标准差S。统计学的任务就是依据样本统计量来推断总体参数。 9.▲概率与频率的区别：概率是参数，频率是统计量；频率总是围绕概率上下波动。当某事件发生的概率≤0.05时，即P≤0.05，统计学习惯上称该事件为小概率事件。 10.▲误差：表示统计量与参数之间的差别或测量值与真值之间的差别。可分为系统误差和随机误差，其中系统误差呈现倾向性偏大或偏小现象，是可以避免的；而随机误差，是非人为偶然因素所致，不可避免，但可通过增大样本量等措施使其减小。 11.因果与联系：存在联系未必有因果关系，需排除虚假关联、间接关联。大多数观察性研究，单靠统计学分析只能考察变量之间的联系，难以证明因果关系。

电大实用卫生统计学期末复习材料

《实用卫生统计学》期末复习题一《实用卫生统计学》期末复习题一一、名词解释 1、卫生统计学： 2、随机抽样： 3、构成比： 4、频率： 5、非参数检验： 6、概率 7、变异系数名词解释答案 1. 卫生统计学：是运用数理统计的基本原理和方法，通过数据的收集，整理和分析，研究预防医学和卫生事业管理中随机现象规律性的一门应用科学。 2. 随机抽样：就是按照随机的原则获得样本，保证总体中每个个体都有同等机会被抽取，使样本对总体有较好的代表性。 3. 构成比：又称构成指标，它表示事物内部各组成部分所占比重或分布。常用百分数表示。 4. 频率：若随机事件在n次重复中出现m次，则n/m比值成为随机事件出现的频率。 5.非参数检验：是一种不依赖总体分布类型，也不对总体参数（如总体均数）进行统计推断的假设检验。 6．概率是描述随机事件发生的可能性的大小的数值，常用P表示。7．变异系数常记为CV，它被定义为标准差与算术均数之比。《实用卫生统计学》期末复习题二单选题 1．对某样品进行测量时，由于测量仪器事先未校正，造成测量结果普遍偏高，这种错误属于（）。 A. 系统误差 B. 随机测量误差 C. 抽样误差 D. 随机误差 2．医学人口统计应属于卫生统计学中的哪部分内容( )。 A. 卫生统计学基本原理 B. 卫生统计学基本方法 C. 健康统计 D.卫生服务统计 3. 原始数据分布不明时，表示其集中趋势易采用 ( ) 。 A. 算数均数 B. 几何均数 C. 中位数 D. 标准差 4.描述一组偏态分布资料的变异度时，最适宜选择的指标是( ) 。　 A.极差 B.标准差 C.四分位数间距 D.变异系数

卫生统计学知识点总结

卫生统计学知识点总结-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

卫生统计学统计工作基本步骤：统计设计（调查设计和实验设计）、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断（参数估计和假设检验）】。 ★统计推断：是利用样本所提供的信息来推断总体特征，包括：参数估计和假设检验。a参数估计是指利用样本信息来估计总体参数，主要有点估计（把样本统计量直接作为总体参数估计值）和区间估计【按预先设定的可信度（1-α），来确定总体均数的所在范围】。b假设检验：是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化，通常是由高级向低级转化。资料按性质可分为计量资料、计数资料和等级资料。定量资料的统计描述 1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。 2频率分布表（图）的用途：①描述资料的分布类型；②描述分布的集中趋势和离散趋势；③便于发现一些特大和特小的可疑值；④便于进一步的统计分析和处理；⑤当样本含量足够大时，以频率作为概率的估计值。 ★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。（1）描述集中趋势的统计指标：平均数（算术均数、几何均数和中位数）、百分位数（是一种位置参数，用于确定医学参考值范围，P50就是中位数）、众数。算术均数：适用于对称分布资料，特别是正态分布资料或近似正态分布资料；几何均数：对数正态分布资料（频率图一般呈正偏峰分布）、等比数列；中位数：适用于各种分布的资料，特别是偏峰分布资料，也可用于分布末端无确定值得资料。（2）描述离散趋势的指标：极差、四分位数间距、方差、标准差和变异系数。四分位数间距：适用于各种分布的资料，特别是偏峰分布资料，常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差：都适用于对称分布资料，特别对正态分布资料或近似正态分布资料，常把均数和标准差结合起来描述资料的集中趋势和离散趋势；变异系数：主要用于量纲不同时，或均数相差较大时变量间变异程度的比较。标准差的应用：①表示变量分布的离散程度；②结合均数计算变异系数、描述对称分布资料；③结合样本含量计算标准误。定性资料的统计描述 1定性资料的基础数据是绝对数。描述一组定性资料的数据特征，通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。 2 指标频率型指标强度型指标相对比型指标概念近似反映某一时间出现概率单位时间内某现象的发生率两个有关联的指标A和B之比计算公式 A/B 有无量纲无有可有、可无取值范围【0,1】可大于1无限制本质大样本时作为概率近似值分子式分母的一部分频率强度，即概率强度的似值表示相对于B的一个单位，A有多少位 A和B可以是绝对数、相对数和平均

山东大学2019考研：353卫生综合参考书目及真题笔记资料汇总

山东大学2019考研：353卫生综合参考书目及真题笔记资料汇总由于山东大学部分专业课官方没有公布参考书目由此给很多考生带来了很大的不便，对此精都考研网整理了山东大学本专业研究生初试用书及配套资料供大家参考一、353卫生综合参考书目： ①《环境卫生学》 ②《流行病学》 ③《卫生统计学》 ④《营养与食品卫生学》 ⑤《职业卫生与职业医学》二、配套精编复习资料山东大学353卫生综合《复习全程通》精都考研组编三、复习全程通内容简介《复习全程通》由精都考研工作室依托多年为各大机构编写考研专业课资料以及学员辅导的经验，由本团队组织目标院校本专业的高分研究生共同合作编写而成，全书考点知识面覆盖全面，权威细致，编排结构科学合理，是专门为本届考研的考生量身定制的必备专业课资料。通过本精编资料四大模块内容，结合考生每个阶段的复习，有助于考生深入了解目标院校以及专业考点重点，提高复习效率，拓展解题思路。 NO.1历年真题汇编通过目标院校原版真题，了解命题老师的出题思路，且分析考点重点，快速了解目标院校出题风格及命题思路，提高复习效率，拓展解题思路 NO.2教辅一本通本部分内容主要是由目标院校本专业研究生对应其初试参考书目整理汇编章节重点考点以及对应章节历年典型考题及答案解析，通过本书的配套复习，分析专业考点侧重，通过大量典型考题让充分掌握本门科目重点，确保考场应对自如。 NO.3冲刺模拟套卷书在遵循专业课最新参考书目，结合历年考研真题规律，制定的模拟卷，并有详细的配套答案讲解，适用于考生在冲刺模拟阶段的专业课复习。 NO.4电子版赠送内容本部分内容为购买全套资料的同学附赠的内容，主要是初试参考书目主编老师的教学讲义以及相关的扩充习题，此部分内容对于跨考的考生相对比较重要，通过讲义了解专业课基础复习侧重，达到专业知识点不缺不漏。四、解析备考辅导班：专业课一对一无忧全程班专业课一对一标准全程班山东大学在读研究生授课以上内容是【精都考研网】整理发布，每天及时发布最新考研资讯、考研经验、考研真题。目前很多同学已加入2019山东大学考研总群640030269，抓紧时间加入了解你所不知道的考研信息。

卫生统计学复习笔记

卫生统计学复习笔记一、概述 1、卫生统计学的概念（熟练掌握）统计学是研究数据的收集、整理和分析的一门科学，帮助人们分析所占有的信息，达到去伪存真、去粗取精、正确认识世界的一种重要手段。卫生统计学是应用数统计学的原理与方法研究居民健康状况以及卫生服务领域中数据的收集、整理和分析的一门科学。由此看出：统计学是处理资料中变异性的科学和艺术，是在收集、归类、分析和解释大量数据的过程中获取可靠结果的一门学科。这里强调了“过程”，但在实际工作中，许多人往往是忽略了设计、收集和归类（整理），到了分析数据时才想到统计学，此时难免发生“悔之晚矣”的憾事。作为统计学的应用者应充分认识到这一点。卫生统计学的内容（了解）： 1）健康统计：医学人口统计、疾病统计和生长发育统计等； 2）卫生服务统计：包括卫生资源利用、医疗卫生服务的需求、医疗保健体制改革等方面的统计学问题。 2、卫生统计学的工作步骤（熟练掌握）统计学对统计工作的全过程起指导作用，任何统计工作和统计研究的全过程都可分为以下四个步骤： 1)、设计：在进行统计工作和研究工作之前必须有一个周密的设计。设计是在广泛查阅文献、全面了解现状、充分征询意见的基础上，对将要进行的研究工作所做的全面设想。其内容包括：明确研究目的和研究假说，确定观察对象、观察单位、样本含量和抽样方法，拟定研究方案、预期分析指标、误差控制措施、进度与费用等。设计是整个研究工作中最关键的一环，也是指导以后工作的依据 2)、收集资料：遵循统计学原理采取必要措施得到准确可靠的原始资料。及时、准确、完整是收集统计资料的基本原则。卫生工作中的统计资料主要来自以下三个方面：①统计报表：是由国家统一设计，有关医疗卫生机构定期逐级上报，提供居民健康状况和医疗卫生机构工作的主要数据，是制定卫生工作计划与措施、检查与总结工作的依据。如法定传染病报表，职业病报表，医院工作报表等。②经常性工作记录：如卫生监测记录、健康检查记录等。③专题调查或实验。 3）、整理资料：收集来的资料在整理之前称为原始资料，原始资料通常是一堆杂乱无章的数据。整理资料的目的就是通过科学的分组和归纳，使原始资料系统化、条理化，便于进一步计算统计指标和分析。其过程是：首先对原始资料进行准确性审查（逻辑审查与技术审查）和完整性审查；再拟定整理表，按照“同质者合并，非同质者分开”的原则对资料进行质量分组，并在同质基础上根据数值大小进行数量分组；最后汇总归纳。 4）、分析资料：其目的是计算有关指标，反映数据的综合特征，阐明事物的内在联系和规律。统计分析包括统计描述和统计推断。前者是用统计指标与统计图（表）等方法对样本资料的数量特征及其分布规律进行

卫生统计学重点整理-预防医学

1.卫生统计学：是应用概率论和数理统计学的基本原理和方法，研究居民卫生状况以及卫生服务领域中数据的收集、整理和分析的一门科学。 2.同质(homogeneity)：在统计学中，若某些观察对象具有相同的特征或属性称为同质的。否则称为异质(heterogeneity)的或者间杂的。 3.变异(variation)：同质事物之间的差别称为变异。[没有个体变异，就没有统计学！] 4.总体(population)：根据研究目的所确定的同质观察单位的全体。 5.样本(sample)：是从总体中随机抽取的具有代表性的部分观察单位的集合。 6.样本含量(sample size)：样本中包含的观察单位个数。 7.参数(parameter)：反映总体特征的指标。特点：未知、唯一，希腊字母表示，如总体均数、总体率等。 8.统计量(statistic)：根据样本观察值计算出来的指标。特点：已知、不唯一，拉丁字母表示，如样本均数、样本率等。 9.变量(variable)：研究者需要对每个观察单位的某项特征或属性进行观察或测量，这种特征或属性称为变量。 10.变量值(value of variable)：变量的观察值或测量值称为变量值或观察值(observed value)。 11.资料(data)：变量值的集合称之为资料。 12.定量资料(quantitative data)：变量值是定量的，表现为数值大小。特点：一般有度、量、衡单位，一般属连续性资料。 13.定性资料(qualitative data)：观察值是定性的，表现为互不相容的类别或属性。特点：一般无度、量、衡单位，一般属于离散型资料。可进一步分为计数资料和等级资料。 14.计数资料(count data)：将观察单位按某种类别或属性进行分组，清点各组观察单位数所得的资料。可进一步分为二项分类资料和无序多项分类资料。 15.等级资料(ordinal data)：将观察单位按照某种特质或属性的程度或等级顺序分组，清点各组观察单位所得的资料。各属性之间互不相容且有程度的差别。 16.抽样研究(sampling research)：从总体中随机抽取样本，通过样本信息推断总体特征的研究方法。 17.抽样误差(sampling error)：由随机抽样造成的样本统计量与总体参数之间、样本统计量之间的差异。 18.概率(probability)：概率是随机事件发生可能性大小的数值度量。通常用P表示。大小介于0与1之间，即0≤P ≤1。 19.小概率事件：医学研究中，将概率小于等于0.05或0.01的事件称为小概率事件。 20.小概率原理：并不表示不可能发生，但在某一次试验中，是不会发生的。

卫生统计学考试题及答案要点

《卫生统计学》一、名词解释 1.计量资料 2.计数资料 3.等级资料 4.总体 5.样本 6.抽样误差 7.频数表 8.算术均数 9.中位数 10.极差 11.方差 12.标准差 13.变异系数 14.正态分布 15.标准正态分布 16.统计推断 17.抽样误差 18.标准误 19.可信区间 20.参数估计 P的含义假设检验中21. 型错误II I型和22. 检验效能23. 24.检验水准方差分析25. 26.随机区组设计27.相对数- 1 - 28.标准化法 29.二项分布 30.Yates校正 31.非参数统计 32.直线回归 33.直线相关 34.相关系数 35.回归系数 36.人口总数 37.老年人口系数 38.围产儿死亡率 39.新生儿死亡率 40.婴儿死亡率 41.孕产妇死亡率 42.死因顺位 43.人口金字塔二、单项选择题

1．观察单位为研究中的( D )。 A．样本B．全部对象 C．影响因素D．个体 2．总体是由（C ）。 A．个体组成B．研究对象组成 C．同质个体组成D．研究指标组成 3．抽样的目的是（B ）。 A．研究样本统计量B．由样本统计量推断总体参数 C．研究典型案例研究误差D．研究总体统计量 4．参数是指（ B ）。 A．参与个体数B．总体的统计指标 C．样本的统计指标D．样本的总和 5．关于随机抽样，下列那一项说法是正确的（A ）。 - 2 - ．抽样时应使得总体中的每一个个体都有同等的机会被抽取A ．研究者在抽样时应精心挑选个体，以使样本更能代表总体B ．随机抽样即随意抽取个体C ．为确保样本具有更好的代表性，样本量应越大越好D B ）。6．各观察值均加（或减）同一数后（．均数改变，标准差不变BA．均数不变，标准差改变．两者均改变 D ．两者均不变C ）。7．比较身高和体重两组数据变异度大小宜采用（A B．方差．变异系数 A D．标准差C．极差 D ）可用来描述计量资料的离散程度。8．以下指标中（．几何均数 B A．算术均数 D．标准差C．中位数）。9．血清学滴度资料最常用来表示其平均水平的指标是（C B．中位数A．算术平均数 D．平均数C．几何均数。）10．两样本均数的比较，可用（C 检验B．t A．方差分析．方差齐性检验 D C．两者均可 ?。D 11．配伍组设计的方差分析中，）等于（配伍???? A．--B．总误差总处理?????? D．---C．+处理总误差总处理误差??|X??|?，的正态总体中随机抽样，）的概率为5% 。12．在均数为标准差为（ B tSst?1.96 C．D. A． B．?1.96??,,X20.0520.05X13．完全随机设计方差分析的检验假设是（D ）。 A．各处理组样本均数相等B．各处理组总体均数相等 C．各处理组样本均数不相等D．各处理组总体均数不全相等 14．已知男性的钩虫感染率高于女性。今欲比较甲乙两乡居民的钩虫感染率，但甲乡人口女多于男，而乙乡男多于女，适当的比较方法是（ D ）。 2检验χB A．分别进行比较．两个率比较的 - 3 -

卫生统计学重点笔记之欧阳家百创编

医师资格考试蓝宝书预防医学欧阳家百（2021.03.07）医学统计学方法第一节基本概念和基本步骤（非常重要）一、统计工作的基本步骤设计（最关键、决定成败）、搜集资料、整理资料、分析资料。总体：根据研究目的决定的同质研究对象的全体，确切地说，是性质相同的所有观察单位某一变量值的集合。总体的指标为参数。实际工作中，经常是从总体中随机抽取一定数量的个体，作为样本，用样本信息来推断总体特征。样本的指标为统计量。由于总体中存在个体变异，抽样研究中所抽取的样本，只包含总体中一部分个体，这种由抽样引起的差异称为抽样误差。抽样误差愈小，用样本推断总体的精确度愈高；反之，其精确度愈低。某事件发生的可能性大小称为概率，用P表示，在0～1之间，0和1为肯定不发生和肯定发生，介于之间为偶然事件， <0.05或0.01为小概率事件。二、变量的分类

变量：观察单位的特征，分数值变量和分类变量。第二节数值变量数据的统计描述（重要考点）一、描述计量资料的集中趋势的指标有 1.均数均数是算术均数的简称，适用于正态或近似正态分布。 2.几何均数适用于等比资料，尤其是对数正态分布的计量资料。对数正态分布即原始数据呈偏态分布，经对数变换后（用原始数据的对数值lgX代替X）服从正态分布，观察值不能为0，同时有正和负。 3.中位数一组按大小顺序排列的观察值中位次居中的数值。可用于描述任何分布，特别是偏态分布资料的集中位置，以及分布不明或分布末端无确定数据资料的中心位置。不能求均数和几何均数，但可求中位数。百分位数是个界值，将全部观察值分为两部分，有X％比小，剩下的比大，可用于计算正常值范围。二、描述计量资料的离散趋势的指标 1.全距和四分位数间距。 2.方差和标准差最为常用，适于正态分布，既考虑了离均差（观察值和总体均数之差），又考虑了观察值个数，方差使原来的单位变成了平方，所以开方为标准差。均为数值越小，观察值的变异度越小。 3.变异系数多组间单位不同或均数相差较大的情况。变异系数计算公式为：CV=s/×100％，公式中s为样本标准差，为样本均数。三、标准差的应用

16秋实用卫生统计学终考综合练习题

16秋实用卫生统计学期末终考综合练习题说明： 1.本套综合练习题仅针对16秋期末终考而编制，每个题的解题方法在学习网实用卫生统计学课程主页的“每章重难点辅导”中，或在教材后面的习题答案中，找到相应题目或类似题目的详细解答过程和答案。 2.16秋期末终考试题与本综合练习题的题型完全相同。有些数据可能稍有变化，但解题方基本一致。本次期末考试时间为60分钟，开卷考试，时间短，题量大，希望同学们考前一定要做足准备，考试时仔细审阅试题，争取好成绩。一、填空题 1．经调查某地10岁男童身高均数为135厘米，标准差为4.74厘米，其变异系数是 3.51% （注意：保留两位小数）。 2.正态分布的两个重要参数是均值和方差。 3.某市6岁男童的身高均数为115.0cm，标准差为10.0cm。试计算6岁男童身高大于13 4.6cm的约占百分数是 2.5% 4．常用的相对数有构成比、率、比。 5．增长速度与发展速度关系为增长速度=发展速度-1 。 6．环比发展速度的算式为以前一个时间（年）数据为作基数，以相邻的后一时间（年）数据与之相比，或当前一年数据与前一年数据之比。 7．动态数列是一列按时间顺序排列起来的统计指标，它包括:绝对数,相对数或平均数，这些指标用以说明事物在时间上的变化和发展趋势。 8．统计表是由标题、标目、线条、数字四部分构成。 9．统计学中常见的统计图形有：普通线图、半对数线图、直条图、直方图、圆图、百分条图和散点图 10.置信区间的两个要素：一是准确度，二是；精确度。 s 11.均数标准误的计算公式为 12.均数的抽样误差是对于抽样过程中产生的同一总体中均数之间的差异。 13.根据总体标准差σ是否已知及样本含量n的大小，总体均数置信区间的计算公式不同。

卫生统计学知识点整理

卫生统计学考点整理（一） 2017年11月24日一、绪论： 1、什么是卫生统计学：卫生统计学是运用数理统计的基本原理和方法对预防医学和公共卫生领域中的科学研究进行设计，以及研究资料的收集、整理和分析的一门应用科室。 2、卫生统计学的基本内容包括哪些 ①卫生统计学的基本理论和方法，包括研究设计和数据分析中的统计理论和方法。 ②健康统计，包括医学人口统计、疾病统计和生长发育统计等。 ③卫生服务统计，包括卫生资源、医疗卫生服务的需求和利用、医疗保健制度和管理等的统计问题。 3、什么是计量资料用度量衡的方法测定每个观察单位的某项研究指标量的大小，所得到的数据（即测量值）成为计量资料（计量资料含有单位） 4、什么是计数资料将全体观察单位按照某种性质或类别进行分组，然后分别清点各组中的例数，这样得到的数据成为计数资料（也称分类资料）（不含单位） 5、什么是等级资料将全体观察单位按照某种性质的不同程度分为若干组，分别清点各组中观察单位的个数。 6、什么是总体根据研究目的的确定的同质观察单位的全体。（是同质的所有观察单位某种变量值的集合）研究对象具有相同的背景、条件、属性 8、什么是变异同一性质的事物，其个体观察值（变量值）之间的差异。 9、什么是样本从总体中随机抽取具有代表性的一部分个体，其测量值（或观察值）的集体成为样本。 10、什么是抽样研究对从所研究的总体中随机抽取有代表性的一部分个体构成的样本进行研究。 11、抽样研究的目的是什么通过用样本资料计算的指标去推论总体。 12、什么是参数参数是指总体指标。（如：总体均数μ、总体率π、总体标准差σ等） 13、什么是统计量统计量是指样本指标。（如：样本均数、样本率p、样本标准差S等） 14、什么是统计描述用统计图或计算统计指标的方法表达一个指定群体的某种现象或特征 15、什么是统计推断根据样本资料的特性对总体的特性作估计或者推论的方法。（常用方法是参数估计和假设检验）

卫生统计学重点笔记

医师资格考试蓝宝书-预防医学医学统计学方法第一节基本概念和基本步骤（非常重要) 一、统计工作的基本步骤设计（最关键、决定成败）、搜集资料、整理资料、分析资料。总体:根据研究目的决定的同质研究对象的全体,确切地说,是性质相同的所有观察单位某一变量值的集合。总体的指标为参数。实际工作中,经常是从总体中随机抽取一定数量的个体,作为样本，用样本信息来推断总体特征。样本的指标为统计量。由于总体中存在个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体,这种由抽样引起的差异称为抽样误差。抽样误差愈小，用样本推断总体的精确度愈高；反之，其精确度愈低。某事件发生的可能性大小称为概率,用P表示，在0~1之间,0和１为肯定不发生和肯定发生,介于之间为偶然事件,<0.０5或0.01为小概率事件。二、变量的分类变量：观察单位的特征，分数值变量和分类变量。第二节数值变量数据的统计描述(重要考点) 一、描述计量资料的集中趋势的指标有 1.均数均数是算术均数的简称,适用于正态或近似正态分布。 2.几何均数适用于等比资料,尤其是对数正态分布的计量资料。对数正态分布即原始数据呈偏态分布,经对数变换后(用原始数据的对数值ｌgX代替X）服从正态分布，观察值不能为0,同时有正和负。 3.中位数一组按大小顺序排列的观察值中位次居中的数值。可用于描述任何分布,特别是偏态分布资料的集中位置,以及分布不明或分布末端无确定数据资料的中心位置。不能求均数和几何均数，但可求中位数。百分位数是个界值,将全部观察值分为两部分,有Ｘ%比小，剩下的比大,可用于计算正常值范围。二、描述计量资料的离散趋势的指标 1.全距和四分位数间距。 2．方差和标准差最为常用,适于正态分布,既考虑了离均差（观察值和总体均数之差）,又考虑了观察值个数，方差使原来的单位变成了平方,所以开方为标准差。均为数值越小，观察值的变异度越小。 3.变异系数多组间单位不同或均数相差较大的情况。变异系数计算公式为：CＶ=s/X ×1０0%,公式中s为样本标准差,X为样本均数。三、标准差的应用表示观察值的变异程度(或离散程度）。在两组(或几组)资料均数相近、度量单位相同的条件下,标准差大，表示观察值的变异度大,即各观察值离均数较远,均数的代表性较差;反之，表示各观察值多集中在均数周围,均数的代表性较好。（常考!）四、医学参考值的计算方法,单双侧问题,医学为95% 医学参考值是指正常人体或动物体的各种生理常数，由于存在变异，各种数据不仅因人而异，而且同一个人还会随机体内外环境的改变而改变，因而需要确定其波动的范围，即正