文档库 最新最全的文档下载
当前位置:文档库 › 卫生统计学知识点(笔记)

卫生统计学知识点(笔记)

卫生统计学知识点(笔记)
卫生统计学知识点(笔记)

第一章绪论

1.统计学(statistics)是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。

2.▲总体(population)用来表示大同小异的对象全体,例如一个国家的所有成年人;某地的所有小学生。可分为目标总体和研究总体。若试图对某个总体下结论,这个总体便称为目标总体(target population);资料常来源于目标总体中的一个部分,它称为研究总体(study population)。需要谨慎的是,就研究总体所下的结论未必适用于目标总体。

3.▲样本(sample)是指从研究总体中抽取的一部分有代表性的个体。获取样本的过程称为抽样(sampling)。抽样研究的目的是用样本数据推断总体的特征。需要注意的是,统计学的结论从来就不是完全肯定或完全否定的,能不能成功地达到从样本推断总体的目的,关键是抽样的方法、样本的代表性和推断的技术。

4.▲同质(homogeneity)是指同一总体中个体的主要性质相同。

5.▲变异(variation)是指同质的个体之间存在的差异。

6.▲变量的类型

二分类变量

分类变量或名义变量

定性变量多分类变量

变量有序变量或等级变量

定量变量离散型变量

连续型变量

变量的转化:只能由“高级”向“低级”转化,即由信息量多的向信息量少的类型转化,如:定量有序分类二值

7.▲参数(parameter)是反映总体特征的指标,参数的大小是客观存在的,是一个常数,不会发生变化,然而往往是未知的,需要通过样本资料来估计,如总

体均数μ,总体标准差σ。

8.▲统计量(statistic)又称样本统计量,是反映样本特征的指标,是由观察资料计算出来的,如样本均数 X,样本标准差S。

统计学的任务就是依据样本统计量来推断总体参数。

9.▲概率与频率的区别:概率是参数,频率是统计量;频率总是围绕概率上下波动。当某事件发生的概率≤0.05时,即P≤0.05,统计学习惯上称该事件为小概率事件。

10.▲误差:表示统计量与参数之间的差别或测量值与真值之间的差别。可分为系统误差和随机误差,其中系统误差呈现倾向性偏大或偏小现象,是可以避免的;而随机误差,是非人为偶然因素所致,不可避免,但可通过增大样本量等措施使其减小。

11.因果与联系:存在联系未必有因果关系,需排除虚假关联、间接关联。大多数观察性研究,单靠统计学分析只能考察变量之间的联系,难以证明因果关系。

第二章 定量变量的统计描述

第一节 频率分布表与频率分布图

1.频率分布表:是指对各变量值出现的频率列表,简称频率表,频率分布表的图形表示即为频率分布图。

2.编制频率表的注意事项:

(1)分组不宜过粗或过细,组段数一般取10左右,且常采用等距分组;

(2)各组段要连续但不能重叠,除最后一个组段外,其余组段应包含下限值,不包含上限值。

(3)第一组段应包含最小值,最后一个组段应包含最大值。

3.▲编制频率分布表(图)流程: (1)求极差(全距)

(2)划分组段:确定组段数、组距、 (3)根据组距分组

(4)制作频数表和频数图

4. ▲频数分布表(图)的用途: (1)描述变量的分布类型 对称分布

分布 正偏峰分布 偏峰分布

负偏峰分布 (2)揭示变量的分布特征

集中趋势(平均水平):算术均数、几何均数、中位数、众数 分布特征

离散趋势(变异程度):极差、四分位数间距、方差、标准差、变

异系数

(3)便于发现某些离群值或极端值

(4)便于进一步计算统计指标和统计分析

第二节 描述平均水平的统计指标

1.均数的特性:

①各观察值与均数之差(离均差)的总和等于0

()0=-∑x x

②各观察值的离均差平方和最小

()()()x a a x x x ≠-<-∑

∑2

2 (x 为表中数,a 为表中任意≠x 的数)

2.▲常用的平均数的比较

PS :

正态分布 :均数=中位数 正偏峰分布:均数>中位数 负偏峰分布:均数<中位数

3. 百分位数(x P ) ▲()L x

x F x n f i

L P -?+

=% L :欲求的百分位数所在组段的下限 i :该组段的组距 x f :该组段内的频数

n :总频数

L F :所在组段的累计频数 百分位数50P 就是中位数

4. 众数(mode ):总体/样本中出现次数最多的数值

第四节 描述变异程度的统计指标

小结:对于服从正态分布或近似正态分布的变量,常把算术均数和标准差结合起来( X±S),从平均水平和变异程度两方面描述变量的分布特征;对于服从偏峰分布的变量,常把中位数和四分位数间距结合起来描述变量的平均水平和变异程度。

第五节统计表和统计图

1.▲统计表的组成部分

(1)表号及标题:位于统计表上方中央。

(2)标目:分为横标目和纵标目。

(3)线条:常用“三线表”,包括顶线、底线和纵标目分隔线;左右两侧不应有边线,左上角不宜有斜线,表内不应有竖线。

(4)数字:服从正态分布用(均数±标准差)描述;不服从正态分布用中位数(下四分位数~上四分位数)。表内不留空格,数字暂缺或未记录用“...”表示,无数字用“-”表示。

(5)备注:非基本要素,在统计表下方。

2.绘制统计图的基本要求

(1)图号和标题:位于图的下方中央。

(2)纵横坐标轴:标目尺度,纵轴尺度自下而上,横轴尺度自左而右,数量一律由小到大,并等距表明。

(3)直方图、累计频率分布图和直条图纵坐标要从0开始。

(4)纵横坐标长度的比例一般为7:10。

3.▲描述定量变量的常用统计图比较

第三章 定性变量的统计描述

第二节 常用相对数指标

(注:具体计算公式详见课本)

2. ▲应用相对数时的注意事项

(1)理解相对数的含义不可望文生义;需牢牢掌握三者的概念 (2)频率型指标的解释要紧扣总体与属性;

(3)计算相对数时分母应有足够的数量;样本例数较少会使相对数波动较大 (4)正确计算合计频率; (5)注意资料的可比性;在比较相对数时,除了要对比的因素(如不同的药物),其余的影响因素应尽可能相同或相近

(6)样本相对数的统计推断。应进行参数估计与假设检验

第三节 医学人口统计常用指标

1.描述人口特征的常用指标

(1)人口总数:一般指一个国家或地区在某一特定时间的人口数,按惯例,一般采用一年的中点,即7月1日零时为标准时点进行统计。

(2)平均人口数:通常是指相邻两年年末(12月31日)人口数的平均值,当人口数在一年中是均匀变动时,也可用年中(7月1日零时)人口数代表全年的平均人口数,平均人口数常用作计算出生率、死亡率、发病率等指标的分母。 (3)▲人口学特征指标

指标 分子 分母 基数 指标类型 老年(人口)系数 ≥65岁人口数 人口总数 100% 频率型 少儿(人口)系数 ≤14岁人口数 人口总数 100% 频率型

总负担系数 ≤14岁人口数+≥65

岁人口数

15-64岁人口数 100% 相对比型

少儿负担系数 ≤14岁人口数 15-64岁人口数 100% 相对比型 老年负担系数 ≥65岁人口数 15-64岁人口数 100% 相对比型 老少比 ≥65岁人口数 ≤14岁人口数 100% 相对比型

性别比男性人口数女性人口数100% 相对比型

2.▲测量生育水平的统计指标

指标粗出生率总生育率年龄别生育率总和生育率

定义某年某地平均每千人

口的活产数

某年某地平

均每千名育

龄妇女的活

产数

某年某地每千

名某年龄组育

龄妇女的活产

表示每个妇女

一生平均生多

少个孩子

分子同年活产数同年活产数同年某年龄组

活产数

计算方法:

15-49岁年龄

别生育率的总

分母同年平均人口数×1年同年15-49岁

妇女数

同年某年龄组

平均妇女数×1

用途反映一个国家或地区

的人口自然变动的基

本指标

更确切地反

映生育水平

可直接比较不

同地区不同时

期同一年龄别

生育率

局限性受人口年龄性别结构

的影响较大,只能粗

略反映生育水平

受育龄妇女

内部年龄结

构的影响

3.测量人口再生育的统计指标

指标定义计算用途

自然增长率粗生育率与粗死亡率

之差粗生育率-粗死亡率粗略估计人口增

长趋势

粗再生育率每个妇女一生平均生

育的女儿数总和生育率×女婴占出生婴儿的比例

净再生育率(NRR)NRR=1,未来人口将保持恒定;NRR>1,未来人口将增多;

NRR<1,未来人口将减少

4.▲测量死亡水平的指标

指标定义分子分母用途

粗死亡率某地某年平均每

千人口中的死亡

同年内死亡

人数

年平均人口数×1

反映当地居民

总的死亡水平

年龄别死亡率某年某年龄别平

均每千人口中的

死亡数

同年某年龄

组死亡人数

同年某年龄组平

均人口数×1年

婴儿死亡某年活产儿中未同年<1周同年活产儿总数反映社会卫生

率▲满一周岁婴儿的

死亡频率岁死亡人数状况、婴儿保

健工作以及人

群健康状况的

重要指标之

一,也是死亡

统计中较敏感

的指标

围生儿死亡率同年围生期

死胎数+死

产数+<7天

死亡人数

同年围生期死胎

数+死产数+活产

衡量孕前、孕

期、产期、产

后保健工作质

量的敏感指标

之一

5岁以下儿童死亡率▲同年5岁以

下儿童死亡

同年活产儿总数

综合反映儿童

健康水平和变

化的主要指标

孕产妇死亡率某年中由于怀孕

和分娩及并发症

造成的孕产妇死

亡人数与同年出

生活产数之比

同年孕产妇

死亡数

同年活产儿总数

间接反映一个

国家的卫生文

化水平

死因别死亡率某种原因所致的

死亡率,也称某病

死亡率

同年内某原

因死亡人数

同年平均人口数

×1年

死因分析的重

要指标,反映

各类病伤死亡

对居民生命的

危害程度

某病病死率在某一期间内(1

年)患某病者因该

病死亡的百分比

同年某病死

亡人数

同年患该病总数

说明一种疾病

的严重程度,

也可反映一个

医疗单位医疗

水平和质量

死因构成比全部死亡人数中,

死于某死因者所

占的百分比

同年某死因

死亡人数

同年内死亡总数

说明各种死因

的相对重要性

死因顺位按各类死因构成比的大小由高到低排列的位次说明各类死因的相对重要性

第四节疾病统计常用指标

1.疾病统计指标

指标定义用途

发病率一定时期内,在可能发生某病的

一定人群中新发生某病的强度

1.表示发病危险的直接指标;

2.用于探讨疾病的危险因素;

3.评价疾病防治效果

患病率某特定时间内某病新旧病例占描述病程较长或发病时间不易明确

患病率=发病率×病程

治愈率 受治病人中治愈的频率

第五节 粗率的标准化法

1.标准化法

(1)目的:消除用于比较的两组个体其他变量分布不同的影响

(2)做法:找一个“标准”,在这个共同的“平台”上比较两组资料。“标准”的选择有以下三种:第一,选定两组之一,将其作为“标准”;第二,两组合并,作为“标准”;第三,在两组之外另选一个群体,将其作为“标准”。 2.▲标准化率的计算 直接标准化法

(1)选定“标准人口”;

(2)分别计算“标准人口”的预期治愈人数之和; (3)分别计算两种疗法的标准化治愈率

标准化治愈率=预期治愈人数之和/标准人口数 间接标准化法

(1)选定该事件的“标准发生率”;

(2)分别计算两组每个类别中发生某事件的预期人数之和; (3)分别计算两组合计发生率与标准患病率的乘积 预期患病人数之和

实际患病人数之和

标准患病率标准化患病率?

=

3.▲应用标准化法的注意事项:

(1)标准化法的目的是消除混杂因素的影响;

(2)标准化后的标准化率,已经不再反映当时当地的实际水平,它只是表示相互比较的资料间的相对水平;

(3)标准化法的实质是找一个“标准”,使两组得以在一个共同的“平台”上进行比较。选择不同的“标准”,算出的标准化率也会不同,比较的结果也未必相同,所以报告结果时必须说明所选用的“标准”和理由。

(4)两样本标准化率是样本值,存在抽样误差。比较两样本的标准化率,当样本含量较小时,还应做假设检验。

第七节 定性变量统计图

1.▲常用统计图的用途 条图 离散型变量,分类变量 1. 坐标尺度必须从0点开始

2. 一般为等间距,中间不能折断 百分条图 分类变量

圆图

分类变量

一般以时钟9点/12点位置作始点,顺时针方向排列

线图连续型变量,分类变量

2.不应将折线绘制成平滑的曲线

半对数线图连续型变量,分类变量用线段的升降表达事物的发展速度(相对比)

直方图连续型变量

散点图双变量,连续型变量用点的排列趋势和密集度表示两变量的相关关系

统计地图连续型变量,分类变量

箱式图连续型变量5个指标(最小值、

25

P、中位数、

75

P、最大值)

第四章 常用概率分布

第一节 二项分布

1.▲三个条件:

①每次实验只能产生相互对立的两种结果之一 ②各实验的结果相互独立

③每次结果出现的概率是相同的,即P (A )=π (二分类、独立、重复)

2. ▲公式:

()()

X

n X X n C X P --=ππ1,其中()!

!!

X -n X n C X n =

3. 特征:

①π=0.5时,图形是对称的

②π≠0.5时,图形不对称,且对同一n ,π离0.5越远,对称性越差。对同一n ,随着π的增大,分布趋于对称

③当n →∞时,只要n 不太靠近0或1(特别是当n π和n(1-π)均大于5时),二项分布趋于对称

4. X 和p :

对于任何二项分布问题,如果每一次试验出现阳性结果的概率均为π,进行n 次独立重复试验,出现X 次阳性结果,那么,可得: (1)X

①总体均数:πμn = ②方差:()ππσ-=12n ③标准差:()ππσ-=1n (2)p :出现阳性结果的频率:n

X

p = ①总体均数为:πμ=p

②方差:()

n

p ππσ-=

12

③标准差:()

n

p ππσ-=

1

5. 应用:(1)概率估计(2)累计概率计算

第二节 Poisson 分布

1. ▲适用条件:

①独立、两个结果率教稳定 ②独立重复的次数很大

③每次出现某时间概率π或未出现概率(1-π)很小很小,接近0或1

④单位时间、面积、容积、人群中观察事件的分布应该均匀才符合(PS :传染病、钉螺繁殖期散布不是!)

即二项分布的极限情况:n 很大、π很小

2. 记为()λP ,其中λ为Poisson 分布的唯一参数

3. ▲公式:()!

X e

X P X

λλ

-=,λ为Poisson 分布的总体均数

4. 特性:

①总体均数与总体方差相等,都为λ

②观察结果具有可加性:T=X 1+X 2也服从Poisson 分布,总体均数为21λλ+ ③Poisson 分布是非对称的,总体参数λ越小,分布越偏;随着λ增大,分布趋向对称,λ≥20时,可认为是对称分布

5.应用:

(1)概率估计

(2)累计概率计算(注意!大于一定次数时,不符合Poisson 分布,不能用)

第三节 正态分布

1.▲概念:若变量X 的频率曲线对应于数学上的正态分布曲线,则称该变量服从正态分布

2. ▲公式:()()

2

221

σμπ

σ--

=

x e

x f (参数位置记清)

3. ▲正态分布曲线特点: ①关于μ=x 对称

②在μ=x 处取得最大值,在σμ±=x 处有拐点 ③曲线下面积为1

④μ决定曲线在横轴上的位置,μ增大,曲线右移,反之左移

⑤σ决定曲线的形状,当μ恒定时,σ越小,数据越分散,曲线越“矮胖”,反之“高瘦”

4. 曲线下面积规律

①正负1个标准差内,正态分布曲线下面积为68.27% ②正负1.64个标准差内,正态分布曲线下面积为90% ③正负1.96个标准差内,正态分布曲线下面积为95% ④正负2个标准差内,正态分布曲线下面积为95.44% ⑤正负2.58个标准差内,正态分布曲线下面积为99% ⑥正负3个标准差内,正态分布曲线下面积为99.74%

5. 标准正态分布

(1)转换公式:σ

μ

-=X Z

(2)记作:N (0,1)

(3)总体均数为0,总体标准差为1

6. 正态分布的应用

(1)▲确定医学参考值范围: ①百分位数法:(偏态) 1)双侧界值:P2.5,P97.5 2)单侧上界:P95 3)单侧下界:P5 ②正态分布法:S X 96.1±

(2)质量控制图(了解)

(3)二项分布、泊松分布的正态分布近似:

①二项分布的正态近似:当n π和n (1-π)均大于5时 ②泊松分布的正态近似:λ≥20

第五章 参数估计基础

第一节 抽样分布与抽样误差

一、抽样误差

1. 抽样研究中,抽样误差是不能避免的,但抽样误差有规律,可以通过增加样本量降低

2. 抽样误差是由于个体差异和偶然性存在引起的

3. 反映抽样误差大小的标准是标准误

二、抽样分布

1. 特点(理解):

①样本均数恰好等于总体均数是极其罕见的 ②样本均数之间存在差异

③样本均数围绕总体均数,中间多、两边少,左右基本对称,呈近似正态分布 ④样本均数之间的变异明显小于原始变量值之间的变异

2. 均数的标准误(标准误):样本均数的标准差,反应均数抽样误差的大小

n X σ

σ=

(理论值)

n

S S X =

(估计值)

3.(理解)抽样分布的变异随样本含量的增加而减少。对任意分布,在样本含量足够大时,其样本均数的分布近似于正态分布,且样本均数的均数等于原分布的均数

4. 频率的标准误

()

n

p ππσ-=

1 (理论值)

()()

n

p p n p p S p -≈--=

11

1 (估计值)

第二节 t 分布

1. 公式

n

S X S X t X /μ

μ-=

-=

,1-=n ν

2. t 分布的特点(理解):

①单峰分布,以0为中心,左右对称

②ν越小,t 值越分散,曲线的峰部越矮,尾部越高

③随着ν逐渐增大,t 分布逐渐接近标准正态分布,当ν趋向∞时,t 分布趋近标准正态分布,故标准正态分布是t 分布的特例

第三节 总体均数及总体概率的估计

一、参数估计的理论基础

1.点估计:直接利用样本统计量的一个数值来估计总体均数。缺点是没有考虑到抽样误差的大小

2.区间估计:将样本统计量与标准误结合起来,确定一个具有较大置信度的包含总体参数的范围,该范围称为总体参数的置信区间(CI ),置信区间是一个开区间

二、总体均数及总体概率的区间估计 (一)总体均数的置信区间 1. t 分布法:

▲适用条件:当σ未知且n 较小(如n ≤50)

总体均数μ的双侧(1-α)置信区间记为:()X X S t X S t X νανα,2/,2/,+-

2. 正态近似法:

(1)▲适用条件:当σ已知

总体均数μ的双侧(1-α)置信区间记为:()X X z X z X σσαα2/2/,+- (2)▲适用条件:当σ未知但n 足够大(n >50)

总体均数μ的双侧(1-α)置信区间记为:()X X S z X S z X 2/2/,αα+-

(二)总体均概率的置信区间

1. 查表法:小样本资料(如n ≤50),特别是当p 非常接近0或100%

2. 正态近似法:当n 足够大,且np 及n (1-p )均大于5

总体概率π的双侧(1-α)置信区间近似为:()p p S z p S z p 2/2/,αα+-

PS :

1. ▲医学参考值范围与总体均数的置信区间的区别: 95%参考值范围:总体95%的个体在该区间内

总体均数的95%置信区间:平均每100个样本(n 相同),有95个样本中包含总体均数

2.置信度从90%调整为95%,置信区间会变宽,精度变差

第六章假设检验基础

由样本信息对相应总体的特征进行推断称为统计推断。对所估计的总体首先提出一个假设,然后通过样本数据去推断是否拒绝这一假设称为假设检验。

第一节假设检验的概念与原理

1.假设检验是根据样本提供的信息对两个或多个总体的分布作出判断,用以确定所比较的总体是否一致。

▲2.如何运用假设检验?

如果x与u 接近,其差别可用抽样误差解释,可认为x来自u总体;

如果x与u 相差甚远,不宜用抽样误差解释,则怀疑x不是来自u总体;

那么x与u相差多大算是由抽样误差造成的?通过Z 值或t值求得P来推断。公式:见书上。

结果:如果x与u相差较远,t 或Z值就大,P值就小,当P 小到一定的α界值时,则称为小概率事件,即在一次抽样中发生的可能性就很小,如果发生了,则有理由怀疑原假设μ= μ

可能不成立。如果P值较大,认为差异由抽样误差所致的可能性较大,故还没有足够的理由拒绝所做的假设。

3.▲假设检验的原理?反证法思想、小概率事件原理。

从反面提出一个假设,在假设成立的条件下,看看得到现有样本的可能性有多大。–P<0.05,(小概率事件,可能性很小),在一次试验中本不该得到,居然得到了,说明我们的假设有问题,拒绝之。

–P>0.05(不是小概率事件,有可能得到手头的结果),故根据现有的样本无法拒绝事先的假设(没理由)。

4.假设检验的基本步骤

(1)建立假设,确定检验水准。

零假设/原假设/无效假设:表示为H

0,H

:u=u

。该假设将差异的原因归结为抽

样误差。

对立假设/备择假设:表示为H

1

,该假设将差异的原因归结为非抽样误差。

H=

1

的内容反映了检验的单双侧:

①双侧检验:备则假设为两总体均数不等包含μ

1< μ

2

和μ

1

> μ

2

②单侧检验:凭借专业知识有充分把握可以排除某一侧,备择假设为μ

1< μ

2

者μ

1> μ

2

PS:什么是显著性水平?

①又称a水准, 是预先规定的概率值,它确定了小概率事件的标准。a为I型错误的概率大小。实际工作中常取a= 0.05 。但a的取值并非一成不变,可根据不同研究目的给予不同设置。

②无效假设为真时,拒绝无效假设的概率,被称为抽样分布的拒绝域。

③表示为a(alpha) ,常用的a值有0.01, 0.05 。

(2)计算检验统计量

根据分析目的、资料类型、设计类型、样本大小、方法的适用条件等选择相应的检验方法并计算检验统计量。所有检验统计量都是在假设H

成立的条件下计算

出来的,它是用于决定是否拒绝H

的统计量,其统计分布在统计推断中至关重要。

(3)确定P值,作出统计结论

①根据给定的检验水准,查表得出相应的临界值

②将检验统计量的值(t、Z值)与检验水准相对应的临界值进行比较,即可得到概率P。

③得出拒绝或不拒绝无效假设(H

)的结论。

注意:P值是在H

成立前提下,抽得比现有样本统计量更极端的统计量值的概率。

P值越小只能说明:作出拒绝H

0,接受H

1

的统计学证据越充分。

第二节t检验

1.▲单样本资料的t检验(计算)

(1)▲使用范围:用于样本均数与已知总体均数(一般为理论值、标准值或经

过大量观察所得的稳定值等)的比较。

(2)分析目的:推断样本所代表的未知总体均数u 与已知总体均数u 0有无差别。 (3)▲应用条件:①σ未知且 n 较小,②样本取自正态总体; (4)▲公式:n

S X t /0μ-=

2.▲配对设计资料的t 检验(计算)

(1)目的:配对设计是研究者为了控制可能存在的非处理因素,增加两组的可比性而采用的一种实验设计方法,当总样本量一定时,采用配对设计往往会获得较高的检验效能 。

(2)△配对设计实施的主要形式:

①异体配对。将受试对象按一定条件配成对子(同种属、同体重、同年龄、同性别等),再随机分配每对中的两个受试对象到不同的处理组;

②自身配对。同一受试对象分别接受两种不同处理,其目的是推断两种处理的效果有无差别。

注意:在实际应用中,同一受试对象接收某种处理之前和之后的数据,也可试为自身配对。但需特别注意:如果观察指标随时间变化而变化时,对结果的解释要慎重。

优点: 配对设计减少了个体差异。特点:资料成对,每对数据不可拆分。 (3)应用条件:对于配对设计定量资料的统计分析,若差值服从正态分布,可采用配对t 检验。 (4)▲公式:n

S d t d /0-=,1-=n ν

3.两独立样本资料的t 检验

(1)成组设计两总体均数比较有两种类型:

①将研究对象随机分为两组分别接受不同的处理,一般把这样获得的两组资料视为代表两个不同总体的两份样本,据以推断它们的总体均数是否相等; ② 另一种从两个研究总体中随机抽样,比较某一指标是否相等,目的是推断两

个总体均数是否相等。 (2)▲应用条件:

①两样本分别来自正态分布总体(当每组的样本例数均大于50时,可以不必进行正态性检验,因为近似正态) ②两样本来自的总体方差齐。 (3)公式:???? ??+-=

21

22111n n S X X t C ,其中c S 是利用两样本联合估计的方差

()()2

11212

22211-+-+-=

n n S n S n S c

PS :方差不齐时要用t ’检验,公式见P109

4.两独立样本资料的方差齐性检验

(1)△有两种方法可以判断条件方差齐性是否成立:

①直观分析:当两样本的方差相差超过3 倍时,认为方差齐性不成立; ②进行方差齐性检验。

(2)公式:222

1S S F =,111-=n ν,122-=n ν

(3)若两总体方差不等: ①近似t 检验:t'检验。 ②采用数据变换。 ③非参数检验。

5.大样本资料的Z 检验

1. 单样本资料的Z 检验:样本均数与总体均数比较时(样本来自正态总体),如果样本量较大(例如,大于100)时,可采用Z 检验;但只是近似方法。优点:简单,Z 界值与自由度无关。

n

S X Z /0μ-=

2. 两独立样本资料的Z 检验:两样本均数比较时(样本来自正态总体),当每

组样本量均较大(例如,大于100 )时,可采用Z 检验;但只是近似方法。优点: 简单,Z 界值与自由度无关。

2

22

1212

12

211n S n S X X S X X Z X X +-=-=

-

第三节 二项分布于poisson 分布资料的Z 检验(了解)

1.二项分布资料的Z 检验 (1)一组样本资料的Z 检验

①条件:np 和n(1-p)均大于5时,可用正态近似法。

②公式:详见P113。若n 不太大时,需作连续性校正,公式见书本。

(2)两组独立样本资料的z 检验 公式:详见P113

2.Poisson 分布资料的Z 检验

应用条件:Poisson 分布资料Z 检验的适用条件 λ ≥20。但在实际应用中,λ通常未知,故可以通过观察样本计数是否大于20来判断。 (1)单样本资料的Z 检验

当总体均数λ≥20 时,依据Poisson 分布近似正态分布的原理,可以对其总体均数进行推断。公式例题见P114。 (2)两独立样本资料的 Z 检验

当两总体均数都大于20时,依据Poisson 分布近似正态分布的原理,可以应用 Z Z 检验对其总体均数进行推断。公式例题见P115。

第四节 假设检验与区间估计的关系

1.置信区间具有假设检验的主要功能。

就同一份资料,若假设检验的结果是P<α,拒绝H 0 ,接受H 1 ,则其(1-α)的置信区间必定不包括H 0,成立时所规定的总体参数,反之亦然。

卫生统计学考试试题及答案(附解释)题库

卫生统计学试题及答案(一) 1.用某地6~16岁学生近视情况的调查资料制作统计图,以反映患者的年龄分布,可用图形种类为______. A.普通线图 B.半对数线图 C.直方图 D.直条图 E.复式直条图 【答案】C(6——16岁为连续变量,得到的是连续变量的频数分布) 直方图(适用于数值变量,连续性资料的频数表变量) 直条图(适用于彼此独立的资料) 2.为了反映某地区五年期间鼻咽癌死亡病例的年龄分布,可采用______. A.直方图 B.普通线图 C.半对数线图 D.直条图 E.复式直条图(一个检测指标,两个分组变量) 【答案】E ? 3.为了反映某地区2000~1974年男性肺癌年龄别死亡率的变化情况,可采用______. A.直方图 B.普通线图(适用于随时间变化的连续性资料,用线段的升降表示某事物在时间上的发展变化趋势) C.半对数线图(适用于随时间变化的连续性资料,尤其比较数值相差悬殊的多组资料时采用,线段的升降用来表示某事物的发展速度) D.直条图 E.复式直条图 【答案】E 4.调查某疫苗在儿童中接种后的预防效果,在某地全部1000名易感儿童中进行接种,经一定时间后从中随机抽取300名儿童做效果测定,得阳性人数228名。若要研究该疫苗在该地儿童中的接种效果,则______. A.该研究的样本是1000名易感儿童 B.该研究的样本是228名阳性儿童 C.该研究的总体是300名易感儿童 D.该研究的总体是1000名易感儿童 E.该研究的总体是228名阳性儿童 【答案】D 5.若要通过样本作统计推断,样本应是__________. A.总体中典型的一部分 B.总体中任一部分 C.总体中随机抽取的一部分 D.总体中选取的有意义的一部分 E.总体中信息明确的一部分 【答案】C 6.下面关于均数的正确的说法是______.

卫生统计学整理笔记

如何绘制频数表? 求组距 确定各组段的两个端点 归组计数 频数分布表与分布图作用 1.揭示变量分布形态 2.揭示变量分布趋势 3.便于发现特大的或特小的极端值 4.便于进一步计算统计指标和分析 5.作为一种数据陈述的形式 算数应用条件: 对称分布,尤其正态分布 几何应用条件: 1.对数对称分布、等比资料 2.变量值中不能有0;不能同时有正值和负值;若全是负值,计算时可先把负号去掉,得出结果后再加上负号。 中位数条件: 所有分布、尤其偏态分布: 1.变量值中出现个别特小或特大的数值 2.资料的分布呈明显偏态 3.含有不确定数值 4.资料的分布不清 极差应用条件:所有分布、尤其偏态分布 不足: 不能全面的反映所有值的偏离程度 不稳定、小样本小于大样本、样本小于总体 四分位数间距应用条件 所有分布、尤其偏态分布: 1.变量值中出现个别特小或特大的数值 2.资料的分布呈明显偏态 3.含有不确定数值 4.资料的分布不清 方差应用条件: 对称分布,尤其正态分布 变异系数应用 1.量纲不一致

散点图作用 观察两组数据的总体趋势和明显偏离趋势的观察点 判断两组数据的关联形式、方向和密切程度 相关分类 线性相关 秩相关 分类变量相关 线性相关意义 r>0表示正相关,r=1表示完全正相关;r<0表示负相关,r=-1表示完全负相关。 |r|→0表示相关性越弱,|r|→1表示相关性越强。 r=0表示没有线性相关,不代表没有相关。 如何判断线性相关 画散点图 计算线性相关系数 假设检验 如何进行秩相关 编秩次 计算秩相关系数 假设检验 回归分析:利用样本信息,找到变量间数量依存关系。 线性回归分析:利用样本信息,找到变量间线性数量依存关系。 决定系数:反映回归贡献的相对程度,即Y的变异被X解释的比例。 如何进行分类变量的相关分析 交叉表的制作,计算各种概率 计算列联系数 假设检验 相关分析的条件 线性相关系数:二元正态分布的定量变量 秩相关系数:非二元正态分布的定量变量、有序分类变量 列联系数:无序分类变量 轶闻数据:由坊间流传或各种媒体报道的一些个案数据,由于其特殊性往往给公众留下突出和深刻的印象。 特点:缺乏代表性,常诱导人们进行简单的推论,得到一些具有倾向性的结论。 可得数据:为了某些特定目的已收集或积累的数据。如:各类监测数据、统计年鉴等。

卫生统计学选择题及答案

t分布与标准正态分布有一定的关系,下述错误的叙述是_____ A.参数数目不同 B.t分布中的自由度趋于无穷大时,曲线逼近标准正态分布 C.为单峰分布 D.对称轴位置在0 E.曲线下面积的分布规律相同 在抽样研究中,当样本例数逐渐增多时_____. A.标准误逐渐加大 B.标准差逐渐加大 C.标准差逐渐减小 D.标准误逐渐减小 E.标准差趋近于0 抽样误差是指。 A.不同样本指标之间的差别 B.样本指标与总体指标之间由于抽样产生的差别(参数与统计量之间由于抽样而产生的差别) C.样本中每个个体之间的差别 D.由于抽样产生的观测值之间的差别 E.测量误差与过失误差的总称 下面说法中不正确的是_____. A.没有个体差异就不会有抽样误差 B.抽样误差的大小一般用标准误来表示 C.好的抽样设计方法,可避免抽样误差的产生 D.医学统计资料主要来自统计报表、医疗工作记录、专题调查或实验等 E.抽样误差是由抽样造成的样本统计量与总体参数间的差别及样本统计量间的差别 t分布与正态分布存在如下哪一种关系。 A.二者均以0为中心,左右对称 B.曲线下中间95%面积对应的分位点均为±1.96 C.当样本含量无限大时,二都分布一致 D.当样本含量无限大时,t分布与标准正态分布一致 E.当总体均数增大时,分布曲线的中心位置均向右移 抽样研究中,适当增加观察单位数,可() A.减小Ⅰ型错误 B.减小Ⅱ型错误 C.减小抽样误差 D.提高检验效能 E.以上均正确

说明两个有关联的同类指标之比为。 A.率 B.构成比 C.频率 D.相对比 E.频数 构成比用来反映。 A.某现象发生的强度 B.表示两个同类指标的比 C.反映某事物内部各部分占全部的比重 D.表示某一现象在时间顺序的排列 E.上述A与C都对 以下属于分类变量的是___________. A.IQ得分 B.心率 C.住院天数 D.性别 E.胸围 计算麻疹疫苗接种后血清检查的阳转率,分母为______. A.麻疹易感人群 B.麻疹患者数 C.麻疹疫苗接种人数 D.麻疹疫苗接种后的阳转人数 E.麻疹疫苗接种后的阴性人数 关于构成比,不正确的是_____. A.构成比中某一部分比重的增减相应地会影响其他部分的比重 B.构成比说明某现象发生的强度大小 C.构成比说明某一事物内部各组成部分所占的分布 D.若内部构成不同,可对率进行标准化 E.构成比之和必为100% 甲乙两地某病的死亡率进行标准化计算时,其标准的选择______. A.不能用甲地的数据 B.不能用乙地的数据 C.不能用甲地和乙地的合并数据 D.可用甲地或乙地的数据 E.以上都不对 用均数与标准差可全面描述资料的分布特征() A.正态分布和近似正态分布 B.正偏态分布 C.负偏态分布 D.任意分布

《卫生统计学》考试重点复习资料

《卫生统计学》复习资料 08生物技术曾洋and林阳第一章绪论 名词解释 统计学:就是一门通过收集、整理与分析数据来认识社会与自然现象数量特征得方法论科学。其目得就是通过研究随机事件得局部外在数量特征与数量关系, 从而探索事件得总体内在规律性,而随机性得数量化,就是通过概率表现出来。 总体:总体就是根据研究目得确定得同质得观察单位得全体,更确切得说,就是同质得所有观察单位某种观察值(变量值)得集合。总体可分为有限总体与无限总体。总体中得所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果得集合称为样本(sample)。样本应具有代表性。所谓有代表性得样本,就是指用随机抽样方法获得得样本。 抽样:从研究总体中抽取少量有代表性得个体,称为抽样。 概率:概率(probability)又称几率,就是度量某一随机事件A发生可能性大小得一个数值,记为P(A),P(A)越大,说明A事件发生得可能性越大。0﹤P(A)﹤1。 频率:在相同得条件下,独立重复做n次试验,事件A出现了m次,则比值m/n称为随机事件A 在n次试验中出现得频率(freqency)。当试验重复很多次时P(A)= m/n。 变量:表现出个体变异性得任何特征或属性。 随机变量:随机变量(random variable)就是指取指不能事先确定得观察结果。随机变量得具体内容虽然就是各式各样得,但共同得特点就是不能用一个常数来表示,而且,理论上讲,每个变量得取值服从特定得概率分布。 系统误差:系统误差(systematic error)就是指由于仪器未校正、测量者感官得某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不就是分散在真值得两侧,而就是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计与完善技术措施来消除或使之减少。随机误差:随机误差(random error)又称偶然误差,就是指排除了系统误差后尚存得误差。它受多种因素得影响,使观察值不按方向性与系统性而随机得变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。 变异:在自然状态下,个体间测量结果得差异称为变异(variation)。变异就是生物医学研究领域普遍存在得现象。严格得说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值得参差不齐。 抽样误差:(消除了系统误差,并将随机测量误差控制在允许范围内)由于个体变异得存在,在抽样过程中产生得样本统计量与总体参数之间得差异。 分布:随机现象得规律性通过概率来刻画,而随机事件得所有结局及对应概率得排列称为分布。 第二章定量资料得统计描述 名词解释 算术均数:描述一组数据在数量上得平均水平。总体均数用μ表示,样本均数用X表示。 几何均数:用以描述对数正态分布或数据呈倍数变化资料得水平。记为G。 中位数:将一组观察值由小到大排列,n为奇数时取位次居中得变量值;为偶数时,取位次居中得两个变量得平均值。

卫生统计学试题6含答案

. 统计试题题库 1. 下列那个是对标化后总死亡率的正确描述? A A.仅仅作为比较的基础,它反映了一种相对水平 B.它反映了实际水平 C.它不随标准选择的变化而变化 D.它反映了事物实际发生的强度 E.以上都不对 2. 两样本作均数差别的t检验,要求资料分布近似正态,还要求: D A.两样本均数相近,方差相等 B.两样本均数相近 C.两样本方差相等 D.两样本总体方差相等 E.两样本例数相等 3. 四格表资料的卡方检验时无需校正,应满足的条件是: D A.总例数大于40 B.理论数大于5 C.实际数均大于l D.总例数大于40且理论数均大于或等于5 E.总例数小于40 4. 总体应该是由: D

. A.研究对象组成 B.研究变量组成 C.研究目的而定 D.同质个体组成 E.任意个体组成 5. 两样本均数比较的t检验中,结果为P<0.05,有统计意义。P愈小则: E A.说明两样本均数差别愈大 B.说明两总体均数差别愈大 C.说明样本均数与总体均数差别愈大 D.愈有理由认为两样本均数不同 E.愈有理由认为两总体均数不同 6. 抽样误差是指: D A.总体参数与总体参数间的差异 B.个体值与样本统计量间的差异 C.总体参数间的差异 D.样本统计量与总体统计量间的差异 E.以上都不对 7. 抽签的方法属于下列那种抽样: D A.分层抽样 B.系统抽样 C.整群抽样 D.单纯随机抽样 E.分级抽样

8. 以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属下列那类资料: B A.计算 B.计数 C.计量 D.等级 E.都对 9. 实验设计中要求严格遵守四个基本原则,其目的是为了: D A.便于统计处理 B.严格控制随机误差的影响 C.便于进行试验 D.减少和抵消非实验因素的干扰 E.以上都不对 10. 两个样本作t检验,除样本都应呈正态分布以外,还应具备的条件是: B A.两样本均数接近 B.两S2数值接近 C.两样本均数相差较大 D.两S2相差较大 E.以上都不对 11. 同一总体的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠?A A.Sx B.S C.X D.CV

卫生统计学考试重点总结复习

一、绪论 1.总体:根据研究目的确定的同质观察单位的全体,确切的说是同质的所有观察单位某种变量值的集合。 2.样本:从总体中随机抽取部分观察单位所组成的集合。 3.参数:用样本的指标来推算或估计出来的,用来说明总体情况的统计指标。 4.统计量:根据观察值计算出来的量,是用来描述和分析样本的统计指标。 5.变量的类型及其转换: ①定性变量:a.分类变量(计数资料)i.二分类变量 ii.多项无序分类 b.有序变量(等级资料) ②定量变量:a.连续型变量 b.离散型变量 变量只能由“高级”向“低级”转化:定量→有序→分类→二值。 6.概率:是描述随机事件发生的可能性大些的数值。 7.卫生统计学的内容包括:统计学是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。 8.卫生统计学:运用概率论和数理统计的原理和方法并结合医学实践来研究医学资料的搜集、整理、分析与推断的一门学科。 9.卫生统计学的研究对象:有变异的事物。 10.统计工作的一般步骤:设计资料、搜集资料、整理资料、分析资料。 11.同质:指同一总体中个体的性质、影响条件、背景相同或非常相近。 12.变异:同一总体内的个体间存在差异又是绝对的,这种现象称为变异。 13.误差可分为:系统误差、随机测量误差、抽样误差。 14.抽样误差:由于个体差异的存在,从某一总体中随机抽取一个样本,所得样本统计量与总体参数之间可能存在差异,这种差异称为抽样误差。 二、定量资料的统计描述 1.频率分布表的编制步骤: ①计算极差R、②确定组段数与组距(一般为8-15组)、③确定各组段的上下限、④列表。 2.频率分布表的用途: ①揭示频数分布的分布特点和分布类型,文献中常将频数表作为陈述资料的形式。 ②便于进一步计算统计指标和进行统计分布处理。 ③便于发现某些特大和特小的可疑值。 ④当样本含量比较大时,可用各组段的频率作为概率的估计值。 3.中位数:指将原始观察值从小到大或从大到小排序后,位次居中的那个数。 4.四分位数间距:表示百分位数P75和百分位数P25之差,定义为Q=P75-P25,恰好包括总体中50%的个体观察值,用来描述偏态分布资料的离散趋势的指标。 5.标准差:即方差的算术平方根,是衡量对称分布资料的离散程度的指标,标准差大,则离散度大,标准差小,则离散度小。 6.变异系数:变异的大小S相对于其平均水平X的百分比,主要用于量纲不同的变量间,或均数差别较大的变量间变异程度的比较。 三、定性资料的统计描述 1.构成比:说明一事物内部各组成部分在总体中所占的比重或分布,常用百分数表示。 =某一组成部分的观察单位数/同一事物内部各组成部分的观察单位总数×100% 2.相对数的类型:

卫生统计学试题参考答案

医学统计方法选择题一: 医学统计方法概述 l.统计中所说的总体是指:A A根据研究目的确定的同质的研究对象的全体 B随意想象的研究对象的全体 C根据地区划分的研究对象的全体 D根据时间划分的研究对象的全体 E根据人群划分的研究对象的全体 2.概率P=0,则表示B A某事件必然发生B某事件必然不发生C某事件发生的可能性很小D某事件发生的可能性很大E以上均不对 3.抽签的方法属于 D A分层抽样B系统抽样C整群抽样D单纯随机抽样E二级抽样 4.测量身高、体重等指标的原始资料叫:B A计数资料B计量资料C等级资料D分类资料E有序分类资料5.某种新疗法治疗某病患者41人,治疗结果如下: 治疗结果治愈显效好转恶化死亡 治疗人数8 23 6 3 1 该资料的类型是:D A计数资料B计量资料C无序分类资料D有序分类资料E数值变量资料6.样本是总体的C A有价值的部分B有意义的部分C有代表性的部分 D任意一部分E典型部分 7.将计量资料制作成频数表的过程,属于¬¬统计工作哪个基本步骤:C A统计设计B收集资料C整理资料D分析资料E以上均不对 8.统计工作的步骤正确的是 C A收集资料、设计、整理资料、分析资料B收集资料、整理资料、设计、统计推断 C设计、收集资料、整理资料、分析资料D收集资料、整理资料、核对、分析资料 E搜集资料、整理资料、分析资料、进行推断 9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:B A抽样误差B系统误差C随机误差D责任事故E以上都不对 10.以下何者不是实验设计应遵循的原则D A对照的原则B随机原则C重复原则 D交叉的原则E以上都不对 第八章数值变量资料的统计描述 11.表示血清学滴度资料平均水平最常计算 B A算术均数B几何均数C中位数D全距E率 12.某计量资料的分布性质未明,要计算集中趋势指标,宜选择C A X B G C M D S E CV 13.各观察值均加(或减)同一数后:B A均数不变,标准差改变B均数改变,标准差不变 C两者均不变D两者均改变E以上均不对 14.某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、lO、2、24+(小时),

卫生统计学重点笔记之令狐文艳创作

医师资格考试蓝宝书-预防医学 令狐文艳 医学统计学方法 第一节基本概念和基本步骤(非常重要) 一、统计工作的基本步骤 设计(最关键、决定成败)、搜集资料、整理资料、分析资料。 总体:根据研究目的决定的同质研究对象的全体,确切地说,是性质相同的所有观察单位某一变量值的集合。总体的指标为参数。 实际工作中,经常是从总体中随机抽取一定数量的个体,作为样本,用样本信息来推断总体特征。样本的指标为统计量。 由于总体中存在个体变异,抽样研究中所抽取的样本,只包含总体中一部分个体,这种由抽样引起的差异称为抽样误差。抽样误差愈小,用样本推断总体的精确度愈高;反之,其精确度愈低。 某事件发生的可能性大小称为概率,用P表示,在0~1之间,0和1为肯定不发生和肯定发生,介于之间为偶然事件,<0.05或0.01为小概率事件。

二、变量的分类 变量:观察单位的特征,分数值变量和分类变量。 第二节数值变量数据的统计描述(重要考点) 一、描述计量资料的集中趋势的指标有 1.均数均数是算术均数的简称,适用于正态或近似正态分布。 2.几何均数适用于等比资料,尤其是对数正态分布的计量资料。对数正态分布即原始数据呈偏态分布,经对数变换后(用原始数据的对数值lgX代替X)服从正态分布,观察值不能为0,同时有正和负。 3.中位数一组按大小顺序排列的观察值中位次居中的数值。可用于描述任何分布,特别是偏态分布资料的集中位置,以及分布不明或分布末端无确定数据资料的中心位置。不能求均数和几何均数,但可求中位数。百分位数是个界值,将全部观察值分为两部分,有X%比小,剩下的比大,可用于计算正常值范围。 二、描述计量资料的离散趋势的指标 1.全距和四分位数间距。 2.方差和标准差最为常用,适于正态分布,既考虑了离均差(观察值和总体均数之差),又考虑了观察值个数,方差使原来的单位变成了平方,所以开方为标准差。均为数值越 小,观察值的变异度越小。 3.变异系数多组间单位不同或均数相差较大的情况。变

卫生统计学部分题库

对两个变量进行直线相关分析,r=0.46,P>0.05,说明两变量之间______. A.有相关关系 B.无任何关系 C.无直线相关关系 D.无因果关系 E.有伴随关系 若分析肺活量和体重之间的数量关系,拟用体重值预测肺活量,则采用_____. A.直线相关分析 B.秩相关分析 C.直线回归分析 D.方差分析 E.病例对照研究 四格表资料的χ2检验应使用校正公式而未使用时,会导致。 A.χ2增大,P值减小 B.χ2减小,P值也减小 C.χ2增大,P值也增大 D.χ2减小,P值增大 E.视数据不同而异 配对设计四格表资料比较两个率有无差别的无效假设为。 A.μ1=μ2 B.π1=π2 C.μ1≠μ2 D.π1≠π2 E.b=c 四格表χ2检验的校正公式应用条件为。 A.n>40且T>5 B.n<40且T>5 C.n>40且1<T<5 D.n<40且1<T<5 E.n>40且T<1 两组设计两样本均数比效的t检验公式中,位于分母位置上的是。 A.两样本均数之差 B.两样本均数之差的方差 C.两样本均数之差的标准误 D.两样本均数方差之差

E.两样本均数标准误之差 两组数据中的每个变量值减去同一常数后,作两个样本均数比较的假设检验______. A.t值不变 B.t值变小 C.t值变大 D.t值变小或变大 E.不能判断 在假设检验中,P值和α的关系为。 A.P值越大,α值就越大 B.P值越大,α值就越小 C.P值和α值均可由研究者事先设定 D.P值和α值都不可以由研究者事先设定 E.P值的大小与α值的大小无关 t分布与正态分布存在如下哪一种关系。 A.二者均以0为中心,左右对称 B.曲线下中间95%面积对应的分位点均为±1.96 C.当样本含量无限大时,二都分布一致 D.当样本含量无限大时,t分布与标准正态分布一致 E.当总体均数增大时,分布曲线的中心位置均向右移 下面关于均数的正确的说法是______. A.当样本含量增大时,均数也增大 B.均数总大于中位数 C.均数总大于标准差 D.均数是所有观察值的平均值 E.均数是最大和最小值的平均值 从同一正态总体中随机抽取多个样本,用样本均数来估计总体均数的可信区间,下列哪一样本得到的估计精度高。 A.均数大的样本 B.均数小的样本 C.标准差小的样本 D.标准误小的样本 E.标准误大的样 以一定概率由样本均数估计总体均数,宜采用。 A.抽样误差估计 B.点估计 C.参考值范围估计 D.区间估计

卫生统计学试题6含答案

统计试题题库 1. 下列那个是对标化后总死亡率的正确描述? A A.仅仅作为比较的基础,它反映了一种相对水平 B.它反映了实际水平 C.它不随标准选择的变化而变化 D.它反映了事物实际发生的强度 E.以上都不对 2. 两样本作均数差别的t检验,要求资料分布近似正态,还要求: D A.两样本均数相近,方差相等 B.两样本均数相近 C.两样本方差相等 D.两样本总体方差相等 E.两样本例数相等 3. 四格表资料的卡方检验时无需校正,应满足的条件是: D A.总例数大于40 B.理论数大于5 C.实际数均大于l D.总例数大于40且理论数均大于或等于5 E.总例数小于40 4. 总体应该是由: D

A.研究对象组成 B.研究变量组成 C.研究目的而定 D.同质个体组成 E.任意个体组成 5. 两样本均数比较的t检验中,结果为P<0.05,有统计意义。P愈小则: E A.说明两样本均数差别愈大 B.说明两总体均数差别愈大 C.说明样本均数与总体均数差别愈大 D.愈有理由认为两样本均数不同 E.愈有理由认为两总体均数不同 6. 抽样误差是指: D A.总体参数与总体参数间的差异 B.个体值与样本统计量间的差异 C.总体参数间的差异 D.样本统计量与总体统计量间的差异 E.以上都不对 7. 抽签的方法属于下列那种抽样: D A.分层抽样 B.系统抽样 C.整群抽样 D.单纯随机抽样 E.分级抽样

8. 以舒张压≥12.7KPa为高血压,测量1000人,结果有990名非高血压患者,有10名高血压患者,该资料属下列那类资料: B A.计算 B.计数 C.计量 D.等级 E.都对 9. 实验设计中要求严格遵守四个基本原则,其目的是为了: D A.便于统计处理 B.严格控制随机误差的影响 C.便于进行试验 D.减少和抵消非实验因素的干扰 E.以上都不对 10. 两个样本作t检验,除样本都应呈正态分布以外,还应具备的条件是: B A.两样本均数接近 B.两S2数值接近 C.两样本均数相差较大 D.两S2相差较大 E.以上都不对 11. 同一总体的两个样本中,以下哪种指标值小的其样本均数估计总体均数更可靠?A A.Sx B.S C.X D.CV

卫生统计学试题(含答案)

医学统计方法选择题一 医学统计方法概述 l .统计中所说的总体是指: A A 根据研究目的确定的同质的研究对象的全体 B 随意想象的研究对象的全体 C 根据地区划分的研究对象的全体 D 根据时间划分的研究对象的全体 E 根据人群划分的研究对象的全体 2. 概率P=0,则表示B A 某事件必然发生 B 某事件必然不发生 D 某事件发生的可能性很大 E 以上均不对 7. 将计量资料制作成频数表的过程,属于 A 统计设计 B 收集资料 C 整理资料 8. 统计工作的步骤正确的是 C A 收集资料、设计、整理资料、分析资料 C 设计、收集资料、整理资料、分析资料 E 搜集资料、整理资料、分析资料、进行推断 ¬¬ 统计工作哪个基本步骤: C D 分析资料 E 以上均不对 B 收集资料、整理资料、设计、统计推断 D 收集资料、整理资料、核对、分析资料 B 10. 以下何者不是实验设计应遵循的原则 D A 对照的原则 B 随机原则 C 重复原则 D 交叉的原则 E 以上都不对 第八章 数值变量资料的统计描述 11. 表示血清学滴度资料平均水平最常计算 B A 算术均数 B 几何均数 C 中位数 D 全距 E 率 12. 某计量资料的分布性质未 明,要计算集中趋势指标,宜选择 C A X B G C M D S E CV 13. 各观察值均加(或减)同一数后: B A 均数不变,标准差改变 B 均数改变,标准差不变 C 两者均不变 D 两者均改变 E 以上均不对 14. 某厂发生食物中毒,9名患者潜伏期分别为:16、2、6、3、30、2、10、2、24+(小时), 问 3.抽签的方法属于 D A 分层抽样 B 系统抽样 C 整群抽样 4.测量身高、体重等指标的原始资料叫: A 计数资料 B 计量资料 某种新疗法治疗某病患者 治愈 8 D 单纯随机抽样 E 二级抽样 5. 治疗结果 治疗人数 该资料的类型是: A 计数资料 6.样本是总体的 A 有价值的部分 D 任意一部分 显效 23 B C 等级资料 41 人, 好转 6 D 分类资料 治疗结果如下: 恶化 3 E 有序分类资料 计量资料 C B 有意义的部分 C 有代表性的部分 E 典型部分 C 无序分类资料 死亡 1 D 有序分类资料 E 数值变量资料 A 抽样误差 B 系统误差 C 随机误差 D 责任事故 E 以上都不对 C 某事件发生的可能性很小 9.良好的实验设计,能减少人力、物力,提高实验效率;还有助于消除或减少:

9住院医师规培考试 卫生统计学方法与应用(下)

1、某地进行甲型病毒性肝炎的调查中,共发现病人231例。其中男性158例占68.40%,女性73例占31.60%,提示()* ? A.男性因在外就餐机会多发病机会就高 ? B.男性病人比例高于女性病人 ? C.男性发病率高 ? D.男性患病率高 ? E.不能说明任何问题 2、甲乙两地某病的死亡率进行标准化计算时,其标准选择()* ? A.不能用甲地数据 ? B.不能用乙地数据 ? C.不能用甲地和乙地的合并数据 ? D.可能用甲地或乙地的数据 ? E.以上都不对 3、若已知该省成年男性血红蛋白平均水平,欲了解某县正常成年男性的血红蛋白含量是否高于该省正常水平,应采用()* ? A.样本均数与总体均数比较的t检验 ? B.配对t检验 ? C.成组t检验 ? D.配对设计差值的符号秩和检验 ? E.成组设计两样本比较的秩和检验 4、对于一组服从双变量正态分布的资料,经直线相关分析得相关系数r=0.9,对该资料拟合回归直线,则其回归系数b值()*

? A.b>0 ? B.b=0 ? C.b<0 ? D.b=1 ? E.不能确定正负 5、对原始统计资料的要求是()* ? A.及时收集完整、准确的资料 ? B.综合资料 ? C.方差分析时要求个样本所在总体的方差相等 ? D.完全随机设计的方差分析时,组内均方就是误差均方 ? E.完全随机设计的方差分析时,F=MS组间/MS组内 6、实验设计应遵循的基本原则是()* ? A.随机化、对照、盲法 ? B.随机化、盲法、配对 ? C.随机化、重复、配对 ? D.随机化、齐同、均衡 ? E.随机化、对照、重复 7、作符号秩和检验时,统计量T为较小的秩和,则正确的是()* ? A.T值越大越有理由拒绝HO ? B.T值越大越有理由拒绝HO ? C.P值与T值毫无关系

卫生统计学知识点(笔记)

第一章绪论 1.统计学(statistics)是一门处理数据中变异性的科学与艺术,内容包括收集、分析、解释和表达数据,目的是求得可靠的结果。 2.▲总体(population)用来表示大同小异的对象全体,例如一个国家的所有成年人;某地的所有小学生。可分为目标总体和研究总体。若试图对某个总体下结论,这个总体便称为目标总体(target population);资料常来源于目标总体中的一个部分,它称为研究总体(study population)。需要谨慎的是,就研究总体所下的结论未必适用于目标总体。 3.▲样本(sample)是指从研究总体中抽取的一部分有代表性的个体。获取样本的过程称为抽样(sampling)。抽样研究的目的是用样本数据推断总体的特征。需要注意的是,统计学的结论从来就不是完全肯定或完全否定的,能不能成功地达到从样本推断总体的目的,关键是抽样的方法、样本的代表性和推断的技术。 4.▲同质(homogeneity)是指同一总体中个体的主要性质相同。 5.▲变异(variation)是指同质的个体之间存在的差异。 6.▲变量的类型 二分类变量 分类变量或名义变量 定性变量多分类变量 变量有序变量或等级变量 定量变量离散型变量 连续型变量 变量的转化:只能由“高级”向“低级”转化,即由信息量多的向信息量少的类型转化,如:定量有序分类二值 7.▲参数(parameter)是反映总体特征的指标,参数的大小是客观存在的,是一个常数,不会发生变化,然而往往是未知的,需要通过样本资料来估计,如总

体均数μ,总体标准差σ。 8.▲统计量(statistic)又称样本统计量,是反映样本特征的指标,是由观察资料计算出来的,如样本均数 X,样本标准差S。 统计学的任务就是依据样本统计量来推断总体参数。 9.▲概率与频率的区别:概率是参数,频率是统计量;频率总是围绕概率上下波动。当某事件发生的概率≤0.05时,即P≤0.05,统计学习惯上称该事件为小概率事件。 10.▲误差:表示统计量与参数之间的差别或测量值与真值之间的差别。可分为系统误差和随机误差,其中系统误差呈现倾向性偏大或偏小现象,是可以避免的;而随机误差,是非人为偶然因素所致,不可避免,但可通过增大样本量等措施使其减小。 11.因果与联系:存在联系未必有因果关系,需排除虚假关联、间接关联。大多数观察性研究,单靠统计学分析只能考察变量之间的联系,难以证明因果关系。

卫生统计学试题汇总

医学统计学复习题 一、名词解释 1、总体 2、样本 3、随机抽样 4、变异 5、概率 6、随机误差(偶然误差) 7、参数 8、统计量 9、算术均数 10、中位数 11、百分位数 12、频数分布表 13、几何均数 14、四分位数间距 15、方差 16、标准差 17、变异系数 18、标准正态分布 19、医学参考值范围 20、可信区间 21、统计推断 22、参数估计 23、标准误及 24、检验水准 25、检验效能 26、率 27、直线相关 28、直线回归 29、实验研究 30、回归系数 二、单项选择 1.观察单位为研究中的()。 A.样本 B.全部对象 C.影响因素 D.个体 E.观察指标 2.总体是由( )组成。 A.部分个体 B.全部对象 C.全部个体 D.同质个体的所有观察值 E.相同的观察指标 3.抽样的目的是()。 A.研究样本统计量 B.由样本统计量推断总体参数 C.研究典型案例 D.研究总体统计量 E.研究特殊个体的特征 4.参数是指( ) 。 A.参与个体数 B.总体中研究对象的总和 C.样本的统计指标 D.样本的总和 E.总体的统计指标 5.关于随机抽样,下列哪一项说法是正确的()。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随机抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 E.选择符合研究者意愿的样本 6.反映计量资料平均的指标是()。 A.频数 B.参数 C.百分位数 D.平均数 E.统计量 7.表示总体均数的符号是( ) 。 A.σ B.μ C.X D. S E. M 8.下列指标中,不属于集中趋势指标的是()。 A.均数 B.中位数 C.百分位数 D.几何均数 E.众数 9. ( )分布的资料,均数等于中位数。 A.对称分布 B.正偏态分布 C.负偏态分布 D.对数正态分布 E.正态分布 10.一组某病患者的潜伏期(天)分别是:2、5、4、6、9、7、10和18,其平均水平的指标该选()。 A.中位数 B.算术均数 C.几何均数 D.平均数 E.百分位数末端有确定数据

卫生统计学知识点总结

卫生统计学知识点总结-CAL-FENGHAI-(2020YEAR-YICAI)_JINGBIAN

卫生统计学 统计工作基本步骤:统计设计(调查设计和实验设计)、资料分析{收集资料、整理资料、分析资料【统计描述和统计推断(参数估计和假设检验)】。 ★统计推断:是利用样本所提供的信息来推断总体特征,包括:参数估计和假设检验。a参数估计是指利用样本信息来估计总体参数,主要有点估计(把样本统计量直接作为总体参数估计值)和区间估计【按预先设定的可信度(1-α),来确定总体均数的所在范围】。b假设检验:是以小概率反证法的逻辑推理来判断总体参数间是否有质的区别。 变量资料可分为定性变量、定量变量。不同类型的变量可以进行转化,通常是由高级向低级转化。 资料按性质可分为计量资料、计数资料和等级资料。 定量资料的统计描述 1频率分布表和频率分布图是描述计量资料分布类型及分布特征的方法。离散型定量变量的频率分布图可用直条图表达。 2频率分布表(图)的用途:①描述资料的分布类型;②描述分布的集中趋势和离散趋势;③便于发现一些特大和特小的可疑值;④便于进一步的统计分析和处理;⑤当样本含量足够大时,以频率作为概率的估计值。 ★3集中趋势和离散趋势是定量资料中总体分布的两个重要指标。 (1)描述集中趋势的统计指标:平均数(算术均数、几何均数和中位数)、百分位数(是一种位置参数,用于确定医学参考值范围,P50就是中位数)、众数。算术均数:适用于对称分布资料,特别是正态分布资料或近似正态分布资料;几何均数:对数正态分布资料(频率图一般呈正偏峰分布)、等比数列;中位数:适用于各种分布的资料,特别是偏峰分布资料,也可用于分布末端无确定值得资料。 (2)描述离散趋势的指标:极差、四分位数间距、方差、标准差和变异系数。四分位数间距:适用于各种分布的资料,特别是偏峰分布资料,常把中位数和四分位数间距结合起来描述资料的集中趋势和离散趋势。方差和标准差:都适用于对称分布资料,特别对正态分布资料或近似正态分布资料,常把均数和标准差结合起来描述资料的集中趋势和离散趋势;变异系数:主要用于量纲不同时,或均数相差较大时变量间变异程度的比较。 标准差的应用:①表示变量分布的离散程度;②结合均数计算变异系数、描述对称分布资料;③结合样本含量计算标准误。 定性资料的统计描述 1定性资料的基础数据是绝对数。描述一组定性资料的数据特征,通常需要计算相对数。定性变量可以通过频率分布表描述其分布特征。 2 指标频率型指标强度型指标相对比型指标 概念近似反映某一时间出现概率单位时间内某现象的发生 率 两个有关联的指标A和B之比 计算 公式 A/B 有无 量纲 无有可有、可无 取值 范围 【0,1】可大于1无限制 本质大样本时作为概率近似值分子式分母的一部分频率强度,即概率强度的 似 值 表示相对于B的一个单位,A有多少 位 A和B可以是绝对数、相对数和平均

卫生统计学试卷(附答案)

2004~2005学年第(1)学期预防医学专业本科 期末考试试卷 (卫生统计学课程) 姓名____________________ 班级____________________ 学号____________________ 考试时间:200 年月日午 —(北京时间)

一、选择题(每题1分,共60分) 1、A1、A2型题 A. 48.0 B. 49.0 C. 52.0 D .53.0 E.55.0 2. 比较7岁男童与17岁青年身高的变异程度,宜用: A. 极 差 B. 四分位数间距 C. 方差 D. 标准差 E. 变异系数 3. 根据观测结果,已建立y 关于x 的回归方程? 2.0 3.0y x =+,该回归方程表示x 每增加1个单位,y 平均增加几个单位? A. 1 B. 2 C. 3 D. 4 E.5 4. 设从 5.11=μ的总体中作五次随机抽样(n =5),问哪一个样本的数据既精确又准确? A. 8,9,10,11,12 B. 6,8,10,12,14 C. 6,10,12,14,18 D. 8,10,12,14,16 E. 10,11,12,13,14 5. 为表示某地近20年来婴儿死亡率的变化情况,宜绘制 A.散点图 B. 直条图 C. 百分条图 D. 普通线图 E. 直方图 6. 临床上用针灸治疗某型头痛,有效的概率为60%现用该法治疗5例,问其中至少2例有效的概率约为 A. 0.913 B. 0.087 C. 0.230 D.0.317 E. 以上都不对 7.二项分布、Poisson 分布、正态分布各有几个参数? A. 1,1,2 B. 2,1,2 C. 1,2,2 D. 2,2,2 E. 1,2,1 8. 假定某细菌的菌落数服从Poisson 分布,经观察得平均菌落数为9,问菌落数的标准差为: A. 18 B. 9 C. 3 D. 81 E. 27 9. 对于同一资料的直线相关系数与回归系数,下列论断有几句是正确的? 相关系数越大,回归系数也越大。 相关系数与与回归系数符号一致。 相关系数的t r 等于回归系数的t b 。 相关系数描述关联关系,回归系数描述因果关系。 A.1句 B.2句 C. 3句 D. 4句 E. 0句 10.下列四句话有几句是正确的? 标准差是用来描述随机变量的离散程度的。 标准误是用来描述统计量的变异程度的。 t 检验只用于检验两样本均数的差别。 χ2可用来比较两个或多个率的差别。 A. 0句 B. 1句 C. 2句 D. 3句 E. 4句

山东大学2019考研:353卫生综合参考书目及真题笔记资料汇总

山东大学2019考研:353卫生综合参考书目及真题笔记资料汇总由于山东大学部分专业课官方没有公布参考书目由此给很多考生带来了很大的不便,对此精都考研网整理了山东大学本专业研究生初试用书及配套资料供大家参考 一、353卫生综合参考书目: ①《环境卫生学》 ②《流行病学》 ③《卫生统计学》 ④《营养与食品卫生学》 ⑤《职业卫生与职业医学》 二、配套精编复习资料 山东大学353卫生综合《复习全程通》精都考研组编 三、复习全程通内容简介 《复习全程通》由精都考研工作室依托多年为各大机构编写考研专业课资料以及学员辅导的经验,由本团队组织目标院校本专业的高分研究生共同合作编写而成,全书考点知识面覆盖全面,权威细致,编排结构科学合理,是专门为本届考研的考生量身定制的必备专业课资料。 通过本精编资料四大模块内容,结合考生每个阶段的复习,有助于考生深入了解目标院校以及专业考点重点,提高复习效率,拓展解题思路。 NO.1历年真题汇编 通过目标院校原版真题,了解命题老师的出题思路,且分析考点重点,快速了解目标院校出题风格及命题思路,提高复习效率,拓展解题思路 NO.2教辅一本通 本部分内容主要是由目标院校本专业研究生对应其初试参考书目整理汇编章节重点考点以及对应章节历年典型考题及答案解析,通过本书的配套复习,分析专业考点侧重,通过大量典型考题让充分掌握本门科目重点,确保考场应对自如。 NO.3冲刺模拟套卷 书在遵循专业课最新参考书目,结合历年考研真题规律,制定的模拟卷,并有详细的配套答案讲解,适用于考生在冲刺模拟阶段的专业课复习。 NO.4电子版赠送内容 本部分内容为购买全套资料的同学附赠的内容,主要是初试参考书目主编老师的教学讲义以及相关的扩充习题,此部分内容对于跨考的考生相对比较重要,通过讲义了解专业课基础复习侧重,达到专业知识点不缺不漏。 四、解析备考辅导班: 专业课一对一无忧全程班 专业课一对一标准全程班 山东大学在读研究生授课 以上内容是【精都考研网】整理发布,每天及时发布最新考研资讯、考研经验、考研真题。目前很多同学已加入2019山东大学考研总群640030269,抓紧时间加入了解你所不知道的考研信息。

卫生统计学题库56025

最佳选择题 1. 收集资料的方法是:E A. 收集各种报表 B.收集各种工作记录 C.进行专题调查 D. 进行科学实验 E.以上都对 2. 统计工作的基本步骤是:D A. 调查资料、审核资料、整理资料 B.收集资料、审核资料、 分析资料 C. 调查资料、整理资料、分析资料 D.收集资料、整理资料、分析资料 E. 以上都对 3. 在抽样研究中样本是:D A.总体中的一部分 B.总体中任意一部分 C.总体中典型部分 D. 总体中有代表性的一部分 E.总体中有意义的一部分 4. 计量资料、计数资料和等级资料的关系是:C A. 计量资料兼有计数资料和等级资料的一些性质 B. 计数资料兼有计量资料和等级资料的一些性质 C. 等级资料兼有计量资料和计数资料的一些性质 D. 计数资料有计量资料的一些性质 E. 以上都不是 5. 用图形表示某地解放以来三种疾病的发病率在各年度的升降速度,宜绘制 D : A.普通线图 B.直方图 C.构成比直条图 D.半对数线图 E.直条图 6. 直方图可用于: A.某现象的内部构成 B.各现象的比较 C.某现象的比较 D. 某现象的频数分布E某现象的发展速度 7. 统计图表的要求是: A.简单明了 B.层次清楚 C.说明问题明确 D.避免臃肿复杂 E.以上都对 8. 在列频数表时,分组数目一般为: A.5-10 B.8-15 C.10-30 D.15-20 E.> 20 9. 平均数作为一种统计指标是用来分析: A.计数资料 B.计量资料 C.等级分组资料 D.调查资料 E. 以上都不对 10. 表示变量值变异情况的常用指标是: A.全距 B.标准差 C.方差 D.变异系数 E.以上均是 11. 确定正常人某个指标正常值范围时,调查对象是: A.从未患过病的人 B.健康达到了要求的人 C.排除影响被研究指标的疾病和因素的人 D.只患过小病但不影响研究指标的人 E.排除了患过某病或接触过某因素的人 12. 标准误: A.与标准差呈反比 B.与标准差呈正比 C.与标准差的平方呈反比 D.与标准差平方呈正比 E.以上都不对 13. x是指: A.所有观察值对总体均数的离散程度 B.某一个样本均数的离散程度 C. 所有样本均数对总体均数的离散程度 D.某些样本均数对 总体均数的离散程度

相关文档
相关文档 最新文档