文档库 最新最全的文档下载
当前位置:文档库 › (完整版)医学统计学重点

(完整版)医学统计学重点

(完整版)医学统计学重点
(完整版)医学统计学重点

医学统计学重点

第一章绪论

1.基本概念:

总体:根据研究目的确定的性质相同或相近的研究对象的某个变量值的全体。

样本:从总体中随机抽取部分个体的某个变量值的集合。

总体参数:刻画总体特征的指标,简称参数。是固定不变的常数,一般未知。

统计量:刻画样本特征的指标,由样本观察值计算得到,不包含任何未知参数。

抽样误差:由随机抽样造成的样本统计量与相应的总体参数之间的差异。

频率:若事件A在n次独立重复试验中发生了m次,则称m为频数。称m/n为事件A在n次试验中出现的频率或相对频率。

概率:频率所稳定的常数称为概率。

统计描述:选用合适统计指标(样本统计量)、统计图、统计表对数据的数量特征及其分布规律进行刻画和描述。

统计推断:包括参数估计和假设检验。用样本统计指标(统计量)来推断总体相应指标(参数),称为参数估计。用样本差别或样本与总体差别推断总体之间是否可能存在差别,称为假设检验。

2.样本特点:足够的样本含量、可靠性、代表性。

3.资料类型:

(1)定量资料:又称计量资料、数值变量或尺度资料。是对观察对象测量指标的数值大小所得的资料,观察指标是定量的,表现为数值大小。每个个体都能观察到一个观察指标的数值,有度量衡单位。

(2)分类资料:包括无序分类资料(计数资料)和有序分类资料(等级资料)

①计数资料:是将观察单位按某种属性或类别分组,清点各组观察单位的个数(频数),由

各分组标志及其频数构成。包括二分类资料和多分类资料。

二分类:将观察对象按两种对立的属性分类,两类间相互对立,互不相容。

多分类:将观察对象按多种互斥的属性分类

②等级资料:将观察单位按某种属性的不同程度、档次或等级顺序分组,清点各组观察单

位的个数所得的资料。

4.统计工作基本步骤:统计设计、资料收集、资料整理、统计分析。

第二章实验研究的三要素

1.实验设计三要素:被试因素、受试对象、实验效应

2.误差分类:随机误差(抽样误差、随机测量误差)、系统误差、过失误差。

3.实验设计的三个基本原则:对照原则、随机化分组原则、重复原则。

4.实验设计方法

有析因设计正交试验设计均匀试验设计

交互作用两组:异体配对设计同体配对设计交叉设计无随机同期对照实验设计(单因素两水平)扩展

多组:单因素多水平配伍组设计拉丁方设计

(两因素多水平)(三因素多水平)配伍组设计:也称随机区组设计,将条件相近的受试对象配伍,每个配伍组中的对象随机分配到各处理组中。

析因设计:考察两个或两个以上的处理因素,将各个因素的水平进行全面组合,每个组合下至少有两个以上的观察对象重复测量。一般来讲,应尽可能安排等重复试验,以简化计算,2-3个水平数。优点是全面性和均衡性较好,可同时分析处理因素的效应及因素间的交互作用。拉丁方设计:用于三因素等水平无交互。

第三章定量资料的统计描述、参考值范围

1.频数表编制过程(了解)

(1)找出样本数据的最大值和最小值,计算极差 R;

(2)分组:确定分组的组距 d 和组数 k;

一般n<50,5-6组;n在100左右,7-10组;n>100,10-15组

(3)求频率密度:统计频数,算出频率、频率密度和累积频率;

(4)画出直方图。

2.频数表和直方图的作用:用于观察个数较多资料的统计描述,可以直观提示资料的分布特征和分布类型。

3.集中趋势、离散趋势的指标及适用范围

(1)集中趋势:x,G,M,P

x ,M

算术均数:适用于对称分布;

不适用于偏态分布和资料中出现极值的资料。

几何均数:适用于呈倍数关系的资料或对数正态分布的资料,尤其是正偏态分布。

不适用与观察值中有0或正负数值同时出现的资料。

中位数:适用于大样本偏态分布或分布情况不明的资料或资料中有不确定数值的资料。

百分位数的作用:多个百分位数结合使用,全面描述数据分布的特征;

用于确定医学参考值范围(偏态或分布不明的资料)。

众数:适用于大样本,较粗糙。

(2)离散趋势:

极差:优点:简单明了、容易使用。

缺点:①只反映最大值和最小值间的差异,不能反映其他观察值的变异程度。

②样本容量越大,极差可能越大。

③极差的抽样误差大,不稳定。

四分位数间距:适用于确定医学参考值范围,与中位数一起描述偏态分布资料变异程度。

缺点:类似于极差,利用度低。

方差与标准差:与均数一起描述对称分布,特别是正态分布的分布特征。

变异系数:适用于:①适用于比较度量衡单位不同资料的变异度。

②比较均数相差悬殊的资料的变异度。

③衡量实验精密度和稳定性的常用指标。

(3)频数分布特征

高峰在中间,左右大致对称,称为对称分布。平均数=中位数=众数

高峰偏向小值的一侧(左侧),称正偏态分布(亦称右偏态)。平均数>中位数>众数高峰偏向大值的一侧(左侧),称负偏态分布(亦称左偏态)。平均数<中位数<众数

对称分布正(右)偏态分布负(左)偏态分布

4.正态分布图形的特点及意义

(1)特点:①f (x )关于x=μ对称 ②x=μ时取得最大值

③在x=μ±σ处为拐点,且以 x 轴为水平渐近线 ④f (x )大于0

⑤P (x=a )=0

⑥若 f (x) 在点 x 处连续,则F ′(x )=f (x) (2)意义:?

+∞∞

-)(x f =1,f (x )在负无穷到正无穷的积分值为1,即曲线下方面积为1。

5.μ和σ2的意义

μ:位置参数,当σ固定时,μ增大,曲线沿横轴向右移动;μ减小,曲线沿横轴向左移动。 σ2:形状参数,当μ固定时,σ越大,曲线越矮胖;σ越小,曲线越高瘦。

6.标准化变换

z=

σ

μ

-x x ~N (μ,σ2) z ~N (0,1) F (x)=Ф(σμ-x )=Ф(z) 即P (X ≤x)=Ф(σ

μ

-x )=P (Z ≤z)

P (a

σμ-b )-Ф(σμ-a P (σμ-a <σμ-x <σμ-b )=P (σμ-a < Z <σ

μ

-b )

7.标准正态分布界值

规定:界值右侧曲线下方面积等于它的下角标。下角标一致,x 轴上方中间面积一致。 双侧界值:

P (|z|≤z 2α)=1-α P (z

α)=1-2α

P (|z|≥z 2α)=α P (z>z 2

α)=2α

单侧界值:

上限: 下限:

P (z>z α)=α P (z>z 1-α)=1-α P (z

8.正常值范围及意义

概念:医学临床中,常将就诊者的某些生理、生化、免疫学指标的测定结果,与排除了对研 究指标有影响的疾病和有关因素的大多数“正常人”的相应数值进行比较,以就诊者 的测定值是否超出了大多数“正常人”相应指标的波动范围,作为临床诊断的重要参 考,又称医学参考值范围。

意义:95%的参考值范围含义是指:样本中有95%的个体测定值在所求范围之内。 以95%的置信区间来说,意义是:该区间以95%的概率包含了待估计的参数,这种 估计的可信度是95%,会冒5%的风险。 公式: 双侧95%的界限值:x ±1.96s 单侧95%的上限值:x +1.645s 单侧95%的上限值:x -1.645s

第四章 总体均数的估计、假设检验

1.标准误

(1)概念:每次样本计算出的x 不同,这些x 的标准差称为均数的标准误。 (2)意义:是衡量样本统计量抽样误差大小的统计指标。

(3)与标准差的区别:二者都是描述变异程度的指标,标准差描述个体值的变异,标准误描 述统计量的变异。 (4)均数标准误的公式:S x =

n

s 2.置信区间

(1)定义:设θ为总体的未知参数,若由样本确定的两个统计量θ1(x 1、x 2、…、xn)和θ2(x 1、 x 2、…、x n ),且θ1<θ2,对于预先给定的值α(0<α<1),若满足P(^

θ1<^

θ2)=1-α, 则称随机区间(^

θ1,^

θ2)为θ的1-α置信区间,其中称为^

θ1置信下限,称为^

θ2 置信上限,1-α称置信度。

(2)意义:区间(^θ1,^θ2)包含有参数θ的概率为1-α,不能说θ在(^θ1,^

θ2)的概率为 1-α。

例:可以说(a ,b )包含均数μ的概率为95%,不能说μ在(a ,b )的概率为95%。 (3)公式:单个正态总体均数μ的区间估计

①σ已知:

双侧:n

z x σα2

± 即 x z x σα2

±

z 分布

单侧:n

z x σ

α

± 即 x z x σα±

②σ未知:

双侧:n s

t x 2

α

± 即 x s t x 2

α± 小样本(n ≤50) t 分布

单侧:n

s

t x α± 即 x s t x α±

双侧:n s

z x 2

α

± 即 x s z x 2

α± 大样本(n>50) z 分布

单侧:n

s

z x α± 即 x s z x α± (4)两要素:

准确度:由1-α 决定,1-α 越大,准确度越高。 精确度:由区间长度决定。

99%置信区间准确度高于95%置信区间。95%置信区间精确度更高。

3.抽样分布

(1)t 分布

①定义: 来自正态总体的一组样本,x 和s 分别是样本的均数和标准差。则t=n

s x /μ-~

t 分布,自由度 df=n-1,极限分布是标准正态分布。 ②图形分布特征:

以0为中心,左右对称的单峰分布。 自由度越大,越高瘦

③界值: 双侧:

P (|t|≤t 2α)=1-α P (t

α)=1-2α

P (|t|≥t 2α)=α P (t>t 2

α)=2α

单侧:

上限: 下限:

P (tt α)=α P (t>t 1-α)=1-α (2)χ2分布

①定义:若从均数为μ,标准差σ的正态总体中,每次抽取样本含量为n 的样本,计算 样本标准差s ,则χ2=(n-1)s 2/σ2服从自由度df=n-1的χ2分布。 ②图形分布特征: 曲线偏向左边 自由度越小曲线越偏 ③界值: 双侧:

P (x 2

>x 2

2

α)=2α P (x 2>212α-

x )=1-2α P (x 2

α)=1-2α P (x 2<212α-

x )=

2α 单侧:

上限: 下限:

P (x 2>x 2α)=α P (x 2>x 21-α)=1-α P (x 2

①定义:如果分别从两个正态总体N (μ1,σ1)和N (μ1,σ1)中随机抽取样本含量 n 1、n 2的两个样本,算出样本均数和方差分别为x 1,s 21和x 2,s 2

2,则σ

σ22

2

22121//s s F =

服从df 1=n 1-1,df 2=n 2-1的F 分布。

若χ1、χ2分别服从自由度df 1、df 2的χ2分布,则F=df

df

2

2

212

1

//χχ~df 1df 2

②图形分布特征 曲线偏向左边

df 1、df 2同时增大,曲线趋向于对称 ③倒数性质:F df df )(),1(2,1α-=

F df df

)

(

2,

11

α

④界值: 双侧:

P (F>F 2α)=2α P (F>2

1α-F )=1-2α

P (F

α)=1-2α P (F<2

1α-F )=2α

单侧:

上限: 下限:

P (F>F α)=α P (F>F 1-α)=1-α P (F

4.假设检验

(1)基本思想:反证法、小概率事件原理 (2)基本步骤:

①建立假设,确定检验水准

H0:原假设,差异存在但不显著或差异无统计学意义 H1:备择假设,差异显著或差异有统计学意义

②在原假设成立条件下,选择统计方法并计算检验统计量。(认为误差由抽样产生) 参数检验统计量要求满足:

i)在H0成立的条件下,服从特定的抽样分布; ii)必须包含要检验的总体参数;

iii)对于给定的样本数据,能计算出该检验统计量的数值。 ③对于给定的α值做出检验结论,并给以专业解释

判断P 值:(与界值比较,反查界值表确定范围,软件计算) 若P>α,则接受 H 0,拒绝H 1 ;若P<α,则拒绝 H 0,接受H 1 。

(3)检验方法:

正态性检验、方差齐性检验、t检验

(4)两类错误

①第一类错误又称弃真错误、假阳性错误,第二类错误又称取伪错误、假阴性错误。

②P≤α时,拒绝H

,可能犯Ⅰ类错误(α)。此时,P值越小,犯Ⅰ类错误的概率越小,结论越可靠。

③P>α时,接受H

,可能犯Ⅱ类错误(β)。此时,虽然β未知,但P值越大,犯Ⅱ类错误的概率越小,结论越可靠。

④减少(增加)I型错误,将会增加(减少)II型错误

⑤增大n,可以同时降低两类错误。

第五章方差分析

1.方差分析基本思想

目的:根据各个总体的样本观测值,检验各个总体均值间和两两总体均值间是否存在显著性差异。

基本思想:根据离差来源的不同,将总离差平方和分解为两部分:

由试验的随机因素(误差)引起的组内离差,

由因素的作用(即处理水平不同)引起的组间离差。

总离差平方和 = 组内离差平方和+ 组间离差平方和(SS

T = SS

E

+ SS

A

2.方差分析

单因素方差分析、配伍组设计方差分析、析因设计方差分析拉丁方设计方差分析、正交设计方差分析

交叉设计方差分析、组内分组设计方差分析

第六章双变量相关与回归

1.散点图特征

正相关完全正相关负相关完全负相关

不相关

2.相关系数意义及分类

(1)意义:

①相关系数r的大小反映随机变量X和Y之间线性关系的密切程度:

若 r=0,则 X 与 Y 不相关;

若 |r|=1,则 X 与 Y 完全相关。

②相关系数r的符号反映随机变量X和Y之间线性关系的相关方向:

若 0

若 -1

(2)分类:

①积差相关系数:双变量为服从正态分布的计量资料

②等级相关系数:等级或相对数资料;不服从正态分布;总体分布类型未知。

(3)适用范围:

两个变量必须是随机变量,即变量的取值在实验前或测定前是无法预先知道的。

3.线性相关分析和回归分析的联系与区别

(1)联系: ①r=l

l xy

xx

b

/ l xx 、l xy 分别是x 、y 的标准差

②方向一致,r 与b 方向一致

③r 与b 的假设检验等价,即同一样本存在:t r =t b

④回归强度与相关强度:R 2=SS 回/SS 总=r 2 (仅限Ⅱ型回归)

(2)区别: ①资料

相关:x,y 必须是随机变量

回归: x 是确定变量称Ⅰ型回归, y 必须是随机变量

x 是随机变量称Ⅱ型回归 ②计量单位:r 不受单位影响,b 受单位影响 ③意义:

相关说明相关关系,相关关系描述变量间关系的密切程度与方向。 回归说明依存关系,回归方程描述变量间的数量依存关系。 ④取值范围:|r|≤1,b R

4.最小二乘法

5.决定系数的意义

R 2=SS 回/SS 总=(SS 总-SS 剩)/SS 总=(1-SS 剩)/SS 总

0≤ R 2 ≤1,R 2越接近于1,表示回归平方和在总平方和中所占的比重越大,回归效果越好。

把观测点 (x i , y i ) 标在直角坐标系下作成散点图,则必存在着一条直线,使每个点 (x i , y i ) 距这条直线在纵方向上的距

离的平方和为最小,此平方和称为残差平方和,这就是最小二乘法。

第七章 两分类资料的统计描述与推断

1.相对数指标

两个有联系的指标之比。常用的有率和比(构成比、相对比)。

(1)率:频率,说明某现象发生的频率和强度。总体率:π,样本率:p 。 K ?=

可能发生该现象的总例某现象实际发生的例数

(2)构成比说明某事物内部各组成部分在总体中所占的比重或分布。 %100?=

察单位总数

同一事物各组成部分观位数

某一组成部分的观察单构成比

(3)相对比:两个有关指标A 、B 之比,说明两者的对比水平,A 是B 的若干倍或百分之几。 对比的数值可以是绝对数、相对数或平均数。

第八章 R ×C 表资料的分析

1.列联表分类及统计方法

(1)双向无序:多个样本率或构成比比较→χ2检验 (2)单向有序:

分组变量有序→χ2检验(同双向无序) 结果变量有序→秩和检验或Ridit 分析 (3)双向有序:

属性相同→McNemar 、Kappa 检验

属性不同→秩相关分析、线性趋势检验、秩和检验或Ridit 分析

2.列联表注意事项

(1)R ×C 表中不宜有20%以上的格子的T<5,不能有T<1。 理论数太小处理办法:①最好增加样本例数以增大理论数 ②删去理论数太小的行和列

③将太小理论数所在行或列的实际数与性质相近的邻行/列合并 ④采用Fisher 检验

(2)R×C表χ2检验未考虑等级顺序关系,若处理效应按强弱或优劣分为有序等级时采用秩和检验或Ridit分析。

(3)拒绝H0时不能确定是不全相等还是全不相等,需进行两两比较。

第九章非参数检验、Ridit分析

1.参数检验和非参数检验特点

(1)参数检验:

特点:总体分布的类型为已知,只是一个或几个参数未知,对未知参数进行检验。

优点:检验效能高,允许应用样本提供的数据

缺点:受应用条件限制

(2)非参数检验:

特点:又称任意分布检验,是与总体无关的检验方法,它不比较参数,而是比较分布的位置,允许根据分布情况而不是总体参数做出推论。

优点:不依赖总体分布类型,应用广泛

缺点:符合参数检验的用非参数检验会降低检验效能。

2.检验方法

符号秩和检验、成组秩和检验、多组秩和检验、配伍秩和检验。

检 验 方 法

1.正态性检验

(1)目的:在做t 检验方差分析之前首先判断是否服从正态分布

(2)过程:假设H 0:总体服从正态分布;H 1:总体不服从正态分布。α

(3)SPSS 结果:看sig 值,sig>α,接受H 0,服从正态;sig<α,接受H 1,不服从正态。

2.方差齐性检验

(1)目的:利用样本信息推断总体方差是否相等 (2)前提:正态分布 (3)过程:

①建立假设:假设H 0:σ2

1=σ2

2即方差齐;H 1:σ2

1≠σ2

2。α ②计算统计量:σ

σ22

2

22121//s s F =

=s

s 2

2

2

1 df 1=n 1-1 df 2=n 2-1 ③P 值: Fα,接受H 0

F>F α(df 1,df 2)则P<α,拒绝H 0

(4)SPSS 结果:sig>α,接受H 0,满足方差齐性;sig<α,接受H 1,不满足方差齐性。

3.单样本t 检验

(1)目的:推断一组样本代表的总体均数与已知总体均数间的差异。 (2)前提: ①单组设计

②计量资料(非分类) ③资料服从正态分布 (3)过程:

①建立假设:假设H 0:μ=μ0 ;H 1:μ≠μ0。α ②计算统计量:=

z n x /σμ-或t= n

s x /μ- ③P 值: zα,接受H 0

z>z αdf 1,则P<α,拒绝H 0

(4)SPSS 结果:sig>α,接受H 0,差异无统计学意义;sig<α,接受H 1,差异有统计学意义。

4.配对t 检验

(1)目的:推断两组样本代表的总体均数的差值是否为零。 (2)前提: ①配对设计

②计量资料(非分类) ③差值服从正态分布 (3)过程:

①建立假设:假设H 0:μd =0 ;H 1:μd ≠0。α ②计算统计量:t=

n

d

s d / df=n-1

③P 值: tα,接受H 0 , t>t αdf 1,则P<α,拒绝H 0

t

αdf 1,则P>α,接受H 0 , t>t 2

αdf 1,则P<α,拒绝H 0

(4)SPSS 结果:sig>α,接受H 0,差异无统计学意义;sig<α,接受H 1,差异有统计学意义。

5.成组t 检验

(1)目的:推断两组样本代表的总体均数是否有显著性差异。 (2)前提:

①完全随机成组设计; ②计量资料(非分类); ③独立性; ④正态性; ⑤方差齐性。 (3)过程:

①方差齐性检验

②建立假设:假设H 0:μ1=μ2;H 1:μ1≠μ2(或μ1>μ2,μ1<μ2)。α ③计算统计量:t 或t ′(方差不齐)df=n 1+n 2-2

④P 值: tα,接受H 0 ,t>t α(df 1,df 2),则P<α,拒绝H 0

t

α(df 1,df 2),则P>α,接受H 0 ,t>t 2

α(df 1,df 2),则P<α,拒绝H 0

(4)SPSS 结果:sig>α,接受H 0,差异无统计学意义;sig<α,接受H 1,差异有统计学意义。

6.单因素方差分析

(1)目的:推断多组样本代表的总体均数是否有显著性差异。(2)前提:

①完全随机多组设计;

②计量资料(非分类);

③独立性;

④正态性;

⑤方差齐性。

(3)过程:

①正态性检验和方差齐性检验

②建立假设:假设H

0:μ

1

2

=…=μ

n

;H

1

:μ

1

、μ

2

、…、μ

n

不全相等或全不相等。α

③计算统计量:

④P值:P>α,接受H

0 ,P<α,拒绝H

(4)SPSS结果:sig>α,接受H

0,差异无统计学意义;sig<α,接受H

1

,差异有统计学意义。

方差分析表:

(5)注意:组内变异:随机误差

组间变异:随机误差+处理因素

若H

成立:组内变异≈组间变异

若H

1

成立:组内变异 < 组间变异

7.配伍设计的方差分析

(1)目的:推断多组样本代表的总体均数是否有显著性差异。

(2)前提:

①完全随机多组设计;

②计量资料(非分类);

③独立性;

④每个因素的各水平正态性;

⑤每个因素的各水平方差齐性。(3)模型设计:双因素且无交互作用:处理因素——重要实验因素

配伍因素——主要非处理因素

SS

总=SS

处理

+SS

配伍

+SS

误差

(3)过程:

①正态性检验和方差齐性检验

②建立假设:

处理组:假设H

0:μ

1

2

=…=μ

n

;H

1

:μ

1

、μ

2

、…、μ

n

不全相等或全不相等。

配伍组:假设H

0:μ

1

2

=…=μ

n

;H

1

:μ

1

、μ

2

、…、μ

n

不全相等或全不相等。α

③计算统计量:

④P值:P>α,接受H

0 ,P<α,拒绝H

(4)SPSS结果:sig>α,接受H

0,差异无统计学意义;sig<α,接受H

1

,差异有统计学意义。

方差分析表

8.析因设计的方差分析

(1)目的:推断多组样本代表的总体均数是否有显著性差异。(2)前提:

①完全随机多组设计;

②计量资料(非分类);

③独立性;

④每个因素的各水平正态性;

⑤每个因素的各水平方差齐性。

(3)过程:

①正态性检验和方差齐性检验

②建立假设:

因素A:假设H

0:μ

1

2

=…=μ

n

;H

1

:μ

1

、μ

2

、…、μ

n

不全相等或全不相等。

因素B:假设H

0:μ

1

2

=…=μ

n

;H

1

:μ

1

、μ

2

、…、μ

n

不全相等或全不相等。

交互作用:假设H

0:μ

1

2

=…=μ

n

;H

1

:μ

1

、μ

2

、…、μ

n

不全相等或全不相等。α

③计算统计量:

④P值:P>α,接受H

0 ,P<α,拒绝H

(4)SPSS结果:sig>α,接受H

0,差异无统计学意义;sig<α,接受H

1

,差异有统计学意义。

方差分析表

A B

9.线性相关分析

(1)目的:分析两变量间是否有直线相关关系 (2)前提:x 、y 必须都是随机变量 (3)过程:

①计算样本相关系数r 的大小 r=

l

l l xy

xx xy

=

2

2)()())((y y x x y y x x -∑-∑--∑=s s y

x n y x n xy )1(--∑ df=n-2 将r 与界值表界值比较:

当|r|>r α时,P<α,拒绝H 0 ,认为有直线相关关系。 当|r|α,接受H 0 ,认为没有直线相关关系。 ②根据r ,df=n-2检验ρ是否为0

假设H 0:总体相关系数ρ=0,即无关系;H 1:总体相关系数ρ≠0,即有关系。α ③结合专业知识评价相关分析是否有价值

P 值:P>α,接受H 0 ,P<α,拒绝H 0 ,P<α,拒绝H 0

(4)SPSS 结果:sig>α,接受H 0,无直线相关关系;sig<α,接受H 1,有直线相关关系。

10.线性回归分析

(1)目的:就是寻找出具有相关关系变量之间的函数关系,并进行统计推断。

(2)前提:y 必须是随机变量 (3)过程:

①计算反映两个变量依赖关系的直线回归方程,即计算方程的截距a ,斜率b 。

bx a y

+=? 意义:x 每增加1,y 增加a+bx ∑∑==---=n

i i n

i i

i

x x y y x x b

12

1

)()

)((? x b y a

-=? ②根据截距a ,斜率b ,检验样本所抽自的总体截距α是否为0,总体斜率β是否为0。 做法1:直接查相关系数的临界值表 做法2:费舍尔t 检验法:2

12r

n r t --=

df=n-2

做法3:F 检验

假设H 0:β=0,即无回归关系;H 1:β≠0,即有回归关系。α F=

剩回

回df SS df SS // df=n-1

③结合专业知识,评价此直线回归方程是否有实用价值。 Fα,接受H 0,无回归关系

F>F α df ,则P<α,拒绝H 0 ,有回归关系

(4)SPSS 结果:sig>α,接受H 0,无直线回归关系;sig<α,接受H 1,有直线回归关系。

11.列联表Χ2检验

(1)目的:①推断两个或多个总体率或构成比之间的差异;

②分析行列两种属性或两个变量之间有无关联性(相关分析); ③频数分布的拟合优度检验。 (2)前提:小样本,非二项分布 (3)过程:

①建立假设:H0:总体率或构成比无显著性差异(行列变量独立或无相关性) H1:总体率或构成比有显著性差异(行列变量不独立或有相关性),α ②计算最小理论频数T ij ,并计算Χ2。

一般公式:∑-=)1(2

2

c

r n n A N χ df=(r-1)×(c-1)

四格表公式: (最小理论频数:T )

基本公式:n ≥40且T ≥5 )

)()()(()(/)(2

2

2

d b c a d c b a bc ad n T T A ++++-=-=∑χ

校正公式:n ≥40且1≤T ≤5 )

)()()(()2|(|/)5.0|(|2

22d b c a d c b a n

bc ad n T T A ++++--=--=∑χ

特殊公式:n<40 , T<1 四格表确切概率法(Fisher )

③P 值:若χ2<χα2

df 则P>α,接受H 0,若χ2>χα2

df 则P<α,接受H 1。

(4)SPSS 结果:先看最小理论频数值范围,再看sig ,sig>α,接受H 0,总体率或构成比 无显著性差异;sig<α,接受H 1,总体率或构成比有显著性差异。

医学统计知识点整理(1)

医学统计学知识点整理 第一节统计学中基本概念 一、同质与变异 同质:统计研究中,给观察单位规定一些相同的因素情况。 如儿童的生长发育,规定同性别、同年龄、健康的儿童即为同质的儿童。 变异:同质的基础上个体间的差异。 “同质”是相对的,是客观事物在特定条件下的相对一致性,而“变异”则是绝对的 二、总体与样本 1、总体:是根据研究目的所确定的,同质观察对象(个体)所构成的全体。 2、样本:是从总体中随机抽取的部分观察单位变量值的集合。 三、参数与统计量 总体参数:根据总体个体值统计计算出来的描述总体的特征量。用希腊字母表示。μ.δ.π 样本统计量:根据样本个体值统计计算出来的描述样本的特征量。用拉丁字母表示。X.S.p 总体参数一般是不知道的,抽样研究的目的就是用样本统计量来推断总体参数,包括区间估计和假设检验 四、误差:实测值与真值之差★ 1.随机误差:是一类不恒定的、随机变化的误差,由多种尚无法控制的因素引起。随机测量误差、抽样误差。 2.系统误差:是一类恒定不变或遵循一定变化规律的误差,其产生原因往往是可知的或可能掌握的。 3.非系统误差:过失误差,可以避免或清除。 五、概率 是用来描述事件发生可能性大小的一个量值,常用P表示。概率取值0~1。 统计上一般将P≤0.05或P≤0.01的事件称为小概率事件,表示其发生的概率很小,可以认为在一次抽样中不会发生。 第二节统计资料的类型★

变量:确定总体之后,研究者应对每个观察单位的某项特征进行观察或测量,这种特征能表现观察单位的变异性,称为变量。 一、数值变量资料 又称为计量资料、定量资料:观测每个观察单位某项指标的大小而获得的资料。表现为数值大小,带有度、量、衡单位。如身高(cm)、体重(kg)、血红蛋白(g)等。 二、无序分类变量资料 又称为定性资料或计数资料:将观察对象按观察对象的某种类别或属性进行分组计数,分组汇总各组观察单位后得到的资料。 分类:二分类:+ -;有效,无效;多分类:ABO血型系统 特点:没有度量衡单位,多为间断性资料 【例题单选】某地A、B、O、AB血型人数分布的数据资料是( ) A.定量资料 B.计量资料 C.计数资料 D.等级资料 【答案】C 【解析】ABO血型系统人数分布资料属于无序分类变量资料,又称为计数资料。因为是按照变量的血型分类,血型表现为互不相容的属性。所以本题选C。 【例题单选】测量正常人的脉搏数所得的变量是() A.二分类变量 B.多分类变量 C.定量变量 D.定性变量 【答案】C 【解析】脉搏数有数值大小,有度量衡,所以这个资料属于定量资料。本题选C。 三、有序分类变量资料 半定量资料或等级资料:将观察对象按观察对象的某种属性的不同程度分成等级后分组计数,分组汇总各组观察单位后得到的资料。 特点:每一个观察单位没有确切值,各组之间有性质上的差别或程度上的不同举例:- + ++ +++ 第三节统计工作的基本步骤★ 1.统计设计 2.收集资料

医学统计学考试重点整理

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 假设检验的结论 真实情况拒绝H0不拒绝H0 H0正确Ⅰ型错误(ɑ) 推断正确(1 ?ɑ) H0不正确推断正确(1?β) Ⅱ型错误(β) Ⅰ型错误(ɑ错误): H0为真时却被拒绝,弃真错误 Ⅱ型错误(β错误): H0为假时却被接受,取伪错误 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义:①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上) 安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数) ㈠均数 抽样误差:由个体变异产生的、随机抽样引起的样本统计量与总体参数间的差异。 标准误:是指样本均数的标准差,反映抽样误差大小的定量指标,其公式表示为S x =S/√n ㈡样本率 率的抽样误差:样本率p和总体率π的差异 率的标准误:样本率的标准差,公式为σp=√π(1-π)/n

医学统计学试题及答案

医学统计学试题及答案 The latest revision on November 22, 2020

医学统计学 一、选择题 1、根据某医院对急性白血病患者构成调查所获得的资料应绘制( B ) A 条图 B 百分条图或圆图 C线图 D直方图 2、均数和标准差可全面描述 D 资料的特征 A 所有分布形式B负偏态分布C正偏态分布D正态分布和近似正态分布 3、要评价某市一名5岁男孩的身高是否偏高或偏矮,其统计方法是( A ) A 用该市五岁男孩的身高的95%或99%正常值范围来评价 B 用身高差别的假设检验来评价 C 用身高均数的95%或99%的可信区间来评价 D 不能作评价 4、比较身高与体重两组数据变异大小宜采用( A ) A 变异系数 B 方差 C 标准差 D 四分位间距 5、产生均数有抽样误差的根本原因是( A ) A.个体差异 B. 群体差异 C. 样本均数不同 D. 总体均数不同

6. 男性吸烟率是女性的10倍,该指标为( A ) (A)相对比(B)构成比(C)定基比(D)率 7、统计推断的内容为( D ) A.用样本指标估计相应的总体指标 B.检验统计上的“检验假设” C. A和B均不是 D. A和B均是 8、两样本均数比较用t检验,其目的是检验( C ) A两样本均数是否不同 B两总体均数是否不同 C两个总体均数是否相同 D两个样本均数是否相同 9、有两个独立随机的样本,样本含量分别为n1和n2,在进行成组设计资料的t 检验时,自由度是( D ) (A) n1+ n2 (B) n1+ n2 –1 (C) n1+ n2 +1 (D) n1+ n2 -2 10、标准误反映( A ) A 抽样误差的大小 B总体参数的波动大小

医学统计学总结

医学统计学总结 一、绪论 1,医学统计学:运用概率论与数理统计学得原理与方法,研究医学领域中随机现象有关数据得搜集、整理、分析与推断,进而阐明其客观规律性得一门应用科学。 2,医学统计学得主要内容: 1) 统计研究设计调查研究设计与实验研究设计 2) 医学统计学得基本原理与方法研究设计与数据处理中得基本统计理论与方法。A:资料得搜集与整 理 B:常用统计描述,集中趋势与离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计与假设检验。 3)医学多元统计方法多元线性回归与逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、 logistic回归与Cox回归分析。 3,统计工作步骤: 1) 设计明确研究目得与研究假说,确定观察对象与观察单位,样本含量与抽样方法,拟定研究方案,预 期分析指标,误差控制措施,进度与费用。 2) 搜集材料 A, 搜集材料得原则及时、准确、完整 B, 统计资料得来源医学领域得统计资料得来源主要有三个方面。一就是统计报表,二就是经常性工作记录,三就是专题调查或专题实验。 C, 资料贮存 3) 整理资料 a检查核对b设计分组c拟定整理表d归表 4) 分析资料统计分析包括统计描述与统计推断 4,同质(homogeneity):指被研究指标得影响因素相同。 变异(variation):同质基础上得各观察单位间得差异。 变量(variable):收集资料过程中,根据研究目得确定同质观察单位,再对每个观察单位得某项 特征进行测量或观察,这种特征称为变量 变量值:变量得观察结果或测量值。 5,总体(population) 根据研究目得所确定得同质研究对象中所有观察单位某变量值得集合。总体 具有得基本特征就是:同质性 样本(sample) 从总体中随机抽取部分观察单位,其变量值得集合构成样本。样本必须具有代表 性。代表性就是指样本来自同质总体,足够得样本含量与随机抽样得前提。 统计量(statistics)描述样本变量值特征得指标(样本率,样本均数,样本标准差)。 参数(parameter)描述总体变量值特征得指标(总体率,标准差,总体均数)。

医学统计学章节重点归纳

医学统计学章节重点归纳 第一节概述 1、主要内容:a、卫生统计学的基本原理和方法(研究设计和数据处理中的统计理论和方法)b、健康统计(医 学人口统计、疾病统计和生长发育统计)c、卫生服务统计(卫生资源、医疗卫生服务的需求和利用、医疗保健制度和管理中的统计问题)。 2、 卫生统计工作的步骤:设计、资料的搜集、资料的整理、资料的分析 3、医学统计资料主要四个方面:统计报表、报告卡(单)、日常医疗卫生工作记录,专题研究或实验。 4、观察单位:是获得数据的最小单位,观察单位是根据研究目的确定的,观察单位可以是人、标本、家庭、国 家等。 5、变异:是指客观事物的多样性和不确定性。 6、变量: 观察单位的某种特征,称为变量。a、数值变量(定量变量)b、分类变量(定型变量或字符变量)。 7、总体:根据研究目的所确定的同质研究对象的全体。确切的说是性质相同的所有观察单位的某种变量的集合。 8、样本:从总体中随机抽取部分观察单位,其变量值就构成样本,通过样本信息来推断总体特征。 9、概率:事件发生的可能性大小的量度,通常以符号P表示。 10、误差:测量值与真值之差或样本指标和总体指标之差。分为随机误差和系统误差。 第二节数值资料的统计描述 1、频数分布就是观察值在所取得范围内分布的情况。重要特征:集中趋势和离散趋势。 2、频数分布类型:正态分布型频数、正偏态分布型频数,负偏态分布型频数。 3、集中趋势指标:算术平均数(均数)、几何均数、中位数。 指标使用条件计算公式 算术平均数适用于正态或近似正态分布 的数值变量资料 几何均数①对数正态分布,即数据经 过对数变换后呈正态分布的 资料;②等比级数资料,即 观察值之间呈倍数或近似倍 数变化的资料。 中位数①非正态分布资料(对数正 态分布除外);②频数分布 的一端或两端无确切数据的 资料③总体分布不清楚的资 料。为奇数 , 为偶数, 4、离散型趋势指标:极差、标准差和变异系数 指标计算公式主要优缺点 极差R=Xmax-Xmin 计算简单,便于理解;只考虑最大值与最小值之差异,不能反映 组内其它观察值的变异度,不稳定,受样本量影响很大。

(完整word版)医学统计学试题和答案

(一)单项选择题 3.抽样的目的是(b )。 A.研究样本统计量 B. 由样本统计量推断总体参数 C.研究典型案例研究误差 D. 研究总体统计量 4.参数是指(b )。 A.参与个体数 B. 总体的统计指标 C.样本的统计指标 D. 样本的总和 5.关于随机抽样,下列那一项说法是正确的( a )。 A.抽样时应使得总体中的每一个个体都有同等的机会被抽取 B.研究者在抽样时应精心挑选个体,以使样本更能代表总体 C.随机抽样即随意抽取个体 D.为确保样本具有更好的代表性,样本量应越大越好 6.各观察值均加(或减)同一数后( b )。 A.均数不变,标准差改变 B.均数改变,标准差不变 C.两者均不变 D.两者均改变 7.比较身高和体重两组数据变异度大小宜采用( a )。 A.变异系数 B.差 C.极差 D.标准差 8.以下指标中(d)可用来描述计量资料的离散程度。 A.算术均数 B.几何均数 C.中位数 D.标准差 9.偏态分布宜用(c)描述其分布的集中趋势。 A.算术均数 B.标准差 C.中位数 D.四分位数间距 10.各观察值同乘以一个不等于0的常数后,(b)不变。 A.算术均数 B.标准差 C.几何均数 D.中位数 11.( a )分布的资料,均数等于中位数。 A.对称 B.左偏态 C.右偏态 D.偏态 12.对数正态分布是一种( c )分布。 A.正态 B.近似正态 C.左偏态 D.右偏态 13.最小组段无下限或最大组段无上限的频数分布资料,可用( c )描述其集中趋势。 A.均数 B.标准差 C.中位数 D.四分位数间距 14.( c )小,表示用该样本均数估计总体均数的可靠性大。 A. 变异系数 B.标准差 C. 标准误 D.极差 15.血清学滴度资料最常用来表示其平均水平的指标是( c )。 A. 算术平均数 B.中位数 C.几何均数 D. 平均数

医学统计学基础理论和上机考试模拟复习题答案解析

“医学统计学”上机考试模拟题A卷 1.测得10例某指标值治疗前后情况如下: 例号 1 2 3 4 5 6 7 8 9 10 治疗前76 64 60 62 72 68 62 66 70 60 治疗后74 62 64 58 68 70 56 60 66 56 1.用参数方法比较治疗前后该指标值的差异有无统计学意义,结果填入下表: 例数均数标准差治疗前 治疗后 差值(前-后) H0:治疗前后该指标值无差异。 H1:治疗前后该指标值有差异。 统计量t=2.512 P=0.0332 统计结论:P<0.05,拒绝H0,认为在α=0.05水平上差异有统计学意义,即治疗前后该指标值有差异。 2.上题资料,用非参数方法比较治疗前后该指标值的差异有无统计学意义。结果填入下面空格。 H0:治疗前后该指标值无差异。 H1:治疗前后该指标值有差异。 统计量s=19.5 P=0.0547 统计结论:P>0.05,不拒绝H0,认为在α=0.05水平上差异无统计学意义,即治疗前后该指标值无差异。

3.测得10例正常儿童身高(cm)和体重(kg)如下: 例号 1 2 3 4 5 6 7 8 9 10 身高(X)120 133 126 130 121 122 131 128 110 124 体重(Y)20 27 23 25 25 18 22 25 15 22 (1)求身高和体重的相关系数,并作显著性检验。 相关系数r =0.81211 H0:p=0 H1:p≠0 P= 0.0043 统计结论:P<0.05,拒绝H0,认为在α=0.05水平上差异有统计学意义,即认为身高和体重存在正相关。 (2)求身高推算体重的直线回归方程,并作显著性检验。 直线回归方程:y=-32.964+0.443*x H0:β=0 H1:β≠0 P=0.0043 统计结论:P<0.05,拒绝H0,认为在α=0.05水平上差异有统计学意义,即认为身高和体重之间存在直线回归关系。 三.10名氟作业工人在工作前后测定尿氟(mg/L)排出量结果如下: 编号 1 2 3 4 5 6 7 8 9 10 工前 1.7 1.6 1.4 2.3 1.9 0.8 1.4 2.0 1.6 1.1 工后 2.7 3.1 3.2 2.1 2.7 2.4 2.6 2.4 2.3 1.4 1.计算工后比工前尿氟排出量增加值的均数,标准差,标准误,变异系数和中位数。 均数0.91,标准差0.635,标准误 0.201,变异系数 69.78,中位数 0.900 2.检验氟作业工人在工作前后尿氟排出量的差异有无统计学意义。 H0:氟作业工人在工作前后尿氟排出量的差异无统计学意义。 H1:氟作业工人在工作前后尿氟排出量的差异有有统计学意义 统计量t=4.532 P=0.0014

医学统计学知识点范文.doc

第一章绪论 1、统计学,是关于数据收集、整理、分析、表达和解释的普遍原理和方法。 2、研究对象:具有不确定性结果的事物。 3、统计学作用:能够透过偶然现象来探测其规律性,使研究结论具有科学性。 4、统计分析要点:正确选用统计分析方法,结合专业知识作出科学的结论。 5、医学统计学基本内容:统计设计、数据整理、统计描述、统计推断。 6、医学统计学中的基本概念 (1) 同质与变异 同质,指根据研究目的所确定的观察单位其性质应大致相同。 变异,指总体内的个体间存在的、绝对的差异。 统计学通过对变异的研究来探索事物。 (2) 变量与数据类型 变量,是反映实验或观察对象生理、生化、解剖等特征的指标。 变量的观测值,称为数据 分为三种类型:定量数据,也称计量资料,指对每个观察单位某个变量用测量或其他定量方法准确获得的定量结果。(如身高、体重、血压、温度等) 定性数据,也称计数资料,指将观察单位按某种属性分组计数的定性观察结果。包括二分类、无序多分类。(进一步分为二分类和多分类,如性别分为男和女,血型分为A、B、O、AB等) 有序数据,也称半定量数据或等级资料,指将观察单位按某种属性的不同程度或次序分成等级后分组计数的观察结果,具有半定量性质。 统计方法的选用与数据类型有密切的关系。 (3)总体与样本 总体,指根据研究目的确定的所有同质观察单位的全体,包括所有定义范围内的个体变量值。 样本,是从研究总体中随机抽取部分有代表性的观察单位,对变量进行观测得到的数据。抽样,是从研究总体中随机抽取部分有代表性的观察单位。 参数,指描述总体特征的指标。 统计量,指描述样本特征的指标。 (4)误差 误差,指观测值与真实值、统计量与参数之间的差别。 可分为三种:系统误差,也称统计偏倚,是某种必然因素所致,不是偶然机遇造成的,误差的大小通常恒定,具有明确的方向性。 随机测量误差,是偶然机遇所致,误差没有固定的大小和方向。 抽样误差,是抽样引起的统计量与参数间的差异。 抽样误差主要来源于个体的变异。 统计学主要研究抽样误差。 (5)概率 概率,是描述某事件发生可能性大小的量度。 必然事件,事件肯定发生,概率P(U)=1; 随机事件,事件可能发生,可能不发生,概率介于0≤P(A)≤ 1; 不可能事件,事件肯定不发生,概率P(∮)=0; 小概率事件,事件发生的可能性很小,概率P(A)≤ 0.05、或P(A)≤ 0.01。 医学科研中,P(A)≤0.05作为事物差别有统计意义,P(A)≤ 0.01作为事物差别有高度统

医学统计学考试重点

考试题型: 名词解释10个 选择20个 填空题20个 简答4-5个 讨论分析1-2题 计算1-2题 绪论 2选1 总体:总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总 体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代 表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 3选1 小概率事件:我们把概率很接近于0(即在大量重复试验中出现的频率非常低)的事件称为小概率事件 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义 小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。 资料的类型(3选1) (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为 计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表 现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、 脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的 类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效 的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治 愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别 却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 2选1 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情 况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是

研究生医学统计学上机试题

医学科研中的统计学方法上机试题 时间:2014-12-15 共4题,共100分 1.某医院病理科研究人体两肾的重量,20例男性尸解时的左、右肾的称重记录见下表,问左、右肾重量有无不同? 表1:20例男性尸解时左、右肾的称重记录 编号左肾(克)右肾(克) 1 170 150 2 155 145 3 140 105 4 11 5 100 5 235 222 6 125 115 7 130 120 8 145 105 9 105 125 10 145 135 11 155 150 12 110 125 13 140 150 14 145 140 15 120 90 16 130 120 17 105 100 18 95 100 19 100 90 20 105 125 2. 在评价某药物耐受性及安全性的I期临床试验中,对符合纳入标准的40名健康自愿者随机分为4组,每组10名,各组注射剂量分别为0.5U、1U、2U、3U,观察48小时后部分凝血活酶时间(s)。试比较任意两两剂量间的部分凝血活酶时间有无差别?

表2 各剂量组48小时部分凝血活酶时间(s) 0.5 U 1 U 2 U 3 U 36.8 40.0 32.9 33.0 34.4 35.5 37.9 30.7 34.3 36.7 30.5 35.3 35.7 39.3 31.1 32.3 33.2 40.1 34.7 37.4 31.1 36.8 37.6 39.1 34.3 33.4 40.2 33.5 29.8 38.3 38.1 36.6 35.4 38.4 32.4 32.0 31.2 39.8 35.6 33.8 3. 某神经内科医师观察291例脑梗塞病人,其中102例病人用西医疗法,其它189 例病人采用西医疗法加中医疗法,观察一年后,单纯用西医疗法组的病人死亡13例,采用中西医疗法组的病人死亡9例,请分析两组病人的死亡率差异是否有统计学意义? 4. 某省卫生防疫站对八个城市进行肺癌死亡回顾调查,并对大气中苯并(a)芘进行监测,结果如下,试检验两者有无相关? 表4 八个城市的肺癌标化死亡率和大气中苯并(a)芘浓度城市编号肺癌标化死亡率(1/10万)苯并(a)芘(μg/100m3) 1 5.600.05 2 18.50 1.17 3 16.23 1.05 4 11.400.10 5 13.800.75 6 8.130.50 7 18.000.65 8 12.10 1.20

医学统计学重点总结

医学统计学 第一章 医学统计中的基本概念 1 医学统计工作的内容:设计,收集资料,整理资料,分析资料。 2 资料的类型:计量资料(数值变量),计数资料(无序分类),等 变异(variation):在同质的基础上被观察个体的差异。级分组资料(有序分类)。 3 同质(homogeneity):对研究指标有影响的非实验因素相同。 4 总体(population):根据研究目的确定的同质的全部研究对象称总体 。 样本(sample):根据随机化的原则从总体中抽出有代表性的一部分观察单位组成的子集称样本。 5 参数(parameter):总体的设计指标称为参数。 统计量(statistic):样本的统计指标称为统计量。 6 变量(variable):观察对象的特征或指标称为变量,测量的结果即为变量值。 7 概率(probability):描述随机事件发生的可能性的大小的一个量度,其概率介于0与1之间。 第二章 集中趋势的统计描述 一 算术均法(mean)简称为均数,适用于正态或近似正态分布资料 (一)直接法 X n x n X X X n ∑= +?++= 21 (二)加权法(针对频数表)n fx n x f f f X k k ∑= +++= (21) 二 几何均数(geometic mean,G)适用于倍数关系变化,经对数转换后呈正态分布(如:抗体滴度, 血清凝集效价,细菌计数,某些物质浓度等) G= n n X X X ?21 为了计算方便,常改用对数的形式计算,即=G lg 1 -( n X ∑lg ) 对于频数表资料,可用公式 G=lg 1 -( n x f ∑lg ) 三 中位数(M)与百分位数 中位数:适用于偏态分布资料,末端无确切数值的资料及分布情况不确定 公式:M=L+( M L f f n -5.0) M i L,M i ,M f 分别为M 所在组段的下限,组距与频数,L f 为M 所在组段之前各组数的累积频数。 百分位数:用符号X P 表示,x 即百分位 公式:x P =L+( x L f f x n -%·)x i 式中L,x i ,x f 分别为x P 所在组段的下限,组距与频数,L f 为x P 所在组段之前各组段的累积频数

医学统计学知识点总结

医学统计学 1. 对定量资料进行统计描述时,如何选择适宜的指标 定量资料统计描述常用的统计指标及其适用场合描述内容指 标 意义适用场合 平均水平;均 数 个体的平均值· 对称分布 几何均数平均倍数取对数后对称分布 中位数[ 位次居中的观察值 ①非对称分布;②半定量资料;③末端开 口资料;④分布不明 众 数 频数最多的观察值不拘分布形式,概略分析 ? 调和均数 基于倒数变换的平均值正偏峰分布资料 变异度全 距 观察值取值范围不拘分布形式,概略分析 标准差 (方差) 观察值平均离开均数的 程度对称分布,特别是正态分布资料 四分位数 间距 ? 居中半数观察值的全距 ①非对称分布;②半定量资料;③末端开 口资料;④分布不明 变异系数标准差与均数的相对比①不同量纲的变量间比较;②量纲相同但 数量级相差悬殊的变量间比较 定性资料:阳性事件的概率,概率分布,强度和相对比。 ¥ 2. 应用相对数时应注意哪些问题 答:(1)防止概念混淆相对数的计算是两部分观察结果的比值,根据这两部分观察结果的特点,就可以判断所计算的相对数属于前述何种指标。 (2)计算相对数时分母不宜过小样本量较小时以直接报告绝对数为宜。 (3)观察单位数不等的几个相对数,不能直接相加求其平均水平。 (4)相对数间的比较须注意可比性,有时需分组讨论或计算标准化率。 3. 常用统计图有哪些分别适用于什么分析目的 常用统计图的适用资料及实施方法 < 图形 适用资料实施方法 条图组间数量对比用直条高度表示数量大小 直方图用直条的面积表示各组段的频数或频率

( 定量资料的分布 百分条图构成比用直条分段的长度表示全体中各部分的构成比 饼图构成比用圆饼的扇形面积表示全体中各部分的构成比 定量资料数值变动线条位于横、纵坐标均为算术尺度的坐标系 、 线图 半对数线图定量资料发展速度线条位于算术尺度为横坐标和对数尺度为纵坐标的坐标 系 散点图} 双变量间的关联点的密集程度和形成的趋势,表示两现象间的相关关系箱式图定量资料取值范围用箱体、线条标志四分位数间距及中位数、全距的位置茎叶图定量资料的分布' 用茎表示组段的设置情形,叶片为个体值,叶长为频数 第3章概率分布(连续随机变量的正态分布;离散随机变量的二项分布及Poisson分布)1. 服从二项分布及Poisson分布的条件分别是什么 二项分布成立的条件:①每次试验只能是互斥的两个结果之一;②每次试验的条件不变;③各次试验独立。 Poisson分布成立的条件:除二项分布成立的三个条件外,还要求试验次数n很大,而所关心的事件发生的概率 很小。 、 2. 二项分布、Poisson分布分别有什么特征 ①二项分布、Poisson分布都是离散型分布。 ②二项分布的形状取决于π与n的大小。π=时,不论n大小,对称分布。π≠时,图形呈偏态,随n增大而逐渐对称。当n足够大,π或1-π不太小,二项分布近似正态。 ③Poisson分布μ越小,分布越偏。μ越大,分布越对称。当n足够大时,分布接近正态。 4、正态分布应用 ①估计变量值的频数分布 《 ②制定参考值范围 ③质量控制 ④正态分布是很多统计方法的基础 5. 正态分布特征 ①以均数为中心,左右对称 ②正态曲线在横轴上方均数处取得最高点 ~ ③正态分布有两个参数,即均数(位置参数)和标准差(变异度参数)(μ,σ2 ;标准0,1)

医学统计学上机试题-U

习题集(分析应用题) 1、某卫生防疫站对30名麻疹易感儿童经气溶胶免疫一个月后,测得其血凝抑制抗体滴度资料如下:请问:要反映其平均滴度,用何指标?为什么? 抗体滴度 1:8 1:16 1:32 1:64 1:128 1:256 1:512 合计 例数 2 6 5 10 4 2 1 30 2、测得某地300名正常人尿汞值,其频数表如下。欲根据此资料制定95%正常值范围。请问:用何种估计方法?(列出计算公式,不用计算) 300例正常人尿汞值(ug/L)频数表 尿汞值例数尿汞值例数尿汞值例数 0-4924-1648-3 4-4728-952-- 8-5832-956-2 12-4036-460--

16-3540-564-- 20-2244--68-721 3、某医师在研究血管紧张素I转化酶(ACE)基因I/D多态与Ⅱ型糖尿病肾病(DN)的关系时,将249例Ⅱ型糖尿病患者按有无糖尿病肾病分为两组,资料见下表。拟比较两组Ⅱ型糖尿病患者的ACE基因型分布有无差别,用何统计分析方法? DN组与无DN组2型糖尿病患者ACE基因型分布的比较 组别DD ID II合计 DN组42(37.8)48(43.3)21(18.9)111 无DN组30(21.7)72(52.2)36(26.1)138 合计72(28.9)120 (48.2) 57(22.9)249 4、某单位研究胆囊腺癌、腺瘤的P53基因表达,对同期手术切除的胆囊腺癌、腺瘤标本各10份,用免疫组化法检测P53基因,资料见下表。欲分析胆囊腺癌和胆囊腺瘤的P53基因表达阳性率有无差别,用何统计分析方法? 胆囊腺癌与胆囊腺瘤P53基因表达阳性率的比较 病种阳性阴性合计 胆囊腺癌6410

预防医学与医学统计学总结

绪论 进和维护健康,预防疾病、失能和早逝 二.预防医学特点:1.工作对象包括个体及确定的群体,主要着眼于健康和无症状患者;2研究方法注重微观和宏观相结合,但更侧重于影响健康的因素与人群的关系;3.采取的对策更具积极的预防作用,具有较临床医学更大的人群健康效应。 三.健康决定因素:指决定个体和人群健康状态的因素。包括:1、社会经济环境。2、物质环境3.个人因素。4卫生服务。 四.三级预防策略:1.第一级预防:又称病因预防,即防止疾病的发生。2.第二级预防:在疾病的临床前期做好早起发现、早期诊断、早起治疗的“三早”预防工作,以控制疾病的发展和恶化。3.第三级预防:对已患某些病者,采取及时的、有效的治疗措施,防止病情恶化,预防并发症和伤残,延长生命。 第一章流行病学概论 进健康的策略和措施的科学。 流行病学定义涵:1.流行病学的研究对象时人群。2.流行病学关注的事件包括疾病与健康状况。3.流行病学主要研究容是:(1)揭示现象(2)找出原因(3)评价效果。4.流行病学研究和实践的目的是防治疾病、促进健康。 二.流行病学基本原理:1.分布论。2.病因论。3.健康-疾病连续带。4预防控制理论(三级预防理论)5.数理模型。6.流行病学的几个基本原则:(1)群体原则(2)现场原则(3)对比原则(核心)(4)代表性原则 三.流行病学的用途:1.描述疾病及健康状况的分布。2.探讨疾病的病因。3.研究疾病自然史,提高临床诊断、治疗水平和预后评估。4.疾病的预防控制及其效果评价。5.流行病学分支。 第二章疾病分布 的存在方式及其发生、发展规律。 二.疾病分布的测量指标:1.发病率:指在一定期间(一般为1年)特定群中某病新病例出现的频率。 病频率的测量(日、周、旬、月),常用于疾病暴发或流行时的调查。 例。患病率=发病率*病程。 病的人数占所有易感接触者总数的百分率。 5.死亡率:指在一定时间期间(通常为1年),某人群中死于某病(或死于所有原因)的频率。死亡率是测量入群死亡危险最常用的指标。 6.病死率:表示一定时期,患某病的全部病人中因该病死亡者所占的比例。 三.疾病的分布形式(“三间分布”) 1.地区分布:疾病的地方性:由于自然环境和社会因素的影响而使一些疾病无需从外地输入,只存在于某一地区,或在某一地区的发病率水平总是较高,这种现象称为疾病的地方性。 2.时间分布 3.人群分布:出生队列分析:将同一时期出生的人划归为一组称为一个出生队列,对其随访观察若干年,观察死亡等情况。 4.判断疾病地方性的依据:(1)该病在当地居住的各群组

预防医学考试重点完整最新版

预 防 医 学 医学统计学 第一章医学统计学中的基本概念 1医学统计学中的基本概念 3选1 变异:由众多的、偶然的、次要的因素造成的个体之间的差异称为变异。 总体:总体(population)指特定研究对象中所有观察单位的测量值。可分为有限总体和无限总 体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。 样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代 表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。 样本特性代表性随机性可靠性可比性 3选1 小概率事件:我们把概率很接近于0(即在大量中出现的频率非常低)的事件称为小概率事件。 P值:结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。p值是将观察结果认为有效即具有总体代表性的犯错概率。一般结果≤0.05被认为是有统计学意义。 小概率原理:一个事件如果发生的概率很小的话,那么可认为它在一次实验中是不会发生的,数学上称之小概率原理。统计学中,一般认为等于或小于0.05或0.01的概率为小概率。

资料的类型(3选1) (1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为 计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表 现为数值大小,一般有度量衡单位。如某一患者的身高(cm)、体重(kg)、红细胞计数(1012/L)、 脉搏(次/分)、血压(KPa)等。 (2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料 (count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的 类别或属性。如调查某地某时的男、女性人口数;治疗一批患者,其治疗效果为有效、无效 的人数;调查一批少数民族居民的A、B、AB、O 四种血型的人数等。 (3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察 单位数,称为等级资料(ordinal data)。等级资料又称有序变量。如患者的治疗结果可分为治 愈、好转、有效、无效或死亡,各种结果既是分类结果,又有顺序和等级差别,但这种差别 却不能准确测量;一批肾病患者尿蛋白含量的测定结果分为+、++、+++等。 等级资料与计数资料不同:属性分组有程度差别,各组按大小顺序排列。 等级资料与计量资料不同:每个观察单位未确切定量,故亦称为半计量资料。 3选1 抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情 况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。 系统误差:由于测量仪器结构本身的问题、刻度不准确或测量环境改变等原因,在多次测量时所产生的,总是偏大或总是偏小的误差,称为系统误差。它带有规律性,经过校正和处理,通常可以减少或消除。 随机测量误差:在收集原始资料时,仪器由于各种偶然因素造成同一对象多次测定的结果不一致。 统计的步骤(考填空题,四个空) 医学统计工作的内容 1.实验设计:设计内容包括资料收集、整理和分析全过程总的设想和安排。设计是整个研 究中最关键的一环,是今后工作应遵循的依据。 2.收集资料:应采取措施使能取得准确可靠的原始数据。 3.整理资料:简化数据,使其系统化、条理化,便于进一步分析计算。 4.分析资料:计算有关指标,反映事物的综合特征,阐明事物的内在联系和规律。分 析资料包括统计描述和统计推断。 实验设计的基本原则(考填空题,三个空) 随机化原则、对照的原则(对照的类型,对照的设置)、重复的原则。 对照的类型空白对照实验对照标准对照 自身对照相互对照历史对照安慰剂对照 2选1 参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数 是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样 本,用算得的样本统计量估计未知的总体参数。 统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本 统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机 变量。 完全随机设计常用的几种实验设计方法:配对设计和完全随机设计(名解2选1) 完全随机设计:完全随机设计仅涉及一个处理因素(但可为多水平),故又称单因素(one-way)设计。它是将受试对象按随机化的方法分配到各个处理组中,观察实验效应,临床试验中的随机对照试验也属于此类设计。 配对设计:是将受试对象按一定条件配成对子,再随机分配每对中的两个受试对象到不同处理组。配对的因素是影响实验效应的主要非处理凶素。 第二章集中趋势的统计描述 频数表的制作步骤以及频数分布表的用途(问答题) 频数分布表的编制步骤: 例:某市1982年50名7岁男童的身高(cm)资料如下,试编制频数表。 114.4117.2122.7124.0114.0110.8118.2116.7118.9118.1

医学统计学总结

医学统计学总结 一。绪论 1,医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学. 2,医学统计学的主要内容: 1) 统计研究设计调查研究设计和实验研究设计 2)医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法.A:资料的搜集与整理 B:常用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计和假设检验. 3)医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析. 3,统计工作步骤: 1)设计明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。 2)搜集材料 A,搜集材料的原则及时、准确、完整 B, 统计资料的来源医学领域的统计资料的来源主要有三个方面。一是统计报表,二是经常性工作记录,三是专题调查或专题实验。 C,资料贮存 3)整理资料 a检查核对b设计分组c拟定整理表d归表 4)分析资料统计分析包括统计描述和统计推断 4,同质(homogeneity):指被研究指标的影响因素相同。 变异(variation):同质基础上的各观察单位间的差异。 变量(variable):收集资料过程中,根据研究目的确定同质观察单位,再对每个观察单位的某项 特征进行测量或观察,这种特征称为变量 变量值:变量的观察结果或测量值。 变量类型变量值表现实例资料类型 数值变量离散型 定量测量值,有计量单位产前检查次数 计量资料 连续型身高 分类变量无 序 二分类对立的两类属性性别(男女) 计数资料多分类不相容的多类属性血型(A,B,O,AB) 有 序 多分类类间有程度差异的属性受教育程度(小学,中 学,高中,大学…)等级资料5,总体(population) 根据研究目的所确定的同质研究对象中所有观察单位某变量值的集合。总体具有的基本特征是:同质性 样本(sample)从总体中随机抽取部分观察单位,其变量值的集合构成样本。样本必须具有代表性.代表性是指样本来自同质总体,足够的样本含量和随机抽样的前提。 统计量(statistics)描述样本变量值特征的指标(样本率,样本均数,样本标准差)。

医学统计学知识点汇总(精华)

医学统计学知识点汇总(精华) 一.概论 1,医学统计学:运用概率论和数理统计学的原理和方法,研究医学领域中随机现象有关数据的搜集、整理、分析和推断,进而阐明其客观规律性的一门应用科学。 2,医学统计学的主要内容: 1)统计研究设计调查研究设计和实验研究设计 2)医学统计学的基本原理和方法研究设计和数据处理中的基本统计理论和方法。 A:资料的搜集与整理 B:常用统计描述,集中趋势和离散趋势,相对数,相关系数,回归系数,统计表,统计图 C:统计推断,如参数估计和假设检验。 3)医学多元统计方法多元线性回归和逐步回归分析、判别分析、聚类分析、主成分分析、因子分析、logistic回归与Cox回归分析。 3,统计工作步骤: 1)设计明确研究目的和研究假说,确定观察对象与观察单位,样本含量和抽样方法,拟定研究方案,预期分析指标,误差控制措施,进度与费用。 2)搜集材料 A,搜集材料的原则及时、准确、完整 B,统计资料的来源医学领域的统计资料的来源主要有三个方面。一是统计报表,二是经常性工作记录,三是专题调查或专题实验。 C,资料贮存 3)整理资料 a检查核对b设计分组c拟定整理表d归表 4)分析资料统计分析包括统计描述和统计推断

4,同质(homogeneity):指被研究指标的影响因素相同。 变异(variation):同质基础上的各观察单位间的差异。 变量(variable):收集资料过程中,根据研究目的确定同质观察单位,再对每 个观察单位的某项特征进行测量或观察,这种特征称为变量变量值:变量的观察结果或测量值。 5,总体(population)根据研究目的所确定的同质研究对象中所有观察单位某 变量值的集合。总体具有的基本特征是:同质性 样本(sample)从总体中随机抽取部分观察单位,其变量值的集合构成样本。 样本必须具有代表性。代表性是指样本来自同质总体,足够的样 本含量和随机抽样的前提。

医学统计学考试重点

医学统计学考试重点 The latest revision on November 22, 2020

一、基本概念 1.总体与样本 总体:所有同质观察单位某种观察值(即变量值)的全体 样本:是总体中抽取部分观察单位的观察值的集合 2.普查与抽样调查 普查:就是全面调查,即调查目标总体中全部观察对象 抽样调查:是一种非全面调查,即从总体中抽取一定数量的观察单位组成样本,对样本进行调查 3.参数与统计量 参数:总体的某些数值特征 统计量:根据样本算得的某些数值特征 4.Ⅰ型与Ⅱ型错误 真实情况拒绝H 不拒绝H

H 正确Ⅰ型错误(ɑ) 推断正确(1ɑ) 不正确推断正确(1β) H Ⅱ型错误(β) 为真时却被拒绝,弃真错误 Ⅰ型错误(ɑ错误): H 为假时却被接受,取伪错误 Ⅱ型错误(β错误): H 5.随机化原则与安慰剂对照 随机化原则:是将研究对象随机分配到实验组和对照组,使每个研究对象都有同等机会被分配到各组中去,以平衡两组中已知和未知的混杂因素,从而提高两组的可比性,避免造成偏倚。(意义: ①是提高组间均衡性的重要设计方法;②避免有意扩大或缩小组间差别导致的偏倚;③各种统计学方法均建立在随机化基础上)安慰剂对照:是一种常用的对照方法。安慰剂又称伪药物,是一种无药理作用的制剂,不含试验药物的有效成分,但其感观如剂型、大小、颜色、质量、气味及口味等都与试验药物一样,不能被受试对象和研究者所识别。(安慰剂对照主要用于临床试验,其目的在于控制研究者和受试对象的心理因素导致的偏倚,并提高依从性。安慰剂对照还可以控制疾病自然进程的影响,显示试验药物的效应) 6.误差与标准误(区分率与均数)

相关文档
相关文档 最新文档