Meta分析
在医学研究中,绝大多数的医学现象都呈一定的随机性,因此医学研究的结果都受随机抽样误差影响而有所差异。所以对于同一研究问题的多个研究结果往往不全相同,有些研究的结论甚至相反。因此如何从结果不一的同类研究中综合出一个较为可靠的结论是医学研究中常常需要面临的问题。Meta分析就是研究如何综合同类研究结果的一种统计分析方法。
Meta分析就是把相同研究问题的多个研究结果视为一个多中心研究的结果,运用多中心研究的统计方法进行综合分析。Meta统计分析可以分为确定性模型分析方法和随机模型分析方法。较常用的确定性模型Meta分析有Mantel-Haeszel统计方法(仅适用于效应指标为OR)和General-V ariance-Based统计方法。然而所有的确定性模型统计方法都要求Meta分析中的各个研究的总体效应指标(如:两组均数的差值等)是相等的,并称为齐性的(Homogeneity),而随机模型对效应指标没有齐性要求。因此Meta分析可以采用下列分析策略:
1)如果各个研究的效应指标是齐性的,则选用确定性模型统计方法:
●效应指标为OR,则采用Mantel-Haeszel统计方法
●效应指标为两个均数的差值、两个率的差值、回归系数、对
数RR等近似服从正态分布的效应指标,则采用General-
V ariacne-Based方法进行Meta统计分析。
2)如果各个研究的效应指标不满足齐性条件或者研究背景无法用
确定性模型进行解释的,则采用随机模型进行Meta 统计分析。 为了使读者较容易地掌握Meta 分析方法,以下将结合STA TA 软件的Meta 分析操作命令,通过实例介绍Meta 分析步骤和软件操作以及相应的统计分析结果解释,然后对Meta 分析中所涉及的统计公式进行分类汇总小结。
确定性模型的Meta 分析方法
例1:为了研究Aspirin 预防心肌梗塞(MI)后死亡的发生,美国在1976年-1988年间进行了7个关于Aspirin 预防MI 后死亡的研究,其结果见表1,其中6次研究的结果表明Aspirin 组与安慰剂组的MI 后死亡率的差别无统计意义,只有一个研究的结果表明Aspirin 在预防MI 后死亡有效并且差别有统计意义。现根据表1所提供的资料作Meta 分析。
表1 Aspirin 预防心肌梗塞后死亡的研究结果
研究 Aspirin 组 安慰剂组 编号 观察人数 死亡人数 死亡率P E (%)
观察人数 死亡人数
死亡率P C (%)
P 值
OR *
1 615 49 7.97 624 67 10.74 0.094 0.720
2 758 44 5.80 771 64 8.30 0.057 0.681
3 832 102 12.26 850 126 14.82 0.125 0.803
4 317 32 10.09 309 38 12.30 0.382 0.801
5 810 85 10.49 40
6 52 12.81 0.229 0.798 6 226
7 246 10.85 2257 219 9.70 0.204 1.133 7
8587
1570
18.28
8600
1720
20.00
0.004 0.895
注:11E C E
C
P P O R P P =--。可以证明:OR>1对应P E >P C ;OR<1对应P E
P E =P C 。
具体分析和计算步骤如下: 一、把表1资料改写为表2形式的资料
表2 Mantel-Haeszel 计算用表
Aspirin 组
安慰剂组
研究 编号 死亡人数 (a) 存活人数 (b) 死亡人数 (c) 存活人数 (d) 样本量 (n) 权重 (w) OR
w ×OR
1 49 566 67 557 1239 0.0389 0.7197 0.0280
2 44 714 64 707 1529 0.0412 0.6808 0.0280
3 102 730 126 72
4 1682 0.020
5 0.8029 0.0165 4 32 285 38 271 62
6 0.0648 0.800
7 0.0519 5 85 725 52 354 1216 0.0352 0.7981 0.0281 6 246 2021 219 203
8 4524 0.0096 1.1327 0.010
9 7 1570 7017 1720 6880 17187 0.0015 0.8950 0.0013
合计
0.2116
0.1647 其中括号中的a,b,c,d,w 为统计计算公式中所对应的符号。如:权重1111w a
b
c
d
=+
+
+
二、计算Mantel-Haeszel OR:
0.03890.71970.00150.89500.16470.7780.03890.04120.02050.0015
0.2116
i
i
i
M H i
i
w O R
O R w ?++?=
=
=
=++++∑∑
三、OR 的齐性检验H 0:各个研究的总体OR 相同 vs H 1:各个研究
的总体OR 不全相同。OR 的齐性检验在统计软件中一般采用Breslow-Day 齐性检验[1]。由于Breslow-Day 齐性检验方法计算步骤较为复杂,所以本书将仅给出参考文献供读者查阅。 四、如果OR 齐性,则用Mantel -Haeszel 方法计算总体OR MH 的95%
可信区间以及检验H 0:总体OR MH =1。Mantel -Haeszel 方法计算OR 的可信区间比较误差,故在汇总中给出计算公式。 五、用STA TA 软件对上述资料进行统计分析操作步骤如下: 资料输入的格式:其中no 为研究编号,group=1表示Aspirin 组,group=0表示安慰剂组;dead=1表示死亡,dead=0表示活着;w
表示频数。
第一个研究的资料
第二个研究的资料
第七个研究的资料
●
●STA TA软件输出结果如下:
各个研究的OR齐性检验(H0:总体OR1=总体OR2=…=总体OR7=公共总体OR)
设齐性检验的检验水平 =0.1,齐性检验的卡方值为9.95,自由度为6,相应的P值=0.1269>0.1,因此可近似认为OR是齐性的。
综合效应的统计检验H0:公共的总体OR=1 vs H1:公共的
总体OR ≠1
设综合效应的统计检验水平α=0.05,对应的Mantel -Haeszel 卡方=10.82,自由度为1,相应的P 值=0.0010<0.05,因此可以推断综合分析中公共总体OR 不等于1,公共OR 的Mantel -Haeszel 估计值=0.8968,相应的95%可信区间为(0.8405,0.9570),因此在95%可信意义下可以推断综合分析的总体OR<1(或者说:可以断定总体OR<1的概率大于0.95)。
由于本研究的11C E E
C
P P O R P P =
--,因此可以推断:Aspiring 组的死
亡率低于安慰剂组的死亡率,并且差别有统计意义。
结论:服用Aspiring 有助于降低心肌梗塞后的死亡率。 例2:为了研究某减肥药的疗效,现以身高体重指数BMI 为疗效观察指标,为了避免其它的混杂作用,故限定所有研究对象均为45岁至55岁的健康女性(其它体检指标均正常)。研究问题为:通过一个疗程的治疗,该药物是否能降低45岁至55岁的健康女性的BMI? 因此需要检验治疗组和对照组所对于BMI 总体均数是否相同?
现收集了6个研究的结果如下
所收集研究
治疗组 对照组 两个样本 均数的差值 d 两个样本均数
差值的标准误
se P 值
结果的编号(no)
均数 (mean E ) 标准差 (S E ) 样本量 (n E ) 均数 (mean C ) 标准差 (S C ) 样本量 (n C ) 1 28.0 3.3 30 29.0 2.8 35 -1.0 0.766159 0.1910 2
25.5 2.9 34 27.4 2.7 31 -1.9 0.694632 0.0083 3 26.5 2.7 32 27.5 2.9 31 -1.0 0.706472 0.1615 4 27.8 3.4 33 29.8 2.6 31 -2.0 0.753902 0.0107 5 27.2 3.0 30 28.1 2.9 32 -0.9 0.750208 0.2345 6
28.0
2.8
60
29.2
3.1
50
-1.2
0.568214 0.0353
在这6个研究中,研究结果表明:有3组BMI 的差异有统计意义(P 值<0.05),但是另外3组BMI 的差异无统计意义。因此存在较大的争议,所以有必要通过Meta 分析综合这6个研究的结果。
总体效应指标为治疗组BMI 的总均数-对照组BMI 的总体均数:D E C μμμ=-,相应的样本效应指标为mean D =mean E -mean C ,标
准误()E
C se x x -=
详细叙述。以均数差值为效应指标的Meta 分析可以用General V ariance-Based 方法进行综合分析。计算步骤简述如下: 一、计算各个研究的权重:2
1i
i
w se =
研究编号i 1 2 3 4 5 6 标准误se i 0.766159 0.694632 0.706472 0.753902 0.750208 0.568214 权重w i 1.703579
2.07248
2.003596
1.759423
1.776792
3.097249
二、计算加权平均的均数差d 和相应的方差()V ar d
研究编号I 1 2 3 4 5 6
合计 两个均数差值d i -1.0000 -1.9000 -1.0000 -2.0000 -0.9000 -1.2000
权重w i 1.7036 2.0725 2.0036 1.7594 1.7768 3.0972 12.4131 w i ×d i
-1.7036 -3.9377 -2.0036 -3.5188 -1.5991 -3.7167 -16.4795
加权平均的均数差6
16
1
-16.4795-1.3276 12.4131
i
i
i i
i w d
d
w
===
=
=∑∑
加权平均的均数差的方差6
1
1
1()0.0806
12.4131
i
i Var d w
==
=
=∑
三、齐性检验:2()i i Q w d d =-∑。如果各个研究的两个总体均数的差
值μd 是相等的,则Q 近似服从自由度为5的卡方分布(自由度=研究个数-1,本例df=6-1=5)。设齐性检验的统计检验水平α=0.1。
研究编号I 1 2 3 4 5 6
合计 两个均数差值d i -1.0000 -1.9000 -1.0000 -2.0000 -0.9000 -1.2000 i
0.3276 -0.5724 0.3276 -0.6724 0.4276 0.1276
权重w i
1.7036
2.0725 2.0036 1.7594 1.7768
3.0972 12.4131 i i 0.1828 0.6791 0.2150 0.7955 0.3249 0.0504 2.2477
齐性检验统计量2()i i Q w d d =-∑=2.2477<2
5,0.1
9.23χ=,P 值>0.1。因此可以近似认为各个研究的效应是齐性的。
四、计算11226d E
C E C E
C μμμμμμμ=-=-==- 的95%可信区间1
.(
)
d d ± 综
合的总体均数差
值
μd 的下限1.3276 1.96
1.8839d
-=--?=- 综合的总体均数差值μd
的
上
限
1.3276 1.960.7713d +=-+?=-
因此综合的总体均数差值μd的95%可信区间为(-1.8839,-0.7713) 五、假设检验H0:综合的总体均数差值μd=0 vs H1:综合的总体均数差值μd≠0
检验统计量 4.6674
Z===-,|Z|>0.96,对应P值<0.05,
因此可以认为治疗组BMI低于对照组的BMI,并且差别有统计意义。
并可用STA TA软件进行统计分析。资料输入的格式如下:
均数差值均数差值的标准误
第1个研究
第2个研究
第3个研究
第4个研究
第5个研究
第6个研究
得到下列确定性模型的输出部分(Stata软件同时输出随机模型部分,但下面没有给出)
STA TA软件Meta分析输出中,
效应齐性检验的卡方值Q=2.248,自由度df=5,P值=0.814>0.1,因此可以认为各个研究之间的效应是齐性的。
均数差的加权平均值Est=-1.328
总体均数差值的95%下限Lower=-1.884,总体均数差值的95%
上限Upper=-0.771
检验统计量Z=-4.677,相应P 值<0.001
STA TA 软件输出结果与上述计算一致,结论与上述相同。
General V ariance-Based 方法进行Meta 分析都可以用STA TA 软件中的Meta 命令,但要求效应指标统计量近似服从正态分布,常见的效应指标统计量有:取对数的相对危险度ln(RR),回归系数b ,两个率的差值(要求率比较大,接近0.5),对数OR ,效应指标及其标准误计算见下表
效应指标D 效应指标的标准误se(d)
有关两个率比较的统计量
1a P a b
=
+,2
c P
c d
=
+,12
P RR P =
d=ln(RR)
d=P 1-P 2
ad O R bc
=
d=ln(OR)
*
回归系数
d=b se(b)
两个样本均数的差值
12d x x -=
*
虽然OR 可以通过取对数后,再用General V ariance-Based 方法
进行Meta 分析,但是有关研究表明:对于OR 为效应指标而言(四格表资料),Mantel -Haeszel 方法要优于General V ariance-Based 方法,所以我们还是建议用Mantel -Haeszel 方法对OR 的四格表资料进行Meta 分析。
在STA TA软件Meta分析操作命令为
随机模型的Meta分析方法
为了帮助读者较好地理解Meta分析的随机模型,先举一个比较容易理解的收缩血压观察的随机模型例子(非Meta分析)。例如,任一正常人的收缩血压随着时间变化呈随机性的变化,因此对于任一观察对象的一次收缩压观察值与该对象自身平均收缩压之间存在一个随机变异并称为个体自身内部随机变异(个体内变异)。而任一正常人的平均收缩压与所有正常人平均收缩压的总体均数(正常人群的总体均数)之间也存在随机变异的并称为个体之间的随机变异(简称个体间变异)。所以正常人收缩压的一次观察值与正常人群的收缩压总体均数之间含有两个层次的随机变异:个体内变异和个体间变异。
Meta分析中随机模型把随机变异分为2个层次。在第一个层面上,任一研究的总体均数(简称均数)与该研究的样本均数之间都存在抽样误差,因此这种抽样误差视为个体内变异(该研究内的变异);在第二个层面上,首先假定存在许许多多同一研究问题的的研究,由于研究之间在许多因素上存在微小差异,并且导致各个研究的总体均数之间存在差异并视为随机变异。同一研究问题的所有这些研究的总体均数构成了一个集合可视为一个总体以及这些(研究)总体均数的平均数就是它们的总体均数,为了叙述方便称为群体总体均数。并且认为Meta分析所收集的若干个研究仅是许许多多个研究中的一个随机抽样,这些研究的总体均数与群体总体均数之间的变异为随机变异
(个体间变异)。因此任意一个研究中的效应指标的样本估计值与该研究的总体均数之间存在个体内变异,而该研究的总体均数与群体总体均数之间存在个体间变异,所以在Meta分析的随机模型中,任一研究中的样本均数与群体总体均数之间也含有两种随机成分:研究内部的抽样误差(个体内变异)和研究之间的随机变异(个体间变异)。Meta 分析中的随机模型的统计分析就是对群体总体均数进行统计推断。
随机模型也要求效应指标近似服从正态分布或变换后的效应指标近似服从正态分布。一般采用Der Simonian and Laird方法对 进行估计和检验。
例3:为了评价A药和B种药治疗骨质疏松症。经检索,共有12个医疗单位做了临床药物疗效观察观察。疗程为12个月,并以骨密度改变比例作为效应指标。但各个研究效果不一致,故需做Meta分析。
研究均数标准差样本量均数标准差样本量两个均数均数差值
编号mean
a S
a
n
a
mean
b
S
b
n
b
的差值d 标准误se P值
1 2.6 0.474 26 8.73 1.587 29 -6.13 0.309 <0.05
2 2.41 0.639 27 3.94 1.541 32 -1.5
3 0.299 <0.05
3 1.
4 0.639 28 6.2 1.574 27 -4.80 0.326 <0.05
4 3.58 0.144 21 5.39 1.209 23 -1.81 0.254 <0.05
5 2.22 0.277 2
6 7.54 1.246 22 -5.32 0.271 <0.05
6 1.99 0.208 25 0.74 0.154 33 1.25 0.049 <0.05
7 1.48 0.671 27 3.98 1.606 31 -2.50 0.316 <0.05
8 1.08 0.869 29 1.23 0.856 23 -0.15 0.241 0.536
9 3.24 0.603 25 4.51 0.416 28 -1.27 0.144 <0.05
10 0.44 0.523 20 3.81 1.787 20 -3.37 0.416 <0.05
11 3.74 0.773 20 10.62 1.233 33 -6.88 0.276 <0.05
12 1.89 0.942 28 6.7 1.132 30 -4.81 0.273 <0.05 两个均数的差值和均数差值的标准误的计算方法与General-
V ariacne-Based方法中两个均数比较相同,故不再重复。由于Meta 分析的随机模型统计方法较为复杂,故现用STA TA软件进行Meta分析上述资料。STA TA命令与上述相同。
meta d se
得到下列结果
Meta-analysis of 12 studies
----------------------------
Fixed and random effects pooled estimates,
lower and upper 95% confidence limits, and
asymptotic z-test for null hypothesis that true effect=0
Fixed effects estimation确定性模型统计分析
Est Lower Upper z_va~e p_va~e
0.052 -0.029 0.133 1.259 0.208
Test for heterogeneity: Q= 2860.070 on 11 degrees of freedom (p= 0.000)齐性检验
Der Simonian and Laird estimate of between studies variance = 10.137
Random effects estimation随机模型统计分析
Est Lower Upper z_va~e p_va~e
-3.105 -4.914 -1.297 -3.366 0.001
由于齐性检验的卡方值Q=2860.070,自由度df=11,P值<0.001,故认为各个研究之间的效应是不齐的。因此General-Variacne-Based 方法不适合用,所以只有用随机模型的meta分析方法。
随机模型统计分析中,各个研究之间的随机效应的方差=10.137,各个研究的(群体)总体均数的平均值μ =-3.105,95%可信区间为(-4.914,-1.297)
H0:μ=0 vs H1:μ≠0,检验统计量Z=-3.366,P值=0.001,因此认为B药使骨密度改善的比例高于A药骨密度改善的比例,并且差别有统计意义。
1Breslow .N. E. and Day. N. E.(1980). Statistical Methods in Cancer Research. V olume 1:The Analysis of Case-Control Studies. Lyon. International Agency for Research on Cancer.
Meta分析 在医学研究中,绝大多数的医学现象都呈一定的随机性,因此医学研究的结果都受随机抽样误差影响而有所差异。所以对于同一研究问题的多个研究结果往往不全相同,有些研究的结论甚至相反。因此如何从结果不一的同类研究中综合出一个较为可靠的结论是医学研究中常常需要面临的问题。Meta分析就是研究如何综合同类研究结果的一种统计分析方法。 Meta分析就是把相同研究问题的多个研究结果视为一个多中心研究的结果,运用多中心研究的统计方法进行综合分析。Meta统计分析可以分为确定性模型分析方法和随机模型分析方法。较常用的确定性模型Meta分析有Mantel-Haeszel统计方法(仅适用于效应指标为OR)和General-V ariance-Based统计方法。然而所有的确定性模型统计方法都要求Meta分析中的各个研究的总体效应指标(如:两组均数的差值等)是相等的,并称为齐性的(Homogeneity),而随机模型对效应指标没有齐性要求。因此Meta分析可以采用下列分析策略: 1)如果各个研究的效应指标是齐性的,则选用确定性模型统计方法: ●效应指标为OR,则采用Mantel-Haeszel统计方法 ●效应指标为两个均数的差值、两个率的差值、回归系数、对 数RR等近似服从正态分布的效应指标,则采用General- V ariacne-Based方法进行Meta统计分析。 2)如果各个研究的效应指标不满足齐性条件或者研究背景无法用
确定性模型进行解释的,则采用随机模型进行Meta 统计分析。 为了使读者较容易地掌握Meta 分析方法,以下将结合STA TA 软件的Meta 分析操作命令,通过实例介绍Meta 分析步骤和软件操作以及相应的统计分析结果解释,然后对Meta 分析中所涉及的统计公式进行分类汇总小结。 确定性模型的Meta 分析方法 例1:为了研究Aspirin 预防心肌梗塞(MI)后死亡的发生,美国在1976年-1988年间进行了7个关于Aspirin 预防MI 后死亡的研究,其结果见表1,其中6次研究的结果表明Aspirin 组与安慰剂组的MI 后死亡率的差别无统计意义,只有一个研究的结果表明Aspirin 在预防MI 后死亡有效并且差别有统计意义。现根据表1所提供的资料作Meta 分析。 表1 Aspirin 预防心肌梗塞后死亡的研究结果 研究 Aspirin 组 安慰剂组 编号 观察人数 死亡人数 死亡率P E (%) 观察人数 死亡人数 死亡率P C (%) P 值 OR * 1 615 49 7.97 624 67 10.74 0.094 0.720 2 758 44 5.80 771 64 8.30 0.057 0.681 3 832 102 12.26 850 126 14.82 0.125 0.803 4 317 32 10.09 309 38 12.30 0.382 0.801 5 810 85 10.49 40 6 52 12.81 0.229 0.798 6 226 7 246 10.85 2257 219 9.70 0.204 1.133 7 8587 1570 18.28 8600 1720 20.00 0.004 0.895 注:11E C E C P P O R P P =--。可以证明:OR>1对应P E >P C ;OR<1对应P E