文档库

最新最全的文档下载
当前位置:文档库 > 队列研究

队列研究

第四章队列研究

探讨疾病的病因、危险因素及预后因素等是流行病学在医学研究中的重要应用之一。通过描述性研究,可以初步获得研究对象的各种特

征,但此时疾病的影响因素与结局是同时观察的,因此需要采用分析性研究方法加以探讨。队列研究(cohort study)是分析性研究的重要

方法之一,它可以直接观察暴露于不同危险因素或不同特征人群的结局,从而探讨危险因素与疾病发生或结局之间的关系。

第一节概述

一、概念

队列研究是指将某一特定人群按是否暴露于某可疑因索或按不同竑露水平分为亚组,追踪观察一定的时间,比较两组或各组发病率或死

亡书的差异,以检验该因素与某疾病有无因果关联及关联强度大小的一种观察性研究方法。

二、研究目的

{一)检验病因假设

由于队列研究是由因及果的研究,能确证暴錤与疾病的关系,因此检验病因假设是队列研究的主要目的和用途。一次队列研究可以只检

验一种接露与一种疾病之间的因果关联(如吸烟与肺癌),也可检验一种秘錤与多种结局之间的关联(如可同时检验吸烟与肺癌、心脏病、

慢性支气忏炎等的关联)。* '

(二)评价预防效果

有些域鋸有预防某结局发生的效应,即具有预防效果。如大蒜的摄入可预防消化道肿瘤如I?癌的发生,戒烟可减少吸烟者肺癌发生的危

险等。这里的预防措施(如大蒜摄人和戒烟)即暴露因素不是人为给予的,而是研究对象的自发行为。通过这种人群的“自然实验”(natural experiment)也可以评价某因素的预防效果。

(三)研究疾病自然史

临床上只能通过观察单个病人从发病到痊愈或死亡的过程来了解疾病的自然史。在队列研究开始时,研究前研究对象只是具有某种暴谣

而不患有相应的疾病,因此可以观察人群中不同个体缺露于某因素后,疾病逐渐发生、发展,直至结局的全过程,包括亚临床阶段的

变化与表现,M时还可以观察到各种自然和社会因素对疾病进程的影响。队列研究不但可了解个体疾病的自然史,而且可了解疾病在人

群中的发生发展过程。

三、研究类型

(一)前瞻性队列研究(prospective cohort study)

研究对象的确定与分组是根据研究开始时研究对象的暴露状况而定的,研究结局的获得?要随访观察一段时间后才能获得,这是队列研

究的基本形式。

前啲性队列研究的鍛大优点就是研究者可以直接获取关于暴露与结局的第一手资料,因而资料的偏倚较小,结果可信;其缺点是随访观

察的时间往往很长,所?观察的人群样本很大,需要花费很大,因而影响其现场可行性。

{二)历史性队列研究(historical cohort study)

历史性队列研究也称回顾性队列研究。研究工作从现在开辦,但研究对象是在过去某个时间进人队列,即观察或随访的起点是过去某个

时间,研究对象的确定与分组是根据过去某时点进人队列时的接露悄况。研究的结局在研究开始时可能已经发生,但资料收集是从暴

餺到结局的方向进行的。

在历史性队列研究中,研究对象的分组以及研究结局的获得都来源于研究者研究开始时所常捉的有关历史资料,因此有时不溢要进行随

访观察,对于一些从暴露到出现结局耑要很长时间的疾病研究,可以在较短时期内完成,具有省时、省力、出结果快的特点,W 而适用

于长诱导期和K潜伏期的疾病,也常常用于具有特殊缺露的职业人群研究。但M这种研究常常缺乏影响絲露与疾病关系的混杂因素资料,

影响暴露组和对照组的可比性。

(三)历史前瞻性队列研究(historical prospective cohort study)

如果在历史性队列研究之后,继续进行随访观察,称历史前瞻性队列研究,这种研究同时具有历史性队列研究和前胳性队列研究的性质,

一定程度上弥补了相互的不足。一般应用在研究开始时暴辦和暴鋸引起的快速效应(如肝功能损害、出生崎形、流产、不育等)已经

发生,而与祕餺有关的长期影响(如肿瘤)尚未出现,茁要进一步的观察,闪此适于评价对人体健康同时具有短期效应和长期作用的暴

露因尜。

53

一、率的计算

结局事件的发生率的计算是队列研究资料分析的重点,根据观察资料的特点,可选择计箅不同的指标。

(一)常用指标

尜积发病率(cumulative incidence,CI) 当研究人群的数量比较多,人口比较稳定,资料比较整齐的时候,无论其发病强度大小和观察时间长短,均可用观察开始时的人口数作分母,以幣个观察期内的发病(或死亡)人数为分子,计箅某病的累积发病率(或粜积死亡率)。尜积发病率的M:值变化范围为0?1,其流行病学意义有赖于对累积时间长度的说明。

某观察期内发病人数“ ”

同期的麵人口数

发病密度(incidence density,ID) 当观察的人口不稳定,观察对象进人研究的时间先后不一,以及各种原因造成失访,研究对象出现终点结局的时间不同等原因均可造成每个对象被观察的时间不一样。如果观察期间为8年,而存的对象可能只被观察了1年、4年、7年或儿年几个月不等,因此资料变得很不整齐。此时以总人数为单位计算发病(死亡)率是不合理的,闪为提早退出研究者若能坚持到随i方期结朿,则仍有发病可能。此时浓以观察人时(person time)即观察人数与观察时间的乘积为分母计箅发病率。以人时为中.位计箅出来的率带有瞬时频率性质,即表示在一定时间内发生某病新病例的速率,称为发病密度。iii常用的人时单位是人年(person year),以此求出人年发病(死亡)率。关于人年的计箅请参阅相关的统计书。

发病密度=魅臟观麵細■发病人数,4_o )

观察期内的观察对象人年数3)

(二)显著性检验

队列研究中暴辦组和非暴滿组两组人群的发病率或死亡韦比较浓作统计学显著性检验。当研究样本世较大,/>和1-/>都不太小,如72P 和均大于5时,样本率的频数分布近似[K态分布,此时用正态分布的原理來检验率的差异是否有賊著性,即用L;检验法来检验暴錤纟丨〖与非暴谣纟丨〖之间率的差异。求出U值后,查界值表得P值,按所収的检验水准即可作出判断。如果率比较低,样本较小时,可改用直接概率法、二项分布检验或Poisson分布检验;也可以利用四格表资料的x2检验,详细方法可参阅有关书籍。

二、效应的估计'

队列研究的资料一般整理成表4-2模式。

队列研究

式中和t/m分别为暴鋸组的发病率和非暴辦组的发病率,是统计分析的重要指标。

(一)相对危险度(relative risk,RR) " '

是反映狨露与发病(死亡)关联强度的最常用的指标,其本质是率比(rate ratio)。

RR = jiL = ^riL (4-4)

i o c/ Wo

式中/,

队列研究

和/o分别代表竑露组和非秘露组的发病或死亡率。尺尺表示暴露组发病或死亡的危险是非綠露组的多少倍。尺K=1表示两组的发

病率或死亡率没有差别;RR>1表示暴满组的发病率或死亡率尚于非秘露组,则该暴露因素为危险因素;RKC1表示暴露组的发病率或死

亡率低于非暴餺组,则该暴露因素为保护因素。因此值离1越远,表明暴露的效应越大,犍露与结局关联的强度越大。无论尺尺大于1

或小于1,都应进行统计学的显著性检验再下结论。

由样本资料计箅出的相对危险度是的一个点估计值,若要估计数值的总体范围,应考虑到抽样误差的存在,需计算其可信区间,通常用95%可信区间。具体计箅方法可用Woolf法计算,该方法是建立在RR方差基础上简单易行的方法。

Var(ln _RR) =*=丄+~^?+丄H\ (4-5)

abed

In RR 的95%可信区间=ln 尺尺士1. 96/Var(ln RR)

其反自然对数即为RR的95%可信区间。’

(二)归因危险度(attributable risk, AR)

又叫特异危险度、率差(rate difference,RD)和超额危险度(excess risk),是秘滿绀发病率与非祕麻组发病率相差的绝对值,说明危险特

异地归因于暴露因素的程度,即由于暴露因素的存在使暴餺组人群发病率增加或减少的部分。

AR=Ie-10 =—~ (4-6)

由于RR =导,Ir=RRXI0

J 0

所以A尺=尺尺父一7。= 7。(尺尺一1) . (4-7)

同样,归因危险度也是一个样本值,可以计算其95%可信区间。

AR 的95%可信区间=AK士1. 96X.M-f-%

V w 丨Wo

RR与AJ?都是队列研究的重_指标,彼此密切相关,但其公共卫生意义却不同。

说明暴露者与非暴露者比较相应疾病危险的倍数,其结果是一个相对数,没有单位;A1? 则一般是对人群而言,暴露人群与非暴露人群

比较,所增加的疾病发生的比例。如果该録露因素消除,就可减少疾病发生的比例。Ai?是一个有单位的率。兄R具有病因学的意义,Ai?

54

更具有疾病预防和公共卫生学上的意义。以表4-3为例说明两者的区别,从RR看,吸烟对肺癌的作用较大,病因联系较强;从AR看,吸烟对心血管疾病的作用较大,预防所取得的社会效果将更大。

队列研究

(

(三)归因危险度百分比(attributable risk percent, AR%)

又称为病因分值(etiologic fraction,EF),是指暴露人群中归因于暴獬的发病或死亡部分占全部发病或死亡的百分比。’

AR°/o = ~ J IoXlOO°/0 (4-8)

或AR% = ^j~ 1X1Q0% (4-9)

(四)人群归因危险度(population attributable risk, PAR)与人群归因危险度百分

人群归因危险度百分比也叫人群病因分值(population etiologic fraction,PEF),是指总人群发病率中归因于暴餺的部分,而是指PAR占总人群全部发病(或死亡)的百分比。

尺R和都说明暴露的生物学效应,即暴露的致病作用有多大;而PAR和则说明據露对一个具体人群的危害程度,以及消除这个因素后可能使发病率或死亡率减少的程度,它既与和Ai?有关,又与人群中暴露者的比例有关。除非研究对象两组的暴露比例与人群中的恰好一致,否则,计箅出来的A/?、与PAR和不一致。PA1?和P/U? %的计算式如下:

PAR=^I, - 10 (4-10)

厂代表全人群的率,Z。为非暴露组的率

PAi^% = ^--~--pX 100% (4-11)

另外,尸八尺%亦可由下式计箅:

PAR% = p fj^^「八丄X 100% (4-12)

式中P,表示人群中有某种暴露者的比例,从该式可看出PAK%与相对危险度及人群中暴露者的比例的关系。?

例如表4-3中,已知吸烟者肺癌年死亡率为0.4833%。(/,),非吸烟人群肺癌年死亡率为0.0449%。(70),全人群的肺癌年死亡率为0. 2836%。

(/,),贝lj :

RR=Ie/Io=0. 4483%0/0. 0449%。=9. 98,说明吸烟.组的肺癌死亡危险是非吸烟组的9.98倍;‘?

AR= lr - /o =0. 4483%0- 0. 0449%o=0. 4034%o,说明如果去除吸烟因素,则可使吸烟组人群肺癌死亡率减少0. 4034%。;’

AR°/o = CIg - Jo )//, = (0. 4483%0- 0. 0449%。)/0. 4483%。= 89. 98%,说明吸烟人群中由吸烟引起的肺癌死亡占所有肺癌死亡的比例为89.

98%,

PAR=It - /0 =0. 2836%0- 0. 0449%0~0. 2387%0,说明如果去除吸烟因素,则可使全人群中的肺癌死亡率减少0. 2387%。;?

PAR°/o = CIt ~ Jo)/// X 100% = (0. 2836%。- 0. O449%0)/O. 2836%。= 84. 17%,说明全人群中由吸烟引起的肺癌死亡占所有肺癌死亡的比例为84. 17%。

(五)标化比

. 当研究对象数目较少,结局事件的发生率比较低时,无论观察的时间长或短,都不宜直接计箅率。此时可以全人口的发病(死亡)率作为标准,计箅出该观察人群的理论发病(死亡)人数,即预期发病(死亡)人数,再求观察人群中实际发病(死亡)人数与此预期发病人数之比,即得标化发病(死亡)比。最常用的指标为标化死亡比(standardized mortality ratio, SMR)0有时某单位的历年人口资料不能得到,而仅有死亡人数、原因、FI期和年龄,则可计赏杯化比例死亡比(standardized proportional mortality ratio,SPMR)0其计箅方法是以全人口中某病因死亡占全部死亡之比例乘以某单位实际全部死亡数而得出某病闪的预期死亡数,然后计箅实际死亡数与预期死亡数之比。标化比实际上不是率,而是与全人口的发病(死亡)率计算出来的比。

例如,某地区已知30?40岁组居民有600名,某年内有4人死于冠心病,已知该年全人口30?40岁组冠心病的死亡率2. 5%。,求其SMR。

H 研究人群中观察死亡数(O)

一标准人口(全人口)预期死亡数(E) ?

已知0=4, E=600X2. 5%0=1. 5,则SMR=4/1. 5 = 2. 67

即某地区30?40岁年龄组居民死于冠心病的危险达到相应一般人群的2. 67倍。

五、队列研究的偏倚及其防止

偏倚(bias)是流行病学的一个术语,是指研究设计、实施、分析和推断过程中存在的各种对暴獬因素与疾病关系的错误估计,它系统地歪曲了暴餺因素与疾病间的啟实联系,其本质是一种系统误差。同样队列研究在设计、实施和资料分析等各个环节都》了能产生偏倚,因此,在各阶段都应采取措施,预防和控制偏倚的发生。

一、常见偏倚的种类

(一)选择偏倚(selection bias)

鉍理想的研究样本人群应当是总体人群的一个无偏样本,如果研究人群在一些重要因素方面与?般人群或待研究的总体人群存在差异,即研究人群(样本)不是-?般同质人群的一个无偏的代表,将会引起选择偏倚。队列研究中选择偏倚常发生于?.最初选定参加研究的对象中有人拒绝参加;在进行历史性队列研究时,有些人的档案丢失了或记录不全;研究对象由志愿者组成,他们往往或是比较健康的,或是有某种特殊倾向或习惯;另夕卜,

如果抽样方法不正确,或者执行不严格,则将导致严重的选择偏倚。

(二)失访偏倚(withdraw bias)

55

^ 流行病学

在研究过程中,某些选定的研究对象因为种种原因脱离了观察,研究者无法继续随访他们,这种现象称为失访(kxst follow-up),因此对研究结果造成的影响称为失访偏倚。这是:队列研究中不可避免的偏倚,因为在一个较长的追踪观察期内,总会有对象迁移、外出、死于非终点疾病或拒绝继续参加观察而退出队列。失访从本质上是破坏了原有样本的代表性,失访对研究结果造成的影响类似于选择偏倚。一项研究的失访率最好不超过10%,否则应慎重考虑结果的解释和推论。

(三)信息偏倚(information bias)

在获取暴露、结局或其他信息时所出现的系统误差或偏差叫信息偏倚。信息偏倚常是由于使用的仪器不梢确、洵问技巧不佳、检验技术不熟练、医生诊断水平不髙或诊断标准不明确等造成的。另外,信息偏倚也可来源于记录错误,甚至造假等。

(四)混杂偏倚(confounding bias)

混杂是指所研究因索与结果的联系被其他外部因素所混淆,这个外部因素就叫混杂变址,它是疾病的一个危险因子,又与所研究的因素有联系,它在暴露组与非祕露组的分布是不均衡的。性别、年龄是最常见的混杂因素。.

二、常见偏倚的预防及处理

(一)选择偏倚、

选择偏倚一旦产生,往往很难消除,因此应采取预防为主的方针。首先要严格按规定的标准选择对象;对象一旦选定,必须克服困难,坚持随访到底;如果有志愿者加人或有选定的研究对象拒绝参加,则应了解他们的基本情况后,与正常选择参加的人群进行比较,如果两者之间在一些基本特征上没有差异,则可认为导致的选择偏倚很小,否则,将引起的选择偏倚不能忽视。目前对选择偏倚程度的精确估计足困难的,对偏倚的处理亦缺乏有效的办法。

(二)失访偏倚

主要靠尽可能提高研究对象的依从性。在研究现场和研究对象的选择中就要考虑此问题,并应做好宣传解释工作。对失访者和已随访者的特征做比较分析,从各种途径了解失访者最后的结局,并与已随访者的最后观察结果做比较,以推测失访可能导致的影响。(三)信息偏倚

选择精确稳定的测方法、调准仪器、严格实验操作规程、同等地对待每个研究对象、提尚临床诊断技术、明确各项标准、严格按规定执行是防止信息偏倚的電要措施。此外,还应认W?做好调查员培训,提高洵问调奄技巧,统一标准,并进行有关责任心和诚信度的教脊。

信息偏倚一旦产生,往往既难发现,也难佔计与处理。常用的办法只是通过对一个随机样本进行取纪的调杳与检测,将两次检测的结果进行比较,以估计信息偏倚的可能与大小。

(四)混杂偏倚

在研究设计阶段可利用对研究对象作某种限制,以便获得同质的研究样本;在对照选择中采用匹配的办法,以保证两组在一些重要变址上的可比性;在研究对象抽样中,严格遵守随机化的原则等措施,来防止混杂偏倚的产生。

混杂偏倚的处理首先应根据混杂的判断标准来判断混杂存在的可能性,比较分层调整前后的两个效应测量值的大小以估计混杂作用的大小,进而采用分层分析、标准化或多因素分析等方法来处理混杂因素的混杂作用。

第六节队列研究的优点及局限性

由于研究对象暴露资料的收集在结局发生之前,并且都是由研究者亲自观察得到,所以资料可靠,回忆偏倚相对较小。,

可以直接获得暴露组和非暴露组人群的发病率或死亡率,直接计算出尺K等反映暴露与疾病关联强度的指标,可以充分而直接地分析暴露的病因作用。

由于病因发生在前,疾病发生在后,因果时间顺序明确,加之偏倚较少,又可直接计算各项测M:疾病危险关联的指标,故其检验病因假说的能力较强,一般可证实病因联系。

有助于了解人群疾病的自然史。

有时还可能获得多种预期以外的疾病的结局资料,分析一种原因与多种疾病的关系,也可以分析多种原因与一种或多种疾病之间的关系。.

二、局限性

不适于发病率很低的疾病的病因研究,因为在这种情况下需要的研究对象数M太大,一般难以达到。'

由于随访时间较长,对象不易保持依从性,容易产生失访偏倚。

研究耗费的人力、物力、财力和时间较多,其组织与后勤工作亦相当艰巨。

由于消耗太大,_故对研究设计的要求更严密,.资料收集的难度较大,不易实施。

在随访过程中,未知变量引入人群,或人群中已知变娥的变化等,都可使结局受到影响,使分析鉍杂化。

43

第三章描述性研究务布的关系,从而探求病因线索。

二、目的

(一)提供病因线索,产生病因假设.

通过对人群中某种疾病或健康状况的频率与某因素的暴露状态的研究,可分析该暴露因素与疾病或健康状况之间分布上的关

联,提供与疾病或健康状况分布有关的线索,从而为病因学假设的建立提供依据。* (二)评价干预实验或现场实验的效果?

在某些情况下,如果不是直接控制危险因素,而是通过综合方式(如健康教育、健康促进等)减少对危险因素的騷露,对此

干预措施的评价只?在人群水平上进行,则生态学研究更为合适,通过描述人群中某种(些)干预措施的实施状况及某种疾病或健

康状况的频率的变化,作进一步比较和分析,对干预措施进行评价。

例如,在某人群中推广低钠盐摄人,然后比较推广前后人均钠盐摄入水平的变化与人均血压值的变化趋势,以评价低钠盐干

预的效果。.

(三)人群中变异较小和难以测定的暴露研究

对于个体的暴辦剂量无法测咕的变a,如空气污染与肺癌的关系;在所研究地区变异非常小的变:《,如脂肪摄入域与乳腺

癌的关系,生态学研究是唯一可供选择的研究方法。

(四)监测

佔计某种疾病或健康状况的流行趋势,为制定疾病预防与控制的对策和措施提供依据。

三、方法(一)生态比较研究

生态比较研究(e c o l o g i c a l c o m p a r i s o n s t u d y)是生态学研究中应用最广泛的一种方法,观察

不同人群或地区某种疾病或健康状况的分布,然后根据同一时间内,不同地区或人群疾病或健康状况分布的差异,探索环境因素与

疾病的关系,提出病因假设。

生态比较研究更常用来比较不同人群中某因素的平均暴满水平和某种疾病或他康状况频率之间的关系,了解这些人群中暴露

因素的频率或水平,比较不同暴露水平的人群中疾病或健康状况的频率,从而为病因探索提供线索;生态比较研究也可应用于评价

社会设施、人群干预以及在政策、法令的实施等方面的效果。

(二)生态趋势研究

生态趋势研究(e c o l o g i c a l t r e n d s t u d y)是连续观察平均暴辦水平的变化(或者给予干预)和一

个群体中某种疾病或健康状况频率变化的关系,了解其变化趋势,通过比较暴餺水平变化前后疾病或健康状况频率的变化情况,判

断该暴餺与某种疾病或健康状况的联系。它足先将一个地区的预定调丧人群按年龄、出生年代等时间变丨i t分成不同的群组,

然后调仵各人群疾病或健康状况频率的变化和某叫因素的变化情况,以探索疾病或健康状况与这些因素及时间是否相关。

生态学研究在应用中也常常将比较研究和趋势研究两种类型结合起来,观察在儿组人群中平均暴露水平的变化与某种疾病或

健谈状况频率之间的关系,以减小混杂因素的影响,提髙生态学研究的准确性。

由于生态学研究是以由各个不同情况的个体集合而成的群体为观察和分析的单位,无法得知个体的暴餺与效应(疾病或健康

状况)间的关系,得到的资料是群体的平均水平,只是粗线条的描述,会削弱变a之间的联系,以及存在的混杂因素等原因而造成

的研究结果与真实情况不符,从而产生了生态学谬误(ecological fallacy〉,它是生态学研究最主要的缺点。因此在

应用时应尽可能集中研究目的;选择研究对象时,尽可能使组间可比,观察分析的单位尽可能的多,每个单位内人数尽可能少;资

料分析时采用生态学回归分析,分析模型中尽可能多纳人一些变l i t;对研究结果进行推测时,尽试与其他非生态学研究结果相

比较,并结合对所研究问题的专业知识等来综合分析和判断。

.

1.概念抽样调杏(s a m p l i n g s u r v e y)是指在特定时点、特定范围内某

人群总体中,

第五章按照一定的方法抽取一部分有代表性的个体组成样本进行调查分析,以此推论该人群总体 某种疾病的患病率及某些特征的一种调查。

2. 目的主要是以样本统计估计总体参数所在范围,描述某种疾病或健康状况于 特定时间、特定范围内人群特征'上的分布及影响其分布的因素;衡《人群总体的健康水 平;考核防治效果;检奄与衡《资料的质w ,即抽样调查常可作为其他调查研究方法中的 质崖:控制的方法。

3. 基本原理抽样必须遵循随机化的原则,样本必须足够大,且调査材料的分布要 均匀,才能获得有代表性的样本,并通过样本信息推断总体的特征。随机化抽样是指研究 总体中每个个体均有同等的机会被抽到并组成样本。

4. 优缺点与普查相比,抽样调査具有节省人力、物力和时间以及由于调査范围小 而使调查精度较商的优点,在流行病学凋查中占有很重要的地位,是最常用的方法。但是 抽样调查的设计、实施与资料分析均比普查要复杂,重复和遗餚不易被发现;不适用于变 异较大的资料,不适用于患病率较低的疾病。

5. 抽样方法目前在流行病学调查中使用的随机抽样方法可分为单纯随机抽样、系 统抽样、分层抽样、幣群抽样和多级抽样。在现况调查中,.后三种方法较常用。