当前位置：文档库 › 基于随机系数模型的重复测量资料分析方法

基于随机系数模型的重复测量资料分析方法

3基金项目:温州市科技局(编号:Y20070063);温州医学院科研发展基金(编号:XN K07096)资助。

11温州医学院环境与公共卫生学院预防医学系(325035)21浙江大学医学院流行病与卫生统计学教研室

基于随机系数模型的重复测量资料分析方法3

施红英1　沈　毅2

【提　要】　目的　探讨随机系数模型在重复测量资料分析中的应用。方法　以实例说明随机系数模型,包括线性随机系数模型和多项式随机系数模型在重复测量资料中的应用,并与重复测量方差分析进行比较。结果　重复测量方差分析结果显示,处理因素无统计学意义,时间因素有统计学意义;随机系数模型拟合结果还提示因变量与时间之间可能存在非线性关系。结论　随机系数模型拟合结果基本与重复测量方差分析结论一致,但随机系数模型可以考虑资料的相关性、非线性问题,因此更为准确可信。

【关键词】　随机系数模型　重复测量　混合模型

重复测量资料是对同一受试者的某项观察指标进

行多次观测得到的资料。由于在同一受试者的多次观测值之间往往存在某种相关性,用通常的统计方法不能充分揭示出其内在的特点,有时甚至会得出错误的

结论〔1〕

。因此,有关重复测量资料的分析方法成为近代统计学研究的热点之一。目前,混合模型(包括协方差类型模型、随机系数模型)是新兴的分析重复测量资

料的一种强有力的统计方法〔2〕

。笔者曾对协方差类型模型在重复测量资料分析中的应用进行了探讨〔3〕。本文就随机系数模型做一探讨。

原理简介

随机系数模型是针对重复测量资料的又一种重要建模方法,该模型可以描述观测值随时间变化的算术关系。最常见的是应用于观测值随时间变化呈线性关系的情况。此时,要解决的首要问题就是比较不同处理组各观测值随时间变化的速度是否相同。为解决该问题,一个非常简单的方法就是把时间效应(time )作为定量变量(注意,此处不是作为定性变量)引入模型,当作协变量来处理。此时的模型可以简单地表示为:

y ij =μ+b ×pre +t reat k +m ×ti me ij +e ij 其中,ti me ij 是第i 个病人的第j 次观测的时间,m 是一个常数,代表每个单位时间内观测值y 的变化。因此,就可以得到时间ti me 的斜率m ,它描述了观测值和时间之间的线性关系。由于考虑到各个病人之间的这种线性关系很可能存在变异,可以拟合病人效应以提供每个病人的截距项,同时拟合病人×时间交互效应以提供每个病人的斜率。模型如下:

y ij =μ+b ×pre +t reat k +p i +m ×ti me ij +

(pm )

×ti me ij +e ij

其中,(pm )i 是第i 个病人斜率与平均斜率的差别;p i 是第i 个病人的截距与平均截距之差。由于假定病人效应和病人×时间交互效应来自某种分布是合情合理的,因此,可以将病人效应和病人×时间交互效应均拟合为随机效应,但是由于此处的随机效应涉及协变量即时间变量(ti me ),与一般的随机效应模型不同。因此,称这类模型为随机系数模型(random co 2efficients models ),该模型构成了混合模型的第三大类。可以简单地这么理解:其中随机效应是连续性变量的混合模型是随机系数模型,而随机效应是分类变量的混合模型是随机效应模型。

在拟合线性随机系数模型时,我们希望拟合固定效应以代表反应变量随时间的平均变化速度,通过拟合处理×时间交互效应估计不同处理组变化速度的差异,同时,我们还需要固定效应代表每个处理组的截距。除了用固定效应代表平均斜率和截距之外,随机系数模型还允许每个受试者之间的斜率和截距存在随机变异,使得针对每个受试者均有一条回归线。这可以通过拟合受试者效应为随机效应,使得截距变异;而拟合受试者×时间交互效应为随机效应,使得斜率变异。这些效应又用于计算时间效应和处理×时间交互效应的标准误,从而对这两个效应进行估计,而这正是分析的主要目的。因此,随机系数模型中,基本模型包括:固定效应:ti me 、t reat 、t reat ×ti me ,随机效应:pa 2

tient 、patient 2ti me 。另外,其他一些受试者因素如年

龄、性别以及这些因素与时间的交互作用等也可以引入模型。

实例分析

本文以某次临床试验中的观察指标———丙氨酸氨基转移酶为例,说明随机系数模型在重复测量资料分析中的应用。由于该指标不满足正态性的前提,所以先进行了对数变换处理,转换成正态分布。

首先对该资料进行概貌分析,了解不同处理组的

742?　

中国卫生统计2008年6月第25卷第3期

反应变量平均值随时间变化的特点,见表1。

表1　两组受试者各时间点的丙氨酸氨

基转移酶(AL T)平均值

TREAT n mday0mday15mday30mday45 a72 2.14894 1.75015 1.63147 1.57946

b72 2.15652 1.83264 1.77595 1.66258

随着时间的推移,两处理组丙氨酸氨基转移酶AL T的变化均呈下降趋势,但是a组下降更快,且在30天时两组相差最大。

第二,采用重复测量方差分析(repeated measures analysis of variance,RMAOV),结果表明,时间×处理交互效应无统计学意义,P=012763;处理效应也无统计学意义,P=010961,表明两处理组之间无差别;时间效应具有统计学意义,P<010001,表明各个时间点上丙氨酸氨基转移酶AL T的水平是有差异的。

第三,随机系数模型的拟合。此时数据集结构转换成表2形式,注意与重复测量资料的方差分析时的数据集结构有所不同。

表2　数据集格式

Patient Obs TREAT CEN TER ti me y 11a311.79934

12a321.84510

13a331.54407

14a341.60206………………………………

144573a111.44716 144574a121.89763 144575a131.56820 144576a141.14613 首先进行线性随机系数模型的拟合,其中,固定效应包括:time、treat以及treat-time,而随机系数包括:

patient以及patient-time。结果如表3～5所示。

表3　固定效应的解

Effect Estimate Standard Error DF t P

Intercept- 2.26520.0571413839.64<0.0001 TREA T a-0.009700.08037135-0.120.9042

TREA T b0....

Time--0.15960.02003117-7.97<0.0001 Time×TREA T a-0.030820.02778112-1.110.2696 Time×TREA T b0....

表4　固定效应的3型假设检验

Effect Num DF Den DF F P

TREAT11350.010.9042

Time1112158.81<0.0001 Time×TREAT1112 1.230.2696

表5　拟合多项式随机系数模型时的数据集结构

Patient Obs TREAT CEN TER ti me y ti me2ti me3 11a31 1.7993411

12a32 1.8451048

13a33 1.54407927

14a34 1.602061664…………………………………………144573a21 1.4471611 144574a22 1.8976348 144575a23 1.56820927 144576a24 1.146131664

由线性随机系数模型拟合结果可知,时间×处理交互效应无统计学意义,P=012696,说明两个处理组的丙氨酸氨基转移酶随时间的下降速度差别没有统计学意义。处理效应也无统计学意义,P=019042;时间效应有统计学意义,P<010001,表明各个时间点上丙氨酸氨基转移酶的水平是不同的。

在表3中,Ti me一行给出了参照组(此处为b 组)的丙氨酸氨基转移酶下降速度平均估计值及其标准误,表明参照组的丙氨酸氨基转移酶下降速度为011596(u/L)/15天,相应的标准误为01020(u/L)。为了得到另一处理组的相应数据,将两个组的编码反一下,即将原来为a组的重新编码为b组,而b组的编码为a组,之后重新进行模型拟合,结果发现,交互项的估计值等均不变,但是ti me行的估计值变为011904(u/L)/15天,标准误为01019(u/L),表明a组的丙氨酸氨基转移酶下降速度较大。这与表1中看到的结论一致,a组的斜率相对较大。

以上探讨的模型都是假定反应变量随时间变化呈线性关系,在多数情况下,这种线性随机系数模型用于评估是否具有时间趋势以及不同处理组的时间趋势是否不同已经足够。但是,在有些情况下,反应变量随时间变化规律并不一定是线性的,此时,我们也可以进行随机系数模型的拟合,但采用的是多项式随机系数模型(polynomial random coefficients model)〔4〕,此时的数据集结构如表5所示。其中,ti me2为原变量ti me的平方,ti me3为原变量ti me的三次方。

将时间效应的二次项、三次项依次引入模型,并且同时作为固定效应和随机系数引入。只要其方差成分是正的,则相应的随机系数项即保留在模型中;但是,固定效应的多项式依次引入模型,直到其没有统计学意义为止,具体见表6。

但是,当把时间的三次项(ti me3)作为随机系数引入模型时,发现模型不能收敛,因此剔除该项,随机系数拟合到时间的二次项(ti me2)为止。但是,时间的三次项(ti me3)仍然可以作为固定效应引入模型,此时的模型即为模型3。其中包括:

固定效应:t reat,ti me,ti me2,ti me3

?Chinese Journal of Health Statistics,J un2008,Vol.25,No.3

表6　模型1～模型3的主要分析结果汇总

Model Fixed effects

G matrix and residual 1(linear )

Intercept

2.3045(0.04495)0.1405-0.035980.

01280

0.05494

Treat -0.08627(0.04111)Ti me

-0.1757(0.01390)

2(quadratic )Intercept

2.6413(0.08353)0.7274-0.51360.39280.08508

-0.06646

01154

0.02419

Treat -0.08955(0.04017)Ti me -0.5262(0.06455)Ti me 2

0.07217(0.01177)3(cubic )Intercept

3.0768(0.1324)0.7483-0.53280.41240.08866

-0.07027

01230

0.02104

Treat -0.08997(0.04027)Ti me -1.2260(0.1773)Ti me 20.3895(0.07585)Ti me 3

-0.04263(0.01007)

　随机系数:patient ,ti me ,ti me 2　此时的协方差参数估计值见表7。

表7　协方差参数估计值

Cov Parm Subject Estimate SE Z

UN (1,1)PAT 0.74830.1149 6.52<0.0001UN (2,1)PAT -0.53280.08986-5.93<0.0001UN (2,2)PAT 0.41240.07379 5.59<0.0001UN (3,1)PAT 0.088660.01603 5.53<0.0001UN (3,2)PAT -0.070270.01339-5.25<0.0001UN (3,3)PAT 0.012300.002473 4.97<0.0001Residual

-0.02104

0.002838

7.41

<0.0001

在表7中,UN (1,1),UN (2,2)和UN (3,3)分别是随机系数受试者(patient )、受试者×时间(patient ×time )、受试者×时间2(patient ×time2)的方差成分估计值。UN (2,1)、UN (3,1)和UN (3,2)是随机系数之间的协方差。可以看到,方差成分估计值均为正,假设检验结果均有统计学意义,P <0101。

另外,patient ,patient ×time 和patient ×time2两两之间均呈现出高度的相关性,这与由协方差参数估计值计算出来的相关系数(分别为:019591,019241,019866)可以看出。说明该资料确实存在聚集性,进一步提示对于重复测量进行分析时应该考虑资料的非独立性问题。

另外,该模型拟合结果还显示,ti me 、ti me 2、ti me 3均有统计学意义,P <010001。对处理效应的假设检验,P =010272,仍然提示处理组之间的差异有统计学意义。但由于考虑到此处重复测量次数太少,仅4次,故该结果意义并不大。

最后,我们还对模型的前提条件进行了检查。通过绘制残差图等,未见违背正态性等前提条件、也未提示存在异常值,说明模型拟合良好。

讨论

一般地,对这类资料的分析通常采用两种方法(均

为固定效应模型),一种是将处理×时间、处理×时间

交互效应拟合为固定因素,而完全忽略受试者效应、受试者×时间交互效应,因此所有的观测都当作独立的来处理,对标准误的估计不准确。另一种稍为稳健,分两步进行:先计算每个受试者的斜率,然后对斜率进行分析。这种方法相对于第一种方法,具有考虑了受试者间斜率的变异情况的优点,但是,由于对于仅有几次重复观测的受试者来说,对其估计斜率是不实在的。给这类受试者适当地赋予权重也许可以考虑,但是相当复杂,而且不一定有效。但是,拟合随机系数模型对上述资料进行分析时,对标准误的估计考虑了受试者之间的变异情况;缩小的(shrunken )随机系数估计值避免了那些仅仅由几次重复测量组成的受试者造成的不切实际的斜率的估计的影响。因此,使用随机系数模型更简洁、有效。

本次分析中,随机系数模型拟合的结论基本与传统方法一致。但是由于随机系数可以考虑重复测量资料各观测值之间相关性的问题,拟合结果更准确、可信;另外,通过拟合多项式随机系数模型还可以分析因变量与时间变量之间的非线性关系,解决了传统方法不能解决的非线性问题。这些都是传统方法所不能比拟的。

因此,重复测量资料可以通过混合模型的两种类型进行建模,或者使用协方差类型模型对重复测量值间的协方差类型建模,或者采用随机系数模型描述观测值随时间变化的关系。当重复测量不是以固定的时间间距进行时,或者当对随时间变化的关系尤其感兴趣时,随机系数模型通常更为准确。

Using R andom Coeff icients Model to Analyze R epeated Measures Data S hi Hongying ,S hen Yi.Depart ment of Preventive

Medicine ,School of Environmental Science and Public Health ,

Wenz hou Medical College (325035),Wenz hou

(下转第252页)

著关联,但是却发现T45T基因型个体比X45G基因型个体具有更高浓度的HDL水平。

Meta Analysis:Single2nucleotide Polymorphism(SNP+45)of the Adiponectin G ene in T ype2Diabetes in Chinese H an Population Zou L iling,Zhao N aiqing,Qin Guoyou.Depart ment of Health S tatistics and Social Medicine,The Fudan U niversity(200032), S hanghai

【Abstract】　Objective　The purpose of this study was to review the relation of the adiponectin gene SNP+45polymorphism with type2di2 abetes in Chinese Han population.Methods　Performed a meta2analysis of the published data from5case2control studies to evaluate the OR level of gene variation.R esults　Individuals with the adiponectin gene SNP+ 45GG genotype had a141%(OR=2141,95%CI=1163～3155)increased risk of type2diabetes compared with individuals with SNP+45TT or TG genotype.Conclusion　The adiponectin gene SNP+45G is risk allele and individuals with the SNP+45GG genotypes are at higher risk of developing type2diabetes.

【K ey w ords】　Type2diabetes;Adiponectin gene;Polymor2 phism;Meta2analysis;Chinese Han population

参　考　文　献

11Hara K,Boutin P,Mori Y,et al.G enetic variation in the gene encoding adiponectin is associated with an increased risk of type2diabetes in the Japanese population.Diabetes,2002,51(2):5362540.

21魏颖丽,强华,霍正浩,等.脂联素基因+45位点多态性及其血清水平与2型糖尿病相关性的研究.武警医学,2006,17(9):6532655. 31刘德敏,靳立忠,于德民,等.2型糖尿病患者中脂联素基因多态性

的研究.中华糖尿病杂志,2004,12(6):3972398.

41翟冰,叶玲,刘建伟,等.北京社区人群脂联素和过氧化物酶增殖物活化受体γ2基因多态性及其交互作用与2型糖尿病的关系.中国临床康复,2006,10(4):28231.

51夏晖,莫永珍,卞茸文,等.中国人脂联素基因单核苷酸多态性与2型糖尿病的相关性.中华内分泌代谢杂志,2004,20(3):2362237. 61王长江,王佑民,汝颖,等.脂联素基因第45位点单核苷酸多态性与肥胖及胰岛素抵抗的相关性.中华糖尿病杂志,2005,13(5):3242 325.

71杜鹏飞,徐敏,洪洁,等.脂联素基因多态性与胰岛素抵抗的相关性研究.中华糖尿病杂志,2004,12(6):3932396.

81董艳,李果,骆天红,等.脂联素基因多态性与2型糖尿病的关系.上海第二医科大学学报,2004,24(12):100121003.

91薛付忠,王洁贞,胡平.中国人群1型糖尿病HLA2DQ基因多态性的Meta分析.中华内分泌代谢杂志,2005,21(1):39242.

101Vasseur F,Helbecque N,Dina C,et al.Single2nucleotide polymorphism haplotype in the both proximal promoter and exon3of the APMI gene modulate adipocyte2secreted adiponectin hormone levels and contribute to the genetic risk for type2diabetes in French Caucasians.Hum Mol

G enet,2002,11:2607214.

111Menzaghi C,Ercolino T,Paola RD,et al.A haplotype at the adiponectin locus is assoclated with obesity and other features of the insulin resis2 tance syndrome.Diabetes,2002,57(7):2306.

121Y ang WS,Hsiung CA,Ho L T,et al.G enetic epistasis of adiponectin and PPAR gamma2genetypes in modulation of insulin sensitivity:a family2 based association study.Diabetologia,2003,46:977283.

131Firoozeh M,Tuula T,Jari J,et https://www.wendangku.net/doc/624480712.html,mon polymorphisms(single2nu2 cleotide polymorphisms SNP+45and SNP+276)of the adiponectin gene regulate serum adiponectin concentrations and blood pressure in young Finnish men.Mol G enet and Meta,2006,87(2):1472151.

(上接第249页)

【Abstract】　Objective　To apply random coefficients model to analyze the repeated measures data.Methods　Using an example in clinical trials to illustrate different statistical models(repeated measures analysis of variance,linear random coefficients model and polynomial random coeffi2 cients model)in SAS procedures for repeated measures data.R esults　Re2 peated measures analysis of variance showed that there were significant dif2 ference among different time points,but no difference between treat,so did random coefficients model.Conclusion　Random coefficients model can been used to analyze repeated measures data more effectively and accurate2 ly.What’s more,it can also solve the correlation and non2linear problem in data.

【K ey w ords】　Random coefficients model;Repeated measures data;Mixed model

参　考　文　献

11余松林,向惠云.重复测量资料分析方法与SAS程序.北京:科学出版社,2004,3.

21KruegerC,Tian https://www.wendangku.net/doc/624480712.html,parison of the G eneral Linear Mixed Model and Repeated Measures ANOVA Using a Dataset with Multiple Missing Da2 ta Points.Biological Research For Nursing,2004,6(2):1512157.

31施红英,沈毅.混合模型在临床试验重复测量资料中的应用.中国卫生统计,2007,24(2):1402142.

41Helen B,Robin P.Applied mixed model in medicine.John Wiley and Sons,1999,1992259.

变系数模型的变量选择及在股票数据中的应用

2009年11月四川大学学报(自然科学版)N ov．2009第46卷第6期Jour na l of Si c huan U ni ve r si t y(N a t ur a l Sc i enc e E di t i on)V01．46N o．6 doi：103969／j．i ssn．0490’6756．2009．06．003 变系数模型的木鲁又里选择及在股票数据中的应用邓金兰，王彬寰，樊仕利 (四J II大学数学学院，成都610064) 摘要：作者研究了纵向数据分析中变系数模型的变量选择及效应估计问题，该模型允许变量的效应随时间改变．本文方法在进行变量选择的同时，也估计变系数函数，避免了传统的变量选择方法极其复杂的计算．将本文方法用于股票价格分析，能够快速地在公司的众多财务变量中挑选出对股票收益率有显著影响的变量，并估计这些变量的时变效应，很好地解释股票收益率的变化．关键词：变量选择；变系数模型；局部线性；交叉验证中图分类号：0212．7文献标识码：A文章编号：0490—6756(2009)06—1585—07 V ar i abl e s el ect i on of var yi ng-coef f ci ent m ode l s and i t s appl i cat i on on s t oc k da t a D E N GJ i n—Lan。W A N GB i n—H uar l，FA N Shi-L i (Sch ool of M a t hem at i c s，S i chua n U ni ve r s i t y，C hengdu610064，C hi na) A bs t r ac t：T hi s pap er di scus ses t he var i a bl e s el ec t i on and es t i m at i on bas ed o n var yi ng—e oe f fc i e nt m odel s f or l o ngi t u di n al dat a．T he m ode l al l ow s t he ef f ec t of var i abl es t o var y w i t h t i m e．T he m et hod i n t h i s pa—pe r es t i m at es t he f un ct i o ns of var yi ng—coef fc i e nt and se l e ct s var i abl es s i m ul t aneou s l y，w hi ch avo i ds t he i nt ens i ve co m put at i o n f or t he t ra di t i onal var i abl e s el ect i on．A ppl yi ng t h i s m e t hod t o s t o ck pr i c e，t he var i—abl es ar e s el ec t ed qui ckl y w hi c h have si gni f i c ant ef f ec t on t he r e t u r n r at e of s t o ck f r om t he num e r ous com p any fi na nc i a l var i abl es，a nd t he t i m e-var yi ng ef f ec t of t ho s e s i gni fi ca nt var i abl es coul d be es t i m at ed s i m ul t aneo us l y．T he r es ul t s s h ow t hat t hi s m e t hod w or ks w el l． K ey w or ds：v ar i abl e s el ec t i on，va ryi ng—c oe ff c i e nt m odel s，l ocal l i nea r，c ross—va l i da t i on 1引嗣上市公司股价与公司基本面(财务信息)的关系一直受到国内外学术界和投资界的广泛关注，是西方发达国家证券市场研究中长盛不衰的课题．从表面上看，股价取决于市场供求关系，但从本质上来说，股票价格最终要受制于股票价值，遵循“价格围绕内在价值上下波动”的价值规律．影响上市公司股票价值的主要因素是公司的经营能力和管理能力，而公司的经营和管理能力主要是通过公司每个季度的财务基本面来体现的，因而研究上市公司的财务基本面对股票价格的影响关系具有重要的意义．国外研究(见文献[1，2])表明：上市公司股价与公司基本面具有显著的相关关系．B a l l和B r ow n (1968)(见文献[1])开创了上市公司基本面与股价变动关系的实证研究；O u和Penm an(1989)在文献[2]中选用了投资者比较关心的68个财务变量，对未来股票价格变化进行预测，得出的结论是公开收稿日期：2008—11一16 基金项目：国家自然科学基金(10771148) 作者简介：邓金兰(1983一)，女，四川德阳人，硕士，主要研究向概率论与理统计及其应用．E-m ai l：c dj t一1024@163．CO f f l

SPSS重复测量的多因素方差分析报告

1、概述重复测量数据的方差分析是对同一因变量进行重复测量的一种试验设计技术。在给予一种或多种处理后，分别在不同的时间点上通过重复测量同一个受试对象获得的指标的观察值，或者是通过重复测量同一个个体的不同部位（或组织）获得的指标的观察值。重复测量数据在科学研究中十分常见。分析前要对重复测量数据之间是否存在相关性进行球形检验。如果该检验结果为P﹥0.05，则说明重复测量数据之间不存在相关性，测量数据符合Huynh-Feldt条件，可以用单因素方差分析的方法来处理；如果检验结果P﹤0.05，则说明重复测量数据之间是存在相关性的，所以不能用单因素方差分析的方法处理数据。在科研实际中的重复测量设计资料后者较多，应该使用重复测量设计的方差分析模型。球形条件不满足时常有两种方法可供选择：（1）采用MANOVA（多变量方差分析方法）；（2）对重复测量ANOVA检验结果中与时间有关的F值的自由度进行调整。 2、问题新生儿胎粪吸入综合征（MAS）是由于胎儿在子宫内或着生产时吸入了混有胎粪的羊水，从而导致呼吸道和肺泡发生机械性阻塞，并伴有肺泡表面活性物质失活，而且肺组织也会发生化学性炎症，胎儿出生后出现的以呼吸窘迫为主，同时伴有其他脏器受损现象的一组综合征。血管内皮生长因子(vascular endothelial growth factor，VEGF)是一种有丝分裂原，它特异作用于血管内皮细胞时，能够调节血管内皮细胞的增殖和迁移，从而使血管通透性增加。而本实验旨在通过观察分析给予外源性肺表面活性物质治疗前后胎粪吸入综合征患儿血清中VEGF的含量变化，评价药物治疗的效果。将收治的诊断胎粪吸入综合症的新生儿共42名。将患儿随机分为肺表面活性物质治疗组（PS组）和常规治疗组（对照组），每组各21例。PS组和对照组两组所有患儿均给予除用药外的其他相应的对症治疗。PS组患儿给予牛肺表面活性剂PS 70mg/kg治疗。采集PS 组及对照组患儿0小时，治疗后24小时和72小时静脉血2ml，离心并提取上清液后保存备用并记录血清中VEGF的含量变化情况。结果如下： 3、统计分析

第八章统计回归模型

第八章统计回归模型回归分析是研究一个变量Y 与其它若干变量X 之间相关关系的一种数学工具.它是在一组试验或观测数据的基础上，寻找被随机性掩盖了的变量之间的依存关系.粗略的讲，可以理解为用一种确定的函数关系去近似代替比较复杂的相关关系.这个函数称为回归函数. 回归分析所研究的主要问题是如何利用变量X 、Y 的观察值(样本)，对回归函数进行统计推断，包括对它进行估计及检验与它有关的假设等. 回归分析包含的内容广泛.此处将讨论多项式回归、多元线性回归、非线性回归以及逐步回归. 一、多项式回归 (1) 一元多项式回归一元多项式回归模型的一般形式为εβββ++++=m m x x y ...10. 如果从数据的散点图上发现y 与x 呈现较明显的二次(或高次)函数关系，则可以选用一元多项式回归. 1. 用函数polyfit 估计模型参数，其具体调用格式如下： p=polyfit(x,y,m) p 返回多项式系数的估计值；m 设定多项式的最高次数；x ，y 为对应数据点值. [p,S]=polyfit(x,y,m) S 是一个矩阵，用来估计预测误差. 2. 输出预估值与残差的计算用函数polyval 实现，其具体调用格式如下： Y=polyval(p,X) 求polyfit 所得的回归多项式在X 处的预测值Y . [Y ,DELTA]=polyval(p,X,S) p ，S 为polyfit 的输出，DELTA 为误差估计.在线性回归模型中，Y ±DELTA 以50%的概率包含函数在X 处的真值. 3. 模型预测的置信区间用polyconf 实现，其具体调用格式如下： [Y ,DELTA]=polyconf(p,X,S,alpha) 求polyfit 所得的回归多项式在X 处的预测值Y 及预测值的显著性为1-alpha 的置信区间Y±DELTA ，alpha 缺省时为0.05. 4. 交互式画图工具polytool ，其具体调用格式如下： polytool(x,y,m)； polytool(x,y,m,alpha)；用m 次多项式拟合x ，y 的值，默认值为1，alpha 为显著性水平，默认值为0.05. 例1 观测物体降落的距离s 与时间t 的关系，得到数据如下表，求s . 解根据数据的散点图，应拟合为一条二次曲线.选用二次模型，具体代码如下： %%%输入数据

重复测量资料方差分析

重复测量资料方差分析重复测量（repeated measure ）是指对同一观察对象的同一观察指标在不同时间点上进行的多次测量，用于分析该观察指标在不同时间上的变化特点。这类测量资料在临床和流行病学研究中比较常见，例如，为研究某种药物对高血压病人的治疗效果，需要定时多次测量受试者的血压，以分析其血压的变动情况。 1、重复测量资料方差分析中自由度调整方法 1.调整系数ε的计算有两个调整系数，第一个是Greenhouse-Geisser 调整系数)?(?εε G G -，计算公式为 ∑∑∑+---=k l k k kl kl s a s a s a s s a ] )())()(2()()[1()(?2 2 2 2 22 22 22 2ε 式中中的2 kl s 是协方差矩阵中的第k 行第l 列元素， 2 s ＝22 /)(a s k l kl ∑∑是所有元素的总平均值，222 /)( a s s l ll kk ∑=是主对角线元素的平均值，a s s l kl k /)(2 2∑=是第k 行的平均值。ε ?的取值在1.0与1/(a -1)之间。第2个系数是Huynh-Feldt 调整系数)(εεF H -。研究表明，当ε真值在0.7 以上时，用ε ?进行自由度调整后的统计学结论偏于保守，故Huynh 和Feldt 提出用平均调整值ε值进行调整。ε值的计算公式为 ] ?)1()1)[(1(2?)1(εε ε------= a g n a a ng 式中中的g 是对受试对象的某种特征（如年龄或性别）进行分组的组数，n 是每组的观察例数。当ε>1.0时，取ε=1.0。 2. 调整规则只对具有重复测定性质的时间效应的F 值的自由度，和处理时间交互作用的F 值的自由度进行调整。由于F 值的有两个自由度v 1和v 2，调整的分子自由度ενν?=1' 1 分母自由度ενν?=2' 2。具体计算时可用或ε代替。用调整所得的'1ν及' 2ν的F 值查临界值表，得),('2 '1 νναF 。由于ε≤1.0，所以调整后的

变系数模型的研究与分析

变系数模型的研究与分析【摘要】：非参数回归一般假定回归函数属于某一个函数类，如常常假定回归函数是一个光滑的函数，因此非参数回归对模型的假设很少，最主要的优点就是模型具有稳健性。非参数回归作为现代统计分析的主要方法之一，得到广泛的应用。对于非参数回归人们提出了许多估计方法，如核估计，局部多项式估计，光滑样条估计，级数估计(傅里叶级数估计，小波级数估计)等。这些方法本质上讲都是局部估计或局部光滑，当回归变量X为一维变量时，非参数回归函数用这些方法一般都能得到很好的估计。但当回归变量是多维向量时，由于X的局部邻域包含很少的数据，用这些估计方法，很难估计出一般的多元非参数回归函数，人们把这种现象称为‘维数祸根’(thecurseofdimension)。可是实际中我们经常遇到的是高维数据，因此高维数据分析是人们一直关心的问题，近年来统计工作者提出了许多分析方法，总得来说可以分为两大类：一类称为函数近似(functionapproximation)，如可加模型(HastieandTibshirani,1986)，部分线形模型(Engle,etal;1986)；另一类为降维(dimensionreduction)，如SIR 回归(slicedinverseregression(Li,1991))，投影追踪回归(projectionpursuitregression)(FriedmanandStuetzle,1981)；图回归(graphicalregression,Cook,1994),PHD(principalHessiandirection)分析(Cook,1998),MA VE方法(minimumaveragevarianceestimationmethod(Xia,Y.etal.,2002)。本论文主

重复测量的多因素方差分析

1概述重复测量数据的方差分析是对同一因变量进行重复测量的一种试验设计技术。在给予一种或多种处理后，分别在不同的时间点上通过重复测量同一个受试对象获得的指标的观察值，或者是通过重复测量同一个个体的不同部位（或组织）获得的指标的观察值。重复测量数据在科学研究中十分常见。分析前要对重复测量数据之间是否存在相关性进行球形检验。如果该检验结果为P> 0.05，贝U说明重复测量数据之间不存在相关性，测量数据符合Huynh-Feldt条件，可以用单因素方差分析的方法来处理；如果检验结果P< 0.05，则说明重复测量数据之间是存在相关性的，所以不能用单因素方差分析的方法处理数据。在科研实际中的重复测量设计资料后者较多，应该使用重复测量设计的方差分析模型。球形条件不满足时常有两种方法可供选择：（1采用MANOVA多变量方差分析方法）；（2）对重复测量ANOV检验结果中与时间有关的F值的自由度进行调整。 2、问题新生儿胎粪吸入综合征（MAS是由于胎儿在子宫内或着生产时吸入了混有胎粪的羊水，从而导致呼吸道和肺泡发生机械性阻塞，并伴有肺泡表面活性物质失活，而且肺组织也会发生化学性炎症，胎儿出生后出现的以呼吸窘迫为主，同时伴有其他脏器受损现象的一组综合征［11］。血管内皮生长因子（vascular endothelial growth factor ，VEGF是一种有丝分裂原，它特异作用于血管内皮细胞时，能够调节血管内皮细胞的增殖和迁移，从而使血管通透性增加。而本实验旨在通过观察分析给予外源性肺表面活性物质治疗前后胎粪吸入综合征患儿血清中VEGF的含量变化，评价药物治疗的效果。将收治的诊断胎粪吸入综合症的新生儿共42名。将患儿随机分为肺表面活性物质治疗组（PS组）和常规治疗组（对照组），每组各21例。PS组和对照组两组所有患儿均给予除用药外的其他相应的对症治疗。PS组患儿给予牛肺表面活性剂PS 70mg/kg治疗。采集PS组及对照组患儿0小时，治疗后24小时和72 小时静脉血2ml，离心并提取上清液后保存备用并记录血清中VEGF的含量变化情况。结果如下：

重复测量设计资料的方差分析SPSS操作

重复测量设计资料的方差分析SPSS操作重复测量方差分析的基本概述：被试对象在接受不同处理后，对同一因变量（测试指标）在不同时点上进行多次测量所得的资料，称为重复测量资料。这里的重复并不是单一的反复，而是在多个时点上的测量。这种资料的特点是其定量观测指标的数值会随着时间的变化而发生动态变化，并且各时点上的数值是不满足相互独立的假设的。因此不能用方差分析的方法直接进行处理。如果在期初、期中、期末分别测量学生的电脑能力，则这是单变量重复测量问题。如果分别在三个时期测量学生的电脑和数学成绩，则是多变量重复测量的问题。重复测量资料的方差分析需满足的前提条件： 1、一般方差分析的正态性和方差齐性检验。 2、协方差矩阵的球形对称性或者复合对称性；需要进行球形检验，检验对称性。原假设：协方差满足球形对称。当拒绝球形假设时，结果中还有其他表可以检验，见例题中的分析。被试对象处理测量时间1 2 3 4…………m 1 1 …………………………………………. 2 1 ………………………………………….. …………………………………………………………………………………………………………. N1 1 ………………………………………….. N1+1 2 …………………………………………. ………………………………………………………………………………………………………… N2 2 …………………………………………… ………. 例：为研究新减肥药和现有减肥药的效果是否不同，以及肥胖者在服药后不同时间体重的变化情况，将40名体重指标BMIF27的肥胖者随机分为两组，一组用新药，另一组用现有减肥药；坚持服药6个月，期间禁止使用任何影响体重的药物，而且被试对象行为、饮食、运动与服药前平衡期保持一致；分别测得0

重复测量的多因素方差分析

SPSS学习笔记之——重复测量的多因素方差分析[转] 1、概述重复测量数据的方差分析是对同一因变量进行重复测量的一种试验设计技术。在给予一种或多种处理后，分别在不同的时间点上通过重复测量同一个受试对象获得的指标的观察值，或者是通过重复测量同一个个体的不同部位（或组织）获得的指标的观察值。重复测量数据在科学研究中十分常见。分析前要对重复测量数据之间是否存在相关性进行球形检验。如果该检验结果为P﹥0.05，则说明重复测量数据之间不存在相关性，测量数据符合 Huynh-Feldt条件，可以用单因素方差分析的方法来处理；如果检验结果P﹤0.05，则说明重复测量数据之间是存在相关性的，所以不能用单因素方差分析的方法处理数据。在科研实际中的重复测量设计资料后者较多，应该使用重复测量设计的方差分析模型。球形条件不满足时常有两种方法可供选择：（1）采用MANOVA（多变量方差分析方法）；（2）对重复测量ANOVA检验结果中与时间有关的F值的自由度进行调整。 2、问题新生儿胎粪吸入综合征（MAS）是由于胎儿在子宫内或着生产时吸入了混有胎粪的羊水，从而导致呼吸道和肺泡发生机械性阻塞，并伴有肺泡表面活性物质失活，而且肺组织也会发生化学性炎症，胎儿出生后出现的以呼吸窘迫为主，同时伴有其他脏器受损现象的一组综合征[11]。血管内皮生长因子(vascular endothelial growth factor，VEGF)是一种有丝分裂原，它特异作用于血管内皮细胞时，能够调节血管内皮细胞的增殖和迁移，从而使血管通透性增加。而本实验旨在通过观察分析给予外源性肺表面活性物质治疗前后胎粪吸入综合征患儿血清中VEGF的含量变化，评价药物治疗的效果。将收治的诊断胎粪吸入综合症的新生儿共42名。将患儿随机分为肺表面活性物质治疗组（PS组）和常规治疗组（对照组），每组各21例。PS组和对照组两组所有患儿均给予除用药外的其他相应的对症治疗。PS组患儿给予牛肺表面活性剂PS 70mg/kg治疗。采集PS组及对照组患儿0小时，治疗后24小时和72小时静脉血2ml，离心并提取上清液后保存备用并记录血清中VEGF的含量变化情况。结果如下：

Eviews之变系数回归模型

EVIEWS 之变系数回归模型 1 变系数回归模型前面讨论的是变截距模型，并假定不同个体的解释变量的系数是相同的，然而在现实中变化的经济结构或者不同的经济背景等不可观测的反映个体差异的因素会导致经济结构的参数随着横截面个体的变化而变化，即解释变量对被解释变量的影响要随着截面的变化而变化。这时要考虑系数随着横截面个体的变化而变化的变系数模型。 1.变系数回归模型原理变系数模型一般形式如下： ,1,2,,,1,2,,it i it i it y x u i N t T αβ=++==（1）其中：it y 为因变量，it x 为1k ?维解释变量向量，N 为截面成员个数，T 为每个截面成员的观测时期总数。参数i α表示模型的常数项，i β为对应于解释变量的系数向量。随机误差项it u 相互独立，且满足零均值、等方差的假设。在式子（1）中所表示的变系数模型中，常数项和系数向量都是随着截面个体变化而变化，因此将该模型改写为： it it i it y x u λ=+ （2）其中：1(1)(1,)it it k x x ?+=，'(,)i i i λαβ= 模型的矩阵形式为： u X Y +?= （3）其中：11N NT y Y y ?????=??????；121i i i iT T y y y y ???????=??????；????????????=N X X X X 00000021；1121112 22212i i ki i i ki i iT iT kiT T k x x x x x x x x x x ???????=??????，12(1)1N N k λλλ+????????=??????，11N NT u u u ?????=??????，121i i i iT T u u u u ???????=??????

重复测量方差分析

1、利用SAS PROC GLM程序进行重复测量的方差分析本手册描述了如何利用SAS PROC GLM 程序进行重复测量的方差分析，包括对象间变量（a between-subjects variable）的分析。首先解释了何时该使用改方法；描述了本手册中用到的术语；给出了研究问题；最后，用一个详细的例子阐述了如何使用改程序。假定你知道如何书写SAS的程序和导入数据文件以及运行SAS命令。此外，我们还假定你熟悉方差分析（ANOVA）的基本方法和假定。 2、何时使用重复测量的方差分析任何方差分析都一样，重复测量的方差分析也是用来检验平均值的差别的。当在许多不同的条件下测量随机取样的所有成员时，使用重复测量的方差分析。由于样本是依次曝光于各个条件的，所以对因变量的测量是重复的。对此使用标准的ANOVA分析是不合适的，因为它不符合标准方差分析的前提假定：数据之间的独立性。需要注意的是，有些ANOVA设计综合了重复测量因子和非重复测量因子。只要有一个重复测量因子存在，就应该考虑使用重复测量的方差分析。使用该方法有以下几个原因： 1)、一些研究的假说要求重复测量。比如，经度研究测量几个年龄的样本成员。在这个例子中，年龄应该是重复的因子。 2)、当取样成员之间存在很大的变异时，按标准方法得到的误差变异很大。对每个取样成员的重复测量可以减小改误差变异。

3）、当取样成员不宜获取时，重复测量的设计显得经济实惠，因为每个成员都可以用来曝光于所有的条件。 4）、注意的是重复测量的方差分析不能检验随机效应！ 5)、当取样成员根据一些重要的特征配对后，也可使用重复测量方差分析。这里，每个配对的组具有相同的成员，组内每个成员都曝光于某个因子的不同的随机水平。当取样成员配对了，不同条件下的测量可以当作重复测量来看待。比如，假定你选择了一组低气压对象，测量他们的气压水平，然后将那些具有相似气压水平的进行配对。然后给予每对中的一个成员低压处理，再次测量所有成员的低压水平。对此种情况，重复测量的方差分析是最有效的。当然，这里一个配对应当当作一个单一的取样成员。应该认清重复测量设计和单纯的多变量设计之间的区别。对二者来说，都是多次测量取样成员，但是，在重复测量设计中，每次实验测量的是同一特征在不同条件下的数值。比如，你可以用重复测量方差分析来比较橘子树在不同年份所结的橘子的数目。测量的指标是橘子的数目，，这里的条件就是不同的年份。相反，对于多变量的设计，每次实验测量的是不同的特征。你不能够用重复测量的方差分析来比较橘子的数目、重量和价格。三个指标是数目、重量和价格，这些并不是代表不同的条件，只是不同的指标而已。 3、术语解释对象：取样成员。

重复测量设计的方差分析spss例析知识分享

重复测量的方差分析重复测量方差分析的基本概述：被试对象在接受不同处理后，对同一因变量（测试指标）在不同时点上进行多次测量所得的资料，称为重复测量资料。这里的重复并不是单一的反复，而是在多个时点上的测量。这种资料的特点是其定量观测指标的数值会随着时间的变化而发生动态变化，并且各时点上的数值是不满足相互独立的假设的。因此不能用方差分析的方法直接进行处理。如果在期初、期中、期末分别测量学生的电脑能力，则这是单变量重复测量问题。如果分别在三个时期测量学生的电脑和数学成绩，则是多变量重复测量的问题。重复测量资料的方差分析需满足的前提条件： 1、一般方差分析的正态性和方差齐性检验。 2、协方差矩阵的球形对称性或者复合对称性；需要进行球形检验，检验对称性。原假设：协方差满足球形对称。当拒绝球形假设时，结果中还有其他表可以检验，见例题中的分析。被试对象处理测量时间1 2 3 4…………m 1 1 …………………………………………. 2 1 ………………………………………….. …………………………………………………………………………………………………………. N1 1 ………………………………………….. N1+1 2 …………………………………………. ………………………………………………………………………………………………………… N2 2 …………………………………………… ………. 例：为研究新减肥药和现有减肥药的效果是否不同，以及肥胖者在服药后不同时间体重的变化情况，将40名体重指标BMIF27的肥胖者随机分为两组，一组用新药，另一组用现有减肥药；坚持服药6个月，期间禁止使用任何影响体重的药物，而且被试对象行为、饮食、运动与服药前平衡期保持一致；分别测得0周、8周、16周、24周的体重资料；试对其进行方差分析。

SPSS学习笔记之——重复测量的多因素方差分析

SPSS学习笔记之——重复测量的多因素方差分析 1、概述重复测量数据的方差分析是对同一因变量进行重复测量的一种试验设计技术。在给予一种或多种处理后，分别在不同的时间点上通过重复测量同一个受试对象获得的指标的观察值，或者是通过重复测量同一个个体的不同部位（或组织）获得的指标的观察值。重复测量数据在科学研究中十分常见。分析前要对重复测量数据之间是否存在相关性进行球形检验。如果该检验结果为P﹥0.05，则说明重复测量数据之间不存在相关性，测量数据符合 Huynh-Feldt条件，可以用单因素方差分析的方法来处理；如果检验结果P﹤0.05，则说明重复测量数据之间是存在相关性的，所以不能用单因素方差分析的方法处理数据。在科研实际中的重复测量设计资料后者较多，应该使用重复测量设计的方差分析模型。球形条件不满足时常有两种方法可供选择：（1）采用MANOVA（多变量方差分析方法）；（2）对重复测量ANOVA检验结果中与时间有关的F值的自由度进行调整。 2、问题新生儿胎粪吸入综合征（MAS）是由于胎儿在子宫内或着生产时吸入了混有胎粪的羊水，从而导致呼吸道和肺泡发生机械性阻塞，并伴有肺泡表面活性物质失活，而且肺组织也会发生化学性炎症，胎儿出生后出现的以呼吸窘迫为主，同时伴有其他脏器受损现象的一组综合征[11]。血管内皮生长因子(vascular endothelial growth factor，VEGF)是一种有丝分裂原，它特异作用于血管内皮细胞时，能够调节血管内皮细胞的增殖和迁移，从而使血管通透性增加。而本实验旨在通过观察分析给予外源性肺表面活性物质治疗前后胎粪吸入综合征患儿血清中VEGF的含量变化，评价药物治疗的效果。将收治的诊断胎粪吸入综合症的新生儿共42名。将患儿随机分为肺表面活性物质治疗组（PS组）和常规治疗组（对照组），每组各21例。PS组和对照组两组所有患儿均给予除用药外的其他相应的对症治疗。PS组患儿给予牛肺表面活性剂PS 70mg/kg治疗。采集PS组及对照组患儿0小时，治疗后24小时和72小时静脉血2ml，离心并提取上清液后保存备用并记录血清中VEGF的含量变化情况。结果如下：

重复测量资料的统计分析方法简介

重复测量资料的统计分析方法简介在医学研究中，一些干预研究和纵向研究都需要对研究对象进行随访，每次随访进行观测或测量一些效应指标，考察同一研究对象同一指标的变化情况。同一个对象的多次观察或测量所获得的资料称为重复测量的资料。由于同一对象同一指标的相邻两个时间点的效应指标观测值往往是相关的，也就是重复测量的资料存在不独立的问题，然而大多数的医学统计方法都要求资料是独立，所以这些资料的统计分析需要用比较特殊的统计方法进行分析。重复测量资料的统计分析方法可以用重复测量的方差分析，也可以用混合回归模型（Mixed regression Model ），由于重复测量的方差分析要求资料满足球形对称性（可以理解为相关资料情况下的方差齐性），而Mixed 回归模型并不要求资料满足球形对称，并可以借助计算机统计软件对未知参数进行限制的最大似然估计，其他统计分析的思想都是类似的。本节将主要介绍如何借助统计软件应用Mixed 回归模型对重复测量资料进行统计分析。为了帮助读者对重复测量资料分析有一个简单的了解，本节将举一个非常简单的例子初步说明重复测量资料的统计分析概况。例1 为了比较A 药和B 药在疗程为6个月中的持续减肥的疗效，现有10个身高为160cm 的女性肥胖者志愿参加这项研究。随机分成2组，每组各5人。分别考察这2组肥胖者在服药前、服药3个月和服药6个月的体重变化。这2组肥胖者在服用该药前、服药3个月和服药6个月的体重测量值(kg)见表1。表 1 2组肥胖者在服用该药前、服药3个月和6个月的体重组别和肥胖者编号服药前（120,0t t ==） 3个月（121,0t t ==） 6个月（120,1t t ==） A 药组1号 52 49 42 A 药组2号 51 50 46 A 药组3号 50 49 41 A 药组4号 51 49 44 A 药组5号 49 47 40 B 药组1号 51 54 53 B 药组2号 49 47 46 B 药组3号 50 47 44 B 药组4号 49 48 41 B 药组5号 52 50 48 这是两组观察对象的多个测量时间点的重复观察测量资料，同样对于同一对象的不同观察时间点的观察资料是相关的，但由于需要比较两个药的减肥疗效，所以采用两因素方差分析，随机区组设计的方差分析或Friedman 秩检验的统计方法都不适用于本例的数据统计分析，但可用Mixed 模型对本例资料进行统计分析。设A 药组对象在服药前体重总体均数为0β；服药3个月后的总体体重改变量为1β，故服药3个月时的体重总体均数为01ββ+；服药6个月时，体重比服药前的总体改变量为2β，即服药6个月时的体重总体均数为02ββ+；同理，设B 药组对象在服药前体重总体均数为10β；服药3个月后的总体体重改变量为

SPSS中两种重复测量资料分析过程的比较

在SPSS中，有两个过程可以对重复测量资料进行分析：一种是一般线性模型的重复度量；一种是混合线性模型，对于同样的数据资料，使用两种过程分析出的内容不大一样，注意是内容而不是结果，只要操作正确，结果应该是一致的，而输出内容的差异则反映了两种方法的侧重点不同，那么两种方法有何异同以及使用时该如何选择呢？可以从下几个方面进行探讨一、基本思路不同重复度量：重复度量的分析思路还是是基于传统的方差分析思想，即变异分解，只不过在分解时加入了对象间变异和对象间与时间交互作用的变异两部分，模型还是一般线性模型的范畴，这点从结果输出日志的标题中也可以看出，但是在SPSS操作中，并不需要选入因变量。混合线性模型：混合线性模型是一般线性模型的推广，是专门用来解决因变量非独立的数据，也就是层次聚集性数据。而重复测量资料就是属于此类数据，因此混合线性模型对重复测量资料的分析是从纯粹的模型求解的角度出发，而不是变异分解，在SPSS操作中需要选入因变量。二、结果中某些算法不同实际上二者的算法并非完全不同，毕竟独属于多元分析，还是有类似的地方。重复度量：从分析结果中可以看出，重复度量结果既包含一元分析也包含多元分析，并且以Mauchly球形度检验作为选择标准，实际上球形度检验就是将重复测量资料看做是配对t检验的推广，通过检验两两时间点之间差值的方差协方差矩阵来判断该资料因变量之间是否真的存在相关性。其多元分析结果部分，和多元方差一样使用了四种检验方法，都是基于矩阵计算的。在参数估计上，和一般线性模型一样，使用的是对比矩阵，以某一水平为参照，其余水平和其进行对比进行计算混合线性模型：无论是参数估计还是其他结果的计算，都使用了更加稳健的多元分析方法，如极大似然法、迭代法、熵等三、应用范围不同重复度量：主要用来分析因素效应和交互作用对实验结果的影响，因素效应和交互作用是否存在时间趋势，以及进一步分析各因素水平间的两两比较等，在SPSS 操作中并不涉及因变量，只是分析因素之间的关系，离不开一般线性模型的分析范畴，并且在重复度量中也没有办法加入随机因素混合线性模型：既然是一般线性模型的推广，那么其应用范围肯定比一般线性模型要广，除了可以对层次聚集性数据进行分析之外，还可以加入随机效应，建立回归模型，并且可以指定协方差矩阵的类型，还可以对嵌套实验设计进行分析。可以说，重复度量能做的分析，混合线性模型都能做，而反过来则未必。