文档库 最新最全的文档下载
当前位置:文档库 › 羊群效应模型

羊群效应模型

羊群效应模型
羊群效应模型

羊群效应模型

羊群效应模型(Herd behavior model)

[编辑]

羊群效应模型概述

羊群效应模型认为投资者羊群行为是符合最大效用准则的,是“群体压力”等情绪下贯彻的非理性行为,分为序列型和非序列型两种模型。

序列型羊群效应模型

序列型羊群效应模型由Banerjee(1992) 提出,在该模型中,投资者通过典型的贝叶斯过程从市场噪声以及其它个体的决策中依次获取决策信息,这类决策的最大特征是其决策的序列性。但是现实中要区分投资者顺序是不现实的。因而这一假设在实际金融市场中缺乏支持。非序列型则论证无论仿效倾向强或弱,都不会得到现代金融理论中关于股票的零点对称、单一模态的厚尾特征。

行为金融理论中的一个重要的模型是羊群效应模型。实际上,羊群行为同样也是由模仿造成的。Scharfstein and Stein (1990)指出,在一些情况中,经营者简单地模仿其他经营者的投资决策,忽略独立的私人信息,虽然从社会角度看这种行为是无效的,但对于关心其在劳动市场声誉的经营者而言却是合理的。Banerjee (1992)提出序列决策模型分析羊群行为,在这个模型中,

每个决策者在进行决策时都观察其前面的决策者做出的决策,对他而言,这种行为是理性的,因为其前面的决策者可能拥有一些重要的信息,因而他可能模仿别人的决策而不使用其自己的信息,由此产生的均衡是无效的。Banerjee序列决策模型假定投资者的决策次序,投资主体通过典型

的贝叶斯过程从市场噪声以及其他个体的决策中获取自己决策的信息,这种依次决策的过程导致市场中的“信息流”。

非序列型羊群效应模型

与Banerjee序列决策模型相对的是非序列羊群行为模型。该模型也是由贝叶斯法则下得出的。模型假设任意两个投资主体之间的模仿倾向是固定相同的,当模仿倾向较弱时,市场主体的表现是收益服从高斯分布,而当模仿倾向较强时,市场主体的表现是市场崩溃。此外,Rajan(1994)、Maug & Naik(1996)、Devenow & Welch(1996)分别从投资者的信息不对称、机构运作中的委托——代理关系、经济主体的有限理性等角度探讨羊群行为的内在产生机制。

[编辑]

对羊群行为的实证研究的方向

对羊群行为的实证研究分为两个方向:

一是以共同基金、养老基金等指定类型的投资者为对象,通过分析其组合变动和交易信息来判断其是否存在羊群行为(Lakonishok,1992;Werners, 1998; Graham, 1999);

二是以股价分散度为指标,研究整个市场在大幅涨跌时是否存在羊群行为。

[编辑]

关于贝叶斯和贝叶斯法则

贝叶斯(Bayes)是一位统计学家,他发明的贝叶斯统计学在经济分析中大行其道已有多年了。贝叶斯统计学中有一个基本的工具叫“贝叶斯法则”(Bayesian law),尽管它是一个数学

公式,但其原理毋需数字也可明了。如果你看到一个人总是做一些好事,则那个人多半会是一个好人。这就是说,当你不能准确知悉一个事物的本质时,你可以依靠与事物特定本质相关的事件出现的多少去判断其本质属性的概率。用数学语言表达就是:支持某项属性的事件发生得愈多,则该属性成立的可能性就愈大。

贝叶斯定理(又被称为贝叶斯法则)是概率论中的一个结果,它跟随机变量的条件概率以及边缘概率分布有关。在有些关于概率的解说中,贝叶斯定理(贝叶斯更新)能够告知我们如何利

用新证据修改已有的看法。

通常,事件A在事件B(发生)的条件下的概率,与事件B在事件A的条件下的概率是不一

样的;然而,这两者是有确定的关系,贝叶斯定理就是这种关系的陈述。

作为一个规范的原理,贝叶斯定理对于所有概率的解释是有效的;然而,频率主义者和贝叶斯主义者对于在应用中概率如何被赋值有着不同的看法:频率主义者根据随机事件发生的频率,或者总体样本里面的个数来赋值概率;贝叶斯主义者要根据未知的命题来赋值概率。一个结果就是,贝叶斯主义者有更多的机会使用贝叶斯定理。

贝叶斯定理是关于随机事件A和B的条件概率和边缘概率的。

其中L(A|B)是在B发生的情况下A发生的可能性。

在贝叶斯定理中,每个名词都有约定俗成的名称:

?Pr(A)是A的先验概率或边缘概率。之所以

称为"先验"是因为它不考虑任何B方面的

因素。

?Pr(A|B)是已知B发生后A的条件概率,也

由于得自B的取值而被称作A的后验概率。

?Pr(B|A)是已知A发生后B的条件概率,也

由于得自A的取值而被称作B的后验概率。

?Pr(B)是B的先验概率或边缘概率,也作标

准化常量(normalized constant)。

按这些术语,Bayes定理可表述为:

后验概率= (相似度* 先验概率)/标准

化常量

也就是说,后验概率与先验概率和相似度的乘积成正比。

另外,比例Pr(B|A)/Pr(B)也有时被称作标准相似度(standardised likelihood),Bayes定理可表述为:

后验概率= 标准相似度* 先验概率

如何做SPSS的调节效应

标签: 杂谈 1、调节变量的定义 变量Y与变量X 的关系受到第三个变量M 的影响,就称M为调节变量。调节变量可以是定性的,也可以是定量的。在做调节效应分析时,通常要将自变量和调节变量做中心化变换。简要模型:Y = aX + bM + cXM + e 。Y与X 的关系由回归系数a + cM 来刻画,它是M 的线性函数, c衡量了调节效应(moderating effect)的大小。如果c显著,说明M 的调节效应显著。 2、调节效应的分析方法 显变量的调节效应分析方法:分为四种情况讨论。当自变量是类别变量,调节变量也是类别变量时,用两因素交互效应的方差分析,交互效应即调节效应;调节变量是连续变量时,自变量使用伪变量,将自变量和调节变量中心化,做 Y=aX+bM+cXM+e 的层次回归分析:1、做Y对X和M的回归,得测定系数R12。2、做Y对X、M和XM的回归得R22,若R22显著高于R12,则调节效应显著。或者,作XM的回归系数检验,若显著,则调节效应显著;当自变量是连续变量时,调节变量是类别变量,分组回归:按 M的取值分组,做 Y对 X的回归。若回归系数的差异显著,则调节效应显著,调节变量是连续变量时,同上做Y=aX +bM +cXM +e 的层次回归分析。 潜变量的调节效应分析方法:分两种情形:一是调节变量是类别变量,自变量是潜变量;二是调节变量和自变量都是潜变量。当调节变量是类别变量时,做分组结构方程分析。做法是,先将两组的结构方程回归系数限制为相等,得到一个χ2值和相应的自由度。然后去掉这个限制,重新估计模型,又得到一个χ2值和相应的自由度。前面的χ2减去后面的χ2得到一个新的χ2,其自由度就是两个模型的自由度之差。如果χ2检验结果是统计显著的,则调节效应显著;当调节变量和自变量都是潜变量时,有许多不同的分析方法,最方便的是Marsh,Wen和Hau提出的无约束的模型。 3.中介变量的定义

固定效应模型的估计原理说明教学总结

固定效应模型的估计原理说明 在面板数据线性回归模型中,如果对于不同的截面或不同的时间序列,只是模型的截距项是不同的,而模型的斜率系数是相同的,则称此模型为固定效应模型。固定效应模型分为三类: 1.个体固定效应模型 个体固定效应模型是对于不同的纵剖面时间序列(个体)只有截距项不同的模型: 2 K it i k kit it k y x u λβ==++∑ (1) 从时间和个体上看,面板数据回归模型的解释变量对被解释变量的边际影响均是相同的,而且除模型的解释变量之外,影响被解释变量的其他所有(未包括在回归模型或不可观测的)确定性变量的效应只是随个体变化而不随时间变化时。 检验:采用无约束模型和有约束模型的回归残差平方和之比构造F 统计量,以检验设定个体固定效应模型的合理性。F 模型的零假设: 01231:0N H λλλλ-===???== () 1(1,(1)1)(1) RRSS URSS N F F N N T K URSS NT N K --= ---+--+: RRSS 是有约束模型(即混合数据回归模型)的残差平方和,URSS 是无约束模型ANCOV A 估计的残差平方和或者LSDV 估计的残差平方和。 实践: 一、数据:已知1996—2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(cp ,不变价格)和人均收入(ip ,不变价格)居民,利用数据(1)建立面板数据(panel data )工作文件;(2)定义序列名并输入数据;(3)估计选择面板模型;(4)面板单位根检验。年人均消费(consume )和人均收入(income )数据以及消费者价格指数(p )分别见表1,2和3。 表1 1996—2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(元)数据 人均消费 1996 1997 1998 1999 2000 2001 2002 CONSUMEAH 3607.43 3693.55 3777.41 3901.81 4232.98 4517.65 4736.52 CONSUMEBJ 5729.52 6531.81 6970.83 7498.48 8493.49 8922.72 10284.6 CONSUMEFJ 4248.47 4935.95 5181.45 5266.69 5638.74 6015.11 6631.68 CONSUMEHB 3424.35 4003.71 3834.43 4026.3 4348.47 4479.75 5069.28 CONSUMEHLJ 3110.92 3213.42 3303.15 3481.74 3824.44 4192.36 4462.08 CONSUMEJL 3037.32 3408.03 3449.74 3661.68 4020.87 4337.22 4973.88 CONSUMEJS 4057.5 4533.57 4889.43 5010.91 5323.18 5532.74 6042.6 CONSUMEJX 2942.11 3199.61 3266.81 3482.33 3623.56 3894.51 4549.32 CONSUMELN 3493.02 3719.91 3890.74 3989.93 4356.06 4654.42 5342.64 CONSUMENMG 2767.84 3032.3 3105.74 3468.99 3927.75 4195.62 4859.88

混合效应线性模型与单因素方差分析在重复测量数据中的应用比较(一)

混合效应线性模型与单因素方差分析在重复测量数据中的应用比较(一) 【关键词】重复测量;混合效应线性模型;单因素方差分析; 摘要:目的:通过混合效应线性模型与单因素方差分析在重复测量资料中的应用比较,旨在说明两方法在处理重复测量资料时的应用特点。方法:用混合效应线性模型和单因素方差分析处理重复测量资料并比较。结果:混合效应线性模型和单因素方差分析都是处理重复测量资料的重要统计方法,前者在选择协方差结构下可对重复测量资料的固定效应和随机效应参数及协方差矩阵进行参数估计和统计检验,后者可对重复测量资料的固定效应做出统计推断。结论:混合效应线性模型是处理重复测量资料的有力方法,它对资料的协方差结构要求宽松,且结论可靠;单因素方差分析对资料的协方差结构有严格的限定。 关键词:重复测量;混合效应线性模型;单因素方差分析; 统计方法特点重复测量数据(repeatedmeasuresdata)是医学领域中常见的一种数据资料。所谓重复测量是指对同一个观察对象在不同时间点上进行的多次测量〔1〕。由于重复测量资料是对同一受试对象的某一观察指标进行的重复观察所得的数据,同一受试者的观察数据间可能存在相关性,一些传统的统计学方法如t检验等就不能充分揭示这一内在特点,有时甚至会导致错误的结论。 对重复测量资料的分析方法大致可分为两类,即单变量统计分析方法和多变量统计分析方法〔2〕。本研究通过选用多变量统计分析方法中的混合线性效应模型对一例题的分析,并与单因素方差分析进行比较,来说明两种方法在处理重复测量资料中的应用特点。 1方法简介 简单说,混合效应线性模型就是所拟和的模型中既包含固定效应又包含随机效应,特别是个体内的数据结构的选择将对各因素的评价产生直接影响〔3〕。 混合效应线性模型是一般线性模型的扩展,其表达式为: Y=Xβ+Zγ+ε(1) X为已知设计矩阵,β为固定效应参数构成的未知向量,ε是未知的随机误差向量,其元素不必为同独立分布了。在式(1)中Y,γ都是正态随机向量,其均值为0,方差阵分别为G 与R,二者之间不相关,因此Y的方差表达式为: V=ZGZ+R(2) 当R=σ2I,Z=0时,混合线性模型退化为一般线性模型。对G和R必须选择其协方差结构,常用的结构有无结构(一般为协方差)、自回归(常用一阶)、复合对称(共同协方差加一对角元)等〔4〕。选择协方差矩阵的方法是在相同的结构模型下,选择几个不同结构的协方差矩阵,从中选取似然比统计量(-2LogLikelihood)、Akaikes信息量标准(AkaikesInformationCriterion,AIC)及SchwartsBayesian标准(SchwartsBayesianCriterion,BIC)较小的一个,当这些统计量较接近时,则选取含参数个数最少的一个。通常以AIC为主要判断指标。 2实例分析 下面用一实例比较两种方法对处理重复测量资料时的特点:某药有新旧两种剂型,为了比较这两种剂型的代谢情况,对16例病人服药后分别在0、4、8、12小时测得血药浓度(表1),问该药新旧剂型的血药浓度随时间变化的趋势是否一致。表1四个时间点某药新旧剂型血药浓度1用SAS软件的MIXED过程对固定效应和随机效应参数β、γ及协方差矩阵G、R进行估计和统计检验。在本例中因变量为血药浓度,药物剂型、测量时间为固定效应,受试者为随机效应,同时选择合适的协方差结构以便在控制随机误差的基础上分析处理因素(药物剂型)对反应变量(血药浓度)的关系。本例指定为常用的无结构协方差(UN)和复合对称性协方差(CS)。 模型拟合情况见表2。表2模型配合统计量由表2可见,在UN结构下协方差配合的似然比统计量-2LogLikelihood=398.0(表2),对无效模型的似然比检验,χ2=134.43,ν=9,P<0.0001,

第6章方差分析

第六章方差分析 方差分析(Analysis of Variance,ANOVA)是将待分析资料的总变异剖分为不同的变异来源,以获得不同变异来源的总体方差的估计值。通过F检验,完成多个样本平均数之间的差异显著性检验(即多重比较),若处理效应为随机模型时,则进行方差组分的估计。 6.1 方差分析的SAS过程 用于方差分析的主要过程有方差分析(ANOVA)和广义线性模型(GLM)。对于无缺省(缺值、缺组等)资料,或称平衡资料,一般采用(ANOVA)过程,对缺省资料(非平衡资料)应采用(GLM)过程。事实上根据效应模型的不同,还有VARCOME(方差组分)过程,MIXED(混合模型)过程等。 6.1.1 ANOVA过程 1. 名词解释 自变量与依变量在方差分析中,自变量可称为独立变量、定性变量(Qualitative Variale)、分类变量(Classiflcation Variable)或类别变量(Categorcal Variable),相当于因素处理、水平变量。依变量又称反应变量(Response Variable),相当于观察值变量。 实验效应方差分析的目的是找出对依变量产生的实验效应,这种效应可分为3种:主效应,常以自变量的英文字母表示,如A、B等。互作效应,常以星号联接自变量表示,如A*B。嵌套效应,以小括号表示,如A(B)表示A效应嵌套在B效应之内。 2 语句说明: CLASS指令必须出现在MODEL指令之前,如选用TEST、MANOVA指令,则它们必须出现在MODEL指令之后。MEANS、TEST及MANOVA等指令可重复使用,其他指令则只能出现一次。

PROC ANOV A选项串中:⑴DA TA=输入数据集名称,指明对它执行ANOV A分析。⑵MANOV A 要求将含一个或一个以上依变量遗漏数据的观察值剔除。⑶OUTPUT=(含分析结果的)输出文件名称,包括平方和(SS),F检验值,以及各效应的显著程度。 CLASS变量名称串指明自变量,自变量可以是数值的或文字的。 MODEL指令定义分析所用的线性数学模型(见表6—1),删除号(/)后的选项:⑴NOUNI:不印出单变量方差分析的结果,适用于多变量的方差分析。⑵INT:要求SAS把线性模型内的截距(即资料的总平均数)当成一个参数,同时对这个截距作是否为零的假设检验。 MEANS指令前半部要求算出某些自变量(或互作)中各组的平均数,后半部(删除号后)共有24个选项,前17个选项分别对MEANS指令中所列的主效应平均数进行多种方法的多重比较。这些选项有:⑴BON:修正最小显著差异t检验。⑵DUNCAN:邓肯多重范围检验,即邓肯氏新复极差法。⑶DUNNETT(控制组组名):邓尼特控制差异检验。它是依据t分布由各组平均数与控制组(指定组如对照组)进行比较,采用双尾检验。⑷DUNNETTL(控制组组名):邓尼特小于控制均数检验。与控制组平均数的比较,采用单尾检验,临界值订在t分布的下端。⑸DUNNETTU(控制组组名):邓尼特大于控制均数检验。与控制组平均数的比较,采用单尾检验,临界值订在t分布的上端。⑹GABRIEL:贵博氏多重比较。⑺REGWF:R—E—G—W多重F检验。⑻REGWQ:R—E—G—W多种t 检验。⑼SCHEFFE:执行沙菲氏(Scheffe)的多重比较检验。⑽SIDAK:Sidak调整T检验。⑾SUM(或⑿GTI):Sidak独立样本t检验。当两组样本含量不等时为哈氏(Hochberg)的GTI检验。⒀SNK:纽曼—库尔多重范围检验,即q检验。⒁T(或⒂LSD):配对t检验或费歇尔最小显著差异检验。⒃TUKEY:图基固定极差检验。⒄W ALLER:娃尔—邓肯K—比率t检验。以上17种检验法最常用的为⑵、⑶、⑸、⒀、⒁。其它主要选项还有⒅ALPHA=P:界定检验的显著水准。内设值为P=0.05。当上面选项与选项⑵并用时,P值必须是0.10、0.05、0.01三者之一。与上面其他检验选项时,P可以是0.0001与0.9999间任何的值。⒆LINES:将显著性检验的平均数,由大到小排列。若某一对平均数之间无显著差异,则将它们印在同一行上,并以虚线将它们与其他有显著差异的平均数分开。当选用⑵、⑺、⑻、⒀或⒄等检验时,此选项会自动被包括在内,否则,必须附加此选项。⒇CLM:效应的各组平均数以置信区间方式表示。此项必须与⑴、⑹、⑼、⑽、⑾、⒁、⒂等联用。(21)CLDIFF:与(20)相仿,选用⑵、⑺、⑻、⒀、⒄时,附加此选项,将以置信区间方式显示各组平均数。(22)E=效应名称:它界定各显著检验的分母,缺省时以误差项的均方自动成为分母。 FREQ指令指明该变量值为各观察值重复出现的次数。 TEST指令用来指定F检验的分子与分母,H=分子,E=分母;一般而言,系统自动采用误差项的均方作为F检验的分母。但对于随机模型等,可选此项。 MANOV A指令主要用于执行多变量(多元)方差分析。 BY指令用于把数据文件分成几个小文件,然后逐一进行ANOV A分析,但文件内的数据必须先按照BY变量串的值做由小到大的重新排列。此步骤可籍PROC SORT达成。 以上指令中MODEL指令至关重要,同一资料,分析结果依模型不同而异。常用的模型定义语句有:MODEL Y=A;单因素方差分析,MODEL Y=A B两因素主效应模型,MODEL Y=A B A*B两因素带互作模型,MODEL Y=A B(A)嵌套(NESTED)模型用

Eviews面板大数据之固定效应模型

Eviews 面板数据之固定效应模型 在面板数据线性回归模型中,如果对于不同的截面或不同的时间序列,只是模型的截距项是不同的,而模型的斜率系数是相同的,则称此模型为固定效应模型。固定效应模型分为三类: 1.个体固定效应模型 个体固定效应模型是对于不同的纵剖面时间序列(个体)只有截距项不同的模型: 2 K it i k kit it k y x u λβ==++∑ (1) 从时间和个体上看,面板数据回归模型的解释变量对被解释变量的边际影响均是相同的,而且除模型的解释变量之外,影响被解释变量的其他所有(未包括在回归模型或不可观测的)确定性变量的效应只是随个体变化而不随时间变化时。 检验:采用无约束模型和有约束模型的回归残差平方和之比构造F 统计量,以检验设定个体固定效应模型的合理性。F 模型的零假设: 01231:0N H λλλλ-===???== ()1 (1,(1)1)(1) RRSS URSS N F F N N T K URSS NT N K --= ---+--+ RRSS 是有约束模型(即混合数据回归模型)的残差平方和,URSS 是无约束模型ANCOVA 估计的残差平方和或者LSDV 估计的残差平方和。 实践: 一、数据:已知1996—2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(cp ,不变价格)和人均收入(ip ,不变价格)居民,利用数据(1)建立面板数据(panel data )工作文件;(2)定义序列名并输入数据;(3)估计选择面板模型;(4)面板单位根检验。年人均消费(consume )和人均收入(income )数据以及消费者价格指数(p )分别见表1,2和3。 表1 1996—2002年中国东北、华北、华东15个省级地区的居民家庭人均消费(元)数据

meta分析中固定效应模型、随机效应模型和混合OLS模型的选择

meta分析中固定效应模型、随机效应模型和混合OLS模型的选择

meta分析中固定效应模型、随机效应模型和混合OLS模型的选择 在Meta分析中最常用的是固定效应模型、随机效应模型。怎样理解这两种模型呢?举个简单的例子:让十个学生去测量操场中的同一根旗杆,旗杆长度的测量值可以看作是一个固定效应模型;然而如果让一个学生去测量操场上长度不同的十根旗杆,旗杆长度的测量值则是随机效应模型。 一般来说,随机效应模型得出的结论偏向于保守,置信区间较大,更难以发现差异,带给我们的信息是如果各个试验的结果差异很大的时候,是否需要把各个试验合并需要慎重考虑,作出结论的时候就要更加小心。从另一个角度来说,Meta分析本来就是用来分析结论不一致甚至是相反的临床试验,通过Meta分析提供一个可靠的综合的答案,如果每个试验的结果都一模一样,根本就没有必要作Meta分析,因此要通过齐性检验来解决这对矛盾。 一般来说判断方法是根据I2来确定。 1.就是根据I2值来决定模型的使用,大部分

认为>50%,存在异质性,使用随机效应模型,≤50%,用固定效应模型,有了异质性,通过敏感性分析,或者亚亚组分析,去探求异质性的来源,但是这两者都是定性的,不一定能找到,即使你做了,研究数目多的话,可以做个meta 回归来找异质性的来源 2.在任何情况下都使用随机效应模型,因为如果异质性很小,那么随即和固定效应模型最终合并结果不会有很大差别,当异质性很大时,就只能使用随机效应模型,所以可以说,在任何情况下都使用随机效应模型 3.还有一种,看P值,一般推荐P的界值是0.1,但现在大部分使用0.05,就是说P>0.05,用固定,≤0.05用随机效应模型。 但是这些都没有统一的说法,存在争议,如果你的审稿人是其中一种,你和他相冲突了,你只能按照他说的去修改,因为没有谁对谁错,但是现在你的文章在人家手里,如果模型不影响你的结果,你就遵照他们的建议 但是,也不必过度强调哪种方法,更重要的是找到异质性根源。meta分析中,异质性是天然存在的。如果异质性较小,选择固定效应模型

调节效应分析

调节效应分析攻略 一、调节效应回归方程: 调节效应是交互效应的一种,是有因果指向的交互效应,而单纯的交互效应可以互为因果关系;调节变量一般不受自变量和因变量影响,但是可以影响自变量和因变量;调节变量一般不能作为中介变量,在特殊情况下,调节变量也可以作为中介变量,例如认知归因方式既可以作为挫折性应激(X)和应对方式(Y)的调节变量也可以作为中介变量。常见的调节变量有性别、年龄、收入水平、文化程度、社会地位等。在统计回归分析中,检验变量的调节效应意味着检验调节变量和自变量的交互效应是否显著。以最简单的回归方程为例,调节效应检验回归方程包括2个如下: y=a+bx+cm+e 1) y=a+bx+cm+c’mx+e 2) 在上述方程中,m为调节变量,mx为调节效应,调节效应是否显著即是分析C’是否显著达到统计学意义上的临界比率.05水平)。 二、检验调节效应的方法有三种: 1.在层次回归分析中(Hierarchical regression),检验2个回归方程的复相关系数R12和R22是否有显著区别,若R12和R22显著不同,则说明mx交互作用显著,即表明m的调节效应显著; 2.或看层次回归方程中的c’系数(调节变量偏相关系数),若c’(spss输出为标准化?值)显著,则说明调节效应显著; 3.多元方差分析,看交互作用水平是否显著;

4.在分组回归情况下,调节效应看各组回归方程的R2。 注:上述四种方法主要用于显变量调节效应检验,且和x与m的变量类型相关,具体要根据下述几种类型采用不同的方式检验 三、显变量调节效应分析的几种类型 根据调节效应回归方程中自变量和调节变量的几种不同类型组合,分析调节效应的方法和操作也有区别如下: 1.分类自变量(x)+分类调节变量(m) 如果自变量和调节变量都是分类变量的话,实际上就是多元方差分析中的交互作用显著性分析,如x有两种水平,m有三种水平,则可以做2×3交互作用方差分析,在spss里面可以很容易实现,这我就不多讲了,具体操作看spss操作工具书就可以了。 2.分类自变量(x)+连续调节变量(m) 这种类型调节效应分析需要对分类自变量进行伪变量转换,将自变量和调节变量中心化(计算变量离均差)然后做层次回归分析。分类自变量转换为伪变量的方法:假设自变量X有n种分类,则可以转换为n-1个伪变量,例如自变量为年收入水平,假设按人均年收入水平分为8千以下、8000~2万、2万~5万、5万~10万、10万以上四种类型,则可以转换为3个伪变量如下: x1 x2 x3 10万以上 1 0 0 5万到10万 0 1 0 2万到5万 0 0 1 8千以下 0 0 0 上述转换在spss中可以建立3个伪变量x1、x2、x3,变量数据中心化后标准回归方程表示为:

固定效应和随机效应

方差分析(写成英文我就认识了。。analysis of variance (ANOVA) )主要有三种模型:即固定效应模型(fixed effects model),随机效应模型(random effects model),混合效应模型(mixed effects model)。 所谓的固定、随机、混合,主要是针对分组变量而言的。 固定效应模型,表示你打算比较的就是你现在选中的这几组。例如,我想比较3种药物的疗效,我的目的就是为了比较这三种药的差别,不想往外推广。这三种药不是从很多种药中抽样出来的,不想推广到其他的药物,结论仅限于这三种药。“固定”的含义正在于此,这三种药是固定的,不是随机选择的。 随机效应模型,表示你打算比较的不仅是你的设计中的这几组,而是想通过对这几组的比较,推广到他们所能代表的总体中去。例如,你想知道是否名牌大学的就业率高于普通大学,你选择了北大、清华、北京工商大学、北京科技大学4所学校进行比较,你的目的不是为了比较这4所学校之间的就业率差异,而是为了说明他们所代表的名牌和普通大学之间的差异。你的结论不会仅限于这4所大学,而是要推广到名牌和普通这样的一个更广泛的范围。“随机”的含义就在于此,这4所学校是从名牌和普通大学中随机挑选出来的。 混合效应模型就比较好理解了,就是既有固定的因素,也有随机的因素。 一般来说,只有固定效应模型,才有必要进行两两比较,随机效应模型没有必要进行两两比较,因为研究的目的不是为了比较随机选中的这些组别。 固定效应和随机效应的选择是大家做面板数据常常要遇到的问题,一个常见的方法是做huasman检验,即先估计一个随机效应,然后做检验,如果拒绝零假设,则可以使用固定效应,反之如果接受零假设,则使用随机效应。但这种方法往往得到事与愿违的结果。另一个想法是在建立模型前根据数据性质确定使用那种模型,比如数据是从总体中抽样得到的,则可以使用随机效应,比如从N个家庭中抽出了M个样本,则由于存在随机抽样,则建议使用随机效应,反之如果数据是总体数据,比如31个省市的Gdp,则不存在随机抽样问题,可以使用固定效应。同时,从估计自由度角度看,由于固定效应模型要估计每个截面的参数,因此随机效应比固定效应有较大的自由度. 固定效应模型 固定效应模型(fixed effects model)的应用前提是假定全部研究结果的方向与效应大小基本相同,即各独立研究的结果趋于一致,一致性检验差异无显

基于面板数据模型及其固定效应的模型分析

基于面板数据模型及其固定效应的模型分析 在20世纪80年代及以前,还只有很少的研究面板数据模型及其应用的文献,而20世纪80年代之后一直到现在,已经有大量的文献使用同时具有横截面和时间序列信息的面板数据来进行经验研究(Hsiao,20XX)。同时,大量的面板数据计量经济学方法和技巧已经被开发了出来,并成为现在中级以上的计量经济学教科书的必备内容,面板数据计量经济学的理论研究也是现在理论计量经济学最热的领域之一。 面板数据同时包含了许多横截面在时间序列上的样本信息,不同于只有一个维度的纯粹横截面数据和时间序列数据,面板数据是同时有横截面和时序二维的。使用二维的面板数据相对于只使用横截面数据或时序数据,在理论上被认为有一些优点,其中一个重要的优点是面板数据被认为能够控制个体的异质性。在面板数据中,人们认为不同的横截面很可能具有异质性,这个异质性被认为是无法用已知的回归元观测的,同时异质性被假定为依横截面不同而不同,但在不同时点却是稳定的,因此可以用横截面虚拟变量来控制横截面的异质性,如果异质性是发生在不同时期的,那么则用时期虚拟变量来控制。而这些工作在只有横截面数据或时序数据时是无法完成的。 然而,实际上绝大多数时候我们并不关心这个异质性究竟是多少,我们关心的仍然是回归元参数的估计结果。使用面板数据做过实际研究的人可能会发现,使用的效应①不同,对回归元的估计结果经常有十分巨大的影响,在某个固定效应设定下回归系数为正显着,而另外一个效应则变为负显着,这种事情经常可以碰到,让人十分困惑。大多数的研究文献都将这种影响解释为控制了固定效应后的结果,因为不可观测的异质性(固定效应)很可能和回归元是相关的,在控制了这个效应后,由于变量之间的相关性,自然会对回归元的估计结果产生影响,因而使用的效应不同,估计的结果一般也就会有显着变化。 然而,这个被广泛接受的理论假说,本质上来讲是有问题的。我们认为,估计的效应不同,对应的自变量估计系数的含义也不同,而导致估计结果有显着变化的可能重要原因是由于面板数据是二维的数据,而在这两个不同维度上,以及将两个维度的信息放到一起时,样本信息所显现出来的自变量和因变量之间的相关关系可能是不同的。因此,我们这里提出另外一种异质性,即样本在不同维度上的相关关系是不同的,是异质的,这个异质性是发生在回归元的回归系数上,而

基于统计学角度:解读固定效应模型和随机效应模型

中国循证心血管医学杂志2017年3月第9卷第3期 Chin J Evid Based Cardiovasc Med,March,2017,Vol.9,No.3? 261 ? ? 循证理论与实践 ? 基于统计学角度:解读固定效应模型和随机效应模型 程里礼1,2,雷鹏2,陶园3,古辉云3,张超4,赵国忠2 基金项目:2014年度宁夏自然科学基金(NZ14122) 作者单位:1 750000 银川,宁夏医科大学;2 750000 银川,宁夏医科大学总医院肝胆外科;3 442000 十堰,湖北医药学院;4 442000 十堰,湖北省十堰市太和医院循证医学与临床研究中心 通讯作者:赵国忠,E-mail:Zhaogzh1220@https://www.wendangku.net/doc/3414503844.html, doi:10.3969/j.issn.1674-4055.2017.03.02 【摘要】大多数的Meta分析都会用到固定效应模型和随机效应模型中的一种,固定效应模型假设所有的纳入研究拥有共同的真实效应量,而随机效应模型中的真实效应随纳入研究的不同而改变。运用的模型不同,所得到的合并后的效应量均数值也不相同,这不仅体现在效应量的均值上,更多的体现在每个纳入研究权重的分配上,本文主要目的是深度解剖两种模型以及两种模型的假设,区分其共同点和不同点,并通过两种模型计算每个研究所占的权重和合并后效应量的均数值,最后指出并比较其优缺点。 【关键词】随机效应模型;固定效应模型;效应量;统计学 【中图分类号】R4 【文献标志码】 A 【文章编号】1674-4055(2017)03-0261-04Based on statistics: interpret fixed effect model and random effect model CHENG Li-li *, LEI Peng, TAO Yuan, GU Hui-yun, ZHANG Chao, ZHAO Guo-zhong. *Ningxia Medical University, Yinchuan 750000, China.Corresponding author: ZHAO Guo-zhong, E-mail: Zhaogzh1220@https://www.wendangku.net/doc/3414503844.html, [Abstract ] Most of Meta-analysis will use fixed effect model (FEM) or random effect model (REM), and FEM assumes that there is common true effect size in all included studies, while true effect size in REM will change according to different included studies. The mean of pooled effect size will be different as different models are used, which is not only reflected on the average, but also much on the weight distribution of each included study. Main purpose of this article is to deeply analyze these two models and their assumptions, distinguish their similarities and difference, calculate each study’s weight and pooled effect size by these two models, and finally point out and compare their advantages and disadvantages. [Key words ] Random effect model; Fixed effect model; Effect size; Statistics 系统评价/Meta分析是针对某一具体临床问题,系统、全面地收集全世界所有已发表或未发表的临床研究,采用临床流行病学的原则和方法对研究进行严格的评价,筛选出符合纳入标准的研究,进行定性或定量合成,从而得出可靠的结论[1]。1976年,Glass首次提出Meta分析是采用统计学方法总结独立研究的结果。与单个研究的评价相比,Meta分析通过整合所有相关研究,可更精准的估计卫生保健的效果,并有利于探索各研究证据的一致性及研究间的差异性[2]。 目前,很多统计方法模型被用于Meta分析中,最常见的两种模型为固定效应模型(FEM)和随机效应模型(REM)。FEM假设所有的纳入研究拥有共同的真实效应量,而REM中的真实效应随研究的不同而改变。基于不同模型的运算,所得到的合并后的效应量均数值也不相同[3]。早在1976年,第一篇Meta分析就使用FEM进行了数据合并,基于其统计简洁性及异质性认知,致使FEM广泛使用,直到2006年仍然有四分之三的Meta分析的文章在使用[4]。然而,随着方法学不 断更新及异质性理解,方法学家们对于证据合并内在结构理解与剖析,已开始逐渐对“理想”状态的FEM产生疑问。随后,REM逐渐被使用,并替代部分FEM,但至今对两种模型理解错误与使用不当的现象仍层出不穷,严重影响结果真实性与可靠性。 在很多系统评价/Meta分析中,FEM的假设是不合理的,当纳入一组研究进行Meta分析时,假设所有研究拥有足够多的共同点从而使得合并后的效应量均数有意义,然而就相同的真实效应量而言,并没有充分的理由假设所有研究是完全相同的[5]。有证据显示,由于系统评价/Meta分析制作者水平良莠不齐,致使当前已发表的系统评价/Meta分析文章并没有考虑到这方面[6]。为了进一步探讨两种模型间差别及正确使用,本研究基于三个方面来解读REM和FEM及如何正确择选两种模型。1 从定义的角度 1.1 FEM 假设所有纳入的研究拥有共同的真实效应量,或者除了随机误差外,所观察效应量均为真实效应量。如比较对糖尿病黄斑水肿(DME)的抗血管内皮生长因子(Anti-VEGF)药物中aflibercept与bevacizumab疗效,除了药物自身疗效外,其他患者背景、药物使用情况及测量结局的工具等均“一致”,每个研究的观察效应量差

调节效应重要理论及操作务实

调节效应重要理论及操作务实 一、调节效应回归方程: 调节效应是交互效应的一种,是有因果指向的交互效应,而单纯的交互效应可以互为因果关系;调节变量一般不受自变量和因变量影响,但是可以影响自变量和因变量;调节变量一般不能作为中介变量,在特殊情况下,调节变量也可以作为中介变量,例如认知归因方式既可以作为挫折性应激(X)和应对方式(Y)的调节变量也可以作为中介变量。常见的调节变量有性别、年龄、收入水平、文化程度、社会地位等。在统计回归分析中,检验变量的调节效应意味着检验调节变量和自变量的交互效应是否显著。以最简单的回归方程为例,调节效应检验回归方程包括2个如下: y=a+bx+cm+e 1) y=a+bx+cm+c’mx+e 2) 在上述方程中,m为调节变量,mx为调节效应,调节效应是否显著即是分析C’是否显著达到统计学意义上的临界比率.05水平)。 二、检验调节效应的方法有三种: 1.在层次回归分析中(Hierarchical regression),检验2个回归方程的复相关系数R12和R22是否有显著区别,若R12和R22显著不同,则说明mx交互作用显著,即表明m的调节效应显著; 2.或看层次回归方程中的c’系数(调节变量偏相关系数),若c’(spss输出为标准化?值)显著,则说明调节效应显著; 3.多元方差分析,看交互作用水平是否显著; 4.在分组回归情况下,调节效应看各组回归方程的R2。 注:上述四种方法主要用于显变量调节效应检验,且和x与m的变量类型相关,具体要根据下述几种类型采用不同的方式检验 三、显变量调节效应分析的几种类型 根据调节效应回归方程中自变量和调节变量的几种不同类型组合,分析调节效应的方法和操作也有区别如下: 1.分类自变量(x)+分类调节变量(m) 如果自变量和调节变量都是分类变量的话,实际上就是多元方差分析中的交互作用显著性分析,如x有两种水平,m有三种水平,则可以做2×3交互作用方差分析,在spss里面

混合效应线性模型与单因素方差分析在重复测量数据中的应用比较

【关键词】重复测量;混合效应线性模型;单因素方差分析; 摘要:目的:通过混合效应线性模型与单因素方差分析在重复测量资料中的应用比较,旨在说明两方法在处理重复测量资料时的应用特点。方法:用混合效应线性模型和单因素方差分析处理重复测量资料并比较。结果:混合效应线性模型和单因素方差分析都是处理重复测量资料的重要统计方法,前者在选择协方差结构下可对重复测量资料的固定效应和随机效应参数及协方差矩阵进行参数估计和统计检验,后者可对重复测量资料的固定效应做出统计推断。结论:混合效应线性模型是处理重复测量资料的有力方法,它对资料的协方差结构要求宽松,且结论可靠;单因素方差分析对资料的协方差结构有严格的限定。 关键词:重复测量;混合效应线性模型;单因素方差分析; 统计方法特点重复测量数据(repeated measures data)是医学领域中常见的一种数据资料。所谓重复测量是指对同一个观察对象在不同时间点上进行的多次测量[1]。由于重复测量资料是对同一受试对象的某一观察指标进行的重复观察所得的数据,同一受试者的观察数据间可能存在相关性,一些传统的统计学方法如t检验等就不能充分揭示这一内在特点,有时甚至会导致错误的结论。 对重复测量资料的分析方法大致可分为两类,即单变量统计分析方法和多变量统计分析方法[2]。本研究通过选用多变量统计分析方法中的混合线性效应模型对一例题的分析,并与单因素方差分析进行比较,来说明两种方法在处理重复测量资料中的应用特点。 1方法简介 简单说,混合效应线性模型就是所拟和的模型中既包含固定效应又包含随机效应,特别是个体内的数据结构的选择将对各因素的评价产生直接影响[3]。 混合效应线性模型是一般线性模型的扩展,其表达式为: y=xβ+zγ+ε(1) x为已知设计矩阵,β为固定效应参数构成的未知向量,ε是未知的随机误差向量,其元素不必为同独立分布了。在式(1)中y,γ都是正态随机向量,其均值为0,方差阵分别为g 与r,二者之间不相关,因此y的方差表达式为: v=zgz+r(2) 2实例分析 下面用一实例比较两种方法对处理重复测量资料时的特点:某药有新旧两种剂型,为了比较这两种剂型的代谢情况,对16例病人服药后分别在0、4、8、12小时测得血药浓度(表1),问该药新旧剂型的血药浓度随时间变化的趋势是否一致。表1四个时间点某药新旧剂型血药浓度1用sas软件的mixed过程对固定效应和随机效应参数β、γ及协方差矩阵g、r进行估计和统计检验。在本例中因变量为血药浓度,药物剂型、测量时间为固定效应,受试者为随机效应,同时选择合适的协方差结构以便在控制随机误差的基础上分析处理因素(药物剂型)对反应变量(血药浓度)的关系。本例指定为常用的无结构协方差(un)和复合对称性协方差(cs)。 模型拟合情况见表2。表2模型配合统计量由表2可见,在un结构下协方差配合的似然比统计量-2log likelihood=398.0(表2),对无效模型的似然比检验,χ2=134.43,ν=9, p <0.0001,说明模型拟合效果显著,模型较好地拟和了资料。在cs结构下,似然比统计量-2log likelihood=506.4,aic、aicc、bic三个值都是un模型小于cs模型,故本例选用un 结构作模型拟合。 在un结构下的固定效应参数估计值及假设检验结果见表3、4。 由表4可知,在un结构下,不同处理组之间的差别无统计学意义(p=0.07551),不同测量时间点的血药浓度及处理组×时间点的交互作用的差别有统计学意义(p<0.0001),且这种交互作用主要体现在新剂型组。

调节效应分析_

调节效应重要理论及操作务实 调节效应重要理论及操作务实 一、调节效应回归方程: 调节效应是交互效应的一种,是有因果指向的交互效应,而单纯的交互效应可以互为因果关系;调节变量一般不受自变量和因变量影响,但是可以影响自变量和因变量;调节变量一般不能作为中介变量,在特殊情况下,调节变量也可以作为中介变量,例如认知归因方式既可以作为挫折性应激(X)和应对方式(Y)的调节变量也可以作为中介变量。常见的调节变量有性别、年龄、收入水平、文化程度、社会地位等。在统计回归分析中,检验变量的调节效应意味着检验调节变量和自变量的交互效应是否显著。以最简单的回归方程为例,调节效应检验回归方程包括2个如下: y=a+bx+cm+e 1) y=a+bx+cm+c’mx+e 2) 在上述方程中,m为调节变量,mx为调节效应,调节效应是否显著即是分析C’是否显著达到统计学意义上的临界比率.05水平)。 二、检验调节效应的方法有三种: 1.在层次回归分析中(Hierarchical regression),检验2个回归方 程的复相关系数R 12和R 2 2是否有显著区别,若R 1 2和R 2 2显著不同,则 说明mx交互作用显著,即表明m的调节效应显著; 2.或看层次回归方程中的c’系数(调节变量偏相关系数),若c’(spss输出为标准化?值)显著,则说明调节效应显著; 3.多元方差分析,看交互作用水平是否显著;

4.在分组回归情况下,调节效应看各组回归方程的R2。 注:上述四种方法主要用于显变量调节效应检验,且和x与m的变量类型相关,具体要根据下述几种类型采用不同的方式检验 三、显变量调节效应分析的几种类型 根据调节效应回归方程中自变量和调节变量的几种不同类型组合,分析调节效应的方法和操作也有区别如下: 1.分类自变量(x)+分类调节变量(m) 如果自变量和调节变量都是分类变量的话,实际上就是多元方差分析中的交互作用显著性分析,如x有两种水平,m有三种水平,则可以做2×3交互作用方差分析,在spss里面可以很容易实现,这我就不多讲了,具体操作看spss操作工具书就可以了。 2.分类自变量(x)+连续调节变量(m) 这种类型调节效应分析需要对分类自变量进行伪变量转换,将自变量和调节变量中心化(计算变量离均差)然后做层次回归分析。分类自变量转换为伪变量的方法:假设自变量X有n种分类,则可以转换为n-1个伪变量,例如自变量为年收入水平,假设按人均年收入水平分为8千以下、8000~2万、2万~5万、5万~10万、10万以上四种类型,则可以转换为3个伪变量如下: x1 x2 x3 10万以上 1 0 0 5万到10万 0 1 0 2万到5万 0 0 1 8千以下 0 0 0 上述转换在spss中可以建立3个伪变量x1、x2、x3,变量数据中心化后标准回归方程表示为:

面板数据的F检验,固定效应检验

面板数据模型(PANEL DATA)F检验,固定效应检验 1.面板数据定义。 时间序列数据或截面数据都是一维数据。例如时间序列数据是变量按时间得到的数据;截面数据是变量在截面空间上的数据。面板数据(panel data)也称时间序列截面数据(time series and cross section data)或混合数据(pool data)。面板数据是同时在时间和截面空间上取得的二维数据。面板数据示意图见图1。面板数据从横截面(cross section)上看,是由若干个体(entity, unit, individual)在某一时刻构成的截面观测值,从纵剖面(longitudinal section)上看是一个时间序列。 面板数据用双下标变量表示。例如 y i t, i= 1, 2, …, N; t= 1, 2, …, T N表示面板数据中含有N个个体。T表示时间序列的最大长度。若固定t不变,y i ., ( i= 1, 2, …, N)是横截面上的N个随机变量;若固定i不变,y. t, (t= 1, 2, …, T)是纵剖面上的一个时间序列(个体)。 图1 N=7,T=50的面板数据示意图 例如1990-2000年30个省份的农业总产值数据。固定在某一年份上,它是由30个农业总产总值数字组成的截面数据;固定在某一省份上,它是由11年农业总产值数据组成的一个时间序列。面板数据由30个个体组成。共有330个观测值。 对于面板数据y i t, i= 1, 2, …, N; t= 1, 2, …, T来说,如果从横截面上看,每个变量都有观测值,从纵剖面上看,每一期都有观测值,则称此面板数据为平衡面板数据(balanced panel data)。若在面板数据中丢失若干个观测值,则称此面板数据为非平衡面板数据(unbalanced panel data)。

相关文档
相关文档 最新文档