文档库 最新最全的文档下载
当前位置:文档库 › 汪卫华:政治科学研究方法导引

汪卫华:政治科学研究方法导引

【讲习录】汪卫华:政治科学研究方法导引(之一)

2015-08-23汪卫华

以往推送讯息存目供参考

回复目录或索引或index查阅以往讯息存目

依提示回复相应取阅号即可查阅相应文章

按:以下内容是2015年春季学期本人给上外政治学三个专业博士生同学讲授政治科学研究方法的部分讲义笔录,该门课程由三位老师拼盘讲授,本人负责其中的6讲,出于便利考虑,直接用KKV的书作为教材作为辅助教材串讲一遍。现择其要者整理出来,陆续分享。感谢四位硕士班的同学帮忙整理文字初稿。未定文稿,尚在修订之中,欢迎来邮指教,未经本人同意,请勿转载,谢谢。WWH

开场白

在座的各位是国际政治、国际关系、外交学三个专业的博士研究生。国政、国关、外交三个专业到底有啥区别?大概谁也说不清楚。这不过是以往机构设置导致的历史遗留问题罢了,硬要分清楚也没必要。这三个所谓二级学科相当于美国政治学科常见分类里的一个次级研究领域:国际关系。总体上来说,国际关系大概是政治学里最浅薄的一个分支,因为国际关系基本不生产自己独创的知识,它是知识的消费领域,不是生产领域。如果说国际关系有什么独特贡献的话,大概均势理论算是大家认可的带有定律色彩的成果。但国家间的Balance of Power,在基本原理上与国内政治的Checks and Balances(制衡)也没有多大区别,只不过减少了更为复杂的其它干扰因素,将权力制衡放在了国际社会这个大环境里。国际关系研究本身是在大量地借用政治学其他次级学科、社会学、经济学乃至自然科学的概念和理论工具,同时也使用公认的科学研究方法。

国际关系从属于政治学,政治学是社会科学中一个基本组成部分。从方法意义上讲,社会科学各学科间没有明确的界限(或者说界限越来越模糊),方法是一致的。而在更大的范畴中,社会科学与自然科学都称之为科学,其同一性就是在方法上,研究逻辑是一致的。

今天的社会科学主流是经验研究(empirical research)的传统。要特别注意的是,中文文献里经常把两个词混为一谈:实证研究与经验研究。严格加以区分的话,positive research(实证研究)和empirical research(经验研究)是两个不同的概念。有一些研究是实证研究而非经验研究,例如近十几年在国际关系研究中越来越流行的使用博弈论来对涉及双方或多

方互动的问题进行描述、建模(方法上将其称为formalmodel 形式模型)。这一研究脉络是实证研究,但并不是经验研究。经验研究一定是拿可以观察到的数据、资料来验证理论假设。我们这六讲内容的简单定位即是处理经验研究传统下的方法和思路问题。

关于KKV

推荐给大家阅读的辅助教材是我们经常简称为KKV的《社会研究设计》(Designing Social Inquiry),全书一共六章,大体上我们每次主要围绕一章的内容串讲。这本书差不多是上世纪90年代中期以来每个接受过政治科学研究生教育的学人都念过的必读书了。

三位作者Garry King, Robert Keohane, Sidney Verba在本书出版的时候(1994)都是哈佛大学政府系的教授。本书是在三人合开给研究生的研究设计课程讲义基础上产生的。

三人中以研究方法见长的是第一作者Garry King(1958-),目前是哈佛大学级别最高的校聘讲席教授(AlbertJ. Weatherhead III University Professor)。Garry King的专长是做定量研究,在我看来,Garry King是位在政治系教书的统计学家。DSI 书中有给出一些公式和形式模型,可以简化帮助理解文字内容(如果你有一定数学根底的话)。去年他与他的学生合作做了一个研究:通过网络抓取工具研究中国的网络审查,研究究竟网络审查部门在哪些问题上较为敏感,中国网络审查中出现的模式(patterns)是什么样的。(“How Censorship in China Allows Government Criticism but Silences CollectiveExpression”, American Political Science Review, Vol. 107, No. 2, pp. 1–18.With Jennifer Pan and Margaret E. Roberts.)这个研究在方法上展示了一些新的工具,很有特色,得到国内很多学者的关注。

Robert Keohane(1941- )研究国际关系理论,自由制度主义的代表人物,大家比较熟悉,就不多介绍了。最后一位Sidney Verba(1932-)是比前两位资历更深的政治学家,专长是比较政治学和美国政治,曾经当过很长时间哈佛大学图书馆馆长(1984-2007)。1963年他与阿尔蒙德(Cabriel A. Almond, 1911-2002)合作的《公民文化》是政治文化领域经验研究的里程碑。

Keohane和Verba主要都是做传统的定性研究的。教材的副标题是“定性研究中的科学推论”(Scientific Inference in Qualitative Research)。整本书贯穿的主导思想即无论定性或定量,其逻辑是一样的,并不因为使用材料不同而影响推论

的逻辑。定性与定量只是两种不同的研究风格,并没有本质上的区别,其作为科学研究的逻辑是一样的。本书可以说是政治科学领域研究方法的“圣经”,但从量化分析的难度和运用的数理工具上来说远不及今天经济学和社会学量化分析教材的要求,还是比较浅显的,本书主要是讲怎样做一个好的研究设计的思路。我这六讲内容也是解决思路问题,不会涉及到量化统计的技术问题。

本书自1994年出版后,迅速被各大学政治系广泛用于研究生教学,但是也招致了很多批评。一部分学者认为本书有意识地用量化研究的思维方式改造了定性研究的研究设计,而现实世界中所使用的方法比本书所说的方法要更加多样化,本书只是用统计学家的思维方式把研究思路简化了,过于狭隘。围绕本书的争论一直持续不断。至2004年,一群持批评立场的学者集合起来编了一本书:Rethinking Social Inquiry: Diverse Tools, Shared Standards(《反思社会研究》,2010年有第2版)。此书也成为了政治学方法论的经典之作。

去年复旦大学经济学院的陈硕老师翻译的中文本《社会科学中的研究设计》出版了,这对大家是个“福音”。不过,个人觉得中文版中的一些译法还是可以商榷的,如要深究一下研究方法,我还是建议大家读英文版或者至少对照英文版阅读。例如,本书将“形式化”统一翻译成“公式化”。其用意或许是想回避“形式”一词在中文中的歧义(如形式主义一类的语汇),但中文中也有“形式逻辑”这样约定俗成的讲法。Formal model中formal一词含义与形式逻辑的形式一词是一样的。“公式”则是用数学符号表示几个量之间关系的式子,也就是说形式化(formalize)的结果是公式(formula)。但政治学中许多formal model本身没有达到数学或自然科学那种量化公式的要求。很多模型是根本没有办法在经验上加以验证的。因此我个人还是更倾向于形式化、形式模型这样的表述。

中国政治学研究(乃至全部社会科学)的尴尬之处就是其自身属于舶来品,我们所熟悉运用的概念、术语、理论大多都是从西方搬来的。而且,此处的西方还不是一个全称的概念,更多地是指英语学界。如果是欧洲大陆的政治学家在德语、法语背景下所讨论的政治话题,他们所使用的概念术语与英语环境中的政治研究有很大距离。不过,在英语强势霸权的时代,我们必须要接受的现实是,政治学里80%以上的文献是用英文发表的。但我始终认为,最能检验对于一个学科、某种理论有比较准确的把握的标准就是你能否用母语将其流畅地表述出来。作为一个中国人,只有用中文表述能将概念说清楚、理论讲明白的时候才能说明对这个概念、这套理论有了准确的理解和把握。最近二十年政治学中文翻译作品大量涌现,和国际接轨的速度非常快。但我们普遍感觉是中译本越来越难读,其实除了译者自己没看懂这样的低级错误之外,绝大部分要考验译者的中文能力是否过关。对于一个概念、术语,要用母语表述出来,并且能够说出这个概念在中文和英文语汇中内涵和外延的区别何在,才能更好地把握这个概念本身。

除了KKV这本教材,我另外提供给大家一个包括30多篇英文论文的文件包,这些文章是这些年我给本科生上研究方法课一直使用的阅读材料,认真读一下的话,收获还是不小的,而且也可以拓宽一下这本书未涉及的一些内容。大家有时间可以看看,我会在每次课上说明可以参考读哪几篇文章。

有关研究方法讨论的学科背景

我们先看看政治学关于方法的讨论应置于怎样的背景下看待。自然科学家往往对于社会科学研究是不屑一顾的。即便社会科学内部,从事不同学科的研究者总有一种围城的心态,认为城外的世界比城内的世界要好。国际关系研究圈子里近20年最大的一场争论就是冷战的终结。冷战结束后,历史学家对国际关系研究一片嘲讽之声,认为国际关系学者没有预测到冷战的终结。沃尔兹教授的《国际政治理论》中说两极格局是最稳定的,但两极格局戏剧性地垮掉了。沃尔兹教授给自己辩护,说自己是在结构层次建立的理论解释,并没有考虑单元层次的变化,而单元层次是不可能总结理论的——冷战结束,苏联瓦解,这是一个单元层次的事情——这个说法是有道理的,但是对于国关圈子以外的人没有说服力。历史学家加迪斯(JohnLewis Gaddis, 1941- )在《国际安全》杂志上发了一篇文章:“International Relations Theory and the End of the Cold War” 对国际关系学猜想式的研究嘲讽了一把。

还有来自实务界的批评。2009年美国国会一位参议员Tom Coburn提出一项修正案要求把政治学从国家自然科学基金的支持项目中剔除,因在他看来认为政治学并不属于科学,而且政治学家所做的研究对现实没有任何贡献。美国政治学界对此一片哗然,动员一切力量对国会展开游说,希望修正案不要通过。国会掌管预算,钱多钱少往往可能就是一两个议员的努力所致(有兴趣不妨看看2007年Tom Hanks主演的Charlie Wilson’s War)。好在很快发生了一件改善政治学处境的事:奥斯特罗姆(Elinor Ostrom, 1933-2012)作为一名政治学家,因其对公共品治理的研究分享了2009年诺贝尔经济学奖。当然,她并不是第一个获得诺贝尔经济学奖的政治学家。跨学科的奇才司马贺(Herbert Alexander Simon, 1916-2001)1978年就因“有限理性”理论获得过诺贝尔经济学奖。但奥斯特罗姆的工作在政治学研究传统中是非常窄的一支,沿着理性选择(Rational Choice)的脉络做的。今天的政治学里有三个不同的研究理路或范式(approach/paradigm):行为主义、制度主义、理性选择。国际关系学者也喜欢用paradigm这个词,但与政治学科整个领域的不同范式相比,无疑视野局促不少。或许是机缘巧合,最终这项修正案没有在国会通过,让政治学界松了口气。

但奥斯特罗姆能得奖也反映出政治学领域流行风尚的无奈之处——政治学研究倾向于通过用数学公式,将自己改造得看起来像经济学。可是,政治学所追求的原本并不是这些嘛。柏拉图、亚里士多德研究公义、善、城邦。政治学的起点是从规范性研究(normativetheory)起始的,而所有规范性的研究都是由价值观来支撑的。中国人的表述与古希腊人不同,同样是在追求最好的政治状态,我们给了一个词叫“大同”,《礼记·礼运》讲:大道之行也,天下为公。几千年来中国人的观念就是这样,若要做政治,这就是政治的理想状态。但若再往下追问,就会发现,不同的社会追求的价值观不同,所关切的焦点就会发生区别。

西方把理想的政治状态归因于政体,而中国人从小都明白“制度是死的,人是活的”,制度十之八九就是拿来绕过去的。徒法无以自行,中国人的思维习惯里从来不相信形式化的“笼子”可以起作用。双方的社会经验不同,价值观不同。从规范性的角度来说,价值观不同就意味着对制度的理解不同。中国人相信怎么样才能达到理想的政治状态呢?《论语》里讲:为政以德,譬如北辰,居其所而众星共之。下一句就更为明显:道之以政,齐之以刑,民免而无耻;道之以德,齐之以礼,有耻且格。传统中国的主流官方意识形态从来不迷信制度,而相信教化,相信为政者的带头教化作用。王绍光教授认为西方的政治传统重视的是政体,而中国的政治传统重视的是政道,就是怎么把一件事做好,制度本身并不是最终目的。但中国人到底重不重视制度呢?王绍光老师特别提到一个貌似悖论的现象:在世界各大文明体系里,关于制度的记录和研究,恐怕没有任何一个国家比中国更完备。历朝历代关于典章制度的记录是非常翔实的,从秦汉到现在,文献是连贯的,这在任何一个欧洲国家找不到的。所以中国有大量围绕制度史的研究。但是在近代以前,中国学术里很少有思想史。而西方呢,我们习惯上认为西方重视制度,但是在近代以前,甚至在20世纪以前,可以找到大量的思想史著作,却找不到几本制度史。因此,不要被一些流行的话语束缚住了头脑,要自己去找证据。互联网这么发达的时代,找证据线索越来越便捷。

还有一个关键词“自由”,背后充满着意识形态。中国人所理解的自由不是西式的自由。严复当年翻译密尔的《论自由》用了一个独具匠心的说法,叫“群己权界论”。中国人所理解的自由就是“你什么也别管我”。而关于“怎么争取自由”,理解上就更大相径庭了。法国大革命时代是一种理解,到了无产阶级革命的时代又是一种理解,背后充斥着的全是价值观和意识形态。

这些讨论是政治学的传统话题,然而这样的讨论如何把它经验化、形式化呢?所有的与价值观有关的东西难免“萝卜白菜,各有所爱”。环肥燕瘦哪个算美?时代变了,观念变了,评价标准也变了。是非、善恶、美丑,评价的体系会发生变化。要是把政治学永远纠缠于这种讨论里,就好像你成天讲:“在国际关系里不要奉行冷战思维、不要奉行强权政治”,这是外交辞令,但没啥科学价值。今天的政治学之所以进展到科学的范畴,是因为它开始像自然科学那样把关心的焦点放在了事实层面,从事实中揭示一些规律性的东西。这个意义上的政治学(经验研究)时间非常短,是在第二次世界大战之后才出现的。政治学的渊源可以追溯到古希腊,但是政治科学只能追溯到第二次世界大战。在第二次世界大战之前,上世纪30年代美国政治学界有零星借鉴当时社会学所应用的一些问卷调查的方法来处理一些政治问题,但是规模很小。一直到了50、60年代,政治学发生了行为主义革命,才真正确立了所谓政治科学的地位。

到底什么叫政治科学?我们所研究的对象是社会事实,我们不是在讲玄虚的观念,而是社会本来发生了什么,所以才有“行为主义革命”。社会行为是一种社会事实。政治活动体现为一系列的政治行为。这一系列行为中有没有一定的规律?把其中的规律性和因果关系揭示出来,这是政治科学研究所做的工作。所以,当你要提到做一个政治科学意义上的研究时,脑子里不要只反应出来公平、正义、自由这些规范性的概念,应该第一个联想到的是重复发生的规律性的东西(regularity/ pattern)。

研究方法的分类与取舍

政治学研究的议题五花八门,但是不管讨论什么议题,我们是在研究议题上追求某种规律、模式的存在,这是做政治科学最基本的需求(也是KKV致力于灌输的立场)。今天的政治学从研究的领域上来说,一般都会做这样的次级学科的划分,比如本国政治、国际关系、比较政治。值得一提的是,政治科学研究方法本身已经具有相当的独立性。有一些政治学家就是聚焦于方法研究的。现在政治学里相对弱势的研究领域大概就是政治思想。有意思的是,每个国家的政治学应该是做本国政治的人最多,就好像美国政治学差不多一半的学者是做美国政治的。但是我们的政治学一级学科下面的7个二级学科里恰恰没有中国政治,只有中共党史。公共行政传统上是政治学的一部分,但现在已经越来越独立了。公共管理甚至成了和政治学并列的“一级学科”。

今天念政治学的学生必须要像工匠似的接受一些方法上的训练。我们不妨把研究方法类型分成两个维度来看:一个维度就是风格(style),是定性还是定量?(不管定性定量,思路都是归纳。Formalmodel、博弈论是实证研究但不是经验研究,它是演绎的思路。)另一个维度是研究个案的数量,N=1,small-N, large-N。中文翻译将small-N翻译成小样本,这个翻译是不准确的,因为有sample(样本)就一定要讲population(总体)。但是政治学所讲的small-N未必存在总体,或者我们并不是试图藉此推论总体。所以small-N是少数个案研究,但是小样本研究这个说法不太谨慎。Large-N的研究为了避免bias,一定有个科学抽样的过程。结合这两个维度:如果是单一个案研究+定性,最常见的field research(田野调查/实地调查)。做实地调查照理是做Area Study 的必须要求。人类学家最喜欢做这个工作。少数个案+定性比较,是比较(历史)分析。大样本+定性,逻辑上似乎不成立,在历史学可能会有(比如芬利的《统治史》)。单一个案+定量,严格说起来也存在问题。凡是量化研究,想的都是研究结论要可以推而广之。如果研究结论只能因地制宜、就事论事,那么原则上研究结论还是没有普遍意义。在N=1的情况下,现在也比较时髦的做法是有些实验,在微观层次上做一些实验(区分实验与模拟,前者有经验证据后者没有)。不管是small-N 还是large-N,如果是量化研究都是意味着统计分析。今天的定量研究里,大量的课程都是关于统计的技术。如果从演绎的角度,上述维度的区分就没有意义了。现在做formal model 的比较流行些吓唬人的数学建模,比如game theory,agent-based model,这些是在做模拟(建议数学功底比较好的同学不妨尝试弄弄清楚,起码看得懂一些基本的模型)。不过,吓唬人是一回事,要是遇上懂行的,那么模型建构反而更容易对错分明,一眼就能看出来。客观讲,这个领域随着电脑技术的发展会越来越流行。

N在传统的方法的语境下,指的是个案数量,有sample那就对应有population,我们想从样本看总体,这是传统的分析思路,故而我们需要追究抽样过程是否可靠。但是最近又出现了一样好玩的东西BigData大数据。很多统计分析的东西可以拿来用海量的数据进行检验,并且有计算机辅助技术作为支撑。但是,大数据的研究没有经过所谓抽样的保证,所以尽管它数量很大,也可能还是一个有偏的大样本。

马宏尼(James Mahoney)在2007年的文章中提到美国的政治学研究在方法选择上的大概状况。在顶尖的三本期刊中,量化研究在AJPS上达到93%,APSR达到88%,Journalof Politics达到95%。现在纯粹的定性研究生存空间的确已经非常

小了。Formal model 则大行其道(17%、44%、6%),尤其是APSR,使用formal model 的潮流就是被它调动起来的。这样一个状况就导致我们今天的政治研究看起来面目可憎,距离它曾经的研究传统越来越远。

2000年,美国一拨政治学者实在无法容忍这样的状况,于是出现了一封作者化名为改革(Perestroika)的公开信在学术圈邮件组里流行,对走火入魔的量化研究潮流大加鞭挞。2005年出版的一本文集记录了围绕这封公开信的讨论(Perestroika!: The Raucous Rebellion in Political Science)。2009年约瑟夫·奈在《华盛顿邮报》上也发了一篇文章称“学者靠边站”,主要内容是讨论美国政府幕僚中政治学训练出身的越来越少,质疑政治学似乎看起来越来越科学,但是否离政治实践越来越远了呢?我们所阅读的KKV秉持的立场是社会科学与自然科学没有啥区别,但Bent Flyvbjerg借用亚里士多德Phronesis(实践智慧)的讲法,重新讨论了社会科学应该秉持的研究立场(Making Social Science Matter 2001),政治科学从目的上来说应该是学以致用还是学以致知?社会科学的定位到底是什么?对于这类“元问题”的不同态度也会影响到具体的研究风格和方法取舍。

【讲习录】汪卫华:政治科学研究方法导引(之二)

2015-08-27汪卫华

以往推送讯息存目供参考

回复目录或索引或index查阅以往讯息存目

依提示回复相应取阅号即可查阅相应文章

未定文稿,尚在修订之中,欢迎来邮指教,未经本人同意,请勿转载,谢谢。WWH

开场白:五篇补充阅读文献

进入今天的内容之前先给大家布置五篇补充阅读的文章,希望各位回头抽时间看一看:

* Sartori, Giovanni. 1970. "Concept Misformation in Comparative Politics." The American Political Science Review 64 (4):1033-53.

* Gerring, John. 1999. "What Makes a Concept Good? A Criterial Framework for Understanding Concept Formation in the Social Sciences." Polity 31 (3):357-93.

* Adcock, Robert, and David Collier. 2001. "Measurement Validity: A Shared Standard for Qualitative and Quantitative Research." The American Political Science Review 95 (3):529-46.

* Collier, David, and James Mahoney. 1996. "Insights and Pitfalls: Selection Bias in Qualitative Research." World Politics 49 (1):56-91.

* Lijphart, Arend. 1971. "Comparative Politics and the Comparative Method." The American Political Science Review 65 (3):682-93.

Sartori (1970) 与Gerring (1999) 这两篇都是讲概念问题的。华东政法大学高奇琦老师和清华大学景跃进老师他们组织翻译了一个集子《比较政治中的概念问题》(中央编译出版社2014),这两篇文章的中文译本均收入其中了。如果觉得看英文的很麻烦,找这本中文翻译也可以。但我还是得提醒各位中文翻译恐怕始终不能代替你自己去对照原文加深理解。每个译者的专业背景有别,理解上、用语习惯上都可能有差异,和你自己去阅读原文的理解也可能不一样。我上周请大家回去看看KKV第一、二章,如果你对照过这个中译本,会发现尽管译者花了很多心思,但难免还会有些疏漏。比如第

二章里头出现的一个例子,Robert Putnam的《使民主运转起来》Making Democracy Work讲到了意大利的“大区”制改革。中译本就误译成了“意大利人聚居区”,你如果没念过原文、也不清楚Putnam的研究,就可能搞不清楚他写的是什么东西了。术业有专攻,保险起见,大家还是应该养成读英文文献的习惯,至少对那些比较经典的专业文献,不能完全依赖翻译帮忙。这两篇文章都非常重要,我希望大家仔细地去看看原文,尤其是Sartori这篇文章,算得上是政治科学里概念问题的经典,有必要字斟句酌读一读。

John Gerring现在算是政治学方法论领域比较牛的一个人物,波士顿大学的教授。1999年这篇文章主要内容后来整合到他的社会科学方法论的那本教材里面了。[ Gerring, John. 2001. Social Science Methodology: A Criterial Framework. Cambridge and New York: Cambridge University Press.] 那本书可以算是试图覆盖“社会科学”意义上的方法论专著,影响也很大,2012年又出了第二版,而且把副标题改为了A Unified Framework。但我个人觉得那本书不太适合初学者阅读,会让你如坠云雾,很有挫败感,所以我没有把那本书拿来作为大家的参考读物。这篇1999年的文章里试图给啥样的是一个好的概念给出界定,他提了八条标准。八条标准的具体表述后面有一些修改,但是基本内容都差不多。有兴趣深究的同学可以去念念那本方法论书的第五章。

今天我们要读到的第二章讲“描述性推论”,里面提到了“无偏”、“有效”、“一致”三个判断标准(2.7)。偏差(bias)和有效性是研究方法里的两个重点问题,但请大家注意,中文里的有效性通常是Efficiency,但方法论文献里也经常拿来翻译Validity(效度),所以要注意语境,不要混淆。这一章在最后一部分讨论了推论的有效性问题,并给出了详细的形式模型解释。这个指的是用我们研究的样本推论总体的状况,是否有效(果)。

Validity则是放在测量问题上讲的,我们使用的测量手段能不能捕捉到观察对象的属性,传统的研究方法教科书翻译成叫效度。测量质量的标准通常我们说有四个:精确性、准确性、有效性、可靠性,后面的章节会提到(第四章)。四个标准里最重要的是有效性/效度和可靠性/信度。请大家补充阅读的Adcock and Collier (2001) 以及Collier and Mahoney (1996) 这两篇所涉的话题第二章里触及到了,但未充分展开,请大家在进入后续章节之前也提前看一看。

还有一篇文章,Lijphart (1971) 是讲比较政治与比较方法的,谈了到底什么叫比较方法,以及与量化研究相比的得失。这篇文章在《社会经济体制比较》上有一个中文的翻译版本,可以参考。此文是一篇非常重要的方法论经典之作,虽然题目叫《比较政治与比较方法》,但真正被大家反复阅读的在于对“个案研究”的分类,一直到现在大家大体上还是沿着本文的讲法去讲的。Arend Lijphart (1936- )是荷兰人,但退休前大部分时光都在美国大学任教,作过美国政治学会的主席,也是当代民主理论的一位大家。

这五篇文章大概100页左右的篇幅,对理解本书内容都是必要的补充。不知道各位看KKV的感觉如何,是不是开始看的时候觉得有点凌乱,很多东西理解不了?原因是什么?KKV预设了你有一些基础知识,然后涉及一些基本的常识问题本书就不会多展开了。所以上节课我说过,如果你要想理解更通畅的话,最好是再找一本本科生层次的研究方法教材(比如夏夫利的《政治科学研究方法》The Craft of Political Research),先快速地翻一遍,然后再读KKV可能就感觉好多了。

KKV头两章内容概述

第一章相信大家回去都已经看过了,三个小节。1.1导言部分讲了社会科学研究的“科学性”问题,四条:1、以推论为研究目的;2、采用公开的研究程序;3、结论是不确定的;4、科学研究的内容是关于方法的。这里面第3条请大家特别留意,科学不等于正确,不确定性是所有研究与认知中不可或缺的,“推论的目的是用定量和定性的数据/资料去了解周围的世界。从不确定的数据/资料中妄图得到完美、确定的结论是徒劳的。”

这一章的重点当然是第1.2节:研究设计的主要组成部分。研究设计需要考虑三件事:研究问题、理论、数据/资料。到底怎样提一个好的研究问题?理论支援或者理论预期是什么?数据/资料从哪里获得?这些都是在做研究设计时需要关注的。第1.3节中译本翻译有一点理解上的问题,把Volume理解为“章”,其实看原文,这部分是概括了四条贯穿全书的主题,也可以说是四条做研究设计时应当遵循的规矩。

第二章讲“描述性推论”。最关键的一句话,什么东西代表了你的研究是一个科学的研究呢?科学研究一定建立在有Inference 推论的基础之上。第2.2节上来就说“推论是利用已知事实去探索未知事实的过程。未知事实是我们的研究问题、理论和假说涉及的话题。已知事实就是我们已经得到的(定量或定性)数据/资料或观察发现。”上节课也已经提到过,对于推论,我的理解,借用毛主席的话说就是:去粗取精,去伪存真;由此及彼,由表及里。前面八个字是描述性推论,后面八个字是解释性推论。也许这样说可能更加通俗易懂。解释性推论是第三章及以后章节的内容。

谈方法需留意三对关系

明确了本书的大致结构之后,首先我想说在我们选题做研究的过程中,有三根弦要绷紧。这三根弦也可以说是三对关系,脑子里一定要清楚。第一对关系就是事实与价值的关系(fact vs value),西方哲学里的一个老话题。我们一般说事实与价值两分,上节课讲过,明确了这一对关系才是把你的研究到底是往哲学角度去引、往规范性研究的角度去引,还是往经验研究的角度去引。如果你关注的是价值层面的东西,比如正义战争非正义战争,国际关系、国家法里面也经常讨论,那么这是一个规范性的问题,核心是讲是非对错判断。但是,战争归根结底还是社会事实吧?经验研究追究的对象是事实,不管是自然科学还是社会科学,它要讲事实。社会科学处理社会事实,最大的问题就是人的观念在社会生活、人际互动之中所起的作用。这是社会事实与自然事实最根本的区别。尽管都是研究事实,社会科学和自然科学之间就有一个立场上的分化,有方法上的取舍。我们不可能像自然科学做得那么硬邦邦的。2015年《开放杂志》第二期,黄宗智教授和高原博士合作了一篇文章《社会科学和法学有必要仿效自然科学吗?》,我觉得做了一个很好的讨论,有兴趣的话大家可以去找来参考。顺带一提,人类社会生活中最可能被科学化的部分大概也是最没啥意味的部分,就像王国维说的可爱者不可信,可信者不可爱。

第一对关系,第一条绷紧的弦是事实与价值之间的联系与差异。我们找刚才大家给我的这些题目里的例子来看看。比如这个题目:“国际制度的有效性与合法性”。什么叫合法性?有效性和合法性是两个概念还是一个概念?合法性是什么?(答:合法性就是大家都认同的。)谁认同?国内政权的合法性很好解释,公民对于政府的认同。国际组织的合法性呢?国际制度的合法性呢?(答:成员。)成员认同,那么非成员认不认同?非成员对这个组织的看法涉及到这个国际组织的合法性问题么?比如说有同学选题上提到的G20,G20这19个国家加欧盟。那么G20以外的国家对G20的看法影不影响G20的合法性?

合法性这个词,在国内政治里头好理解,对吧?国内公民对于政权的认同这个本身构成了合法性。说白了,中国人经常说:“你凭什么?”实际上也就是在追问合法性。合法性这个概念本身英文是啥?Legitimacy。但是,查字典还有一个英文词叫legality。我们要把legitimacy和legality区分开来,legality可以说是“合法律性”。比如说希特勒政权是合法的,那个是在什么意义上?他上台是按照正常程序的呀,他是通过民选上台的。那么我们为什么说希特勒的纳粹政权是没有合法性的呢?因为他搞种族灭绝、搞武装侵略,对吧。实际上我们中文里更准确的对legitimacy的翻译应该是“正当性”,你做这个事情正不正当。那我们就把它和legality明确区分开来了。在评论这个事情正不正当的时候,我们在追问什么?你要回答这个合法性你要追问什么?一定有一个价值判断的标准,对吧?要回答这样的问题,先开始你得提标准。你拿什么样的标准去衡量说这个东西它是合法的还是不合法的?刚才追问谁认同的问题,换言之,是谁的标准?是成员国的标准就构成国际制度的合法性了?还是其他国家也有合法性方面的诉求呢?那么这个东西有一个客观的尺度吗?还是

说公说公有理婆说婆有理呢?几乎所有涉及到价值观,涉及到评价层面的讨论都会遇到一个障碍,就是公说公有理、婆说婆有理,屁股决定脑袋,萝卜白菜各有所爱。这些大白话它的背后都是告诉你说,规范性的讨论、价值的讨论本身很可能很难追求一个共识。

这个题目前面还有一个词叫有效性。有效性在中文里头就是更模糊的一个说法了。刚才我们说过,M easurement validity,也是把它翻译成有效性。那么国际制度国际组织的有效性是什么呢?你的理解是什么?(答:说到做到。)你看,一个国际制度我们说至少它可能有两种可能性。一种是它能扯皮扯出一个结果,形成一项文件。第二个是它的这个文件能落实。哪一种算有效?(答:落实吧?)所以,这个词在你的问题里也需要重新界定对么?

我们不是要追求这个概念马上要界定清楚,但有效性和合法性是两种不同的状态。当我们追问一项国际制度有效性的时候,可能不需要规范层面的一些标准,只是需要界定清楚其内涵。比如,达成了一个协议作为有效性的衡量标准?还是说,它能够有效地惩罚成员国的违约行为,作为有效性的标准?还是说,它的协定和文件能够得到其他国家的认可并且加以实施作为有效性的标准?不管是三种状态的任何一个状态,它的结果outcomes都可以被观察到,对吧?第二章的关键词就是叫观察发现。

所以,方才我们讨论的这个问题表述本身已经涵盖了价值层面的东西,也涵盖了事实层面的东西。可不可做?你要做成一个大的研究,可能这两个层面的难免会包括在一起的。但是,在我们的学术体系里,衡量经验研究的质量好坏跟衡量一个规范研究它的质量好坏,评价标准是不一样的。是要按照这个规矩来还是按照那个规矩来,具体做起来是要取舍的。这是第一根要绷紧的弦。开始寻找研究选题的时候,你恐怕脑子先得有个清醒的认识:我到底是往哪个方向走?我是往规范性研究层面靠?还是往经验研究方向走?得有取舍。那我两边都靠不成么?两边都靠,到最后可能就是两边得不偿失。

当然我们不能贬低规范性研究的意义和价值。上世纪70年代罗尔斯的《正义论》也好,其论战者自由至上主义者与社群主义者们的作品也好,都是重要的经典之作,学政治学的人需要拿来精读的东西。但是,你对《正义论》的评价高,也不能拿评价沃尔兹的《国际政治理论》的标准去评价《正义论》,那是两码事,两个不同的研究领域。如今做国际关系研究当然经验研究是主流,但规范性研究的东西也得有。国际关系的运作肯定跟国际法相关吧,国际法本身就是一个规范性的价值判断问题,对吧?跟国际法、国际制度相关的很多话题都涉及到规范性层面。所以你选问题开始就要取舍,这根弦要绷紧,那么这是第一对关系。

社会科学的主流主要还是要发现事实,顺便再说一句,这两种研究取向的表述可能在你行文、写东西时,就有很大的分歧。如果是一个规范性的、价值判断的研究,很多就是“我认为”。如果是经验研究,准确的表述不应该是“我认为”,而是“我发现”,尤其是从事实中发现了什么样的Patterns。我们很多学人不讲究这个,写东西是我认为应该这样,我认为应该那样,基于我的判断应该这样。判断和分析是两回事情,发现和认为是两回事情。所以顺便提一句。

第二根要绷紧的弦,或者说贯穿了整个研究过程的又一对关系:理论和什么?你们下意识就说“理论与实践”。我们在KKV书中的1.2可以看到,讲的是Data。不是理论与实践,而是theory vs data。为什么下意识反应出来实践呢?注意,理论结合实际和理论结合实践是两码事情。我们提实践这个词的时候,更多的回到的是马克思在论费尔巴哈的提纲里的一句话:“哲学家们只是用不同的方式解释世界,问题在于改造世界。”所以后面这个改造的过程是一个实践的过程,是知和行统一的过程,要把你知道的这个东西运用到实际之中去,去做事情。

但是,做科学研究我们衡量的标准客观讲,还是以解释为目的的。所以这本教材通篇跟你讲的是,如何恰当地解释这个社会,认识和解释这个世界。你说要追究到实践的这个层面,做政治学研究的,和做政治的,是两码事情。政治学家和政治家是两码事情。我们经常讲为学术而学术,把学术作为一个相对独立的一个领域,不要把它混杂到现实的那些东西中间去。这种精神本身不要求和实践相结合。我们从一个学术研究内部的关系讲,讨论怎么把这个研究做好,我们更关心的是理论和DATA之间的关系。D ata中文,包括我们这本书,一般都翻译成数据。但是我觉得这个翻译不太合适。因为数据这个词在中文里的印象都是跟“数字”联系在一块的。但社会科学研究大量的使用的材料还是非数字材料——文献、历史档案,包括访谈,还有影像资料,这些都可能作为资料的来源。而英文里头Data的说法本身也包括定性的资料,它并不完全是定量的。

所以第二根要绷紧的弦就是时时刻刻要把理论和你手头上的材料结合在一起。我们做一个不恰当的比喻,你手头上只有做京酱肉丝的材料,你非要去做佛跳墙,那就只能是忽悠了。哪怕我是个大厨,我知道佛跳墙怎么做,但手上的材料只有京酱肉丝的材料,那就老老实实地去做京酱肉丝。我们做博士论文,要有文献综述、文献回顾吧。但一般来说,中国社科圈子里目前的相当数量博士论文在这上面是不合格的。胡吹乱侃一通,就想把字数凑满,东扯西拉的一堆文献,其实跟自己的研究问题并不相关。你说我要吃京酱肉丝,厨子告诉你鱼香肉丝怎么做,你觉得有意思吗?你想生活中你觉得好笑的事情,那博士论文呢?做学术研究的时候,干嘛写文献回顾的时候你要扯那些“鱼香肉丝”的材料?到后面经验研究的部分却变成了“京酱肉丝”。一样的道理啊。所以看着材料来做什么样的研究,那这个理论和材料之间的关系纠缠了研究的整个过程。

明确这对关系之后,我们再补充一句话。到底什么叫研究方法?其实有一句话的回答:把理论和资料勾连起来的桥梁就是研究方法。对吧?所以这一对关系是我们整个社会科学研究最核心的内容。讨论如何将理论和资料勾连起来就是方法问题,但中文里的“方法”这个讲法有时候会有点模模糊糊。所谓的方法有两大类,一类叫搜集资料的方法。你怎么找DATA,挖掘搜集资料的方法。第二种叫分析资料的方法,有了材料如何加工?如何帮助我们形成推论,验证理论假说?明确了这一对关系,今后在写“我的研究使用什么方法”的时候,脑子就不会太糊涂了。比如中文里一个常用的说法:本文采取文献研究法。这个说法就是一种莫名其妙的说法。什么叫文献研究法?文献是你资料来源,不是你分析资料的方法。交代我的研究使用的方法,像比较历史分析、结构方程模型、固定效应模型等等这是讲分析资料的方法。当然,

数据/资料的来源在哪里也需要讲清楚,比如我的数据取自于《国家统计年鉴》、某某省的地方统计年鉴或者某某国际组织、世界银行他们的统计资料。这是文献的来源、资料的来源。我个人很反感有同学在研究设计和文章里头写“文献研究法”,这个说法本身是模糊的。KKV书上提到了数据收集,包括观察法、参与观察法、深入访谈法、大规模抽样法(2.4小节),还有二手资料调查、随机实验、民族志研究、内容分析,这些东西是搜集资料的方法。这并没有涵盖所有的内容,需要说清楚。

什么时候才能说你的理论和资料的关系在你脑子里都非常明确了?说实话,不到最后一刻研究完成,你脑子里头可能永远都不能明确清晰。那么这就牵扯到下一个问题了,你研究过程之中到底有几个阶段?提出问题、概念化、操作化(测量)、形成和验证理论假说、形成研究结论等。这其中蕴含了第三对关系:普遍与特殊(一般与个别),也是我们需要绷紧的第三根弦。

【讲习录】汪卫华:政治科学研究方法导引(之三)

2015-08-28汪卫华

以往推送讯息存目供参考

回复目录或索引或index查阅以往讯息存目

依提示回复相应取阅号即可查阅相应文章

未定文稿,尚在修订之中,欢迎来邮指教,未经本人同意,请勿转载,谢谢。WWH

提问题是研究的起点

研究设计的起点是提问题,这是研究的第一个阶段。在中文这个“问题”,它对应的英文词可有一大堆。关键的差别,一个Question,一个I ssue,哪个是我们的研究问题呢?像刚才这个表述,国际制度的有效性与合法性,这是不是一个问题呢?在中文里头说,这是一个问题。但是Issue还是Question?(同学:我知道不是question。因为这是一个肯定的陈述。)就是说Q uestion后面肯定是个问号,是这个意思吗?从形式上说,这是最直观的回答,对吧?你要提一个研究问题,我想等一个什么东西啊?我想等一个回答,对吧?要么一般就是WHY的问题,或者是HOW的问题,那么这个后面加问号是很正常的。那还有一个不太清楚的就是WHAT,问这是什么东西?这样的表述也是一个问题。但这个问题的回答又跟WHY跟HOW的那种回答不太一样,追问的东西不太一样。这之间的分别在哪里?这就是第二章和第三章各自主题的分别。第二章讲得是描述性的推论,第三章讲得是因果性推论。那你回答WHY的问题和HOW的问题往往要牵扯到因果性推论,WHAT的问题顶多涉及描述性推论。当然,如果细分HOW的问题有一部分也能够归入到描述性推论中间,但是绝大多数的HOW问题还是牵涉因果机制的。比如说民主和评论。为什么民主国家不打仗?这是WHY的问题,对吧?怎么民主国家就不打仗了呢?一环一环地把这个逻辑链条勾连起来,前因是怎么造成后果的,这还是HOW的问题,但这就涉及到因果机制,那么它是需要解释性推论的。所以HOW的问题比较麻烦一点,要具体问题具体分析。

Issue在中文里找一个准确的译法,表述为议题更合适,对吧?An Issue=A T opic,你的研究议题并不等于你的研究问题。许多博士论文往往写得像教材。为什么会出现这种情况呢?因为这里面有一个现成的套路。一个领域,两重意义,三个阶段,四大特点,任何议题你都可以按照这个套路来编写。写出来的东西呢,似乎面面俱到,甚至填补空白,但它没有回答一个具体的问题,更像是一本某一领域的教材,它在不断地陈述观点,但那些观点之间怎么样有机地联系在一起呢?它就是一堆东西放在那里。大家都是从小念书念到现在,对于某些中文专业教材这种味同嚼蜡的状况也是深有体会,但是如果博士论文也写成那样的东西就要命了。在我们研究展开的过程中,提问题是第一步。每个人提问题都是先开始从模模糊糊的一个领域慢慢地收敛,聚焦于某个具体的议题,然后再往下具体到一个准确的研究问题。

做博士论文的研究讲知识创新,按规矩来说,博士论文的要求应该不是去回答一个简单的描述性问题,我们是以追求找到某种因果联系,或者说回答一个解释性问题为目的。但是,正如KKV第二章核心观点的表述一样,好的解释也必须要以准确的、清晰的描述为前提,这两者之间不矛盾。如果你写的这个东西的确是以前学人很少触碰到的领域,就老老实

实做一个准确的描述,条分缕析,梳理清楚,跟史学的要求一样,可不可以呢?我个人认为其实觉得这样也未尝不可。但是要以这样的标准放在一流的政治系里,申请博士很可能通不过。描述清楚是你必须要做的事情,然后以此为基础还得讲些“道理”出来,这个道理或者是因果关系,或者是因果机制,这是政治科学博士论文的一般要求。但说实话,国内的政治学研究,能找一个漂亮的描述性研究,我觉得已经是相当不错了。一个现成的例子,于建嵘老师当初在华中师范大学完成的博士论文《岳村政治》,就是一个漂亮的描述,理论解释其实并非它的价值所在。华东理工大学曹锦清教授的《黄河边的中国》,是这些年国内的政治社会学研究比较成功的作品,但居然是上海文艺出版社出版的,还获得了上海市的文学艺术奖。或许当初别人觉得它的体裁是一个报告文学,不那么学术?你要知道,曹老师这本书可是外国人专门把它翻成英文,在英国出版了英文本。我们现在所谓的国际化呢,老是要强调中国学者要用英文写作,国际发表,要发SCI、SSCI这些,似乎英文的作品天然地比中文的作品质量高?这个心态是很成问题的。像曹老师这样就拿中文写的好东西,外国人并非不识货,反而翻成英文在主流的学术出版社推出。所以,用什么工作语言和一项研究的好坏是两码事,英文在传播上有现实的优势,但这不能成为评价学术研究质量的标准。所谓文化自信、学术自信,首先得是语言上自信嘛。

好的问题一定是好的研究前提。怎么能提一个好的问题?说实话,要琢磨出来能够清晰表达出来的研究问题,不那么容易。可能通过博士这一年修课之外不断地思考琢磨,最后能想到一个问题并开始聚焦研究,那已经相当不错了。

选题要做到什么呢?俗话说:又好吃,又好玩。好吃,就是你有材料写,你能够做下去。尤其是从操作层面能够做下去。好玩,这项研究确实在理论上是有意义的。上世纪90年代末期开始,王逸舟老师就经常说我们国内的国际关系研究呈现出低水平重复。有些风气养成得不好,有一段时间就是西方争论什么,我们赶紧跟进,不少研究作品其实不叫研究,更像是拙劣的改写,对吧?拿中文把人家英文的讨论改写一下。上世纪90年代以来中国国际关系学的热闹,不少是建立在“改写”基础之上的,无非就是在做读书报告、读书笔记。现在有很多学人在努力推进扎实的研究工作,能够跟别人去对话,但是又有点玩“大词”吓唬人了。陈乐民先生那句话有道理,国际关系毕竟不是玄学,你全把它变成看不懂的词这好么?沃尔兹的《国际政治理论》本是非常朴实、明白、晓畅的英文,结果翻成中文之后就成了洋枪洋调,拿腔拿调。不假思索地把“学生腔”当“学术腔”,这是很多研究者笔下的毛病。学生腔就是你不懂的时候,你战战兢兢的时候写出来的腔调叫学生腔。哪有什么学术腔?!学术大家是能够把复杂的东西讲清楚、讲简单,对吧?那么这也就触及到另外一个问题,我们说方法要把理论和材料勾连起来,方法最终极的追求是什么?是化繁为简。你们看KKV第一章、第二章里头有一个关键词,简化,对吧?你做任何的理论模型,任何的理论的解释,你试图用简单的方式来描述这个世界最本质的一些规律性的东西。所以一定要简化,这个是方法我们最终极要追求的东西。你如果说你学了一套方法之后,你就学会了怎么用那些吓唬人的词去骗骗那些不懂行的,那就不是方法的目的了。你这叫欺骗了。好一点的叫揣着明白装糊涂,那我真的懂的,我就故意把它写那么艰涩,完了你看不懂,以显示我的牛。坏一点的,试图“以其昏昏使人昭昭”,自己就不懂,还拿那些大词来吓唬别人。实际上写的云山雾罩,不知道什么东西。中文论文,尤其是跟那些洋人的理论相关的论文也好,译文也好,我的一个最基本的判断就是,你看不懂的十之八九不是你的问题,是写的人、译的人的问题。写的不好,译的不好,译出来让人看不懂,那多半就是他自己都没懂,我觉得这个评价标准是适当的。

概念化

问题提好了以后,第二个阶段是什么?这就是涉及开头我说的那两篇关键文章的内容——概念。第二步我们叫概念化。这就是涉及到第三对关系、第三根弦了。普遍(一般)与特殊(个别)。哲学上也讲共相与殊相。研究方法本身毕竟是要找到一个简化的方式来刻画这个世界。观察到经验世界都是具体的、活生生的,但在研究过程中,我们希望得到一个普遍适用的结论,我们把这个做结论的过程成为generalize一般化、概化。科学研究试图发现一般化的结论,一般化的解释。观察到的东西是具体、特殊的,要把它表述为一般化的理论语言时,一定先要提炼出来点什么,抽象出来点什么,也就是挖掘观察对象的核心特性,抽象整理成概念。概念是理论分析的基础,就像砖瓦一样。形成概念的过程就叫做概念化。

概念化是一个什么样的过程?看到的东西,所见即所得,形成观念,然后经过概念化,形成系统化的概念。中文里头概念是什么意思啊?说文解字,概念是什么意思?概括起来的观念,对吧?观念conception,我观察到了,有一个感性认识了,然后抽象出来一些东西,从具体的观念中抽象总结出一个概括性的观念,涵盖这一类东西,这就是概念。

概念和定义是一回事吗?一个概念可能有不同定义,但它还是一个概念。定义是对概念的表述,这是定义和概念的关系。如果一个概念的定义转换会发生什么?很可能发生相应的理论视角、理论分析的内容发生转换。举一个例子,爱因斯坦

对于时间空间的界定和牛顿对于时间空间的界定是不一样的。在爱因斯坦那里,时间和空间都是可变的,它会根据物体运动的速度会发生变化,时空会压缩的。牛顿那呢,那是静态的不变的,时间本身不会有什么曲折变化,它就是一直就这么匀速运动。但是爱因斯坦没有改时间和空间这两个概念,他只是对它们的定义不一样。结果呢?牛顿的经典力学一套体系,爱因斯坦相对论一套体系,两套完全不同体系了。你们脑子里都装过一个词,这是两个不同的“范式”,对吧?说实话,这才叫范式,国际关系理论那些“范式”多少是自己装点门面的,显得科学点罢了,并不合乎库恩的原意。我们姑且不纠缠这些,总之核心概念的重新界定可能诱发 Paradigm Shift 范式转换。

从conception慢慢地抽象为concept,从观念抽象为概念,这个过程叫概念化。通过概念化,我们要明确:一、维度。在社会科学里,重要概念都是多维度概念,要形成一个好的概念一定要养成多维度的思维习惯。社会科学里当然也有不证自明的概念,比如性别。但是仔细琢磨,又不好说。比如社会性别和自然性别,就又是两个不同的说法了。当然,并不一定是维度越多就越好,得能讲清楚、分明白。二、属性。属性也就是特征,例如“人是两足无毛动物”,这就有三个属性。属性规定一个概念的内涵。属性讲的是概念和它的指示物之间的关系,属性的功能就是在抽象的概念和具体的事物之间建立联系。

明确维度是帮助我们分类的,就是一个概念下面的类型让我们有清晰的分类。属性的功能就是,把抽象的概念和具体的现象之间建立起来对应关系。与内涵相对还有一个什么词?外延。什么叫外延?你这个概念对应的现象、事物覆盖范围的大小。一个概念的内涵越大,则外延越怎样?这里有中国人经常犯的错误,一个概念它内涵属性越多,内涵越明确、越具体,则这个概念适用的范围就越窄、越小。社会主义是一个大概念吧,要再加中国特色呢?那只能在中国适用了呀。所以,回头你要看到有谁说,内涵丰富,适用范围广泛,那只能说明这些作者没有把这个问题讲清楚。内涵和外延之间,从经典的形式逻辑上讲,一定是反比关系,你内涵属性多了,外延覆盖范围就小了。我们回到刚才那个例子,熊彼特定义民主,他只抽出来选举这个要素,那它涵盖的民主国家就一大堆了,菲律宾、印度、利比里亚这都是民主国家,但是这些国家明显跟美国、英国不同嘛。我们知道这里头起码还有一大类,一类叫Liberal Democracy,自由民主国家;另外一类叫,Illiberal Democracy非自由的民主国家,那么它们之间的区别在哪儿呢?一个国家法治健全与否,能否有效维护社会秩序,对民主的具体表现是有影响的。增加了自由的这个要素,但是谁来维护自由呢?靠法治。但自由民主制这个概念的外延怎么样?它覆盖的国家范围缩小了。所以这是一个重要的话题,请大家注意Sartori (1970) 这篇文章,回头仔细看一看。

我们在形成或界定概念的时候,是要抽象一点好,还是具体一点好呢?怎么样让它抽象一点或者让它具体一点呢?明确了内涵与外延的关系,你就清楚了,特征属性增加一点,这个概念就具体了,但是它适用范围就会缩小;特征属性减少一点,你的概念倾向于抽象一点,但它适用范围会扩大一点,那么这就是概念的抽象化界定。你可以从具体的,任何一个概念你的界定方式不同,它的覆盖面它的抽象和具体的范围就不同,那你到底抽象好,还是具体好?Sartori文章里这个表其实已经告诉你了,取决于你的研究问题,你对它的理论回答希望到一个什么样的抽象程度、适用多大范围,就要找到与之相称的概念来回答。这就是第三对重要的关系、第三根弦,但是,这对关系可不止影响概念化阶段,它还会影响到后面操作化阶段。

说到这儿大家脑子应该清楚点了,但下面要讲的可能又会让你糊涂了。刚才我说这是关于概念化的一个经典表述,内涵与外延之间是反比关系。但还有一种说法,在概念界定上另外一种类型,内涵与外延是正比关系,内涵属性数量增加,外延并不随之减小。有语言学背景或者哲学背景的同学大概知道大哲学家维特根斯坦,他在《哲学研究》里头提到一个重要说法,叫“家族相似性”。我们举一个现实例子:福利国家。什么叫福利国家?比如说有六种福利制度,如果我们说在六种福利制度里头具备四种的就可以叫福利国家了,四种以下的还不叫福利国家,六选四,我实际上给你的选项是六种属性供你选择,我只要拎出来任何四种放在一起这就是福利国家,要有五种属性呢,它当然也是福利国家呀,我要六种都具备呢,也是福利国家。内涵属性增加了,外延并没有减小。传统的概念界定是取交集,我刚才说的那种用家族相似性的方式来界定概念时呢,取的是并集。所以,这两种概念处理的方式实际上是不太一样,这个地方你们要小心。但是取并集这种界定方式不能变成瞎举例子,不着调的东西全罗列在一起,那就不叫概念,那叫胡扯了。所以我建议大家,还是先把Sartori 1970念清楚,知道我们现在传统的概念界定一般是这么一个关系,内涵属性越多,外延覆盖范围越小。

从模模糊糊的、感性的观念,抽象出来它中间不同的维度,明确出来它的属性,那你就形成了系统化概念。就从conception,变成了concept。在你进行描述性推论的过程,实际上就是从感性认识,不断上升到一个理性认识的过程,所以描述性推

论、描述性的研究,其实有一类成果就是你提出来一个概念,把那个“标签”提炼出来了,让大家觉得真就那一回事了,也挺成功。比如“蚁族”这个说法,媒体一关注,领导一批示,这个概念也就流行开来了。但在学理上来说,这并不是一个很清晰的概念,恐怕还不足以支撑一套严谨的因果推论。

中国文化传统不大讲究逻辑,所以思维方式是我们理解研究方法的最大障碍。研究方法的教材一般介绍工具、技艺层面的内容比较多,也容易讲清楚。但我个人觉得,中国语境下讲研究方法,需要多花些力气搞清楚如何提研究问题,如何界定清楚概念。我甚至认为概念化这个环节是我们中国学生最应该下功夫的地方,我们看到很多学术论著其实连基本概念都弄得不清不楚,就没必要再去纠缠它的学术贡献了。当然,这和我们的语言也有很大关系,李晓宁多年前曾经做过一个很有影响的讲座《我的东西方思想方法观》,他认为人的思维是依靠语言来进行的,没有语言就没法思维,语言不同也就造成了思维方法的不同。有兴趣大家可以上网找来看一下,有文字稿。说实话,这些原本是我们语言类院校专业应该下点功夫去做的研究,可似乎大家都还是划地为牢,懂语言的未必有兴趣追究其他专业问题,做政治学、国际关系的则都忙于搞“智库”递“折子”服务大战略。孔夫子闻韶,三月不知肉味。如今大概是流行作狐狸盯着乌鸦嘴里的那块肉,当刺猬自然就不合时宜了。

【讲习录】汪卫华:政治科学研究方法导引(之四)

2015-09-02汪卫华

以往推送讯息存目供参考

回复目录或索引或index查阅以往讯息存目

依提示回复相应取阅号即可查阅相应文章

未定文稿,尚在修订之中,欢迎来邮指教,未经本人同意,请勿转载,谢谢。WWH

操作化与测量

概念化是从具体到抽象,而要用经验证据去检验研究假说,还得从抽象到具体,我们把这个过程叫做操作化。一个概念可以被操作化也就是可以被测量,所以我们有时候对操作化与测量也不加分别,如果要仔细区别开,Adcock and Collier (2001) 这篇文章里的图1给了一个区分,他们把从Level 2“系统化概念”到Level 3“各项指标”这个环节叫“操作化”,把从Level 3到Level 4“个案分值”这个环节叫“给个案赋值”(Scoring Cases),把Level 2、3、4这三个层次统称为“测量”——相应的从Level 1“背景概念”到Level 2“系统化概念”这个环节称之为“概念化”。也就是说,对他们而言,操作化专指为抽象的概念找到具体的(测量)指标,测量包括操作化。当然,我们也不妨从狭义来理解,操作化就是“找指标”,测量就是“打分数”。

社会科学中有些常见的概念、变量比较直观,比如收入,我们很自然地想到可以用每月或每年获得的货币数量去测量、比较;稍复杂点,我们可以区分不同的收入来源,比如工资薪金、租金收入、利息股息、社会福利所得等等,但还都可以用货币数量加以测量,只要花功夫,不至于“深不可测”。但政治科学中许多重要的概念是复杂的、抽象的、多维度的、难以直接观察的。比如民主,就属于“本质上可争议的概念”,对它的不同界定就会直接影响到测量结果。操作化就是把抽象概念具体化为测量指标indicators,比如,经济发展是个抽象概念,经济发展体现为哪些方面,包括几个维度?我们很容易想到GDP数量的增长,但经济发展与经济增长是两回事,今天我们喜欢说的一句话:保增长,调结构,经济结构的变动本身也是经济发展的重要组成部分,哪怕我们就只说这两个大的维度,再往下面拆,就有不同的属性,这些属性在现实中表征为什么?要找到一一对应的指标,找在具体研究对象(个案)上每个指标的具体取值,我们第二章反复出现这个词,叫观察值。经济发展这么一个复杂的概念,不同的研究者侧重点不同,就可能选取不同的测量指标来衡量经济发展。最近这几年我们经常讲的,不能GDP至上,政府要讲绿色GDP。习主席讲不光要金山银山,还要绿水青山。(在这里顺便说一句,中国政府的官话看上去都四平八稳无甚新鲜,但毕竟那是一大堆笔杆子琢磨出来的。真要考察中国政治,你就会发现那些话的背后不是没道理的,而且它的概括能力是很强的,一字之易可能就意味深长。所

以我觉得做国际关系也好,做中国研究也好,千万不要忘了读文献的基本功夫,通过字里行间读出来那里头蕴含的那些东西,那是体现训练功底的。)

操作化和测量意味着把抽象的概念具体化,进而成为系统的、能够支撑你研究发现的经验证据,所以我们也可以说操作化和测量是“描述过程中的分析阶段”,不是所见即所得,而是我们要想想我们观察到的东西用以说明什么。指标选好,接就是下一步,拿这些指标挨个对研究个案进行测量赋值。

换一个角度来理解,操作化意味着从“理论—假说—工作假说(假设)—观察值”勾连起来:理论表述为概念和概念之间的关系Concept A → Concept B,比如说“经济发展”有助于“民主化”。相应的假说Hypothesis就表述为变量和变量之间的关系Variable a →Variable b。相应的工作假说Working Hypothesis就体现为指标和指标之见的关系Indicator #1 → Indicator #2,可能有数条或者十数条。最后拿什么来检验这个关系是否存在?在具体的观察值上,Values on indicator #1 → Values on indicator #2。

打开一个Excel表格,每一行是一个个案:case1、case2、case3,每一列是一个变量variable:V1、V2、V3,每一个格子里那个取值就是value(Adcock and Collier (2001) 用的词是Score),是这个个案在这个变量上的值,而这个取值怎么得出来呢,是通过具体的指标把它测量出来的,有的是直接观察所得,有的可能要用测量工具去度量,还有的可能是估算。注意,顺便补充一个小常识,方法论的文献里头,会把这样Excel表格的一个格子叫什么?我不是说它的值,它的值是那个value,我说的是那个格叫什么?叫作Cell。为什么我要把这个小事情拎出来呢?因为还真有人把这里的Cell翻成“细胞”呢!

总结一下,前面我们说了提问题、概念化是第一、二阶段,第三阶段操作化(找指标),第四阶段测量。当然,这里我们取Measurement的狭义。在测量的环节里面,有两件事情是最重要的,一是测量的层次或尺度(Scale),二是测量的质量标准。

测量的尺度我们通常说有定性的和定量的,或者通俗理解,有分类、有程度。从低到高,Nominal, Ordinal, Interval, Ratio 定类、定序、定距、定比。当然,测量尺度越高,我们对事物的了解也越丰富、清晰。毛主席在《党委会的工作方法》里讲的第七条:胸中有“数”。“这是说,对情况和问题一定要注意到它们的数量方面,要有基本的数量的分析。任何质量都表现为一定的数量,没有数量也就没有质量。我们有许多同志至今不懂得注意事物的数量方面,不懂得注意基本的统计、主要的百分比,不懂得注意决定事物质量的数量界限,一切都是胸中无数,结果就不能不犯错误。”不要认为这话说得“土”,Jarol B. Manheim的政治学方法教科书里就引用过这段话作为讲测量层次的引言。不过,政治学研究里很多变量达不到定比测量层次,能在定距层次上就不错了。量化研究里,测量尺度的差别影响到我们可以适用的分析工具、统计模型。只适用于高测量尺度的模型不能套用于低测量尺度的变量(尽管现实中的确有不少研究把只适用于定比变量的统计模型拿来分析定距变量)。近年来针对分类数据(Categorical Data)的分析工具越来越精致,相关的教科书也出了不少,比如谢宇教授和Daniel A. Powers教授合著的那本,Alan Agresti那本,都可以参考。关于测量尺度,我们先简单说到这儿。留一句话:我们搜集资料时当然测量尺度越高越有助于我们之后的分析加工,但不等于说“数”一定比“类”好,好的分类胜过貌似科学,实则把不相干的东西混为一谈的量化研究。Lijphart的文章里也特别批评了这种倾向。我们后面结合大家的题目可以讨论一下。

测量质量的主要标准有四个:精确性、准确性、可靠性、有效性。精确性、准确性有区别么?举一个例子,我说这个人40来岁,这句话不精确,但很可能准确,比如他真实年龄是45岁,他是40来岁。若说这个人48岁,这句话精确了,但是不准确,他实际是45岁嘛,在准确性上,它不如前面一句话“这个人40来岁”,那么这两个标准比较好理解。比较难理解的是可靠性和有效性,有效性是什么呢?有效性追问的就是你拿来测量的工具,能不能测出来真实的结果,能不能反映你想要测量的抽象概念。举一个经常被举到的例子:打靶,枪就像一个测量工具,好的测量应该达到什么效果?一个好的枪手,同一个人,拿这把枪去打,都打中靶心,那这把枪是把好枪;同样这个人拿另外一把枪打,都能达到靶上,但是都打偏,而且集中偏到某一个地方了,这不是枪手技术有问题,而是枪本身有问题,枪的准星要么出了点什么问题,要调一调,换成方法论的语言,就是发生了systemic bias,系统性偏差。那这把枪怎么样?它不有效,因为它没有打到我预期的目的,本来应该打靶心,它打偏了;但是,这枪的稳定性很好吧,它总打偏,而且总打那个地方,那说明什么?可靠!注意,它可靠,但没效。就好像女孩子关心体重,用一个电子秤上去称,永远给你少五斤,那你认为这一个秤是一个“爱心秤”——但是,没效,因为我们的目的是要测量你的实际体重,它永远给你少五斤,它发生了系统性偏差,但是它总是少五斤,那它是可靠的,但是没效。再往下讲,还有一种情况,一个秤你上去,头一次少五斤,第二

次少三斤,第三次多五斤,第四次少四斤。换成打靶,一把枪一会这里嘣一下,一会那儿嘣一下,同一个人去打,那么既不可靠,也不有效,既没有信度,也没有效度。总之三种状况:一就是我们想追求的,既可靠又有效;二是有信度,可靠,但是没效度,不有效,就是那个一直打到边上的那种情况;第三种既没信度,也没效度。那么有没有它有效,但是不可靠呢?没有。这篇文章里提到了这个争论,就是有效性、可靠性到底是一个质量标准,还是两个质量标准,有的学者认为,可靠性实际上可以化约为有效性,就是你有效的东西,一定是可靠的,但是可靠的东西不一定有效,就是这么个关系。回头请大家花时间看看这篇文章,我们就不能多展开了。

因为我们讲授的过程不是按照KKV书上照本宣科讲的,书上哪个地方与我讲的内容相关,我会叮嘱大家去看。第二章的内容本身呢,几个要点我们已经讲到了,这里头比较吓唬人的是那些formal model,好在作者自己先交代了一句,中文的是47页(第2.3节)最后一句话,尽管我们不鼓励读者跳过这些代数符号,不过即使没有这些内容也不会影响本书的连贯性,所以大家自己取舍。关于测量问题,除了我们今天提到的这篇文章,大家课后也可以跳着先看看KKV第四章的内容。

【讲习录】汪卫华:政治科学研究方法导引(之五)

2015-09-04汪卫华

以往推送讯息存目供参考

回复目录或索引或index查阅以往讯息存目

依提示回复相应取阅号即可查阅相应文章

未定文稿,尚在修订之中,欢迎来邮指教,未经本人同意,请勿转载,谢谢。WWH

理论与因果关系

首先我想再次强调,布置给大家的那些文献,希望能够尽可能抽出时间读一读。所谓研究方法,虽然就是那么几条简单的规矩,但真要运用自如,需要一定的逻辑思维能力和实践经验,前面这五篇文献主要解决的是一个逻辑思维的问题——研究方法有许多条条框框,到底它们之间是什么样关联起来的。然后,你学习到的方法要跟你的研究问题、你所要做的工作联系起来,反复操练。我相信各位如果之前没有其他相关知识的积累,阅读这些文献还是有一定难度的,包括一些术语的表达、理解,推论思路,可能理解起来还有费劲。但读不懂也要读,要习惯结合自己的研究问题一点点啃、琢磨,这样才能消化。方法是拿来用的,不是拿来炫耀的,学术训练,在我看来其核心就是训练如何运用方法解决问题。KKV第三章是一个重点,是一个枢纽,后续章节全是为第三章来服务的。我们做一个博士研究课题,一个研究者和一个记者的区别,就在于你对你所研究的对象要提供理论解释,而理论的核心是什么?就是因果关系,英文表述是Causality 或者Causation,也可以说Causal relationship,反正都是因果关系,也有的书上会把Causality翻译成因果性,也可以,但我个人觉得这个性、那个性的太别扭了,还不如说因果关系简单明了。因果关系是理论的核心,理论不回答什么是什么的问题,理论回答为什么的问题。上一次课我说的那三种关系里头,理论要直接的跟你所使用的材料Data之间建立起来联系,而且这是一个反复多次互动的过程。理论和材料之间在现实研究过程中可能有两种情况:一种是你的理论储备很好,你知道了一大堆现在书本上的、前人做的理论研究,但是你的材料不够丰富,如果你的阅读量足够好,那可能你把一个博士论文写得像一篇文献综述,把前人的那些理论归纳整理,在这种方式之上,能不能提出来新鲜的见解,很大程度上取决于你是不是足够聪明。其实你只在里头纠缠逻辑问题了,从概念到概念,从逻辑到逻辑,然后你可能提出来新的概念、新的术语,或者新的猜想,但是这个猜想验证的过程,在你的资料不充分的情况之下,是做不完全的,那么这是好的情况。不好的情况,这篇博士论文顶天就是一本读书报告、读书笔记,因为你提不出来任何新的东西,你只是把前人的东西做一个综述。中间那个状态呢,就是你如同做一道练习题,把别人现成的理论,套在一个看起来也没有什么特别的研究个案上,做一个具体的解释。这种做法当然从训练的角度是可以接受的,但严格来说作为博士论文

的要求,那就远远没有达到创新的要求了。所以,这三种情况,好的、相对比较好的(中间的)、比较差的,这三种情况呢,统一的根源都是因为你的资料没有办法支撑你的分析,这是一大类的情况。

第二大类情况呢,就是你的资料很丰富,但是你的理论储备不足,那么你的文章可能写成一篇类似于报告文学或者类似于长篇纪实的东西,通篇是一个描述。如果你的文笔比较好,然后你写文章也比较清晰,可能写成一篇比较像样的描述性文章,这就是我们第二章所处理的话题。当然从这里头,你抽象不出来太多的理论上的推论,也可能没有什么理论上的结论,但如果报告一个别人不知道的话题,那也是蛮有意思的事情,毕竟我们这个世界上呢,很多东西是在大家想象之外的、直观感受之外的。所谓区域研究Area Studies或者我们常见的“国别和区域研究”这个领域,主要的功能就是跟别人去报告一些别人不知道的事情。其实从学科的角度来讲,国别和区域研究是不称其为一个学科的,它是研究对象,是研究领域field,我们如果看看SSCI社会科学引文索引,这里头有一个类别确实是Area Studies,包括亚洲研究,非洲研究,拉美研究等各个区域的研究期刊。大家熟悉的中国社科院国际片,原来最早是八个所(2013年底又新成立了和平发展研究所),除了世界经济与政治研究所之外,其他的七个所,都是按照区域与国别来划片的,所以笼统的都是叫国际片,像欧洲所、美国所、日本所、拉美所、西亚非洲所,原来的亚太所现在改为了亚太与全球战略研究院,苏联东欧研究所现在叫欧亚所(俄罗斯东欧中亚研究所),这都是按照国别和区域划片的。区域研究也好,国别研究也好,它是一个领域,不是一个学科,它没有自己所谓独立的研究方法,方法是跟学科挂在一起的,你是做经济学的,你是做政治学的,你是做社会学的,各自熟悉的方法与理论是不一样的,把具体的一个学科的方法和理论,带入到某个具体的国别、具体的区域里头,这是你研究的个案。所以,我一直认为,单独去讲再多的某个国家的国情事实,是不足以训练一个学者的,因为缺少了理论上和方法上的储备你就无从去找问题,你的脑子里头也就记住了一些事,但没有理论和方法上的敏感,拎不出来的一个值得研究的puzzle。所以在资料比较丰富,但是你的理论储备不足的情况之下,一个直观的体现,就是你脑子里头想不出问题来,跟一个新闻记者,跟普通老百姓的视角无甚区别。看电视节目,昨天飞机又失事了,普通老百姓看了这种节目之后就会说,以后还是少乘飞机吧,这是我们普通人的观感。但一个专家会这么说呢?他会问为什么飞机会掉,这架飞机失事的原因是什么呀?作为这个领域的专家,更关心的是为什么,原因是什么。要回答这个问题,我们把历次的空难放在一起,看看这是机械故障造成的原因,还是什么样的原因?从机械的角度,从制造的角度,怎么样来提高它的安全性?从管理的角度,看看历次发生的这些飞机故障,到底是哪个环节出了问题?从而提出来改进的建议会是什么样的。作为一个专家,训练有素的态度就是去追问为什么,而且不同领域的专家尽管都是问为什么,但关注的焦点是不一样的,各个领域对同样一个现象的回答都是不一样的。

我相信很多老师上课都会说要有问题意识,但什么时候才能够培养出来你的问题意识呢?就要在理论与资料之间求取平衡。当然,我们最希望看到的是资料也相对比较丰富,理论解释也比较精彩,这样的论文当然是最好,也具有创新性。求其次呢?就我个人的偏好而言,我宁可看到资料比较丰富的研究,哪怕理论解释比较薄弱也未尝不可,为什么?它至少这个东西上给我提供一些新鲜的信息出来,这本书本身尽管没有太多的理论解释,但是满足了我的好奇心,让我知道了一些不知道的事。比如人类学的主要工作就是这样的,根本不讲究形式模型之类的东西,也没那么在意因果关系理论概括。人类学家写出来的作品,很好读,很生动,有不少特异的信息,我们平时不知道。你的研究搜集整理来的信息,如果能够满足人家的好奇心,做出来的东西别人也会有兴趣去看。比如《黄河边的中国》,真正吸引读者的是那里头拎出来的那些活生生的材料。

再求其次,才是你资料不足,拿你理论上的逻辑推演来给人家“洗脑”,因为你资料不足,所以你没办法验证,你的工作可能是提出来一个很有意思的理论假说,也可能给进一步的经验分析提供思路。这样写出来的东西呢,说实话就有点头重脚轻,通俗来讲,根基不稳,下盘不稳。绝大多数人对理论是没兴趣的,专家对理论有兴趣吗?有兴趣,但是他需要你给他总结概括吗?知道的人也许早就知道了,不知道的人你再怎么总结他也是不知道的,无所谓嘛,所以你这样写出来的东西可能只有对你自己有意义——我这念了三年书之后,知道了这么一大堆莫名其妙的理论,莫名其妙的概念,我把它凑成了一个整的东西,仅此而已。最麻烦的一种博士论文,就是里头理论也是不清不楚的,资料也是糊弄的,不客气地说,中国国际关系研究里,大概有半数多的博士论文有这样的问题——我们的门槛实在是低得很。能够有机地平衡理论和材料之间关系的,我估计最多不超过一成。美国的政治学博士论文极好的也不是很多,但是中间的这部分体量是比较大的,原因很简单,方法训练比我们好,你起码知道了什么叫好东西,你哪怕做不出来好东西,但大概知道什么是好东西,起码鉴赏水平还有。我们这里成天给大家吃快餐,你大概就不知道什么叫做好的菜式了,你的鉴赏水平就被拉低了,要做出来好东西,那是不可能的事情。美国政治学的博士训练,管你懂不懂,反正要在方法学习上摸爬滚打,

过了这一关之后,可能做出来的东西不尽如人意,但你的鉴赏能力会提升一点,最后特别差的可能也就放弃了,整体上还看得过去。既没有理论敏感,然后又不花力气去挖材料、挖东西,说实话博士、硕士训练三年的时间,一晃就过去了。到头来老师对学生不满意,学生对老师更不满意,典型的“负反馈”。

所以,总而言之,理论和资料是我们在做研究的时候,最关键的两样东西,然后方法训练就是要告诉你怎么把这两个东西给串起来。

研究要求注重理论上的贡献,所谓理论,其核心是因果推论。这是第三章的主题——因果关系。到底什么叫因果关系,第3.1节这一部分定义了因果关系,大概有的同学还是看得云里雾里。我们姑且把那几个公式放在一边,简单说一说。我希望大家注意几点,首先,因果关系到底有没有,这个事情在科学哲学上还是有争论的。我们要去纠缠因果关系的本体论意义呢,就不好讲了。我们退而求其次,我们不在本体意义上去追问因果关系存不存在,我们只需要看到表现出来的因果关系是什么。中文词里,因果从哪儿借用来的说法,这是典型的佛教术语,因与果,实际上是两个东西,一因一果。但你看英文里头cause是动词,顾名思义因果关系就是什么东西的变化“导致”另外一个东西的变化,“导致”。你把它变成名词形式,Causality/Causation,中文翻成因果关系,词根是从cause来的,也就是说,从经验上面讲,因果关系意味着要观察到至少两个东西在变化,而且一个东西的变化导致了另外一个东西的变化,这个时候我们说这两者之间有因果关系。我们不去追究在本体论上因果关系是什么,我们就说在经验层面上,A导致B,这叫因果关系,A的变化导致了B的变化。我们可以看到变化variation,并且两者各自的变化可以联系起来,相关correlation(注意:因果必相关,相关则未必因果)。

前因后果那两个变的东西叫什么呢?Variable,变量。有几种变量?第3.1节这里头提到的,Dependent variable/ outcome variable,中文翻译成“因变量/ 结果变量”,注意这就是经常发生困扰的东西了,中文叫因果,但是一旦变成变量就费劲了,原因叫自变量/ 解释变量,就是Independent variable/ Explanatory variable;而结果呢,反而变成了“因”变量,为什么用因来翻译它?这里头因当“依”讲,所以这个词还有一种翻法,叫做依变量,我觉得这个翻译其实比因变量更好,但是现在用的不多,还有一个更少见的翻译,叫应变量,你其实从准确程度上来说,依变量和应变量的翻译,比因变量要合适,因为毕竟这个我们现在语汇变化里头,除了因循守旧这个词之外,基本上不会用到那个因的那层意思了,所以容易引起误解混淆的地方就在这儿。那书上呢,如果说我们为了把这个事情说清楚不混淆,那咱们这个书里头又用了另外一种,比较浅明的表述方式,一种叫做解释变量,那与之相对的就是被解释变量,解释变量就是自变量,被解释变量就是依变量。所以有因果关系存在,我们一定要知道是自变量的变化导致了因变量的变化,这是cause,A cause B,然后它们之间的关系,我们说有causality,有因果关系。注意,书上对解释变量做了更加细致的分别:关键因果变量(或treatment variable干预[介入]变量)和control variable控制变量。

怎么样能够论证是自变量的变化导致了因变量的变化呢?首先,千万不能把相关等于因果。是不是确实是A的变化导致了B的变化呢?我们要解释这个“导致”的过程。判定因果效应是否存在,有三点请大家注意:

首先,因果效应是否存在,是通过干预组和控制组的差异判定的,因此,无比较则无因果,要进行有效的比较,必须能够控制其他干扰因素,反过来说,所谓的控制变量,其实质还是在进行精细的分组对照。另外,第3.1.1节举得例子谈到了单位Unit内部的个体差异,还有一种差异是时间差异,这个比较好理解。

其次,与实验室环境不同,经验研究中因果推论的根本问题是我们无从观察到一个确实的因果效应,所以也可以说本质上这是一个反事实推论问题,请大家注意补充看一下论文包里的Fearon (1991)这篇。

再次,本书反复强调的一点是因果效应是概率性的或随机性的,这和确定性的因果关系不同。换言之,概率论视角下,同因可能不同果,因果效应呈现为均值和趋势。这一部分的几个公式推导也是在这样的视角下讲这个问题。

在时间序列上原因是不是一定在结果之前?我认为是的。谢宇教授有一篇文章里提到一个例子,圣诞节即将到来前超市会出现抢购热潮,那么他认为圣诞节这个“因”在时间上是在抢购潮这个“果”之后的。我觉得这个说法不确切,抢购潮的因不是圣诞节,而是人们对圣诞节的预期,这个预期(观念、想法)在抢购潮之前,也在圣诞节之前。

第3.1节分别用定量和定性两个实例解释了因果效应,第3.2节开头给了一个简单总结:当因果变量有两个不同的值时,平均因果效应就是相应被解释变量中系统化部分之间的差别。说实话,这个定义和两个实例的解读又有点简单问题复杂化的味道,估计各位一开始看都没大看明白。在第3.2节,用他们的定义对照解读了其他有关因果关系的界定,包括因果机制、多重因果、对称与非对称因果关系。这里面请大家特别注意“因果机制”Causal Mechanisms也就是因果效应到底是如何发生的。要论证因果关系,从数据上揭示出来是有因果效应还不够,同时要告诉我A怎么就导致B了。比如,A导致了q,q导致了r,r导致了c,c导致了B,你把它一环一环给扣起来,这是因果机制。对于因果机制,KKV书中树的靶子是Little(1991),那本书是挺好的社会科学哲学读物,但似乎没见到有中文译本,不过李丹(Daniel Little)的《理解农民中国》中译本第十章里给出了一个更新版的有关因果机制的说明。时过境迁,最近这十来年有关因果机制的讨论成了一个热门话题,各家的界定都有所区别,John Gerring(2007) 这篇文章里面一下子罗列出来九种涵义,请各位回头看看。我们对因果机制还是用最一般的理解方式:因果效应赖以产生的过程或途径。顺便一提,注意国际关系里通常把International Regime翻译为“国际机制”,此机制非彼机制,不要混为一谈。至于Mechanism这个机制,指“作用机理”,大概是从生物学借来的,经济学里强调“市场机制”,用的比社会学早,至于政治学里流行所谓因果机制解释,也不过就是最近十数年的事情。但不管怎么去界定因果机制,这个解释思路都不同于所谓Hempel科学解释的覆盖律模型(the Covering Law model)。

相关文档
相关文档 最新文档