当前位置：文档库 › 韦氏儿童智力测验第四版的修订及其对智力测验开发的启示

韦氏儿童智力测验第四版的修订及其对智力测验开发的启示

第30卷第6 期宁波大学学报（教育科学版）V ol. 30 No.6 2008年12月 JOURNAL OF NINGBO UNIVERSITY（EDUCATION EDITION） Dec. 2008

韦氏儿童智力测验第四版的修订及其

对智力测验开发的启示

陈海平

（北京师范大学心理学院，北京 100875）

摘要：根据韦氏儿童智力测验第四版（WISC-IV）的重要变动，分析其修订的动因，探讨其对智力测验开发的意义。韦氏儿童智力测验是世界上应用最广泛的儿童智力个别测验，WISC-IV是它的最新版。它的修订源于弥补其理论基础的先天不足，源于临床应用对心理测验结果加强理论解释和实践指导的需要，而新近提出的Cattell-Horn-Carroll theory智力理论及跨系列测评（Cross-Battery assessment）技术为修订提供了基础。韦氏儿童智力测验的发展表明，心理测验的使用价值和理论基础对其发展和完善都至关重要。

关键词：韦氏儿童智力测验第四版；CHC理论；跨系列测评；修订；因素结构

中图分类号：G449.4 文献标识码：A 文章编号：1008－0627（2008）06－0037－06

一、WISC-IV的缘起

韦氏儿童智力量表第四版（WISC-IV）是以6岁0个月到16岁11个月的儿童或青少年为对象，进行认知能力评估、个别施测的测评工具。该量表最早版本脱胎于David Wechsler于1939年出版的“韦克斯勒－贝尔维量表”（Wechsler-Bellevue Intelligence Scale，W-B I），到当今的第四版先后经历了1946年的W-B II、1949年的WISC、1974年的WISC-R、1991年的WISC-III和2003年的WISC-IV几个版本的变革，目前韦氏智力测验已经被译成27种语言在78个国家（地区）使用。[1](1) 20世纪的后半世纪，韦氏测验的智力概念、方法程序对智力测验的开发和研究一直起着示范作用。[2]韦氏儿童智力测验也一直是儿童智力测量领域最受欢迎、使用最广泛的智力测评工具。仅在美国就有数百万学生接受过韦氏儿童智力测验第三版（WISC-III）的测试，用以决定其是否应给予特殊教育。[3]其实，当年韦氏儿童智力测验修订版（WISC-R）的修订目标就是使之成为使用最普遍的儿童个别智力测验。[4]尽管当今可用的个别施测的智力或IQ测验要比历史上任何心理评估和应用测量的时代都多，但WISC在测量儿童智力的理论及应用领域总是有很好的口碑，研究者常常提到它临床效度高、信息丰富、常模质量好、心理测量性能好、应用最广、相关科研文献丰富、应用及解释的经验多等特点。[5](1)

二、修订目标和测验的重要变动

在决定对WISC-III进行修订时，测验开发者就把修订的重点目标确定为：[1](4), [6]

（1）更新和充实测量工具的理论基础；

（2）改进测验结构，加强临床效用，提供更丰富的常模和临床信息；

（3）增加评估流体智力、工作记忆和加工速度的分测验；

（4）降低操作测验的速度比重；

（5）增加测量工具的心理测量学性能；

（6）提高常模样本的代表性；

收稿日期：2008- 06- 10

作者简介：陈海平（1963-），男，浙江兰溪人，北京师范大学心理学院讲师，博士。

38 宁波大学学报（教育科学版） 2008

（7）增加最易题目和最难题目，消除地板效应和天花板效应，避免秃尾常模（truncated norm）；

（8）及时更新常模，避免Flynn效应的积累。

根据这些修订目标，WISC-IV相对于修订后的WISC-III具有了以下的重要变动：[5](21~29), [6]（一）理论基础大幅度充实，对结果的解释能力和对实践的指导价值得到有效增强

第四版韦氏儿童智力测验不仅继承了韦克斯勒关于智力的基本思想，而且吸纳了最新智力理论CHC及其跨系列测评方法的研究成果，使得WISC及其各个分测验对测量目标的定义和解释变得明确而有体系，为测验结果增大解释能力和对实践的指导价值奠定了基础。

实际上，WISC-IV的解释手册提供了各个分测验对应测量的ＣＨＣ理论的各个窄域能力（narrow ability）成分（窄域能力和下节所称的宽域能力都是CHC理论所用的概念，详见后文对CHC理论的解释）。

（二）测验结构有了重大的改变

修订后的WISC-IV结构反映了当前对儿童认知进行评估的理论导向和实践要求，对工作记忆和加工速度给予了更多关注。新版测验共有15个分测验，积木、类同、数字广度、译码、词汇、理解、填图、常识、算术、符号搜索是10个从第三版保留下来的分测验。①为了强调流体推理和工作记忆的测量，增加了图画概念（Picture Concepts）、字母－数字排序（Letter-Number Sequencing）、划消（Cancellation）、矩阵推理（Matrix Reasoning）、词语推理（Word Reasoning）等5个分测验。另外，还删除了旧版测验中的图片排列、拼图和迷津3个旨在测查问题解决能力的操作分测验。这是因为图片排列和拼图非常依赖反应速度，而研究表明迷津的信度、稳定性和效度都比较差。常识和算术改作补充分测验，以减少对学校教育的强调，使得事实记忆（fact memory）对言语理解指数的影响和数学教育对工作记忆指数的影响都要比以前的版本少。

（三）分数报告和解释有了重要改进

最大的变化是取消了言语智商（VIQ）和操作智商（PIQ）的划分，以避免出现过去普遍存在的对言语IQ与操作IQ分数差距的过度解释。以往的研究对这两个分数差值的意义和临床价值一直没有弄清楚。[1](6)

WISC-IV借助因素分析和线性结构方程技术，重新调整了复合指数的构成及其解释。WISC-IV 总共导出五个合成分数：总智商（或称全量表智商，Full Scale IQ，FSIQ）用以表明儿童的总体认知能力，言语理解指数（Verbal Comprehension Index，VCI）、知觉推理指数（Perceptual Reasoning Index，PRI）、工作记忆指数（Working Memory Index，WMI）和加工速度指数（Processing Speed Index，PSI）四个合成分数用以说明儿童在不同认知领域中的认知能力。总智商（FSIQ）从内容到概念都较WISC-III有了相当大的变化，四个指数在总智商中的比重并不均等，其中工作记忆指数和知觉速度指数因为在g因素上的载荷比较低而只占40%的比重，但总智商赋予CHC 智力理论5个宽域能力成分的权重更接近相等了。

除了合成分数，WISC-IV还提供7个过程分数，更准确、更精细地对受测者的认知过程进行描述，它们是不包含速度加分的积木设计分（BDN）、顺序背数（DSF）、倒序背数（DSB）、顺序背数最大长度（LDSF）、倒序背数最大长度（LDSB）、随机划消（CAR）和结构性划消（CAS）。

四个复合指数可以进行再组合。例如，一般能力指数（General Ability Index，GAI）[7]由构成言语理解和知觉推理的六个分测验导出，它的g 载荷高。在某些临床情况下，它比总智商更能表达人的智力潜能。再如，认知熟练指数（Cognitive Proficiency Index， CPI）[8]，该合成分数由构成工作记忆和加工速度的四个分测验导出。它的g载荷虽低，但侧重认知效率，因此拥有独特的临床价值。综合各位学者对分测验和指数的组合观点，我们可以用图1来描述WISC-IV的结构。

（四）许多局部调整和完善

除了常模的更新，题目有了很多调整。除了删除过时的题目，更增加了延伸地板的容易题目和

第6期陈海平：韦氏儿童智力测验第四版的修订及其对智力测验开发的启示 39

图1 韦氏儿童智力测验第四版（WISC-IV）的结构

注：图中中心为总智商，四个象限分别代表VCI、PRI、PSI和WMI四个复合指数及其分别涵盖的分测验，水平线上下分别为指数GAI和CPI及其分别涵盖的分测验。

延伸天花板的难题。此外还有很多锦上添花的完善工作。例如：记分更加简单方便，指导语更加浅显易懂，美工变得对儿童更有吸引力和参与性，增加示范和练习题目，等等。可以说，WISC-IV具有很好的心理测量学特性。[5](29~41), [6]它具有很好的信度和很好的效度。

三、修订缘由分析

从1949年的WISC到1974年的WISC-R，再到1991年的WISC-III和2003年的WISC-IV，中间相隔的时间分别是25、17和12年，修订的间隔越来越短，为什么？实际上，WISC-IV的开发长达5年的时间，[1](3)也就是说WISC-III出版后的第7年就开始了这次修订，这显然不是单纯为了解决Flynn效应[8]问题——常模总体的智商随时间增长的问题。概括起来，修订WISC-III的原因主要有以下几点：

首先，修订WISC-III旨在增强这一智力评量工具的理论基础，增加其对临床诊断和干预的指导价值。尽管有人为包括WISC在内的韦氏系列测验辩解，称韦氏并不缺乏智力理论基础，认为韦氏主张智力是完整的单一结构，与过去几十年来因素分析主张的g因素一致，[9]但测验的理论基础薄弱一直是韦氏测验的致命伤，常遭到一些人的诟病。[10][11](20)韦氏1939年开发韦克斯勒—贝尔维智力量表时，完全是从实用出发，根据自己在军队使用比内—西蒙量表、陆军甲种测验、陆军乙种测验和科斯积木设计测验（Kohs Block Design）等测验的多年经验，把一些实用、施测和记分方便、有临床价值而非只是有理论价值的智力任务汇集到一起，以图开发一个便于使用的高效测试工具，而非想要开发一个完全不同于比内—西蒙传统的测验；他对于智力到底是什么实际很少论述，把测验分成言语和非言语也只是基于他对比内—西蒙智力测验的优点和不足的认识，并非理论上有什么主张，韦氏本人也不是以理论家著称，而更多是以临床专家闻名。[5](4~7),[10]

1991年出版的WISC-III在增强理论基础方面就开始了尝试，原本为增强抗干扰因子（freedom from distractibility， FDI）的心理测量学合理性和临床用途而增加的符号搜索分测验（symbol search），对测验结构产生了没有预想到的影响——测验的因子结构由原来的言语（VIQ）和操作（PIQ）二个因子变成了言语理解（VCI）、知觉组织（POI）、抗干扰（FDI）和知觉速度（PSI）四个因子。[10]因子结构的这种变化正好有助于测验结果的解释，因此被纳入WISC-III的解释体系。

但是，WISC-III在理论方面的这种改进是被动的，是不如人意的。

40 宁波大学学报（教育科学版） 2008

第一，当初修订WISC-R主要出于维持测验题目和常模的时效，消除flynn效应，增加测验的实践指导价值，事前并没有增强理论基础的考虑，四个因子的理论架构只是无心插柳的结果。实际上，据Kaufman，韦氏本人在修订1974年的WISC-R时非常坚持保留原有的结构不变。[12] 第二，更重要的是它没有赶上测验结果解释的第四次浪潮②，以至于它一出版就被一些人批评为“过时了”。[5](7~17), [10]

其次，修订WISC-III也是为了适应时代的进步和形势的发展。随着测验编制技术的进步，很多对智力理解和测量具有重要意义的认知心理学和神经心理学发现相继出现，一些新的智力理论（如J P Das的PASS理论，Sternberg的三元理论，Gardner的多元智力理论等）先后被提出，显然这些理论研究成果和技术进步需要加以吸纳，同时代许多新版智力测验也都相继吸纳这些成果（如K-ABC II；WJ-III）更是说明了这种调整的必要性。另外，临床测评人员十分期待智力测量工具更具深度，更具诊断价值，法庭和公众也要求对智力测验加强审查，等等。

所有上述因素使得WISC-III在出版后不到10年的时间就面临再次修订的迫切需要。[10]

第三，CHC智力理论及其跨系列测评方法为韦氏测验进行理论基础的更新提供了可能。CHC理论（Cattell-Horn-Carroll theory），Carroll称之为三层理论（three-stratum theory），[13]主张所有的认知能力构成一个三个层次的塔形结构：最高的第三层是广域认知能力（general cognitive ability），即一般能力g因素；其次是第二层的10个宽域认知能力（broad cognitive ability），也叫二阶因子（second～order factor）；最下面的第一层是75个具体的窄域能力（narrow ability），也叫一阶因子（first～order factor）。

CHC理论认为，特殊测验或者成套测验的分测验才能比较纯净地测量到窄域能力。CHC理论是McGrew1997年综合两个互补的智力理论提出的说法，一个是1963年Cattell提出、1966年Horn补充修正的晶体—流体智力理论，另一个就是Carroll在1997年提出的三层认知能力理论。[14]以CHC 理论为基础，Flanagan及其同仁发明了一种称之为“跨系列测评（Cross-Battery assessment）”的测评和解释办法。[15~17]这种方法以智力的CHC理论为基础，提出了一系列确保在认知能力测量和解释过程中智力理论与实践紧密结合的步骤和指南，并在使用1997年版Cognitive Assessment System （CAS）、1991年版Differential Abilities Scale（DAS）、1983年版K-ABC、1986年版Stanford-Binet Intelligence Scales Fourth Edition（SB4）、1991年版WISC-III等著名智力测验的专业人士中产生了深入和广泛的影响，并最终在21世纪初酿成CHC风暴，致使WJ III、SB5和K-ABC II几大智力测验以CHC理论为基础进行了修订，WISC-IV的出版也是这一浪潮冲击的结果。[5](7~17) CHC理论是当前最广泛被人接受的、基于因素分析的智力模型，是近些年来智力测量领域的重大进展，得到了相当多的实证支持。[18~19]单由一个理论扮演如此重大的角色，这在智力测量历史上是前所未有的。有人认为它是最全面、心理测量学实证支持最多的认知能力结构理论。[20]

四、启示

首先，WISC-IV的出版乃是顺应心理测量与认知心理学结合趋势的产物。尽管韦氏儿童智力测验相比其他的智力测量工具具有众多的优点而被人们广为采用，但其理论基础薄弱乃是先天不足，一直受人非议。随着科学技术的发展、理论研究成果的积累以及社会的进步，人们对测验结果的认知解释、测量结果对指导教育干预的价值有了强烈的需求，客观上要求心理测验具有坚实的理论基础。一直作为智力测量领域领头羊的韦氏测验在这个问题上无可回避，而20个世纪90年代后期产生的CHC理论及其衍生的跨系列测评技术，正好迎合了心理测验这一时代需求，成为WISC-IV、WJ III等著名测验的理论基础，韦氏测验得以在保留韦氏关于智力乃单一结构的g因素主张的同时，吸纳智力的认知研究成果，调整量表结构，充实测验的理论基础，增强测验结果对实践的指导价值。WISC-IV的出版标志着韦氏测验的理论基础由过去简单的g因素概念转变为CHC理论体系，韦氏儿童智力测验第四版也因此可能成为其历次修订中最重要的一次，并因为这一理论基础的调整，将

第6期陈海平：韦氏儿童智力测验第四版的修订及其对智力测验开发的启示 41

得以因为与WJ III能够共同覆盖CHC理论所涵盖的大部分认知能力成分而实现应用层面的强强联合，从而奠定了其再次领军儿童智力测验的基础。

其次，WISC-IV的出版也说明了在心理测验的开发中理论与实践不可分割。从韦氏测验的发展历程看，智力测验乃至所有心理测验的发展都是出于解决实际问题，这其实是比内开发智力测验的初衷，也可以说是心理测验的传统。但有些学者，特别是心理测验的临床应用人员，奉行简单的操作主义，以为只要测验具有信度和效度就一切OK（很多测验所谓的效度就是简单的预测效度或相容效度，缺乏扎实的构想效度，因此测验对实践的指导价值不强），特别是国内有些人（如那些运用心理测验从事甄选或选拔的人）满足于测验的群体分类功能，根本不考虑测验结果对受测者的指导价值，因此忽视测验构想的理论基础，以致测验滥用和误用。从测验接受者的角度看，加强测验的理论基础和解释能力，应用测验的诊断信息促进测验接受者的发展将会是测验开发需要特别关注的方面。注重测验的理论基础，无形中提高了测验开发门槛，在客观上就可以避免一些测验的误用和滥用。

注释：

①符号搜索（Symbol Search）是要儿童从给出的一组符号中，尽快确定是否存在待检索的目标符号，有时间限制和速度加分。这是韦氏儿童智力测验第三版才有的分测验，由于中国没有WISC～III修订版，所以大多数中国人都不熟悉这个分测验。

②Randy Kamphus及其同仁把智力测验解释的历史描绘成四个浪潮，即总水平量化（quantification of general level）、临床剖析图分析（clinical profile analysis）、心理测量学剖析图分析（psychometric profile analysis）和理论应用（application of theory）。[5]智力测验解释的第四次浪潮，最早可追溯到Kaufman1979年要在智力测验解释过程中把理论和实践结合起来的明确主张，更得益于Flanagan及其同仁发明的一种称之为“跨系列方式（Cross-Battery approach）”的测评和解释办法。

参考文献

［1］WECHSLER D. Wechsler intelligence scale for Children-Fourth edition：administration and scoring manual [M]. San Antonio，TX：Psychological Corporation，2003：1~45.

［2］KAMPHAUS R W，PETOSKEY M D，MORGAN A W. A history of intelligence test interpretation [M]//FLANAGAN D P，GENSHAFT J L，HARRISON P L. Contemporary intellectual assessment：theories，tests，and issues. New York：Guilford，

1997：32~51.

［3］KAMPHAUS R W，PETOSKEY M D，ROWE E W. Current trends in psychological testing of children [J]. Professional Psychology：Research and Practice，2000（31）：155~164.

［4］OAKLAND T，HU S. The top 10 tests used with children and youth worldwide [J]. Bulletin of the International Test Commission，1992（19）：99~120.

［5］FLANAGAN D P，KAUFMAN A S. Essentials of WISC-IV assessment[M]. New Jersey：John Willey & Sons，Inc.，2004.

［6］KAUFMAN A S，FLANAGAN D P，ALFONSO V C，et al. Test review：wechsler intelligence scale for Children–Fourth edition [J].Journal of Psychoeducational Assessment，2003（8）：278~295.

［7］PRIFITERA A，SAKLOFSKE D H，WEISS L G，et al. The WISC-IV in the clinical assessment context [M]//PRIFITERA A，SAKLOFSKE D H，WEISS L G. WISC-IV clinical use and interpretation：scientist-practitioner perspectives. New

York：Elsevier，2005：3~32.

［8］FLYNN J R. IQ gains over time [M]//STERNBERG R J. Encyclopedia of human intelligence. New York：Macmillan，1994：617~623.

［9］SAKLOFSKE D H，WEISS L G，BEAL A L，et al. The wechsler scales for assessing children’s intelligence：past to present [M]//GEORGAS J，WEISS L G，V AN DE VIJVER F J R. Culture and children’s intelligence：cross-cultural

analysis of WISC-III. San Diego：Elsevier Science，2003：3~21.

［10］THORNDIKE R M. Would the real factors of the Stanford-Binet forth edition please come forward? [J] Journal of Psychoeducational Assessment，1990（8）：412~435.

［11］FLANAGAN D P，GENSHAFT J，HARRISON P L. Contemporary intellectual assessment：theories，tests，and issues [M].

New York：John Wiley & Sons，1997.

［12］KAUFMAN A S. Intelligence testing with WISC-III [M]. New York：John Wiley & Sons，1994.

42 宁波大学学报（教育科学版） 2008

［13］CARROLL J B. The three～stratum theory of cognitive abilities [M]// FLANAGAN D P，GENSHAFT J L. Contemporary intellectual assessment：theories，tests，and issues. New York：The Guilford Press，1997：122~130.

［14］MCGREW K S. Analysis of the major intelligence batteries according to a proposed comprehensive Gf-Gc framework [M]// FLANAGAN D P，GENSHAFT J L. Contemporary intellectual assessment：theories，tests，and issues.New York：Guilford.

1997：131～150.

［15］MCGREW K S，FLANAGAN D P. The intelligence test desk reference（ITDR）：Gf-Gc cross-battery assessment [M].

Needham Heights，MA：Allyn & Bacon，1998.

［16］FLANAGAN D P，ORTIZ S O. Essentials of cross-battery assessment [M]. New York：Wiley，2001.

［17］THORNDIKE R. M. Book review：essentials of cross-battery assessment [J].Journal of Psychoeducational Assessment，2003（21）：93~96.

［18］COHEN A，FIORELLO C A，FARLEY F H. The cylindrical structure of the wechsler intelligence scale for Children IV：a retest of the Guttman model of intelligence [J]. Intelligence，2006，34：587~591.

［19］WASCHBUSCH D A，DALEIDEN E，DRABMAN R S. Are parents accurate reporters of their child’s cognitive abilities? [J].

Journal of Psychopathology and Behavioral Assessment，2000（22）：61~77.

［20］ALFONSO V C，FLANAGAN D P，RADWAN S. The impact of the Cattell–Horn–Carroll theory on test development and interpretation of cognitive and academic abilities [M]//FLANAGAN D，HARRISON P L.Contemporary intellectual assessment：

theories，tests，and issues（2nd ed.）. New York：Guilford，2005：185~202.

Upon the Revision of WISC-IV and its Implication for the Development of Intelligence Test

CHEN Hai-ping

（College of Psychology, Beijing Normal University, Beijing 100875, China）

Abstract: The essay is exploring the motive and implication of the revised WISC-IV in children’s intelligent development. As worldwide use of children’s IQ, the latest revision, based on the new Cattell-Horn-Carroll theory and Cross-battery assessment, has filled certain gaps in its theoretical foundation, and met the needs of practical application in clinic psychological tests. The progress of the WISC shows the significance of the applied values and the theoretical basis of psychological tests.

Key words: WISC-IV；CHC theory；cross-battery assessment；revision；factor structure

（责任编辑赵蔚）