文档库 最新最全的文档下载
当前位置:文档库 › 第七章抽样

第七章抽样

第七章抽样

本章讨论抽样。对抽样的统计学原理我们不作详细介绍,重点讨论抽样的过程和具体的操作。

抽样是一项非常重要的技术,在自然科学和社会科学的各个领域广泛运用。自然科学方面包括化学、天文学、机械工程学和动物学等。在社会科学研究中,抽样技术可用于实验、调查、内容分析等研究。

7.1 抽样原理

7.1.1 为什么要抽样

抽样是从一大批研究对象中选出一小群作为研究对象,如从20000人中选出150人。

用抽样方法获得的研究对象称为样本(sample)。研究中用样本作为具体操作对象比用所有对象要经济得多。然而研究者感兴趣的不仅仅是样本,他的目的是以小见大,希望把从样本得出的结论推广至全体研究对象。

“管中窥豹,可见一斑”。数学理论和科学研究的实践业已表明,抽样是非常有效的技术。如果使用正确,两千多个个体的样本,可有效地代表有两亿个成员的研究对象总体,出错的概率不超过百分之二到四。

这种以小见大,以少胜多并非无稽之谈,而是有缜密的统计学原理为依据,并已一再被经验证据所证实。

并非所有样本都可使结论推而广之,抽取样本必须遵守严密的程序,而且从任何样本得出的结论都必须附带说明,表明其局限性。

7.1.2 总体、个体和抽样框架

研究者从一大批研究对象中抽取样本。这些研究对象是一个个的个体(elements),有时称作个案(cases),可以是个人、群体或组织,也可以是信息、文档,甚至是社会行为(如离婚、吸毒、乱扔垃圾)。这些都是研究者拟测量或可以测量的事物。拟定研究对象的全体叫做总体(population)或全域(universe)。

总体是抽样的基础,必须严格界定,没有定义清晰的总体就谈不上抽样。总体有三个要素:内容、范围和时间。内容即组成总体的个体单位是什么:人、物还是机构等;范围即总体所处的空间界限,包括地理位置;时间即总体存在的时间界限。表7.1举例说明了抽样的个体单位(人、企业、医院住院人次、商业广告),地理位置和时间界限。

表7.1:总体的例子

1.所有年满18岁(含)以上、2016年12月31日居住在上海市市内并有上海市居民户口的成年人,不包括被监禁和劳教人员。

2.所有雇员10人以上、2016年6月在深圳市开业的国外独资企业。

3.从2016年7月1日至2017年6月30日期间江苏省所有县级以上医院收住的病人人次。

4.从2017年1月27日至2月2日期间,中央电视台一套节目在晚间7:00到9:00播放的所有的电视广告。

5.全国在1970年8月至1977年8月期间获得大学专本科医学学历目前仍在从医的人员。

6.2016年云南省所有吸食海洛因的人员。

研究者对研究的总体一般先有一个初步的设想(如一个城市所有的人口),然后对具体的总体再作出更为精确的界定。最后确定的总体称为对象总体(target population)。样本的大小和对象总体规模之间的比值叫做抽样比例(sampling ratio)。假如从一个50000人组成的总体中抽出150人的样本。抽样比例为150/50000=0.003,或百分之0.3。假如总体是500,抽取的样本是100,抽样比例则是100/500=0.2,或百分之20。

总体实际上是一个抽象的概念。为什么总体有具体的数字但却把它看作是抽象的呢?因为除了极小的总体,一般的总体是很难确定准确的规模的。如一个城市的人口,

在任何特定的时刻,它的总量总是在发生变化。有人降生,有人去世,有人坐各种交通工具进入或者离开。在我国,一地的人口一般指的是具有户籍的常住人口,在有关的时刻正在外地工作生活的人也算在内。即便有户籍登记为依据,精确地查明瞬时人口的确切数字也几乎是办不到的事情,各种不确定因素很多。越是大的城市越是如此。

由于总体是抽象的概念,研究者有必要对总体作出估计。抽象的概念却需要具体的测量,因此有必要给总体下操作定义。

怎样才能使总体具有可操作性呢?研究者应首先设法开列一个名单,尽可能包括总体中所有的个体。这个名单就是抽样框架(sampling frame)。抽样框架包括户籍登记(以住户或个人为个体)、企业名册(把企业作为个体)、手机号码(对象总体所有成员都拥有手机)、学校花名册,等等。在美国,研究者可使用驾驶执照注册资料作为抽样框架,因为美国的成年人几乎人人都开车。这点在中国目前还做不到。

要获得成功的样本,好的抽样框架十分关键。抽样框架与概念上界定的总体如不一致就可能产生无效抽样。因此,糟糕的抽样框架是抽样出错的主要原因。然而,要找到完美的抽样框架极不容易,更何况有些对象总体根本没有可供参考的清单。类似学校花名册这样完美的框架并不多。在美国,有人把电话号码作为抽样框架,然而美国有很多人不愿公布自己家庭的电话号码,而且电话号码每天都在变动,有人搬进或者搬出某一住处。除非研究对象就是那些在电话簿上登出号码的人,否则电话号码不能作为框架。

对象总体的任何性质或特点称为总体的参数(parameter),如城市居民吸烟人口的百分比、16岁以上妇女的平均身高。严格说来,总体的参数只有在检测完所有个体的时候才能获得。但是对于大型的总体(如一个国家的人口),我们永远无法获得绝对精确的参数。因此研究者只能依靠样本来估计。研究者根据从样本获取的信息来推断总体的参数。有关的统计推断技术我们将在第十六章介绍。

有一个典型的例子可说明正确使用抽样技术的重要性。早年在美国有一家杂志叫做《文粹》(The Literary Digest)。1920、1924、1928和1932总统大选前,该杂志分别给选民寄去明信片,询问他们选谁当总统。他们利用汽车注册登记和电话号码簿做抽样框架。这四次选举该杂志的预测完全正确,杂志的名声因此大振。1936年,他们将样本扩大至一千万人,调查结果预测兰登将击败福兰克林·罗斯福。然而最终却是罗斯福获得了压倒性胜利。这次预测的错误有几个原因,但最主要的问题出在抽样上。尽管杂志选择了一个很大的样本,可是样本没能准确代表对象总体,即所有的选民。他们的抽样框架将当时未拥有汽车和电话的选民排除在外。在30年代的大萧条中,这种人口的比例在美国高达百分之六十五。当时这些低收入的人拥护罗斯福当总统。该杂志先前的成功是由于那时低收入和高收入人群在选择总统上没有大的分歧,而且因为不是处在大萧条中,拥有汽车和电话的人口比例比30年代后期要大。

这个例子告诉我们两点。首先,抽样框架至关重要。第二,样本的代表性比它的大小更为重要。据信,一个有代表性的2500人的样本对全美人口所能作出的预测,要高于一个不具代表性的一千万甚至五千万人的样本。

7.2 非概率抽样

根据是否按照概率论的随机原则进行操作,抽样可分为两类: 非概率抽样

(non-probability sampling)和概率抽样(probability sampling)。按照概率论原则所做的抽样有强有力的数学理据,较为精确。不按概率论原则办事的抽样有局限性和缺陷。研究者选择后者可能是缺乏时间或身处特殊条件之下,抑或缺少随机抽样的知识。除非万不得已,研究者都应该使用概率抽样。

7.2.1 简便抽样

简便抽样(convenience sampling)会产生没有代表性因而根本无效的样本,建议不要采用。如果图方便省事随意找来一个样本,那么这种样本可能完全不能代表对象总体。唯一的好处是代价低、速度快,但由此产生的偏差会引起误导,甚至很严重。电视台记者带着摄像机和话筒在城市大街上随意采访行人就是这方面的一个例子。这类受访问者不具有代表性。譬如这类人不包括不常外出和家住农村很少进城的人。此外,采访的记

者往往选择他们认为“合适”的对象进行采访,忽略那些其貌不扬、年岁较大、或者看上去反应迟钝的人。

再如,有的报纸或杂志要求读者剪下调查问卷填好后从邮局寄去。并非所有的读者都对有关的主题感兴趣、或者有时间去做剪报的事。那些感兴趣并有时间应答的人数可能不在少数,如多达数千人。尽管如此,由此得出的结论不可用来推测总体的看法。类似的调查结果可作参考,但不可当真,因为它反映的只是感兴趣并有时间应答的人群的观点。

7.2.2 配额抽样

配额抽样(quota sampling)较随意抽样是一大改进,但它仍然是抽样的弱类型。在做配额抽样时,研究者首先确定类别,如男性和女性,30岁以下、30岁至60岁、60岁以上,然后决定每个类别抽取多少个体。每个类别的人数是固定的,如在一个四十人的样本中,30岁以下男女各5名,30至60岁男女各10人,60岁以上男女各5人。这种做法和随机分组中的配对相似,无法准确代表总体所有的特性。

由于研究者确保样本反映总体成员之间的一些差异,配额抽样优于随意抽样,因为随意抽样获得的样本可能来自同一年龄同一性别或者同一职业。然而,使用配额抽样的研究者在确定类别和每类人数以后,有可能使用随意的方法选定具体的人选,如采访他最先遇到的5个30岁以下的女性。这5个女性在某些方面可能非常相似,比如都是大学生,或是一块逛街的同事。在随意选择各类别的成员时,研究者同样有可能只挑选那些看上去愿意合作、善于言谈的人。

美国著名的盖洛普民意调查结构,曾准确预测了1936、1940、1944三届美国总统选举,但在1948年却没能成功。其中一个重要原因是配额类别没能准确代表地方和所有的选民。

配额抽样虽然有缺陷,但它比概率抽样经济,省事,速度快。在概率抽样中,研究者必须准备抽样框架,并且设法找到特定的个人。这些人有可能找不到,即便能找到,他们也有可能拒绝合作。

7.2.3 目的或判断抽样

定量研究一般避免使用随意抽样和配额抽样。在特殊情况下,可使用目的抽样(purposive or judgmental sampling)。研究者头脑中带有特殊的目的、或根据专家的判断来选择个体。这种方法不适用于选择如“普通大学生”或“一般的学校”。所选的个体是否具有代表性,研究者不得而知。这种方法通常用于探索性研究和实地研究。

目的抽样适用于三种情形。第一,用这种方法可选择那些有特点、有信息价值的个体。例如,研究者打算调查近期杂志中出现的某个文化主题,有必要作内容分析。他选择某家流行的妇女杂志作为取材对象,因为这家杂志代表时尚和潮流。

第二,用目的抽样可从那些通常难以接触、特殊的人群总体抽取样本,如卖淫嫖娼者或吸毒者。把所有卖淫者列出名单然后进行随机抽样无法做到。研究者因此转而利用其他途径,如卖淫者出没的场所和其他知情人,也可依靠当地的派出所,目的都是为了找到尽可能多的调查对象,形成研究用的“样本”。七十年代美国有个社会学家叫道格拉斯·哈珀(Douglas Harper), 他与流浪汉交朋友,与他们一同住在长途运行的火车上或贫民窟里,用实地考察方法研究流浪汉。

目的抽样的第三种情形是对某些特别的个体做深入的考察。其目的不是为了将结论推及更大的人群和范围,而是深入细致地了解所选定的样本本身。

7.2.4 滚雪球式抽样

“物以类聚,人以群分”,社会化的人都处于这样或那样的网中,如朋友圈、联谊会、学术团体等,互相之间有联系。王二有朋友张三,张三有朋友李四,王二也许不认识李四,但通过张三他们联系在一起。不管是否互相认识,他们由于共同的背景、兴趣或利益联系在一起。这种网有的小,如两、三个人的扒手集团;有的大,如全世界搞某个共同课题的科学群体。

研究者可利用这样的网,找到若干个体,形成自己的研究样本。这就是滚雪球式的

抽样(snowball sampling)。象滚雪球一样,研究者通过王二找到张三,又通过张三找到李四。如研究一个城市中企事业单位的高级主管,约见某经理,可让他介绍他所认识的其他经理,再约见、再介绍,如此形成需要的样本。

7.3 概率抽样

概率抽样又称随机抽样(random sampling)。概率论建立在随机过程的基础之上。随机一词在数学中有特殊的含义。抽样是一种随机选择。在随机选择中,所有待选个体都有同等的机会被选上,哪些中选,哪些落选,完全听由机遇决定。民间的抓阄就是一种随机选择。在概率抽样中,研究者可计算有关的概率,或说明抽样的精度。

下面我们介绍五类概率抽样。

7.3.1 简单随机

简单随机抽样(simple random)是概率抽样最基本的方法。研究者首先准备好尽可能完善的抽样框架,然后用数学中的随机程序选择个体,再设法找到这些被选的个体,组成样本。

具体来说,简单随机抽样有好几种做法。例如可将框架中所有个体编号。然后参照随机数表,选择受试。所需随机数数量等于框架中个体的总数。如100名个体需要100个随机数。一般的统计学书籍都附有随机数表。很多计算机软件都能产生随机数。随机数由完全随机的过程产生,任何数字都有相同的机会出现。

常有人问,“在抽样时,从抽样框架中已选出的个体,有没有必要放回框架后再继续?”一般不必。只有非限制性的随机抽样(unrestricted random sampling)才放回已选个体,以便有机会重新被选上。普通的简单随机抽样,已选入样本的个体不必再放回框架。

简单随机抽样的原理可用一个基本的例子来说明。一个罐子里装有5000只红色和白色的弹子。这5000只弹子是总体,需要估测的参数是其中红色弹子的百分比。从罐子中随机取出100个弹子(摇动罐子使弹子充分混合,闭上眼睛,从中取出一个弹子,然后不断重复这个过程直至取出100个弹子)。这是一个随机选择的样本。分别数一下样本中的红白弹子的数目,以便估计总体5000个弹子中两种颜色的比例。结果是白色52个,红色48个。

这是不是意味着红色弹子占总数的百分之四十八呢?没准。由于随机的性质,抽取的这个特定的样本可能有误差。把100个弹子倒回罐中,充分混合后抽取第二个样本。这次是白49,红51。到底哪个样本更准确呢?于是一次又一次重复整个过程,共抽出130个包含100个弹子的样本,所有的结果记录在案(见表7.2及图7.1)。

这130个样本呈现出清楚的格局。最常见的混合是50对50。接近这个比例的样本数量显然多于距离这个比例远的。由此可以断定,5000个弹子中,红色弹子和白色的一样多,各占百分之五十。

表7.2:弹子的样本分布

从总体为5000的红白两色弹子中,随机抽

取130个互相独立的样本,每个样本的大小为

100。

红色弹子白色弹子样本数

42 58 1

43 57 1

45 55 2

46 54 4

47 53 8

48 52 12

49 51 21

50 50 31

51 49 20

52 48 13

53 47 9

54 46 5

55 45 2

57 43 1

总数130

图7.1:弹子的样本分布

数学证明和经验检测表明,类似表7.2的格局一再出现。大小相同互相独立的许许多多样本形成了样本分布。不同样本出现的频率总是呈现以上的方式。反映或者接近总体真正参数的样本数量出现最多,与总体真正参数离差大的样本数量少。差异越大,数量越少。无论样本有多大,如不是100而是120;也无论弹子的颜色有几种,如十种而不是两种;也不管总体有多大,是5000还是300或一亿,都会出现上述格局。而且这种趋势随着独立样本数量的增加而愈益明显。如果将结果用条形图的方式形象地表示(如图7.1),我们发现样本分布条形的外缘连接线象一口倒扣的钟。这条线叫做正态分布曲线。随着独立样本的数量不断增大,曲线将趋于平滑,钟形愈加明显,曲线的对称轴是总体参数平均数、中数等的所在位置。

很少有研究人员会抽取一个以上的样本,但统计学的理论使我们能够从一个样本推测整个总体的情况。我们可根据一个特定样本提供的信息来估计总体的参数值,并可估算出离开真实情况有多远。有关正态分布的性质和用途我们在第十六章中还要详细论述。

从弹子一例可看出,抽样不能保证每个样本都完美地代表总体,但随机抽样意味着大部分独立样本会接近总体的面貌。我们可用一个样本提供的信息来推测许许多多样本分布的情况,并可确定该样本偏离总体参数(或者说不具代表性的程度)的概率有多大。这个信息加上统计学的有关知识可使研究者建立所谓的“置信区间”(confidence interval)。

置信区间是围绕某一点的一个范围,可用来推测总体参数。如我们说某项研究的误差大约是正负百分之二,这就是置信区间的一种表述方法。置信区间非常有用。由随机过程形成的统计数字不能准确地预测总体参数,但可让研究者较为肯定地(如有百分之九十五的把握)说出真正的总体参数处于多大的范围之内。

本书不打算讨论抽样误差和置信区间的计算方法。样本分布是计算这两个值的依据。研究者虽然不可能说他的样本可百分之百地预测总体的某个参数,但可以说:“我有百分之九十五的把握,从样本得到的发现与真正的总体参数,其偏差不会超过百分之二。如弹子一例,我们不能断言“根据这个样本,罐子中必定有2500个红色弹子”,但可以说,“从这个样本判断,我们有百分之九十五的把握,罐子中红色弹子的数目在2450到2550之间。”

7.3.2 系统抽样

系统抽样(systematic sampling)在随机选择上走捷径,但也是一种概率抽样。第一步同样需要将抽样框架中的个体分别编号,但下一步不用随机数方法选取样本。研究者

确定一个抽样的区间K,确定每隔多少个体选择一个个体。如打算从1000人中选择10人,K为1000/10=100,即每100个个体选取一个。1000个个体总共有10个抽样区间。在第一区间内必须用随机方法选取任意一个个体,可用随机数、也可用抓阄方法确定。假定选中的是13号,则下一个区间被选的应是13+100=113号,再下一个是213号,如此类推,直至选满10个为止。假如第一次选中的是75号,那么第二次要选的就是175号。

抽样区间很容易计算。首先知道样本的大小和总体的大小。如无法知道总体确切的大小,可用抽样框架作为最佳的估计值。抽样区间是样本与总体大小比值的倒数。上例样本和总体的比值是10/1000=百分之1。抽样区间是100。

在大多数情况下,由简单随机和系统随机抽样获得的结果几乎一样。但在个体排列具有规律性或周期性的情况下,系统随机法不能用来取代简单随机法。比如有一个抽样框架由已婚的夫妇组成,排列的顺序全是丈夫在前妻子在后,或全是妻子在前丈夫在后,这时如抽样区间为偶数的话,所选择的样本必然全由丈夫或妻子组成。

7.3.3 分类抽样

在分类抽样(stratified sampling)中,研究者根据有关信息先将总体划分成若干类别,然后从各类别随机抽取个体组成总的样本。在各类别中,既可采取简单随机法又可使用系统随机法。分类抽样是由研究者而不是随机过程控制每个类别的大小。研究者用这种方法确保各个类别在样本中都能有所代表,以提高抽样的精确性。至于到底分几个类别,各个类别的占比究竟应是怎样,需尽可能找到可供参考的信息。

一般来说,假如有关类别的信息准确无误,分类抽样比简单抽样产生的样本更具代表性。如有一个总体,女性比例是百分之五十一,男性是百分之四十九。用分类抽样,研究者可确保样本中性别比例与总体一致,而用简单随机法则不一定。如此可减小抽样误差,提高精度。

当研究者感兴趣的某个类别占总体的比例较小时,用简单抽样法可能抽取不到其中的个体,因此错失有关的信息。比如在某个综合大学里有20000个学生,其中百分之二是少数民族学生,即400个。现决定从全校大学生中抽取一个200人的样本,占比百分之一。在这个样本中,按百分之一的比例,少数民族学生将有4人。如果放任机遇来决定,他们可能一个也选不上,从而使样本的代表性产生偏差。为避免这类情况发生,研究者可用学校少数民族学生的花名册,从400人中随机选取4人,以确保这个类别在样本中有所代表。

表7.3是分类抽样的另一个例子。按照医院各类人员的比例,从管理人员15人中随机抽取3人,从内科医生25人中抽取5人,等等。

表7.4把简单随机法与分类法进行了比较。分类抽样法按照不同职位所占的比例抽取样本,样本因此具有代表性,用简单随机法抽取的样本其代表性可能不及它。表的最右列表示简单随机法与分类抽样法相比在各类抽取个体数目的差异,+号表示多于,-号表示少于。

表7.3:按职位分类抽样的普通医院职员样本

总体样本

职位人数百分比人数百分比

管理人员15 2.38 3 3

文秘75 14.42 14 14

内科医生25 4.81 5 5

外科医生25 4.81 5 5

护士100 19.23 19 19

卫生员100 19.23 19 19

器械技工75 14.42 14 14

勤杂工50 9.62 10 10

维修工30 5.77 6 6

其他25 4.81 5 5

总数520 100.00 100 100

表7.4:简单随机法和分类法比较

简单随机法分类法

职位抽样人数抽样人数前者与后者的差异

管理人员 1 3 -2

文秘15 14 +1

内科医生 2 5 -3

外科医生 6 5 +1

护士22 19 +3

卫生员21 19 +2

器械技工19 14 +5

勤杂工8 10 -2

维修工 3 6 -3

其他 3 5 -2

总数100 100

7.3.4 分簇抽样

在大型社会调查中常使用分簇抽样(cluster)。与其他概率抽样相比,它最为经济,也便于操作。分簇抽样尤其适用于那些数量不易确定,无法形成抽样框架的对象总体,如一个城市的居民,一个国家所有的中、小学教师等等。

分簇抽样首先是把对象总体分成若干层次。底层以上的任何一层都由大小不同的簇组成,以首层的簇最大。而底层包含最终成为样本成员的个体。从上到下,抽样在各个层次上依次进行。底层以上,被抽取的单位实际上是大小不等的簇。最后从底层抽取的才是样本需要的真正的个体。

比如我们需要抽取一个有某市市民组成的样本。首先我们把这个城市现有的行政区作为簇,根据需要并考虑到代表性,从中随机选择3个区。接着我们把这3个区的居委会(居委会代表一个个街道或住宅小区)作为簇,从中随机抽取若干组成居委会样本。然后我们列出所有这些居委会管辖街道的住户名单,从中随机抽取若干住户,再按一定的要求从每户选取一人组成最终需要的样本。

分簇抽样有两个好处。首先,虽然由个体组成的抽样框架可能并不存在或很难获得,但簇的抽样框架却相对容易找到。一旦簇被选定,各个簇中的个体抽样框架就比较容易形成。另一个优点是,分簇抽样的个体比不分簇抽样的个体相互间在地理上要接近,与他们联系比较经济。

在分簇抽样中,研究者实际上分阶段抽取多个样本。在上例三个阶段的抽样中,第一阶段随机抽取大簇(行政区),第二阶段在选定的大簇中随机抽取小簇(居委会或街道),然后在第三个阶段在小簇的样本中随机抽取个体。

分簇抽样通常比简单随机抽样经济。在地理范围大的区域实施调查并且必须与受试直接接触,用分簇抽样可节省费用。然而这种方法不如简单抽样法精确。抽样过程的每个阶段都会产生误差,多级抽样产生的误差大于一级随机抽样。

使用分簇抽样,必须确定应抽取的簇的数量和簇内个体的数量。比如在一个最终样本为240人的两级抽样中,研究者可有两种选择。一是首先随机抽取120个簇,然后从每一簇中随机抽取两人。另一方法是随机抽取2个簇,然后从每一簇中抽取120人。哪种方法好?一般宜选择簇数多的为好。因为同一簇中的个体具有更大的共性,如在同一个居委会管辖范围居住的居民其社会文化经济背景可能更为接近,如某个街道居住的大部分是文化人,另一些街道居住的则是普通职工。这时的抽样适宜使用簇数多的方法,比如以街道为簇进行抽样,以便对不同性质的街道分类处理。

在分簇抽样中,节省开支和提高抽样精度常常相互冲突,很难兼顾,如何权衡颇费思量。这里举一例加以说明。

有甲、乙、丙三人为了完成某项针对全国大学生的调查,各自打算选取450个大学生进行访谈。这450个大学生组成代表全国所有大学生的样本。甲打算使用简单抽样法,他因此需要旅行去往300个不同的地点以便和他选中的450人访谈。乙决定从所有900所

大学中随机选取3所,然后从每所抽取150人组成样本。丙则抽取90所大学,从每个学校各抽取5人组成样本。假如每赴一地的开支是1000元,甲的旅行开支将达300000元,乙的花费将是3000元,而丙的开支则是9000元。三人中,数甲的样本代表性最高,但花费最大;丙的样本精度略低,开销适中;乙最省钱,然而他所获得的样本代表性最低。

有关分簇抽样,还有两样技术需要介绍。

(1)户内抽样。住户在分簇抽样时被选中后,研究者面临抽取哪个成员参加样本的问题。假如决定选择首先给研究者开门、接电话或回信的人,由此组成的样本可能有偏颇。各家各户首先开门、接电话或回信的人可能都属同一类人,比如都是男人,通常是丈夫。另一种情况是,登门做家访的人,可能会选态度和善的人作为受访人。这也会使样本出现一定的偏向。

避免上述偏差有好几种办法。最常见的是在了解所选定住户的成员组成后,拟定一个选择表格,明确各户由谁入选,如最年长的男性,最年轻的成年女性等。

(2)依据簇的大小按比例抽样。分簇抽样有两类情况。一种是在抽样的各个阶段,簇的大小相同或假定它们相同,最后从各簇选取的个体数目一样,如上述有关大学生的调查。这种分簇方法假定簇与簇之间大小相等,并无轻重之分,因此从中抽取样本个体的比例全都一样,不经加权。然而在实际生活中常见的是另一类情况,簇之间大小不等,这时有必要在抽样的各个阶段调整比例,以使样本具有直正的代表性。

仍以大学生调查为例。丙的抽样在开支和样本精度之间找到了一个平衡点,但是细究起来还有问题。这就是大学与大学之间的学生人数不尽相同。各校规模不同但被选中的概率却一样(90/900=0.1,即百分之十的机会)。然而这样一来,校与校之间学生被选中的概率却不均等了,小学校的学生被选中的机会大,大学校的学生机会反而小。按每校抽取5人计算,有2000学生的学校,各生被选的概率是5/2000=0.0025,即1/400;而有20000人的学校,各生被选的概率却只有5/20000=0.00025,即1/4000。后者只有前者的1/10。丙因此违反了概率抽样一条最基本的原则,即总体中每个个体被选入样本的概率应该均等。为了纠正这一偏差,丙必须根据各校人数首先调整各学校被选入第一阶段簇的样本的概率。

7.3.5 随机数字拨号

随机数字拨号(RDD)是在西方使用的一种特殊的抽样方法。依靠这种技术,研究者用打电话的方式调查大众对某个事物的看法。传统的电话调查利用电话号码簿作为抽样框架,抽取样本后按号码打电话询问,而随机数字拨号不用电话号码簿作抽样框架。

用电话号码簿作抽样框架会遗漏三类人:没装电话、最近搬了家或那些不愿公开自己电话号码的人。在西方发达国家,电话普及率已经达到百分之九十五,不装电话的穷人已经很少。然而随着电话的普及,由于各种原因不愿公开自己电话号码的人数也相应增长。在美国,人们只需交一笔钱就可避免将电话号码列入公共电话号码簿。据了解,在美国一些大城市的市区,未列入电话号码簿的居民高达百分之四十。

使用随机数字拨号技术可避免用电话号码簿作框架带来的一系列问题。随机数字拨号技术的对象总体是所有的电话号码,不是装电话的人。随机数字拨号在美国的具体做法如下。

美国的电话号码分为三个组成部分。第一部分是三位数的地区码,接着是三位数的交换台或中心局号码,最后是四位数的用户号码。如805是一个地区码,在它下面有若干的交换台码,如675、893、767等。但是在这一段并非所有从001至999的号码全都已用上,即没有那么多的交换台或者中心局,有些号码是空号。同样,最后四位数也并非所有从0001至9999的号码全都有用户在使用。有些号从未有人用过,有的用过但已废止,再有的是暂时停用。

使用随机数字拨号方法时,研究者首先确定地区码和确实存在的交换台码,然后用随机方法拨余下四位数组成的任意号码。这时除了遇到空号即无用户的情况以外,所拨号码也有可能是企业号码或是公用的付费电话号码。这三种情况都无效,有效的是住户电话。据说在所有号码中,只有百分之二十二的电话是有人使用的住户电话。如用人工

拨号,效率非常低,这类抽样不可能实现。因此,用随机数字拨号技术必须依靠计算机,以便迅速跳过那些空号。即便如此,对那些有响应的号码,仍需有人在一旁监听,以确认对方是不是住户电话。

要注意的是,随机数字拨号找到的是电话号码,不是一个个住户或个人。这是因为,几个人或几家人可能共用一个电话号码。另一种情况是,一个人或一家人可能用几个电话号码。这就是说,一旦形成电话号码的样本以后,还需进行第二个阶段的抽样,确定具体调查的对象。

7.4 样本该有多大?

样本的大小只能视情况而定。需要考虑的因素包括:数据分析的性质,研究目的对精度的要求以及对象总体的特征。上文已经说过,样本并非愈大愈好,关键是具有代表性。

确定样本的大小有两种方法。一是对对象总体作出估计,然后运用随机抽样过程的统计学技术确定需要多大的置信区间,即容忍多大的误差。

第二种方法是用估摸的办法,即按通常可接受的程度确定样本大小。估摸的办法不是随意的,须以屡试不爽的经验为依据,实践证明符合统计学的要求。

确定大小的一个原则是,总体越小,要获得精确的样本,抽样的比例应越高。样本精确的意义是它具有高度的代表性,研究这类样本极可能获得与研究总体一致的结果。

在总体很大的情况下,抽样的比例反而可降低。这时样本比例大固然没有坏处,但一味的增大对精度的回报已不明显。从经济角度考虑,可尽可能用较低的比例。研究成本无疑是决定样本大小的一个重要因素。

1000个个体以下的总体,为获得精度较高的样本,抽样比例应高达百分之三十。较大的总体如10000个个体,抽样比例可小一些,约百分之十。大型总体如个体数在150000以上,可按百分之一的比例抽样。对150000个个体的总体,1500个个体组成的样本可有相当不错的精度。至于超大型总体(个体数目在一千万以上),抽样比例低至0.025%即可,一千万人总体的样本只需2500人。

在抽样比例很低的情况下,总体大小已并不十分重要。据信,2500个个体组成的样本对一千万或两亿人的总体几乎同样有效。

与上述原则相关的原则是,对小型样本来说,样本规模稍稍增大即可大幅度提高精度。相同的样本增益,小样本比大样本在提高精度方面要显著得多。如,样本从50增至100可使误差从7.1%降至2.1%;而从1000增至2000只能把误差从1.6%降至1.1%。

样本大小取决于三件事:(1)研究所需的精度;(2)总体内部的差异和多样化程度;(3)数据分析中同时考察的不同变量的数目。在其余条件相等的情况下,总体内部的差异和多样化程度越高,或所需考察的变量越多,样本就应越大。如总体呈现较大的匀质性,研究精度要求不高或同时研究的变量不多,则样本可小一些。

数据分析如果需要包括细分的小组,样本大小也有讲究。如研究者想要研究总体以下分组的情况,所需样本要大。如研究者的课题包括对30岁至40岁男性的考察内容,假如样本是从普通大众的总体获得,上述年龄段的男性一般只占很小的比例,如只有10%。惯例是,对分组的研究至少需要50个个体。如果该分组在总体中只占10%,则整个样本的个体数至少应达到10×50=500个。

相关文档
相关文档 最新文档