文档库

最新最全的文档下载
当前位置:文档库 > 有限总体的估计_基于超总体模型_艾小青

有限总体的估计_基于超总体模型_艾小青

有限总体的估计———基于超总体模型

艾小青

金勇进

摘要:

抽样调查下有限总体的估计,一般是基于传统抽样设计,另一种是基于超总体模型,即假定总体取值不是确定的,而是由超总体模型产生的。本文以简单随机抽样和抽样为例,揭示了在不同情况下,如何得到超总体模型下有限总体的估计,并对基于设计和基于模型两种观点进行了比较分析。关键词:

有限总体;超总体模型;估计Estimation for Finite Population Based on Superpopulation Models

Ai Xiaoqing Jin Yongjin

Abstract:The estimation for finite population in sample survey is usually based on traditional sample design.Another type is based on superpopulation models,in which the actual values for the finite population is supposed to be generated from superpopulation model.This paper discusses how to assume the superpopulation model and estimate the population,taking SRS and PPS for examples.And the comparative analysis is done between the design-based and the model-based methods.

Key Words:Finite Population ;Superpopulation Model ;Estimation

作者简介:艾小青,1982年生,湖南邵阳人。中国人民大学统计学院在读博士研究生,研究方向为抽样调查;金勇进,1953年生,北京人。中国人民大学统计学院,博士生导师、教授,研究方向为抽样调查。

1引言

抽样中有两种理念:基于设计和基于模型。前者

把总体取值视为固定的,样本是随机的,其随机性是由抽样导致,并用随机样本去推断确定总体。针对研究对象的每个单元,最核心的概念是入样概率(以及二阶入样概率),常利用的随机变量是示性函数。

后者把总体取值也视为随机的,认为总体本身也是超总体模型的一个样本。在一定的模型假设下,根据联合分布揭示样本单元与非样本单元的联系,再通过样本数据估计(也可以说是预测)非样本数据,进而得到基于模型下的估计。比如区别于对身高、收入、年龄等客观概念的调查,在对态度、情感、心理等主观概念的调查中,总体的各取值可能是随机波动的,并且都服从一定的分布(模型);即使对于如身高等客观概念,每个人的身高值都可认为是他可能值的一个实

现。所以把总体取值看作随机,并且由某超总体模型生成,这种基于模型的理念是有必要的,或许也是更合适的。但它很关键的一点是模型的假定,一般很难有完全的把握保证模型绝对正确,应根据样本进行模型的检验,在检验通过的情况下模型可谨慎使用。

模型的假定,要结合抽样设计、样本信息和辅助信息。在等概率抽样下,并且不借助相关辅助信息时,模型的假定也相对简单,可假定总体单元的取值独立同分布(期望和方差相同);在不等概率抽样下,比如与规模成比例的概率抽样,规模是可以利用的辅助信息,相应的进行模型的假定。下文中,我们将以简单随机抽样、抽样为例,进行特定的模型假定,并进行不失一般性的分析。

2基本概念

基于模型的抽样,总体单元的取值都是随机的,

第2期(总第113期)2009年2月

No.2

(Series No.113)Feb 2009

统计教育Statistical Thinktank