抽样调查有以下三个突出特点:
(1)调查样本是按随机的原则抽取的,在总体中每一个单位被抽取的机会是均等的,因此,能够保证被抽中的单位在总体中的均匀分布,不致出现倾向性误差,代表性强。
(2)是以抽取的全部样本单位作为一个“代表团”,用整个“代表团”来代表总体。而不是用随意挑选的个别单位代表总体。
(3)所抽选的调查样本数量,是根据调查误差的要求,经过科学的计算确定的,在调查样本的数量上有可靠的保证。
(4)抽样调查的误差,是在调查前就可以根据调查样本数量和总体中各单位之间的差异程度进行计算,并控制在允许范围以内,调查结果的准确程度较高。
抽样调查方法的几个主要常用的名词
在抽样调查中,常用的名词主要有:
1、总体
总体是指所要研究对象的全体。它是根据一定研究目的而规定的所要调查对象的全体所组成的集合,组成总体的各研究对象称之为总体单位。
2、样本
样本是总体的一部分,它是由从总体中按一定程序抽选出来的那部分总体单位所组成的集合。
3、抽样框
抽样框是指用以代表总体,并从中抽选样本的一个框架,其具体表现形式主要有包括总体全部单位的名册、地图等。
抽样框在抽样调查中处于基础地位,是抽样调查必不可少的部分,其对于推断总体具有相当大的影响。
4、抽样比
抽样比是指在抽选样本时,所抽取的样本单位数与总体单位数之比。
对于抽样调查来说,样本的代表性如何,抽样调查最终推算的估计值真实性如何,首先取决于抽样框的质量。
5、置信度
置信度也称为可靠度,或置信水平、置信系数,即在抽样对总体参数作出估计时,由于样本的随机性,其结论总是不确定的。因此,采用一种概率的陈述方法,也就是数理统计中的区间估计法,即估计值与总体参数在一定允许的误差范围以内,其相应的概率有多大,这个相应的概率称作置信度。
6、抽样误差
在抽样调查中,通常以样本作出估计值对总体的某个特征进行估计,当二者不一致时,就会产生误差。因为由样本作出的估计值是随着抽选的样本不同而变化,即使观察完全正确,它和总体指标之间也往往存在差异,这种差异纯粹是抽样引起的,故称之为抽样误差。
7、偏差
所谓偏差,也称为偏误,通常是指在抽样调查中除抽样误差以外,由于各种原因而引起的一些偏差。
8、均方差
在抽样调查估计总体的某个指标时,需要采用一定的抽样方式和选择合适的估计量,当抽样方式与估计量确定后,所有可能样本的估计值与总体指标之间离差平方的均值即为均方差。
几种具体的抽样方式
1、简单随机抽样
简单随机抽样也称为单纯随机抽样,是指从总体N个单位中任意抽取n个单位作为样本,使每个可能的样本被抽中的概率相等的一种抽样方式。
简单随机抽样一般可采用掷硬币、掷骰子、抽签、查随机数表等办法抽取样本。在统计调查中,由于总体单位较多,前三种方法较少采用,主要运用后一种方法。
按照样本抽选时每个单位是否允许被重复抽中,简单随机抽样可分为重复抽样和不重复抽样两种。在抽样调查中,特别是社会经济的抽样调查中,简单随机抽样一般是指不重复抽样。
简单随机抽样是其它抽样方法的基础,因为它在理论上最容易处理,而且当总体单位数N不太大时,实施起来并不困难。但在实际中,若N相当大时,简单随机抽样就不是很容易办到的。首先它要求有一个包含全部N个单位的抽样框;其次用这种抽样得到的样本单位较为分散,调查不容易实施。因此,在实际中直接采用简单随机抽样的并不多。
2、分层抽样
分层抽样又称为分类抽样、或类型抽样,它首先是将总体的N个单位分成互不交叉、互不重复的k个部分,我们称之为层;然后在每个层内分别抽选n1、n2、...... nk个样本,构成一个容量为 个样本的一种抽样方式。
分层的作用主要有三:一是为了工作的方便和研究目的的需要;二是为了提高抽样的精度;三是为了在一定精度的要求下,减少样本的单位数以节约调查费用。因此,分层抽样是应用上最为普遍的抽样技术之一。
按照各层之间的抽样比是否相同,分层抽样可分为等比例分层抽样与非等比例分层抽样两种。
实际上,分层抽样是科学分组与抽样原理的有机结合,前者是划分出性质比较接近的层,以减少标志值之间的变异程度;后者是按照抽样原理抽选样本。因此,分层抽样一般比简单随机抽样和等距抽样更为精确,能够通过对较少的样本进行调查,得到比较准确的推断结果,特别是当总体数目较大、内部结构复杂时,分层抽样常能取得令人满意的效果。
3、整群抽样
整群抽样是首先将总体中各单位归并成若干个互不交叉、互不重复的集合,我们称之为群;然后以群为抽样单位抽取样本的一种抽样方式。
整群抽样特别适用于缺乏总体单位的抽样框。应用整群抽样时,要求各群有较好的代表性,即群内各单位的差异要大,群间差异要小。
整群抽样的优点是实施方便、节省经费;缺点是往往由于不同群之间的差异较大,由此而引起的抽样误差往往大于简单随机抽样。
4、等距抽样
等距抽样也称为系统抽样、或机械抽样,它是首先将总体中各单位按一定顺序排列,根据样本容量要求确定抽选间隔,然后随机确定起点,每隔一定的间隔抽取一个单位的一种抽样方式。
根据总体单位排列方法,等距抽样的单位排列可分为三类:按有关标志排队、按无关标志排队以及介于按有关标志排队和按无关标志排队之间的按自然状态排列。
按照具体实施等距抽样的作法,等距抽样可分为:直线等距抽样、对称等距抽样和循环等距抽样三种。
等距抽样的最主要优点是简便易行,且当对总体结构有一定了解时,充分利用已有信息对总体单位进行排队后再抽样,则可提高抽样效率。
5、多阶段抽样
多阶段抽样,也称为多级抽样,是指在抽取样本时,分为两个及两个以上的阶段从总体中抽取样本的一种抽样方式。其具体操作过程是:第一阶段,将总体分为若干个一级抽样单位,从中抽选若干个一级抽样单位入样;第二阶段,将入样的每个一级单位分成若干个二级抽样单位,从入样的每个一级单位中各抽选若干个二级抽样单位入样……,依此类推,直到获得最终样本。
多阶段抽样区别于分层抽样,也区别于整群抽样,其优点在于适用于抽样调查的面特别广,没有一个包括所有总体单位的抽样框,或总体范围太大,无法直接抽取样本等情况,可以相对节省调查费用。其主要缺点是抽样时较为麻烦,而且从样本对总体的估计比较复杂。
6、双重抽样
双重抽样,又称二重抽样、复式抽样,是指在抽样时分两次抽取样本的一种抽样方式,其具体为:首先抽取一个初步样本,并搜取一些简单项目以获得有关总体的信息;然后,在此基础上再进行深入抽样。在实际运用中,双重抽样可以推广为多重抽样。
双重抽样的主要作用是提高抽样效率、节约调查经费。
7、按规模大小成比例的概率抽样
按规模大小成比例的概率抽样,简称为PPS抽样,它是一种使用辅助信息,从而使每个单位均有按其规模大小成比例的被抽中概率的一种抽样方式。其抽选样本的方法有汉森-赫维茨方法、拉希里方法等。
PPS抽样的主要优点是:使用了辅助信息,减少抽样误差;主要缺点是:对辅助信息要求较高,方差的估计较复杂等。
上述各种抽样方式均为随机抽样方式。此外还有非随机抽样方式,即按照调查人员主观设立的某个标准抽选样本的抽样方式,如偶遇抽样、立意抽样、配额抽样等。