分层抽样(stratified sampling),也称类型抽样,是一种能够保证子样本代表性的抽样方法,可以在一定程度上修正简单随机抽样和系统抽样的偏差。分成抽样不是直接从总体中抽样,而是首先将总体中所有单位按某种特征或标志(如性别、地域、收入水平、受教育程度、职业等)划分为若干层,然后再各层中采用简单随机抽样或系统抽样的方法抽取一定数目的单位构成子样本,最后将所有子样本汇总起来构成总体样本。
在样本总含量n确定后,有两种比较常用的方法来分配各层的观察单位数ni,即按比例分配和最优分配。
(1) 按比例分配:
按比例分配(proportional allocation)是按各层观察单位数Ni占总体观察单位数N的比例抽取样本,使各层样本容量ni与样本总含量n之比等于各层观察单位数Ni与总体观察单位数N之比。采用按比例分层实际抽样时,所得均属货币里都是自动加权的。样本分配可按下式计算:
按比例分配公式
(2)最优分配:
最优分配(optimum allocation)即同时按总体各层观察单位数Ni的多少和标准差σi的大小分配,按下面两式分配各层的样本量,是抽样误差最小。
样本均数的抽样公式:
样本均数抽样公式
若令W =N /N样本均数 和样本率 及其标准差的计算公式
样本率的抽样公式
总体分层的基本原则
各层内部的差异要小,层与层之间的差异要大。否则就会失去分层的意义。
分层抽样应注意的问题
(一)确定分层的标准,即根据什么原则进行分层
(二)各层之间要避免重叠现象
分层抽样适合于总体内个体数目较多、结构较复杂、内容差异较大的情况。分层数目与样本大小在很大程度上决定了样本的代表性。一般而言,分层越多越细,所抽样本越大,代表性越强。但分层也不宜过多,否则会造成操作上的困难和分层特性的丧失。遵循的原则是尽可能保持层内个体拥有较高的同质性,而层间个体异质性较大,以达到以简化总体构造,又保持总体内各种特性的目的。
分层抽样可以在不增加样本容量的情况下,降低抽样误差,提高分层抽样的代表性,而且便于了解总体内各不同分层群体的差异。
缺点:
需要在抽样之前对总体情况有所了解,如果不能从实际出发选择恰当的标志变量进行分层,很可能会出现某些层级内无法获得样本的情况。
例如,某电视台需要了解某个节目的收视率,采用分层抽样的方法,可以以受教育程度为标志,在小学及以下、中学、大学及以上三个层级的居民中分别取样,然后合并构成总体样本,这样既可以了解总的收视率,也可以了解各不同层次居民的收视率。