传播学百科网 >>所属分类 >> 传播研究方法    抽样   

非抽样误差

标签: 非抽样误差

顶[0] 发表评论(0) 编辑词条

本章对非抽样误差的构成和各种非抽样误差的影响进行分析。具体要求:
①正确理解非抽样误差的涵义、来源和特点;
②对抽样框误差、无回答误差和计量误差的成因及其对抽样的影响有比较系统的理解;
③掌握控制非抽样误差的基本思想。

目录

第一节 非抽样误差构成编辑本段回目录

一、非抽样误差的来源

非抽样误差就是由抽样误差以外因素引起的,因样本观察数据非同质、或残缺、或不真实而产生的误差。
为了使非抽样误差问题简单化,我们可以按照抽样调查的过程来考察其来源。
◆抽样方案设计阶段
◆数据收集阶段
◆数据处理阶段 ◆在抽样方案设计阶段,非抽样误差的来源:
(1)抽样框的编制与准备不够充分完善;
(2)问卷设计不够科学合理。
◆在数据收集阶段,非抽样误差的来源:
(1)调查数据的残缺;
(2)调查数据的错误。
◆在数据处理阶段,非抽样误差存在于对调查资料的整理、分组、计算、编码和计算机录入等过程中,是一种工作上的差错。

把上述三个阶段的各种非抽样误差加以归纳,可以概括为抽样框误差、无回答误差和计量误差三类。

抽样图抽样图

其中计量误差包括抽样方案设计阶段有缺陷的问卷设计、数据收集阶段有错误的调查数据和数据处理阶段工作上的差错所带来的误差,也就是调查性误差。

第二节 抽样框误差分析编辑本段回目录

一、抽样框误差的成因

丢失目标总体中的单位:覆盖不足,丢失单位,使总体总值的估计值偏低;
包含非目标总体单位:过涵盖,空名单,异质单位;
如果在抽样框中同时出现“丢失单位”和“异质单位”,那么也许可能会相互抵消一部分,形成“净涵盖误差”。
复合联接 :目标总体中的一个调查单位与抽样框中的多个抽样单位相联接,或抽样框中的一个抽样单位与目标总体中的多个调查单位相联接;
不够准确或不够完善的辅助信息;
抽样框陈旧,即抽样框老化;
二、抽样框误差的影响

(一)丢失单位的影响
在假定不存在其他原因的抽样框误差时,丢失单位对抽样效果的影响主要取决于两个方面:丢失单位的分布特征和丢失单位数所占的比重。其中,对总体均值的估计只与前者有关,而对总体总值的估计则与两者都有关。
1)丢失单位是目标总体中的一个随机样本,具有与目标总体相同的期望与方差,则其对总体均值的估计影响不大,但对总体总值的估计会低估。

图形图形

 

图形图形

2)丢失的单位是特殊群体,不具有与目标总体相同的期望与方差,那么对目标总体总值、均值的估计会产生偏差。

图形图形

目标总体总值估计量的偏差为:

公式公式


 

偏差率为:

公式公式
公式公式

 

(二)包含异质单位的影响

公式公式

如果是目标总体总值的估计,则其估计量偏差和偏差率分别为:

公式公式

很显然,这时的偏差或偏差率都是正的,即若抽样框中包含了异质单位必定会使目标总体总值的估计偏高。
(四)不正确辅助信息的影响

重在预防
积极补救
心理准备

第三节 无回答误差分析编辑本段回目录

一、无回答误差的成因

(一)无回答的含义
无回答(Nonresponse)是指未能取得所要搜集资料的一种现象,它包括两种情况: 个体无回答和项目无回答。
个体无回答也称全无回答,是指被调查者没有接受调查、造成整张问卷出现空白的 现象;
项目无回答也称部分无回答,是指被调查者回答了问卷中的部分调查项目未能回答其它调查项目的现象。
不论是个体无回答还是项目无回答,都将导致调查数据残缺不全,从而最终影响估计结果,降低估计精度或可靠程度。因无回答而造成的估计误差,就称为无回答误差。
(二)无回答的成因

1、遗漏了被调查者;
2、被调查者地址不详;
3、调查内容未达被调查者;
4、被调查者拒绝回答;
5、回答不准确或不知如何回答;
6、忘记回答。
以上各种原因,有的属于客观性,有的则属于主观性;有的属于有意识,有的则属于无意识;有的属于调查人员方,有的则属于被调查者方。
二、无回答误差的影响

为了测定无回答对抽样的影响,先把总体分为两层:回答层与无回答层。
就调查项目而言,如果无回答不是故意造成的(即与调查内容无直接关系),且无回答现象不集中于某类特殊单位组成的群体,那么就可以认为这种无回答是由随机因素引起的,这时无回答对抽样的影响是因实际有效的样本容量减少而使估计量方差增大,但却不会造成估计量偏差。估计量方差增大的程度取决于无回答率。如果无回答是故意造成的(即与调查内容直接有关),或无回答现象集中于某类特殊的群体,那么无回答层与回答层之间就存在明显的非随机性差异,这时,无回答对抽样效果的影响,除了会增加估计量方差外,还会带来较严重的估计量偏差。 

图



 

图

 

图

 

图

 

三、无回答误差的控制

(一)事前准备充分,争取尽量高的首 次回答率;
(二)搞清无回答的原因,有针对性地 进行复调查;
(三)必要时,对无回答者进行替;
(四)对于一些敏感性问题,可以采用随 机化回答技术(沃纳模型,西蒙斯模型,格林伯格模型等);
(五)当无回答不可避免时,可采用一些专门技术来调整估计结果,以减少估计偏差。
具体的调整方法技术有以下几种:
1.汉森与赫维茨(Hansen and Hurwitz,1946)方法。
2.复制估算法。
3.加权调整法。

1.汉森与赫维茨(Hansen and Hurwitz,1946)方法。

这种方法是先对抽中的被调查者进行邮寄(问卷)调查,然后从那些无回答者中抽选出一个子样本进行访问调查并尽量取得完整资料,最后把邮寄调查结果与子样本访问调查结果综合起来得出总体指标的估计值。
这种方法的优点是比多次复调查法节省费用,且估计量无偏、估计精度容易掌握和控制,因此当子样本的个体资料能全部取得时比较适用。但所花的时间较长,且要保证取得子样本的完整资料也不容易

图


 

图

 

图

 

图

 

2.复制估算法

这种方法是当无回答出现时,用其它已有的数据来顶替无回答的缺失数据,进而对总体作出估计。用来顶替的数据可以从同次调查的回答者数据中抽选,也可以从以前的同类调查数据中选取或推算而得。在实践中最常用的是从同次调查已取得的数据中随机抽取。
复制估算法的特点是,当顶替数据与无回答缺失数据充分接近时(这就要求与这两者数据相对应的单位来自于同一类别,具有相似的特征),能有效减少估计偏差,但却会增大估计量方差(均方误差)。因此,如果我们能对总体进行分层且适当增大样本容量,那么复制估算法就能很好地解决无回答偏差问题,且保证有较高的估计精度。这种方法尤其适用于“项目无回答”。

图
图

 

3.加权调整法

这种方法是通过一定的权数对调查中的回答数据进行加权来达到对数据进行调整、减少因无回答造成的估计偏差的目的。权数由调查中的回答概率来确定,一般是该概率的倒数。即回答概率大的赋予较小的权,回答概率小的赋予较大的权,从而使估计量的偏差得到一些纠正。具体的加权调整法又有Politz Simmons调整法、加权组调整法和事后分层调整法等,限于篇幅,不再展开详述。
第四节 计量误差分析

一、计量误差的成因

计量误差(Errors of Measurement)是指样本结果(如样本均值,样本方差)与实际情况(真实的样本均值,样本方差)不一致而产生的误差。这种误差可能存在于调查过程中,也可能存在于整理和计算过程中,主要就是任何调查都可能产生的调查性误差。这种误差是由人有意或无意所造成的,且会随调查范围的增大而增加产生的可能性。具体原因如下:
(一)因设计不完善引起的计量误差;
(二)调查员原因引起的计量误差;
(三)被调查者原因引起的计量误差;
(四)其他原因引起的计量误差。
(一)因设计不完善引起的计量误差

一是问卷设计不完善,包括用词不准确;问句具有诱导性或倾向性;问句排列顺序欠妥;调查内容不完整(尤其是缺了重要的项目);调查变量选择有误;问句的切入点不准确;问句给被调查者预备的回答空间不合理;问句的语气太软或太强;问卷的长度太冗长等原因。
二是设计的抽样程序有偏,使样本结构非随机地与总体结构不符。
三是估计量的构造有问题,主要是该加权的未加权,不该加权的却加权,从而产生偏差。
(二)调查员原因引起的计量误差

一是调查员责任心不强、工作粗心,使观察结果不准或登记、填写、计算发生差错。
二是调查员在调查时偷工减料,不按规定操作,用其他数据来代替调查数据。
三是调查员本身弄虚作假,由自己来伪造填写调查表。
四是调查员业务水平不够高,在观察或测量时难以搞准数据。
这些误差成因,有的是无意识的,有的则是故意的。

(三)被调查者原因引起的计量误差

一是被调查者对调查内容的理解(包括问句的含义等)有误。
二是被调查者对于需要回忆才能回答的问题,可能存在记忆差错。
三是被调查者对于调查中的一些相似或者相近内容无法准确区分而出现回答差错。
四是被调查者接受调查时心境不佳、身体不适、家中很忙或有急事和意外,使调查质量受到影响。
五是被调查者对调查不感兴趣而敷衍了事。
六是被调查者为了不让他人知道实情而故意提供不真实的数据(有的夸大,如文化程度、高雅文化消费支出、公益捐款及工作业绩等;有的缩小,如收入、烟酒消费量及工作过程等)。
七是被调查者为了保持同一调查内容在不同时间上的一致性或家庭成员回答口径的一致性而提供相同但不真实的数据。
(四)其他原因引起的计量误差
如计量工具不准确、计算机编码及输入错误、资料整理中的归类错误等。

附件列表


您所在的用户组无法下载或查看附件

→如果您认为本词条还有待完善,请 编辑词条

上一篇传播统计学

词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。
0

收藏到:  

词条信息

王锦2142
王锦2142
书童
最近编辑者 发短消息   

相关词条