这是一种最简单的一步抽样法,它是从总体中选择出抽样单位,从总体中抽取的每个可能样本均有同等被抽中的概率。抽样时,处于抽样总体中的抽样单位被编排成 1~n编码,然后利用随机数码表或专用的计算机程序确定处于1~n间的随机数码,那些在总体中与随机数码吻合的单位便成为随机抽样的样本。
这种抽样方法简单,误差分析较容易,但是需要样本容量较多,适用于各个体之间差异较小的情况。
当总体中的个体数较多时,采用简单随机抽样显得较为费事。这时,可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样叫做系统抽样。
步骤:
一般地,假设要从容量为N的总体中抽取容量为n的样本,我们可以按下列步骤进行系统抽样:
(1)先将总体的N个个体编号。有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等;
(2)确定分段间隔k,对编号进行分段。当N/n(n是样本容量)是整数时,取k=N/n;
(3)在第一段用简单随机抽样确定第一个个体编号l(l≤k);
(4)按照一定的规则抽取样本。通常是将l加上间隔k得到第2个个体编号(l+k),再加k得到第3个个体编号(l+2k),依次进行下去,直到获取整个样本。
它是根据某些特定的特征,将总体分为同质、不相互重叠的若干层,再从各层中独立抽取样本,是一种不等概率抽样。分层抽样利用辅助信息分层,各层内应该同质,各层间差异尽可能大。这样的分层抽样能够提高样本的代表性、总体估计值的精度和抽样方案的效率,抽样的操作、管理比较方便。但是抽样框较复杂,费用较高,误差分析也较为复杂。此法适用于母体复杂、个体之间差异较大、数量较多的情况。
整群抽样是先将总体单元分群,可以按照自然分群或按照需要分群,在交通调查中可以按照地理特征进行分群,随机选择群体作为抽样样本,调查样本群中的所有单元。整群抽样样本比较集中,可以降低调查费用。例如,在进行居民出行调查中,可以采用这种方法,以住宅区的不同将住户分群,然后随机选择群体为抽取的样本。此法优点是组织简单,缺点是样本代表性差。
整群抽样的优缺点
整群抽样的优点是实施方便、节省经费;多阶段抽样是采取两个或多个连续阶段抽取样本的一种不等概率抽样。对阶段抽样的单元是分级的,每个阶段的抽样单元在结构上也不同,多阶段抽样的样本分布集中,能够节省时间和经费。调查的组织复杂,总体估计值的计算复杂。
(也叫机械抽样或系统抽样,SYS抽样)。是将总体各单位按一定标志或次序排列成为图形或一览表式(也就是通常所说的排队),然后按相等的距离或间隔抽取样本单位。特点是:抽出的单位在总体中是均匀分布的,而且抽取的样本可少于纯随机抽样。等距抽样既可以用同调查项目相关的标志排队,也可以用同调查项目无关的标志排队。等距抽样是实际工作中应用较多的方法,目前我国城乡居民收支等调查,都是采用这种方式。
(也叫分层抽样,STR抽样)。就是将总体单位按其属性特征分成若干类型或层,然后在类型或层中随机抽取样本单位。特点是:由于通过划类分层,增大了各类型中单位间的共同性,容易抽出具有代表性的调查样本。该方法适用于总体情况复杂,各单位之间差异较大,单位较多的情况。
(又称集团抽样)。就是从总体中成群成组地抽取调查单位,而不是一个一个地抽取调查样本。特点是:调查单位比较集中,调查工作的组织和进行比较方便。但调查单位在总体中的分布不均匀,准确性要差些。因此,在群间差异性不大或者不适宜单个地抽选调查样本的情况下,可采用这种方式。
(又称两相抽样)。就是先抽取一个容量比较大的初始样本,用初始样本估计总体的某些参数或某些必要的信息作为分层的比例或再次抽样的标志,然后将抽出的初始大样本作为"总体",从中抽取容量合适的样本进行比较详细的调查。特点是,适合用于对总体信息了解比较少的调查。
(PPS抽样)。就是将总体按一种准确的标准划分出容量不等的具有相同标志的单位在总体中不同比率分配的样本量进行的抽样。特点是总体中含量大的部分被抽中的概率也大,可以提高样本的代表性。
主要是:
①可用于只能观察局部单位的调查,如产品的破坏性质量检查,农作物全面成熟前的产量实割实测等;
②只调查部分单位(如5%,1%,1‰ 等),可节约大量人力、物力和费用开支;
③可大大缩短调查和整理时间,较快取得调查结果;
④可集中力量做深入细致调查并提高调查质量。在社会经济统计中,抽样调查日益得到广泛应用,如人口普查的事后质量检查,生育率调查,农产量调查,职工和农民家计调查等。
1, 抽样调查的特点。
(1) 推断总体的目的性;
(2) 推断总体的整体性;
(3) 样本抽取的随机性;
(4) 抽样误差的可控性;
2, 抽样调查的四部曲程序。
(1) 确定调查总体; 4, 随机抽样的形式。
(1) 简单随机抽样;
(2) 等距随机抽样;
(3) 分层随机抽样;
(4) 整群随机抽样;
(5) 多阶段随机抽样。
5, 非随机抽样的形式。
(1) 遇随机抽样;
(2) 判断随机抽样;
(3) 雪球随机抽样;
(4) 定额随机抽样;
总体抽样设计
由于一个城市中居民的户数可能多达数百万,除了一些大型的市场研究机构和国家统计部门之外,大多数企业都不具有这样庞大的居民户名单。这种情况决定了抽样设计只能采取多阶段抽选的方式。根据调查要求,抽样分为两个阶段进行,第一阶段是从全市的居委会名单中抽选出50个样本居委会,第二阶段是从每个被选中的居委会中,抽选出20户居民。
对居委会的抽选
从统计或者民政部门,我们可以获得一个城市的居委会名单。将居委会编上序号后,用计算机产生随机数的方法,可以简单地抽选出所需要的50个居委会。
如果在居委会名单中还包括了居委会户数等资料,则在抽选时可以采用不等概率抽选的方法。如果能够使一个居委会被抽中的概率与居委会的户数规模成正比,这种方法就是所谓PPS(Probability proportional to size)抽样方法。PPS抽样是一种“自加权”的抽样方法,它保证了在不同规模的居委会均抽选20户样本的情况下,每户样本的代表性是相同的,从而最终的结果可以直接进行平均计算。当然,如果资料不充分,无法进行PPS抽样,那么利用事后加权的方法,也可以对调查结果进行有效推断。
在居委会中的抽样
在选定了居委会之后,对居民户的抽选将使用居委会地图来进行操作。此时,需要派出一些抽样员,到各居委会绘制居民户的分布图,抽样员需要了解居委会的实际位置、实际覆盖范围,并计算每一幢楼中实际的居住户数。然后,抽样员根据样本量的要求,采用等距或者其他方法,抽选出其中的若干户,作为最终访问的样本。
确定受访者
访问员根据抽样员选定的样本户,进行入户访问。以谁为实际的被调查者,是抽样设计中最后一个问题。如果调查内容涉及的是受访户的家庭情况,则对受访者的选择可以根据成员在家庭生活中的地位确定,例如,可以选择使用计算机最多的人、收入最高的人、实际负责购买决策的人,等等。
如果调查内容涉及的是个人行为,则家庭中每一个成年人都可以作为被调查者,此时就需要进行第二轮抽样,因为如果任凭访问员人为确定受访者,最终受访者就可能会偏向某一类人,例如家庭中比较好接触的老人、妇女等。
在家庭中进行第二轮抽样的方法是由美国著名抽样调查专家Leslie Kish发明的,一般称为KISH表方法。访问员入户后,首先记录该户中所有符合调查条件的家庭成员的人数,并按年龄大小进行排序和编号。随后,访问员根据受访户的编号和家庭人口数的交叉点,在表中找到一个数,并以这个数所对应的家庭成员作为受访者。
上述案例是一个典型的两阶段入户调查的现场抽样设计,从设计的全过程可以看到,随机性原则分别在选择居委会、选择居民户和入户后选择受访者等环节中得到体现。在任何一个环节中,如果随机原则受到破坏,都有可能对调查结果造成无法估计的偏差。调查中的抽样设计是一个复杂的技术环节
北京物业小区调查报告
一、物业小区业主自主治理能力调查研究说明
(一)研究的理论背景
(二)调查目的
作为新兴事物的业主组织,因其所处的体制边缘的性质导致其组织的法律地位和组织特征模糊不清,加上学术领域内对于社区民间组织研究的相对滞后,使得不论是官方的正式统计口径还是学术界的研究,对业主组织的基本状况都缺乏足够的关注和准确的把握。近几年来,部分学者开始给予关注,在各自研究领域内开展了一些小范围内的调查,并获得一定的数据资源。但是,对于业主组织的基本情况仍然缺乏全面、规范和持续性的科学调查。这既不利于社区民间组织健康发展,也不利于政府管理。摸清业主组织发展的基本情况,是制定相应的法律和政策的依据,是促进其组织发育和发展的条件。对业主组织通过科学调查进行全面了解摸清底数,也是促进物业小区各方之间的沟通和协调、化解矛盾和冲突的前提和基础。
本研究把业主组织自主治理能力作为调查研究的重点。业主组织作为社区群众自治组织,相对于跨区域、全国性、甚至国际性的公民社会组织,更具“草根”特性。它对社会生态环境具有很大的依赖性,也直接反映出基层社会生态的方方面面。业主治理能力既决定其自身的生存发展,也是决定城市草根基层社会兴衰成败的关键。作为非赢利性组织,它不能依靠报酬来吸引参与者,在很大程度上依靠志愿者在时间和精力上的投入,这样的一个群体,是如何克服“公地的悲剧”与“集体行动的困境”,形成一个有效的治理主体? 它在什么样的社会生态环境的要素下,生存和发展起来的呢?这是本研究调查所要探索的旨趣之所在。本调查研究项目只给出了初步的数据分析汇总,还未进行深入的数据分析和坚实的理论分析。
(三)调查方法
●调查范围、单位和时间跨度:北京3,000个商业化物业小区是本项目对象。本研究的调查以一个物业小区为一个调查单位,对于愿意接受调查的合格对象,主要是对业委会成员进行采访和问卷填写。项目申请于2005年,调查数据结构和问卷设计自2006年1月起,此间多次修改(由于经验不足和调查人员的协调等问题,也许修改太多次了),调查的时间跨度从2006年3月—2007年12月。由于时间跨度问题,一些小区在调查当时的状态和现在的状态不一样,发生了变化。
●抽样方法:采用的是“偶遇抽样(方便抽样)”和大样本(138个小区)相结合的方式。这种抽样属于“非概率抽样”。其局限性是可能的样本选择偏差,例如,进入我们调查范围并愿意做调查的小区多数属于北京市物业小区中组织程度高、业主自主治理能力较强或物业纠纷较为严重的部分。他们比较活跃,多是因为参加各种活动、会议或者发生纠纷引起社会关注等等才与我们有了联系,同意接受采访,这样,样本中较少包括那些沉寂无声的小区,因此所用样本在代表总体和推断总体特征时会导致数据估计偏差。但是其积极意义就在于具有探索性,给出一些当前事物状态的典型信息。
●抽样缺陷的补救:由于当前新兴的物业小区基本数据不在官方调查口径内,因而不能从正式途径得到所需信息。物业小区业主组织游离在体制边缘的特性使得物业纠纷又具有相当的敏感性,确定抽样框,采取概率抽样调查极其困难。从另一方面来看,客观因素是,物业小区的物业纠纷状态本身具有很大的突发性,此前安静的小区可能会突然爆发出纠纷与冲突。即使严格采取概率抽样,抽样框的维护也跟不上抽样调查的需要。从主观方面看,由于物业纠纷的敏感性,抽样框中的小区当事人不一定愿意接受调查采访。所以,本研究所做的补救措施是扩大样本数量,以补充抽样的不足。我们的调查目前在北京已涵盖有业委会小区数量的大约三分之一,并且,还用一些别的办法包括典型案例和定性研究对调查数据的客观性予以一定的弥补纠正。
●调查的核查:在调查数据库整理中发现了一些问题,这些问题是调查人员和被调查人员关于问题理解的偏差造成的,例如,关于小区业主组织中是否有“业主代表大会”制度,不少被调查人员误将非正式的“业主代表”当成正式的“业主代表大会”制度,对于明显的偏离经验观察结果的数据,本项目对有疑义的数据进行了逐个核查,尽量纠正可能的偏差。
(四)调查问卷的指标设计
(五)调查问题数据指标结构
http://www.cpdrc.org.cn/rkcd/rkcd_detail.asp?id=154
http://course.cug.edu.cn/21cn/%B4%F3%D6%DA%B4%AB%B2%A5%D1%A7/10-b.htm
您所在的用户组无法下载或查看附件
词条内容仅供参考,如果您需要解决具体问题
(尤其在法律、医学等领域),建议您咨询相关领域专业人士。
1