研究的取样问题是研究的关键环节,样本并不一定是"越大越好",抽取有充分代表性的小样本,即可取得反映总体特征的可靠资料与数据,这样不但能接生人力、物力,而且能显著的提高研究的效率,取样还能起到减少损耗、保护总体的作用,(因为被测对象受到"污染"不利于作进一步的研究)。以缺乏代表性的样本进行的研究,其结果的可应用性是十分有限的,不少研究结果之所以至尽颇有争议而且应用甚少,其中一个原因是由于与这些理论有关的研究在取样方面存在严重缺陷,使这些研究难以重复或验证。
取样所应该事先考虑的问题是:所研究的是什么总体?需要多大的样本?样本的主要特点是什么?如何选取这种样本?如何使样本具有足够的代表性?如何减少取样的误差?等等。
取样过程
取样的过程实际上包括三个方面(1)规定总体,对总体作出明确的定义;(2)选取样本,运用适当取样方法抽取样本;(3)统计推论,从样本的统计数据估算出总体的有关参数。样本是有偏或者无偏的,采用无偏的样本,统计推论才能得出符合实际的参数值。
取样方法
取样的方法很多,这里介绍四种学生比较好掌握的方法:
①简单随机取样法(simple random sampling):在随机取样中,总体中每一个体被抽选的机会是均等的,运用随机取样方法所选取的样本称为"随机样本"。 可以使用严格制作的随机数字表,随意的"进入"包含总体数目的随机数字区,选取所需要的样本数目。在研究者对所研究的总体中各类个体的比例不了解的况下,简单随机取样是最好的取样方法,但如果样本较小,简单随机取样就可能发生偏向,例如:从1000名学生中抽取20名学生,有可能抽到的都是男生,补救的方法是加大样本数量。
②分层随机取样(stratified random sampling):先把总体分成若干层次或子总体,然后独立、随机的从每一层次选取样本,所谓层次,就是指不同类型的个体。例如:高一、高二、高三三个不同层次。为使所取样本是比较理想的"无偏"样本,最好采用非比例分层取样的方法,例如:高一学生350人,高二学生270人,高三学生200人,若按同比例取样,高三的学生数目就会少,而高一学生数目就会很多,所以可按10%,13%,17%的比例分层抽样,可获得"无偏"样本。还应注意的是,对于非比例样本,还应以各层次数目与总体数目的比例值对结果进行加权。
③系统取样法(systematic sampling):是从总体中取一随机起点,从该起点开始选取每k项元素(个体或分数等),直至取满所需要的样本量,k值一般以样本量与总体量的比值来确定。例如:在1000名学生中抽取100名,样本与总体的比值是1/10,在系统中取样时就从随机起点开始分别选取第10名、第20名……。此方法比较简单,而且样本更为准确,但应注意:以随机数字表(这种数字表在大多数统计书中都可以找到)决定第一样本元素;此外,要是在总体中也存在周期性波动或变化,所取样本易发生系统性偏差。
④聚类取样法:在研究不知道或不很了解总体的特征时,可以采用聚类取样法,即先把总体分成若干群类,然后在各群类内进行取样,这种方法成本较低。并且,为了提高精度,必须把总体细分,尽量做到减少群类间的差异,尽可能加大群类内的差异,而上面所讲的分层取样发则尽量加大层次间的差异而缩小层次内的差异,相比之下,聚类取样更为有效。
此外,还有非随机取样法、方便取样法、顺序取样法等等,可以根据研究所涉及的学科的不同适当选用取样方法的。