这是 科研写作研究所 的第 3144 篇原创文章 关于科研写作研究所

“科研写作研究所”公众号由国高集团科研写作研究院主办,是国内人文社科领域专业和有影响力的科研写作研究与教育平台。公司现为教育部高教司产学合作协同育人项目立项单位、教育部高校学生司供需对接就业育人项目立项单位、人社部国家职业资格培训鉴定实验基地“论文写作指导”师资职业课程证书和教育部教育技术与资源发展中心COSE项目“论文写作能力”学生技能课程招生服务机构。自2012年成立以来,我们已经为国内1000多家高校/科研院所、500多万中青年教师/科研人员以及硕博研究生/本科生提供服务。

如果你打算开展一项实证研究,那你就需要挑选研究参与者并使用最佳抽样法,且该法在你的研究情境下是恰当和可行的。但很多作者在研究中可能并没有注重对参与者采取科学合理的抽样方法,那么在实际写作中,也就同样会缺少对此的强调。在这种情况下,就会凸显出研究层面和写作层面确实专业性。因此,为了全面提升专业性,需要首先从理论层面明确常见的抽样方法。在美国学者拉里·克里斯滕森、伯克·约翰逊和莉萨·特纳所著的《研究方法、涉及与分析中》中就对常见的抽样方法作出了详细的说明。下面,则对不同类型的抽样方法进行介绍,以供作者们参考。

一、随机抽样法

(一)简单随机抽样

随机抽样的最基本的类型就是简单随机抽样。简单随机抽样是最名副其实的一种等概率抽样法。在等概率抽样中,总体中的每一个个体都必须具有同等机会入选最终样本。也正是等概率抽样的这个特征,使得简单随机抽样法能够产生代表性样本,从而让你能够直接从样本推论到总体。

将简单随机抽样法进行形象化的一种方式就是想想我们所称的“帽子模型”。具体方法是:将每个人的名字写在相同大小的纸片上,然后把纸片放进一顶帽子里,盖住帽子的顶部,摇晃帽子让纸片在帽中随机分散。接下来,抽取一张纸片将它放在一边。重复这个过程直到被挑出的纸片数量等于你所需要的样本大小。在进行简单随机抽样时,抽样专家们建议采用“不放回”抽样(就像我们在“帽子模型”例子中所演示的那样),而不是“放回”抽样(即我们将抽取出的纸片再放回帽子中,这样它就有可能被再次抽取)。这是因为不放回抽样在产生代表性样本上会更有效率(即它需要的人略少,因此所需的费用也略少)。在不放回抽样中,任何人都不可能被选中一次以上,一旦某人被选中,你就不会再将他放回抽样库(库中的人员都可能被选上)。要想理解不放回抽样的必要性,或许最简单的方式是考虑一个非常小的样本。如果你要从一个总体中抽取一个10人的样本,你肯定希望他们都是不同的人。如果你使用了放回抽样,并且碰巧有5次都选中了同一个人,那么你可能就需要从6个人而不是10个人的特征来估计总体的特征。

(二)分层随机抽样

随机抽样的第二种类型是分层随机抽样(或分层抽样)。在分层抽样中,总体被分为互斥的若干组群或层,然后在每个组群中挑选随机样本。这些组群构成了分层变量的各个水平。例如,如果性别是分层变量,那么总体的抽样框就会被分成分别由所有女性和所有男性组成的两个群。图5.2展示了以性别进行分层的抽样框。分层变量可以是类别变量(如性别、民族、人格类型)或定量型变量(如智力、身高、年龄),而且可以使用多个分层变量。

这里讲的是如何使用一个分层变量获得分层样本:

1.对你的抽样框进行分层(比如,如果性别是分层变量,那么就将名单分为女性和男性),并给各组的元素标上识别编号。

2.从各组群中抽取一个随机样本(比如,从女性组中抽取一个随机样本,并从男性组中抽取一个随机样本)。

3.将随机抽取的各组人混合在一起(比如,男性和女性),这样你就得到了最终的样本。

实际上分层抽样有两种类型:等比例分层抽样和不等比例分层抽样。在等比例分层抽样中,从各组(如男性和女性)选择的人员数量之比与各组在总体中所占的比例是对等的。例如,总体的60%女性,那么你的样本中女性的比例也需要占到60%在不等比例分层抽样中,选自各组的人员数量之比与他们在总体中所占的比例并不相关。例如,即使总体的60%是女性,样本中的女性比例也可以只有50%。

假设你想以性别作为变量进行分层,并且总体包含75%女性和 25%男性。同时假设你想要获得一个样本量为100的样本。如果采用等比例分层抽样,你可以从分层抽样框中随机挑选75名女性和25名男性,最终的样本与总体在性别比例上完全吻合(75%,25%)。等比例分层抽样是一种等概率抽样法(每个个体都有同等机会入选最终样本),你可以直接将样本中得到的结论推广到总体中。

如果采用不等比例分层抽样,你也许会从性别总体中随机选择50名男性和50名女性。不等比例分层抽样不是一种等概率抽样法,因为每个人拥有的机会不同。在这个例子中,总体中包含75%女性和 25%男性,而样本中的男性和女性各占50%当出现这种采样不足或过度抽样的情况时,你的抽样方法就不再是一种等概率抽样法了。你不能将这50名女性和 50名男性混合在一起,而且不能直接将样本中得到的结论推广到总体中。虽然不等比例分层抽样不是一种等概率抽样法,但研究者有时仍然会选用这种方法,因为如果不采用过度抽样,一些小组群可能就会被遗漏。

等比例分层抽样是一种特别强大的抽样方法。就像简单随机抽样法一样,分层比例随机抽样法是一种等概率抽样法,这意味你能够直接从最终获得的样本推论到总体。但是,等比例分层抽样法比简单随机抽样法的效率要略高一些(这意味着它需要的人更少一些,因此所需的费用也相对较少一些)。等比例分层样本比简单随机样本要稍微进步了一些(即它必须代表分层变量,否则它就是一个随机样本)。那些在抽样上需花费大量金钱的公司通常更愿意选择分层抽样,因为它能减少费用支出。

(三)整群随机抽样

第三种主要的随机抽样方法,被称作整群随机抽样(或整群抽样)。在抽样的第一阶段,研究者随机地选取群而非单个单元(比如单独的人)。整群就是包含了多个元素的集合型单元,其中不止一个单元。整群的例子包括:社区、家庭、学校、班级和工作组。注意所有这些集合型单元都包含了多种单个元素或单元。

整群抽样法包括两类:单级和二级。整群抽样的第一种类型是单级整群抽样。为了选取单级整群样本,你要随机地选择群样本。最终的样本包括随机选择的群当中的所有单个单元。例如,如果你随机选择了15个心理学班级。你的样本中就包括了在这15个班级中的所有学生。第二种类型是二级整群抽样。第一步,你随机选择一个群样本(即像你在单级整群抽样时做的那样);但是到了第二步,你需要从第一步选取的各群元素中分别随机抽取一个样本。例如,在第一步时你随机选择了30个心理学班级,那么第二步时你就需要从这30个班级中的每个班级里随机抽取10名学生。

(四)系统抽样

系统抽样是另一种通常会生成随机样本的抽样方法。系统抽样的效率与简单随机抽样的效率差不多,而且也是一种等概率抽样法。如果你决定使用系统抽样法抽取一个样本,你必须进行三个步骤。第一步,确定抽样间隔,即总体大小除以样本容量得出的值。抽样间隔可以用符号“k”表示。第二步,随机选择1至k之间的某个数字,然后将与这个数字对应的人纳入你的样本。第三步,将该数以后每间隔k个数所对应的元素都纳入你的样本中。

例如,假设你的总体大小是100,你想要获取一个容量为10的样本。那么你的抽样间隔k就等于10。接着,假设你在1到10之间随机抽取的数字是5。最后,除了第5个人,还有5之后每隔10个数所对应的人都可以纳入样本(比如,第二个是15号,因为5+10=15;第三个人是25号,因为15+10=25;以此方式继续抽取)。最终的样本包括的人员编号分别为:5、15、25、35、45、55、65、75、85、95。如果你是按照这三个步骤进行操作的,那么当你到达抽样框的末尾时,你也正好抽取到了样本中需要的所有人。在系统抽样中,你实质上是选取了一个随机的起点,然后按照姓名列表从头到尾进行操作。

在系统抽样中有一个潜在问题(但是并不常见),这个问题被称为周期性。如果抽样框中存在循环模式,就会导致周期性的问题。如果你把几个排好序的名单拼接在一起(比如,假设你从多个班级获得了名单,而每一个班级名单都是按照诸如成绩这样的变量进行排序的),而且每个单独的名单的长度正好等于k,那么就很有可能发生周期性问题。只要你不把多个名单拼接在一起,就不会发生周期性问题。如果你有多个名单,一定要将它们作为一个整体进行编排(即按照随机的方式、或者按字母顺序、或者依据分层变量重新排成一个新名单)。

二、非随机抽样法

非随机抽样法有四种常见的类型,包括方便抽样、配额抽样、立意抽样和滚雪球抽样。

(一)方便抽样

方便抽样则是选取那些可能性大的、有意愿的、或者容易招募的人作为样本。在进行方便抽样时,你只要简单地问人们,谁最方便参加你的研究,或者选择最容易获得的参与者参与你的研究。例如,心理学家经常会从选修普通心理学课程的大学生中挑选样本(即参与研究项目的学生是为了获得大学学分或想知道做研究参与者是怎么回事)。

(二)配额抽样

配额抽样则是研究者先确定样本容量或样本中包含的组群的配额,然后使用方便抽样获得样本。在进行配额抽样时,研究者会设置配额(即样本所需的各种类型的人的数量),然后找到(使用方便抽样法)满足这些配额数量的人。例如,研究可能需要这样一组配额:25位非裔美国男性、25位欧裔美国男性、25位非裔美国女性以及25位欧裔美国女性。你可以使用方便抽样法找到这些人。关键在于要为每组配额找到正确数量的人。

(三)立意抽样

立意抽样是指研究者明确感兴趣的总体有何特征,然后找到那些具有这些特征的个体。在进行立意抽样时,研究者会明确其感兴趣的总体有何特征,然后找到与所需要特征吻合的个体。例如,你想要开展一项研究,并以“14-17岁之间、患有强迫性症的青春期男孩和女孩”为对象。那么你就需要努力地找到满足这个要求并且愿意参与研究的男孩、女孩各25个,然后将他们纳入到你的研究之中。

(四)滚雪球抽样

滚雪球抽样是指每一个被选入样本中的人都被要求找出其他的具有准入特征的潜在参与者。在进行滚雪球抽样时,恳请每一个研究参与者推荐其他具有某个特定准入特征(或一组特征)的潜在研究参与者。开始的时候你只能找到一个或几个参与者;你请求他们加入研究并询问他们是否知道其他一些满足准入特征的潜在参与者。接着你就可以顺藤摸瓜找到这些额外参与者,请求他们加入,并请他们推荐其他潜在参与者。你要持续这个过程,直到拥有了足够数量的研究参与者。在你需要从一个没有抽样框且很难找的总体中抽取样本时,使用滚雪球的抽样方式会尤其有效。例如,如果你想在你的城市里开展一项与拥有巨大政治权力(包括官方或非官方的权力)的人有关的研究,你就可能会使用滚雪球的抽样方法,因为这里没有现成的抽样框。你可以确定一组有权力的人,并从那儿入手,然后使用上面描述的滚雪球的方式进行抽样。

综上,常见的抽样方法包含随机抽样和非随机抽样两大类,而各自包含着众多小类。而究竟采用何种抽样方法还需要依照不同的研究情境,也即,确保所选择的理论抽样法在你的研究情境之下是恰当的和可行的。作者们可自行选择适合自己研究的理论抽样方法。作者:张文静(科研写作研究所编辑教研二室学术编辑)