抽样的类型是从总数的一部分中提取数据的各种方法,这是一种功能强大的统计工具,其功能是确定需要检查的人口或宇宙中的哪个部分,进行推断并获取有关它的信息。
当您无法或不想分析整个人口时,抽样非常重要。注意,“人口”一词不仅指大批人或生物,而且通常指在给定问题中将要研究的全部要素。
图1.采样对于从Universe中选择代表性样本很重要。资料来源:
根据选择的抽样类型,始终根据目标选择被认为最具代表性的那部分人口。
当然,当仅获取一部分数据时,可能会遗漏一些细节并忽略信息,这就是为什么结果将不如应有的那样准确的原因。这称为采样误差。
我们的想法是尽可能简化数据的范围,选择能够提供最大信息的最具代表性的样本,以确保结果的有效性。
概率或随机抽样的类型
概率采样基于必须选择样本主题的概率。这样,将为人口中的每个元素提供一个已知的选择机会,当然,该机会必须大于0。
这是非常重要的,因为有可能从大量数据中选择了一个样本,该样本不能充分代表整体。
如果是这样,结果将是有偏见的,因为人口的某些部分将比其他部分更受青睐。为了避免偏见,其中有几种类别,一种选择是让机会选择样本,从而为每个元素选择的可能性为非零。
简单随机抽样
这是确保机会发挥作用的简单方法。例如,如果您要选择班上的一些孩子参加学校的艺术活动,则所有孩子的名字都放在相同的折叠选票上,混在帽子里,并随机绘制几把。
班上所有的孩子组成了总人口,从帽子里掏出的几张选票就是样本。
该程序的成功在于列出所有孩子的完整列表,这样就不会遗漏任何人。在很小的过程中,这不是问题。但是,当您要从更大的总体中选择一个样本时,您必须改进该方法。
可以通过替换或替换进行简单的随机采样。例如,如果我们从总体中提取某些元素并在选择和检查后将其返回,则在整个研究过程中,我们的元素范围始终保持不变。
相反,如果对所选元素进行了研究,则没有返回更多,则它是采样而不替换。在计算选择元素的可能性时必须考虑到这一点。
系统随机抽样
为了进行此采样,还需要列出N个元素并确定样本的大小,我们将其称为n。该列表称为采样帧。
现在定义了跳转间隔,用字母k表示,其计算如下:
在1到k之间随机选择一个随机数,称为ro随机起始。这是列表上的第一个要选择的人,然后从列表中选择以下元素。
例如:假设您有一个大学的2000名学生的清单,并且想要获得100名学生的样本以参加大会。
首先要做的是找到k的值:
一旦我们将学生总数划分为20个学生的100个片段,就取其中一个片段,并在1到20之间选择一个随机数,例如12。因此,我们列表中的第12个学生是随机启动。
下一个要选择的学生必须是12 + 20 = 22,然后是42,然后是62,依此类推,直到完成所有100个学生。
如您所见,这是一种快速应用的方法,通常会产生非常好的结果,而不必在帽中没有周期性的情况下戴上2000个名字并使用100个名字,只要这不会引起偏见。 。
分层随机抽样
图2.在分层随机抽样中,总体被分为称为“阶层”的部分。资料来源:
在简单的随机抽样中,总体中的每个项目都具有相同的被选择概率。但这可能并不总是正确的,尤其是当要考虑更多复杂性时。
要执行分层随机抽样方案,必须将总体分为具有相似特征的组。这些是阶层。然后获取分层,并从每个样本中选择简单的随机样本,然后将其合并以形成最终样本。
在采样之前确定层,研究数据宇宙的特征。
这些特征可以是婚姻状况,年龄,居住地点,例如城市,郊区和农村人口,职业,教育水平,性别等等。
在任何情况下,期望每个层的特征将是非常独特的,即,每个层是均质的。
在分层抽样中,根据每个层次的样本大小是否与其大小成正比,我们将其分为两类。
随机聚类抽样
上述方法直接选择样本的元素,但是在聚类采样中,从总体中选择一组元素,这些元素将成为采样单位,称为聚类。
集群的示例是大学的部门,地理实体(例如省,市,县或市),所有这些实体具有相同的被选择概率。在选择地理实体的情况下,我们说的是按区域抽样。
一旦选择了簇,就从那里选择要分析的元素。因此,该过程可以分为几个阶段。
该方法与分层随机方法有一些相似之处,只是这里从总数中选择了一些聚类,而在以前的方法中,研究了人口的所有阶层。
非概率抽样类型
在某些情况下,概率采样可能会非常昂贵,因为必须投入时间和资源来找到真正具有代表性的样本。
还经常发生没有完整的采样框(列表)的情况,因此无法确定选择元素的可能性。
对于这些情况,使用了非概率采样类型,尽管无法保证结果的准确性,但也可以通过该类型获取信息。
当使用这种类型的采样时,在选择时仍必须遵循一些标准,以寻求尽可能的采样。
简单采样
这是一种相当基本的抽样类型,其中根据要获取的样本来选择样本的要素,即选择最接近的个体。由于其速度和便利性,它具有成本非常低廉的优点。
但是,正如所说的那样,不确定获得有关结果的可靠信息。有时,它用于在选举前进行快速的简短民意测验,或用于查询客户对某些产品的偏好。
例如,民意测验人员可以前往距离他家最近的三个购物中心的出口,并询问那些离开的人将投票给哪个候选人。或者老师可以调查自己的学生,因为他们可以立即访问他们。
尽管看起来这种程序的结果似乎毫无价值,但只要有充分的理由假设偏差不是很大,就可能很好地反映了总体情况。
但是,它不是那么简单,因为某个老师的学生可能无法构成其余学生的代表样本。在大多数情况下,大型购物中心的民意测验人员往往会采访最漂亮的人。
配额抽样
要按配额抽样,必须对人口阶层有一个很好的先验知识,以便对最有代表性的要素有一个认识。但这不受分层抽样的随机性准则支配。
在这种类型的采样中,必须设置“配额”,因此需要设置方法的名称。这些配额包括在一定条件下收集许多要素,例如15名年龄在25至50岁之间,不吸烟并且还拥有汽车的妇女。
确定配额后,将选择符合条件的第一批人员。这最后一步的标准可能是在研究人员方便时进行的。在这里,您可以看到分层抽样方法的差异,这是随机的。
但是,如果如我们所说,所研究的人群是众所周知的,则这是一种低成本的方法,将是有利的。
雪球采样
这种抽样方式遵循的程序是选择一些领导他人的人,然后由其他人领导,直到样本达到研究人员所需的规模为止。
这是一个有用的程序,可用于表征具有特定特征的某些种群。例如:监狱中的囚犯或患有某些疾病的人。
全权抽样
最后,由研究者根据自己的知识决定选择样本的标准。当有必要将某些无法使用的个人添加到研究中时,此方法很有用。
参考文献
- Berenson,M.1985。《管理与经济学,概念和应用统计》。社论Interamericana。
- 统计。采样。摘自:encyclopediaeconomica.com。
- 统计。采样。从以下位置恢复:Estadistica.mat.uson.mx。
- 可探索的。整群抽样。从以下地址恢复:explorable.com。
- Moore,D.,2005年。《应用基本统计》。2号 版。
- Netquest。概率抽样:分层抽样。从以下网站恢复:netquest.com。
- 维基百科。采样。从以下网站恢复:es.wikipedia.org