的配额采样是一种非 - 概率的方式来从样品地层分配配额取数据。配额必须与该层次相对于总人口的比例成正比,配额的总和必须等于样本的大小。
研究者是决定哪些群体或阶层的人,例如,他可以将人口分为男人和女人。阶层的另一个示例是年龄范围,例如18至25岁,26至40岁以及40岁以上,可以这样标记:年轻人,老人和老人。
图1.抽样配额是根据总人口中的差异进行细分的。资料来源:
提前知道总人口中代表每个阶层的百分比是非常方便的。然后,选择具有统计意义的样本量,并将比例配额分配给每个阶层相对于总人口的百分比。每个层级的配额总和必须等于样本的总大小。
最后,获取分配给每个阶层的配额数据,选择完成配额的前几个元素。
正是由于这种选择元素的非随机方式,该采样方法才被认为是非概率性的。
按配额抽样的步骤
第1步
将总人口分成具有某些共同特征的阶层或群体。该特征将由进行研究的统计研究人员事先确定。
第2步
确定占总人口的百分比代表上一步中选择的每个阶层或群体。
第三步
根据统计科学的标准和方法,估算具有统计意义的样本量。
第4步
计算每个层次的元素或配额的数量,以使它们与每个元素相对于总人口和样本总数的百分比成比例。
第5步
获取每个阶层中元素的数据,直到完成与每个阶层相对应的配额。
实际案例
假设您想了解城市中地铁服务的满意度。先前对2000人的研究表明,50%的用户是16至21岁的年轻人,40%是21至55岁的成年人,而只有10%的用户年龄超过55岁。
利用这项研究的结果,可以根据用户的年龄对其进行细分或分层:
-年轻人:50%
-成人:40%
-老人:10%
由于预算有限,因此该研究必须应用于少量但具有统计意义的样本。选择的样本量为200,也就是说,满意度调查将适用于总共200人。
现在剩下的工作是确定每个细分市场或阶层的调查配额或数量,这些配额或数量必须与样本量和每个阶层的百分比成比例。
每层配额
每层调查数量的配额如下:
青年:200 * 50%= 200 *(50/100)= 100次调查
成人:200 * 40%= 200 *(40/100)= 80个调查
老年人:200 * 10%= 200 *(10/100)= 20个调查
图2.根据年龄层次划分的200个人样本中的配额。资料来源:F. Zapata。
请注意,费用总和必须等于样本数量,即等于将要应用的调查总数。然后通过调查,直到满足每个阶层的配额。
重要的是要注意,这种方法比进行所有调查并将其传递给出现的前200个人要好得多,因为根据以前的数据,少数阶层很可能会被排除在研究之外。
适用性,优缺点
为了使该方法适用,需要根据地层的目标确定地层形成的标准。
当您想了解部门的偏好,差异或特征以根据阶层或细分来引导特定的市场活动时,配额采样是合适的。
当出于某种原因而需要了解少数群体的特征或兴趣时,或者当他们不想将其排除在研究之外时,它的使用也很有用。
为了适用,必须相对于总人口知道每个阶层的重量或重要性。此知识的可靠性非常重要,否则将获得错误的结果。
优点
-减少学习时间,因为每层的费用通常很小
-简化数据分析。
-将成本降至最低,因为该研究适用于总人口较少但代表性良好的样本。
缺点
-由于先验定义了阶层,因此有可能将某些人口群体排除在研究范围之外。
-通过建立数量有限的分层,有可能在研究中丢失细节。
-通过消除某些层次或将某些层次作为另一层次的一部分,可能会在研究中得出错误的结论。
-无法估计最大采样误差。
简单的应用示例
我们希望对2000人的焦虑水平进行统计研究。
研究人员指导研究的直觉是,必须根据年龄和性别找到不同的结果。因此,他决定形成三个年龄层,分别表示为:First_Age,Second_Age和Third_Age。关于性别部分,定义了两种常见的类型:男性和女性。
First_Age定义为18至25岁之间,Second_Age为26至50岁之间,Third_Age为50至80岁之间。
分析总人口的数据,必须:
45%的人口属于First_Age。
40%在Second_Age。
最后,只有15%的研究人口属于第三年龄段。
使用此处未详述的适当方法,确定300名样本具有统计学意义。
按年龄确定配额
然后,下一步是为“年龄段”找到相应的配额,操作如下:
第一年龄段:300 * 45%= 300 * 45/100 = 135
年龄:300 * 40%= 300 * 40/100 = 120
第三年龄段:300 * 15%= 300 * 15/100 = 45
验证了配额的总和给出了样本的总大小。
按年龄和性别确定配额
到目前为止,还没有考虑到性别人群,已经为该人群定义了两个阶层:女性和男性。同样,我们必须分析总人口的数据,从而得出以下信息:
总人口的-60%为女性。
-与此同时,要研究的人口中40%是男性。
重要的是要注意,以前关于按性别分布的人口百分比未考虑年龄。
鉴于没有更多信息可用,将假设这些性别比例在为该研究定义的3个年龄层中均等分布。考虑到这些因素,我们现在开始按年龄和性别确定配额,这意味着现在将有6个子层:
S1 =初龄和女性:135 * 60%= 135 * 60/100 = 81
S2 =初生和男性:135 * 40%= 135 * 40/100 = 54
S3 =第二年龄和女性:120 * 60%= 120 * 60/100 = 72
S4 =第二年龄和男性:120 * 40%= 120 * 40/100 = 48
S5 =第三年龄和女性:45 * 60%= 45 * 60/100 = 27
S6 = Third_Age and Male:45 * 40%= 45 * 40/100 = 18
调查和结果研究的应用
一旦确定了六(6)个细分市场及其相应的配额,便会准备300次调查,这些调查将根据已经计算出的配额进行。
这些调查将按以下方式应用,将进行81次调查,并对S1细分市场中的前81人进行访谈。然后,其余五个部分以相同的方式完成。
研究顺序如下:
-分析调查结果,然后进行讨论,然后按分段分析结果。
-按细分对结果进行比较。
-最后提出解释这些结果的原因的假设。
与分层随机抽样的差异
在我们应用配额抽样的示例中,首先要做的是确定配额,然后进行研究。当然,这些配额根本不是异想天开,因为它们是基于先前有关总人口的统计信息得出的。
如果您没有关于研究人群的先验信息,则最好颠倒该过程,即首先定义样本量,并在确定样本量后,继续在随机地。
确保随机性的一种方法是使用随机数生成器并调查其员工编号与该随机生成器匹配的员工。
一旦获得了数据,并且由于研究的目的是根据年龄和性别分层来查看焦虑水平,则根据我们先前定义的六种类别来分离数据。但没有建立任何事先费用。
因此,分层随机抽样方法被认为是一种概率方法。而按先前建立的配额进行采样则不会。
但是,如果使用基于人口统计信息的配额来建立配额,那么可以说配额采样方法是近似概率的。
建议的运动
建议进行以下练习:
在中学里,您想对学习科学或学习人文学科之间的偏好进行调查。
假设学校总共有1000名学生,根据学习年份分为五个级别。众所周知,第一年有350名学生,第二年300名,第三年200名,第四年100名,第五年50名。众所周知,学校55%的学生是男孩,而45%是女孩。
确定层次和按层次划分的配额,以便根据学习年份和性别细分了解要应用的调查数量。进一步假设样本将是学生总数的10%。
参考文献
- Berenson,M.1985。《管理与经济学,概念和应用统计》。社论Interamericana。
- 统计。配额采样。摘自:encyclopediaeconomica.com。
- 统计。采样。从以下位置恢复:Estadistica.mat.uson.mx。
- 可探索的。配额采样。从以下地址恢复:explorable.com。
- Moore,D.,2005年。《应用基本统计》。2号 版。
- Netquest。概率抽样:分层抽样。从以下网站恢复:netquest.com。
- 维基百科。统计抽样。从以下位置恢复:en.wikipedia.org