在随机抽样的是如何选择一个给定的人口统计代表性的样本。样本中每个元素必须具有相同选择概率的部分原理。
抽奖是随机抽样的一个示例,其中,参与者总体的每个成员都分配有一个号码。为了选择与抽奖奖赏(样本)相对应的数字,使用了一些随机技术,例如,从邮箱中提取记录在相同卡上的数字。
图1.在随机采样中,使用某种技术从总体上随机抽取样本,该技术可确保所有元素的选择概率相同。资料来源:netquest.com。
在随机抽样中,必须适当选择样本大小,因为由于统计波动,总体的非代表性样本可能导致错误的结论。
样本大小
有确定样品正确大小的公式。要考虑的最重要因素是人口数量是否已知。让我们看一下确定样本量的公式:
情况1:人口规模未知
当总体大小N未知时,可以选择大小为n的样本来确定某个假设是对还是错。
为此,使用以下公式:
哪里:
-p是假设成立的概率。
-q是不是的概率,因此q = 1-p。
-E是相对误差范围,例如5%的误差范围为E = 0.05。
-Z与研究所需的置信度有关。
在标准化(或标准化)正态分布中,置信水平为90%时Z = 1.645,因为结果在-1.645σ和+1.645σ之间的概率为90%,其中σ为标准偏差。
置信水平及其对应的Z值
1.- 50%的置信度对应于Z = 0.675。
2.- 68.3%的置信度对应于Z = 1。
3.- 90%的置信度等于Z = 1,645。
4.- 95%的置信度对应于Z = 1.96
5.- 95.5%的置信度对应于Z = 2。
6.- 99.7%的置信度等于Z = 3。
可以应用此公式的一个例子是在研究中确定海滩上鹅卵石的平均重量。
显然,不可能研究和称重海滩上的所有鹅卵石,因此建议尽可能地随机抽取具有适当数量元素的样本。
图2。要研究海滩上卵石的特性,必须选择具有代表性数量的随机样本。(来源:图片)
情况2:人口数量已知
当已知组成某个总体(或宇宙)的元素的数量N时,如果我们想通过简单随机抽样选择大小为n的具有统计意义的样本,则公式为:
哪里:
-Z是与置信度水平相关的系数。
-p是假设成功的概率。
-q是假设中的失败概率,p + q = 1。
-N是总人口的大小。
-E是研究结果的相对误差。
例子
提取样品的方法在很大程度上取决于需要进行的研究类型。因此,随机采样具有无限的应用范围:
调查和问卷
例如,在电话调查中,使用适用于研究区域的随机数生成器选择要咨询的人。
如果要对大公司的员工进行问卷调查,则可以通过其员工号或身份证号来选择受访者。
所述数字还必须使用例如随机数生成器来随机选择。
图3.可以通过随机选择参与者来应用问卷。资料来源:
质量检查
如果研究是在机器制造的零件上进行的,则必须随机选择零件,但要从一天中不同时间或不同日期或星期生产的批次中选择零件。
优点
简单随机抽样:
-它可以降低统计研究的成本,因为不必研究总人口即可获得统计上可靠的结果,并且具有所需的置信度和研究中所需的错误度。
-避免偏见:由于要研究的元素的选择是完全随机的,因此该研究忠实地反映了人口的特征,尽管只对其中一部分进行了研究。
缺点
-如果您想了解不同群体或人口阶层的偏好,该方法是不够的。
在这种情况下,最好事先确定要进行研究的组或段。一旦定义了层或组,然后方便每个组进行随机采样。
-极不可能获得有关少数群体的信息,有时需要了解其特点。
例如,如果是针对昂贵产品开展运动的问题,则必须了解最富有的少数群体的偏好。
运动解决
我们想研究人群对某种可乐饮料的偏爱,但该人群尚无以前的研究,其大小尚不清楚。
另一方面,样本必须具有最低90%的置信度,并且必须具有2%的百分比误差。
-如何确定样本的大小n?
-如果将误差范围更灵活地调整为5%,样本量将是多少?
解
由于人口规模未知,因此可以使用上面给出的公式来确定样本数量:
n =(Z 2 p q)/(E 2)
我们假设我们的软饮料品牌与非偏好(q)的偏好相同(p)的概率相同,因此p = q = 0.5。
另一方面,由于研究结果的百分比误差必须小于2%,因此相对误差E将为0.02。
最后,Z值= 1,645将产生90%的置信度。
总结一下,我们有以下值:
Z = 1,645
p = 0.5
q = 0.5
E = 0.02
利用这些数据,可以计算出最小样本量:
n =(1.645 2 0.5 0.5)/(0.02 2)= 1691.3
这意味着具有所需误差范围和所选置信度的研究必须通过简单的随机抽样选择至少1692个人的受访者样本。
如果您将误差范围从2%提高到5%,那么新的样本量为:
n =(1.645 2 0.5 0.5)/(0.05 2)= 271
这是一个明显较低的人数。总之,样本量对研究中所需的误差幅度非常敏感。
参考文献
- Berenson,M.1985。《管理与经济学,概念和应用统计》。社论Interamericana。
- 统计。随机抽样。摘自:encyclopediaeconomica.com。
- 统计。采样。从以下位置恢复:Estadistica.mat.uson.mx。
- 可探索的。随机抽样。从以下地址恢复:explorable.com。
- Moore,D.,2005年。《应用基本统计》。2号 版。
- Netquest。随机抽样。从以下网站恢复:netquest.com。
- 维基百科。统计抽样。从以下位置恢复:en.wikipedia.org