的超几何分布是离散统计功能,适合于与两个可能的结果计算在随机化实验的概率。要求使用的条件是他们是小人群,其中提款不被替换并且概率不是恒定的。
因此,当选择总体中的某个元素以了解某个特征的结果(对或错)时,就无法再次选择同一元素。
图1.在这样的螺栓群体中,肯定存在有缺陷的样本。资料来源:
当然,如果前一个元素的结果为负,则选择的下一个元素因此更有可能获得真实结果。这意味着概率随着从样本中提取元素而变化。
超几何分布的主要应用是:人口少的过程中的质量控制和机会博弈中的概率计算。
至于定义超几何分布的数学函数,它由三个参数组成:
-人口总数(N)
-样本量(米)
-整个人群中具有所研究特征(n)良好(或不利)结果的事件数。
公式和方程式
超几何分布的公式给出了出现某特性的x个有利情况的概率P。基于组合数字的数学写法是:
在前面的表达式中,N,n和m是参数,x是变量本身。
-总人口为N。
-某个二元特征相对于总体的阳性结果数为n。
-样品中元素的数量为m。
在这种情况下,X是一个取值为x的随机变量,而P(x)表示出现x个研究特征的有利情况的概率。
重要的统计变量
超几何分布的其他统计变量是:
-平均值μ= m * n / N
-方差σ^ 2 = m *(n / N)*(1-n / N)*(Nm)/(N-1)
-标准偏差σ,它是方差的平方根。
型号及性能
为了得出超几何分布模型,我们从在大小为m的样本中获得x个有利案例的概率开始。该样本包含符合研究属性的元素和不符合研究属性的元素。
回想一下,n代表N个元素总数中有利案例的数量。然后,概率将像这样计算:
以组合数字的形式表示以上内容,可以得出以下概率分布模型:
超几何分布的主要属性
它们如下:
-即使人口很大,样本也必须始终很小。
-样本元素被一个接一个地提取,而没有将它们合并回总体中。
-要研究的属性是二进制的,即它只能采用两个值:1或0,或者true或false。
在每个元素提取步骤中,概率都根据先前的结果而变化。
使用二项分布进行逼近
超几何分布的另一个特性是,只要总体N大且至少比样本m大10倍,就可以用表示为Bi的二项式分布来近似。在这种情况下,它看起来像这样:
样本中x = 3颗螺钉有缺陷的概率为:P(500,5,60,3)= 0.0129。
就其本身而言,样本中六十个样本中x = 4颗螺钉有缺陷的概率为:P(500,5,60; 4)= 0.0008。
最后,该样本中x = 5颗螺钉有缺陷的概率为:P(500,5,60; 5)= 0。
但是,如果您想知道该样本中有3个以上有缺陷的螺钉的概率,则必须获取累积概率,并添加:
此示例在图2中进行了说明,该示例是通过使用GeoGebra(GeoGebra)获得的,GeoGebra是广泛用于学校,研究所和大学的免费软件。
图2.超几何分布示例。由F. Zapata与GeoGebra共同编写。
例子2
西班牙的套牌有40张牌,其中10张有金牌,其余30张没有金牌。假设从该牌组中随机抽取了7张牌,这些牌未重新并入牌组。
如果X是7张纸牌中出现的金牌数量,那么您在7张纸牌中拥有x牌的概率由超几何分布P(40,10,7; x)给出。
让我们这样看:为了计算在7张牌中有4个金牌的概率,我们使用具有以下值的超几何分布公式:
结果是:4.57%概率。
但是,如果您想知道获得4张以上牌的可能性,则必须添加:
解决的练习
以下练习旨在说明和吸收本文中介绍的概念。在查看解决方案之前,读者必须自己尝试解决这些问题,这一点很重要。
练习1
避孕套工厂发现,某台机器生产的每1000个避孕套中,有5个存在缺陷。为了进行质量控制,随机抽取100个避孕套,如果存在至少一个或多个缺陷,则将批次拒收。回答:
a)可能会有100个被丢弃?
b)此质量控制标准有效吗?
解
在这种情况下,将出现非常大的组合数字。除非您具有合适的软件包,否则计算将很困难。
但是由于人口众多且样本比总人口小十倍,因此可以使用二项分布来近似超几何分布:
在上面的表达式中,C(100,x)是一个组合数字。然后将计算出一个以上缺陷的概率,如下所示:
如果与通过应用超几何分布获得的值相比,则它是一个很好的近似值:0.4102
可以说,以40%的概率,应该丢弃100份预防剂,这不是很有效。
但是,由于对质量控制过程的要求不高,只有在有两个或多个缺陷的情况下才丢弃100个批次,因此丢弃批次的可能性将降至8%。
练习2
一台塑料砌块机的工作方式是每10件中就有一个变形。在5件样本中,只有一件有缺陷的可能性有多大?
解
人口:N = 10
每N个缺陷数量n:n = 1
样本大小:m = 5
因此,在5个样本中,块变形的可能性为50%。
练习3
在一次年轻的高中毕业生会议上,有7位女士和6位先生们。在女孩中,有4人学习人文学科,有3人学习科学。在男孩组中,有1人学习人文科学和5门科学。计算以下内容:
a)随机选择三个女孩:她们全都学习人文科学的可能性如何?
b)如果随机选择了三位参加朋友会议的与会人员:他们中的三位(不分性别)学习科学的全部三个人,还是人文科学的全部三个的可能性是什么?
c)现在随机选择两个朋友,并将x称为“研究人文学科的人数”。在所选择的两者之间,确定x的平均值或期望值以及方差σ^ 2。
解决方案
现在使用的值是:
-人口:N = 14
-研究字母的数量为:n = 6,且
-样本大小:m = 3。
-学习人文学科的朋友人数:x
据此,x = 3表示所有三个人文学科,而x = 0表示没有一个人文学科。这三者学习相同的概率由总和给出:
P(14,6,3,x = 0)+ P(14,6,3,x = 3)= 0.0560 + 0.1539 = 0.2099
然后,我们有21%的概率随机选择三个会议参与者来研究同一件事。
解决方案c
这里我们有以下值:
N = 14个朋友总数,n = 6个研究人文学科的总数,样本大小为m = 2。
希望是:
E(x)= m *(n / N)= 2 *(6/14)= 0.8572
和方差:
σ(x)^ 2 = m *(n / N)*(1-n / N)*(Nm)/(N-1)= 2 *(6/14)*(1-6 / 14)*( 14-2)/(14-1)=
= 2 *(6/14)*(1-6 / 14)*(14-2)/(14-1)= 2 *(3/7)*(1-3 / 7)*(12)/( 13)= 0.4521
参考文献
- 离散概率分布。从以下位置恢复:biplot.usal.es
- 统计和概率。超几何分布。从以下位置恢复:projectdescartes.org
- CDPYE-UGR。超几何分布。从以下位置恢复:ugr.es
- 代数 古典代数,概率演算。从geogebra.org恢复
- 试试吧 解决了超几何分布问题。从以下网站恢复:probafacil.com
- Minitab。超几何分布。从以下位置恢复:support.minitab.com
- 维哥大学。主要离散分布。从以下位置恢复:anapg.webs.uvigo.es
- 督导员。统计和组合学。从以下位置恢复:vitutor.net
- Weisstein,Eric W.超几何分布。从以下位置恢复:mathworld.wolfram.com
- 维基百科。超几何分布。从以下位置恢复:es.wikipedia.com