的峰度或峰度是用于表征一个随机变量的概率分布的统计参数,表示围绕该中心的程度的值的浓度的程度。这也称为“峰值等级”。
该术语来自希腊语“ kurtos”,意为弓形,因此峰度表示分布的指向或展平程度,如下图所示:
图1.不同类型的峰度。资料来源:F. Zapata。
随机变量的几乎所有值都倾向于聚集在诸如平均值之类的中心值周围。但是在某些分布中,值比其他分布更分散,导致曲线更平坦或更细。
定义
峰度是每个频率分布的典型数值,根据平均值附近的值的集中度将其分为三组:
- 尖峰厚尾:其中值非常围绕均值聚类,因此分布是相当尖锐和修长(图1,左)。
- 中度:在平均值附近有中等程度的值集中(中间的图1)。
- Platicúrtica:该分布具有较宽的形状,因为这些值趋于更分散(图1右侧)。
公式和方程式
峰度可以具有任何价值,没有限制。根据数据传递的方式进行计算。每种情况下使用的表示法如下:
-峰度系数:g 2
-算术均值:X或x带小节
-第i个值:x i
-标准偏差:σ
-数据数:N
-第i个值的频率:f i
-一流品牌:MX I
通过这种表示法,我们提供了一些最常用的公式来查找峰度:
-根据数据表示的峰度
数据未按频率分组或分组
数据按时间间隔分组
峰度过大
也称为Fisher的目标系数或Fisher测度,用于将研究中的分布与正态分布进行比较。
当过量峰度为0时,我们处于正态分布或高斯钟形。这样,无论何时计算出分布的峰度,我们实际上都将其与正态分布进行比较。
对于未分组的数据和合并的数据,用K表示的Fisher指向系数为:
K = G 2 - 3
现在,可以证明正态分布的峰度为3,因此,如果Fisher定位系数为0或接近0且存在介晶分布。如果K> 0,则该分布是瘦小体的;如果K <0,则该分布是小数的。
峰度是做什么用的?
峰度是用来描述分布形态的变异性度量。这样,可以比较具有相同平均值和相同色散(由标准偏差得出)的对称分布。
进行可变性度量可确保平均值可靠,并有助于控制分布中的变化。作为示例,让我们看一下这两种情况。
3部门的工资
假设下图显示了同一公司的三个部门的工资分配:
图2.具有不同峰度的三种分布说明了实际情况。(由范妮·扎帕塔准备)
曲线A是最苗条的一条曲线,从它的形式可以推断出该部门的大多数薪水都非常接近平均水平,因此大多数员工会得到类似的报酬。
就其本身而言,在部门B中,工资曲线遵循正态分布,因为该曲线是中速曲线,因此我们假定工资是随机分布的。
最后,我们得到的曲线C非常平坦,这表明该部门的薪资范围比其他部门要宽得多。
考试成绩
现在假设图2中的三个曲线代表了应用于同一主题的三组学生的考试结果。
等级由A瘦体曲线表示的组是相当均一的组,大多数获得了平均或接近的组。
结果也可能是由于测试问题或多或少具有相同的难度。
另一方面,C组的结果表明该组中的异质性更大,其中可能包含普通学生,一些高级学生,而且肯定没有那么专心。
或者,这可能意味着测试题的难度不同。
曲线B是介晶的,表明测试结果遵循正态分布。这通常是最常见的情况。
峰度的工作示例
找到以下等级的费舍尔得分系数,该系数是在一组物理考试中从一组学生中获得的,评分范围为1到10:
解
下面的表达式将用于前面几节中给出的非分组数据:
K = G 2 - 3
此值使您可以知道分布的类型。
要计算g 2,可以方便地以有序的方式逐步进行计算,因为必须解决几个算术运算。
第1步
首先,计算成绩的平均值。有N = 11个数据。
第2步
找到标准偏差,为此使用了以下公式:
σ= 1.992
或者,您也可以构建一个表,该表也是下一步所必需的,并在其中写入所需的总和的每个项,从(x i -X)开始,然后是(x i -X)2然后(x i -X)4:
第三步
进行g 2的分子式中所示的总和。为此,使用上表右列的结果:
∑(x i -X)4 = 290.15
从而:
g 2 =(1/11)x 290.15 /1.992 4 = 1.675
费舍尔的指向系数为:
K = G 2 - 3 = 1.675 - 3 = -1.325
有趣的是结果的符号,该符号为负,对应于上古分布,可以按照前面的示例进行解释:这可能是一门异类课程,具有不同兴趣程度的学生,或者考试题为不同的难度级别。
使用电子表格(例如Excel)极大地促进了这些类型问题的解决,还提供了绘制分布图的选项。
参考文献
- Levin,R.,1988年。《管理员统计资料》。2号 版。学徒大厅。
- 马可(Marco),F。从以下站点恢复:economipedia.com。
- Oliva,J.不对称和峰度。从以下站点恢复:statisticaucv.files.wordpress.com。
- Spurr,W.1982。《管理中的决策》。Limusa。
- 维基百科。峰度。摘自:en.wikipedia.org。