的自由度在统计是一个随机向量的独立部件的数量。如果向量具有n个分量,并且有p个涉及其分量的线性方程,则自由度为np。
自由度的概念也出现在理论力学中,它们大致等于粒子移动的空间尺寸减去键的数量。
图1.钟摆在二维中移动,但只有一个自由度,因为它被迫沿半径为L的弧线移动。来源:F. Zapata。
本文将讨论应用于统计的自由度的概念,但是机械示例更容易以几何形式可视化。
自由度的类型
根据应用的上下文,计算自由度数量的方法可能会有所不同,但基本思想始终是相同的:总尺寸减去限制数量。
在机械情况下
让我们考虑一个与在垂直xy平面(2维)中移动的弦(摆)相连的振动粒子。但是,粒子被迫在半径等于弦长的圆周上移动。
由于粒子只能在该曲线上移动,因此自由度为1。这可以在图1中看到。
计算自由度数的方法是通过减去维数减去约束数的差:
自由度:= 2(尺寸)-1(连字)= 1
使我们得出结果的另一种解释是:
-我们知道二维位置由一个坐标点(x,y)表示。
-但是由于对于给定的变量x值,该点必须符合圆周方程(x 2 + y 2 = L 2),因此变量y由所述方程或约束条件确定。
这样,只有一个变量是独立的,并且系统具有一(1)个自由度。
在一组随机值中
为了说明该概念的含义,假设向量
x =(x 1,x 2,…,x n)
表示n个正态分布随机值的样本。在这种情况下,随机向量x具有n个独立的分量,因此x被称为具有n个自由度。
现在让我们构造残差的向量r
[R =(X 1 -
哪里
所以总和
(X 1 -
这是一个表示残基的向量r的元素中的限制(或结合)的方程式,因为如果已知向量r的 n-1个分量,则限制方程式将确定未知分量。
因此,尺寸为n 的向量r具有以下限制:
Σ(X 我 -
它具有(n-1)个自由度。
再次应用自由度数的计算为:
自由度:= n(尺寸)-1(约束)= n-1
例子
方差和自由度
方差s 2定义为n个数据样本的偏差(或残差)的平方的平均值:
s 2 =(r • r)/(n-1)
其中r是残差的向量r =(x1-
小号2 =Σ(X 我 -
无论如何,应该注意的是,在计算残差平方的平均值时,将其除以(n-1)而不是除以n,因为如前一节所述,向量r的自由度数为( n-1)。
如果用于计算方差除以n而不是(n-1),则对于n小于50的值,结果将具有非常显着的偏差。
在文献中,当涉及总体的方差时,方差公式也显示为除数n而不是(n-1)。
但是,由向量r表示的残差随机变量集虽然具有维n,但仅具有(n-1)个自由度。但是,如果数据数量足够大(n> 500),则两个公式都将收敛到相同的结果。
计算器和电子表格同时提供方差的版本和标准差(标准差的平方根)。
考虑到此处介绍的分析,我们的建议是每次需要计算方差或标准差时,始终选择(n-1)个版本,以避免产生偏差。
在卡方分布
在连续随机变量一些概率分布依赖于自由的参数叫做度,这是卡方分布(χ的情况2)。
此参数的名称恰好来自此分布适用的基础随机向量的自由度。
假设我们有g个种群,从中取n个样本:
X 1 =(x1 1,x1 2,…..x1 n)
X2 =(x2 1,x2 2,…..x2 n)
…。
X j =(xj 1,xj 2,…..xj n)
…。
Xg =(xg 1,xg 2,…..xg n)
具有均值的总体j
标准化或标准化变量zj i定义为:
ZJ 我 =(XJ 我 -
向量Zj的定义如下:
Zj=(zj 1,zj 2,…,zj i,…,zj n),并且遵循标准化的正态分布N(0,1)。
所以变量:
Q =((z1 1 ^ 2 + z2 1 ^ 2 +…。+ Zg 1 ^ 2),…。,(Z1 n ^ 2 + z2 n ^ 2 +…。+ Zg n ^ 2))
遵循χ 2(克)调用的自由克度卡方分布的分布。
在假设检验中(结合实例得出)
当您要基于一组特定的随机数据检验假设时,您需要知道自由度g才能应用卡方检验。
图2.冰淇淋FLAVOR的偏好与客户的GENDER之间是否有关系?资料来源:F. Zapata。
例如,将分析在某个冰淇淋店中男性和女性对巧克力或草莓冰淇淋的偏爱收集的数据。图2总结了男女选择草莓或巧克力的频率。
首先,计算期望频率表,该表是通过将行总数乘以列总数除以总数据而得到的。结果如下图所示:
图3.根据观察到的频率计算预期频率(图2中蓝色值)。资料来源:F. Zapata。
然后,使用以下公式(从数据中)计算卡方:
χ 2 =Σ(F ø - ˚F ë)2 / F ë
其中,F o是观测频率(图2),F e是预期频率(图3)。求和遍及所有行和列,在我们的示例中给出了四个项。
完成操作后,您将获得:
χ 2 = 0.2043。
现在有必要与理论卡方进行比较,后者取决于自由度g的数量。
在我们的情况下,此数字确定如下:
g =(#行-1)(#列-1)=(2-1)(2-1)= 1 * 1 = 1。
事实证明,此示例中的自由度g为1。
如果要检查或拒绝具有1%显着性水平的原假设(H0:TASTE和GENDER之间没有相关性),则使用自由度g = 1计算理论卡方值。
寻找使累积频率(1-0.01)= 0.99,即99%的值。该值(可以从表中获得)为6,636。
当理论Chi超过计算得出的Chi时,将验证零假设。
换句话说,在收集到数据的情况下,变量TASTE和GENDER之间没有任何关系。
参考文献
- Minitab。自由度是多少?从以下位置恢复:support.minitab.com。
- 摩尔,大卫。(2009年)基本应用统计。Antoni Bosch编辑。
- 雷,詹妮弗。如何在统计模型中计算自由度。从以下网站恢复:geniolandia.com
- 维基百科。自由度(统计数据)。从以下位置恢复:es.wikipedia.com
- 维基百科。自由度(物理)。从以下位置恢复:es.wikipedia.com