的连续变量是一个可以取两个给定的值之间的数值的无限数量的,即使这两个值是任意地接近。它们用于描述可测量的属性。例如身高和体重。连续变量采用的值可以是有理数,实数或复数,尽管后一种情况在统计中不那么常见。
连续变量的主要特征是总是可以在两个有理或实际值之间找到另一个,而在另一个与第一个之间可以找到另一个值,依此类推。
图1.曲线代表连续分布,条形代表离散分布。资料来源:
例如,假设一组体重可变,最重的体重为95公斤,而最轻的体重为48公斤;那将是变量的范围并且可能值的数量是无限的。
例如,在50.00kg和50.10kg之间可以是50.01。但是在50.00和50.01之间可以是50.005。那是一个连续变量。另一方面,如果在可能的重量测量中建立了小数点后一位的精度,则使用的变量将是离散的。
连续变量属于定量变量,因为它们具有与之关联的数值。利用该数值,可以执行从算术到无穷小计算方法的数学运算。
例子
物理学中的大多数变量都是连续变量,我们可以命名为它们:长度,时间,速度,加速度,能量,温度等。
连续变量和离散变量
在统计中,可以定义各种类型的变量,包括定性的和定量的。连续变量属于后一类。使用它们可以执行算术和计算操作。
例如,对应于身高在1.50 m和1.95 m之间的人的变量h是连续变量。
让我们将此变量与此变量进行比较:投掷硬币的正面次数,我们将其称为n。
变量n可以采用0到无穷大之间的值,但是n不是连续变量,因为它不能采用1.3或1.5的值,因为在值1和2之间没有其他值。这是离散变量的示例。
连续变量练习
考虑以下示例:一台机器生产火柴,并将其包装在盒子中。定义了两个统计变量:
标称匹配长度为5.0厘米,公差为0.1厘米。每盒火柴的数量是50,公差为3。
a)指出L和N可以取的值的范围。
b)L可以取多少值?
c)不能取多少值?
分别说明它是离散变量还是连续变量。
解
L的值在范围内; 也就是说,L的值在区间中,并且变量L可以在这两次测量之间取无穷大的值。然后,它是一个连续变量。
变量n的值在间隔中。变量n在公差区间内只能取6个可能的值,那么它是一个离散变量。
行使
如果除了连续之外,变量所取的值还具有与它们相关联的确定发生概率,那么它就是一个连续的随机变量。区分变量是离散变量还是连续变量非常重要,因为适用于一个变量和另一个变量的概率模型是不同的。
知道一个连续随机变量可以假定的值以及每个变量发生的概率时,便可以完全定义一个连续随机变量。
-概率练习1
媒人以如下方式制作它们:木棍的长度始终在4.9厘米和5.1厘米之间,并且在这些值之外为零。尽管我们也可以提取5,0003 cm的一根棒,但有可能获得长度在5.00到5.05 cm之间的棒。这些价值是否相等?
解
假设概率密度是均匀的。下面列出了找到一定长度的匹配项的概率:
-匹配在此范围内的可能性为1(或100%),因为机器不会在这些值之外绘制匹配。
-找到介于4.9和5.0之间的匹配项,概率为½= 0.5(50%),因为它是长度范围的一半。
-匹配长度在5.0到5.1之间的概率也是0.5(50%)
-众所周知,没有火柴棒的长度在5.0到5.2之间。机率:零(0%)。
在一定范围内找到牙签的可能性
现在让我们观察获得长度在l 1和l 2之间的棒的以下概率P :
-P匹配长度在5.00到5.05之间的表示为P():
-P的长度在5.00和5.01之间的山为:
-P小山的长度在5,000到5,001之间,甚至更少:
如果我们不断减小间隔以使其越来越接近5.00,则牙签恰好位于5.00厘米的概率为零(0%)。我们所要做的就是在一定范围内找到匹配项的可能性。
在给定范围内找到多个牙签的可能性
如果事件是独立的,则两个牙签在一定范围内的概率是其概率的乘积。
-两把筷子在5.0和5.1之间的概率为0.5 * 0.5 = 0.25(0.25%)
-50根牙签介于5.0和5.1之间的概率为(0.5)^ 50 = 9×10 ^ -16,即几乎为零。
-50根牙签介于4.9和5.1之间的概率是(1)^ 50 = 1(100%)
-概率练习2
在前面的示例中,假设概率在给定间隔内是均匀的,但是并非总是如此。
对于生产牙签的实际机器,牙签位于中心值的机会大于处于极值之一的机会。从数学的角度来看,可以使用称为概率密度的函数f(x)对其进行建模。
度量L在a和b之间的概率是使用a和b之间的函数f(x)的确定积分来计算的。
例如,假设我们要找到函数f(x),它表示练习1中值4.9和5.1之间的均匀分布。
如果概率分布是均匀的,则f(x)等于常数c,该常数由c的4.9与5.1之间的积分确定。由于该积分是概率,因此结果必须为1。
图2.均匀概率密度。(自行阐述)
这意味着c的价值为1 / 0.2 =5。也就是说,如果4.9≤x≤5.1且均在该范围之外,则统一概率密度函数为f(x)= {5。统一的概率密度函数如图2所示。
请注意,在相同宽度(例如0.02)的间隔中,中心处的概率与连续变量L(牙签长度)范围的末端处的概率相同。
更现实的模型应该是概率密度函数,如下所示:
图3.非均匀概率密度函数。(自行阐述)
在图3中,可以观察到在4.99和5.01(宽度0.02)之间找到牙签的概率比在4.90和4.92(宽度0.02)之间找到牙签的概率要大。
参考文献
- 伊万迪诺夫。离散随机变量和概率分布。取自:stat.ucla.edu
- 离散和连续随机变量。取自:ocw.mit.edu
- 离散随机变量和概率分布。取自:homepage.divms.uiowa.edu
- H.皮什罗。概论。从以下网站恢复:概率course.com
- Mendenhall,W. 1978年。《管理与经济学统计》。Grupo编辑Iberoamericana。103-106。
- 随机变量问题和概率模型。从:ugr.es中恢复。
- 维基百科。连续变量。从wikipedia.com恢复
- 维基百科。统计变量。从wikipedia.com恢复。