在概率论和统计学中,泊松分布是一种重要的离散概率分布,广泛应用于描述单位时间内随机事件发生的次数。例如,它常被用来预测某段时间内电话呼入的数量、某地区出现交通事故的频率等。泊松分布的核心在于其参数λ(通常称为强度或均值),而其数学期望与方差是理解该分布特性的关键。
什么是泊松分布?
泊松分布的概率质量函数为:
\[
P(X=k) = \frac{\lambda^k e^{-\lambda}}{k!}, \quad k=0,1,2,...
\]
其中:
- \( X \) 是随机变量,表示某一事件在固定时间间隔内发生的次数;
- \( \lambda > 0 \) 表示事件发生的平均速率;
- \( e \approx 2.718 \) 是自然对数的底数;
- \( k! \) 表示 \( k \) 的阶乘。
从公式可以看出,泊松分布完全由参数 \( \lambda \) 决定,且 \( k \) 必须是非负整数。
数学期望的推导
泊松分布的数学期望 \( E[X] \) 定义为所有可能取值 \( k \) 对应的概率乘以 \( k \) 的加权和:
\[
E[X] = \sum_{k=0}^\infty k \cdot P(X=k)
\]
将泊松分布的概率质量函数代入:
\[
E[X] = \sum_{k=0}^\infty k \cdot \frac{\lambda^k e^{-\lambda}}{k!}
\]
注意到当 \( k=0 \) 时,\( k \cdot P(X=k)=0 \),因此可以从 \( k=1 \) 开始求和:
\[
E[X] = \sum_{k=1}^\infty k \cdot \frac{\lambda^k e^{-\lambda}}{k!}
\]
提取出 \( k \) 中的因子 \( k \),并利用阶乘性质 \( k! = k \cdot (k-1)! \),可以化简为:
\[
E[X] = \sum_{k=1}^\infty \frac{\lambda^k e^{-\lambda}}{(k-1)!}
\]
令 \( j = k-1 \),则 \( k=j+1 \),同时调整求和范围后得到:
\[
E[X] = \lambda e^{-\lambda} \sum_{j=0}^\infty \frac{\lambda^j}{j!}
\]
根据指数函数的展开式 \( e^\lambda = \sum_{j=0}^\infty \frac{\lambda^j}{j!} \),上式进一步简化为:
\[
E[X] = \lambda
\]
因此,泊松分布的数学期望等于其参数 \( \lambda \)。
方差的推导
泊松分布的方差 \( Var(X) \) 定义为:
\[
Var(X) = E[X^2] - (E[X])^2
\]
我们已经知道 \( E[X] = \lambda \),接下来计算 \( E[X^2] \)。类似地,通过概率质量函数展开:
\[
E[X^2] = \sum_{k=0}^\infty k^2 \cdot P(X=k)
\]
代入泊松分布公式:
\[
E[X^2] = \sum_{k=0}^\infty k^2 \cdot \frac{\lambda^k e^{-\lambda}}{k!}
\]
同样,当 \( k=0 \) 时项为零,所以从 \( k=1 \) 开始求和,并提取 \( k^2 \) 中的因子 \( k \cdot (k-1) \):
\[
E[X^2] = \sum_{k=1}^\infty k(k-1) \cdot \frac{\lambda^k e^{-\lambda}}{k!} + \sum_{k=1}^\infty k \cdot \frac{\lambda^k e^{-\lambda}}{k!}
\]
第一个求和项可以化简为:
\[
\sum_{k=1}^\infty k(k-1) \cdot \frac{\lambda^k e^{-\lambda}}{k!} = \lambda^2 e^{-\lambda} \sum_{j=0}^\infty \frac{\lambda^j}{j!}
\]
第二个求和项与之前计算 \( E[X] \) 相同,结果为 \( \lambda \)。最终:
\[
E[X^2] = \lambda^2 + \lambda
\]
因此,方差为:
\[
Var(X) = E[X^2] - (E[X])^2 = (\lambda^2 + \lambda) - \lambda^2 = \lambda
\]
总结
泊松分布的数学期望和方差均为 \( \lambda \),即:
\[
E[X] = Var(X) = \lambda
\]
这一特性使得泊松分布在实际应用中非常灵活,尤其是在建模稀有事件时表现出色。通过理解和掌握这些性质,我们可以更准确地分析和预测相关问题。