统计
误差传递#
假设有 n 个随机变量 \vec{x},服从某联合概率分布。若定义一个函数 y = f(\vec{x}),则 y 的误差可以通过以下公式传递:
其中:
- \sigma_y^2 是 y 的方差;
- \sigma_{x_i}^2 是 x_i 的方差;
- \text{Cov}(x_i, x_j) 是 x_i 和 x_j 的协方差;
- \frac{\partial f}{\partial x_i} 是函数 f 对 x_i 的偏导数。
泰勒展开近似
假设 f 是输入变量的平滑函数,可以对 f 进行一阶泰勒展开近似:
$$ f \approx f_0 + \sum_{i=1}^n \frac{\partial f}{\partial x_i} (x_i - x_{i,0}) $$
其中:
f_0 是 f 在点 (x_{1,0}, x_{2,0}, ..., x_{n,0}) 的值;
\frac{\partial f}{\partial x_i} 是 f 对 x_i 的偏导数。
- 方差的定义
方差的定义为:
$$ \text{Var}(f) = \mathbb{E}[(f - \mathbb{E}[f])^2] $$
将 f 的泰勒展开代入,忽略高阶项,得到:
$$ f - \mathbb{E}[f] \approx \sum_{i=1}^n \frac{\partial f}{\partial x_i} (x_i - \mathbb{E}[x_i]) $$
因此,f 的方差可以近似为:
$$ \text{Var}(f) \approx \text{Var}\left(\sum_{i=1}^n \frac{\partial f}{\partial x_i} (x_i - \mathbb{E}[x_i])\right) $$
- 方差的性质
根据方差的性质,对于随机变量的线性组合:
$$ \text{Var}\left(\sum_{i=1}^n a_i X_i\right) = \sum_{i=1}^n a_i^2 \text{Var}(X_i) + 2 \sum_{i=1}^n \sum_{j=i+1}^n a_i a_j \text{Cov}(X_i, X_j) $$
其中 a_i 是常数,X_i 是随机变量。
在这里,令 a_i = \frac{\partial f}{\partial x_i},X_i = x_i - \mathbb{E}[x_i],代入后得到:
多项式分布的方差与协方差#
对于多项式分布,假设有 n 个类别,每个类别的概率为 p_i,其中 i = 1, 2, ..., n,且 \sum_{i=1}^n p_i = 1。若进行 N 次独立试验,记每个类别的计数为 X_i,则随机向量 \vec{X} = (X_1, X_2, ..., X_n) 服从多项式分布。
方差#
多项式分布中,每个类别的计数 X_i 的方差为:
$$
\text{Var}(X_i) = N p_i (1 - p_i)
$$
协方差#
对于不同类别 i 和 j,计数 X_i 和 X_j 的协方差为:
$$
\text{Cov}(X_i, X_j) = -N p_i p_j \quad (i \neq j)
$$
多项式分布近似为泊松分布或高斯分布#
泊松分布近似#
当试验次数 N 很大且每个类别的概率 p_i 很小(满足 N p_i 为有限值)时,多项式分布中的每个类别计数 X_i 可以近似为泊松分布,其参数为 \lambda_i = N p_i。即:
$$
X_i \sim \text{Poisson}(\lambda_i)
$$
方差与标准差#
在泊松分布中,每个类别计数 X_i 的方差等于其均值 \lambda_i,即:
$$
\text{Var}(X_i) = \lambda_i
$$
标准差是方差的平方根,因此:
$$
\text{Std}(X_i) = \sqrt{\lambda_i}
$$
其中:
- \lambda_i = N p_i 是泊松分布的参数;
- N 是试验次数;
- p_i 是类别 i 的概率。
高斯分布近似#
当试验次数 N 很大且每个类别的概率 p_i 不太小(满足 N p_i (1 - p_i) 较大)时,多项式分布可以近似为高斯分布。随机向量 \vec{X} = (X_1, X_2, ..., X_n) 的分布近似为多元高斯分布,其均值和协方差矩阵分别为:
-
均值向量:
$$
\mathbb{E}[\vec{X}] = (N p_1, N p_2, ..., N p_n)
$$ -
协方差矩阵:
$$
\text{Cov}(\vec{X}) =
\begin{bmatrix}
N p_1 (1 - p_1) & -N p_1 p_2 & \cdots & -N p_1 p_n \
-N p_2 p_1 & N p_2 (1 - p_2) & \cdots & -N p_2 p_n \
\vdots & \vdots & \ddots & \vdots \
-N p_n p_1 & -N p_n p_2 & \cdots & N p_n (1 - p_n)
\end{bmatrix}
$$
这种高斯分布近似在类别数较多且每个类别的概率 p_i 不极端的情况下表现较好。
Created: 2025-05-07