MGF 的定义
第 k 矩,定义为 $\mathbb {E}(X^k)$
第 k 中心矩,定义为 $\mathbb {E}((X-\mu)^k)$
矩生成函数(Moment Generating Function, MGF)是用来寻找矩的函数的函数。随机变量实值函数 $X$ 的 MGF 定义为:
$$
\psi_{X}(t)=\mathbb{E}\left(e^{t X}\right)=\int e^{t x} \mathrm{d} F(x) = \int e^{tx} f(x) \mathrm{d}x
$$
其中 $t = 0$ 表示一阶矩,$t = 1$ 表示二阶矩……
它实际上是一个 Laplace 变换。
对于实变函数 $x (t)$,其拉普拉斯变换是复变函数 $X (s)$ (其中复变量 $s = \sigma + i \omega $),定义为:
$$
X(s) = \int_{0}^{+\infty } e^{-st} x(t) \mathrm{d}t
>
$$
记作 ${\mathcal {L}} x$ 或 ${\mathcal {L}}_{t}\{x (t)\}$
实值函数:函数输出值是实数的函数
实变函数:函数输入参数是实数的函数
复变函数:函数输入参数是复数的函数
输入:一个关于时间变量 $t$ 的函数 $x (t)$ 。
输出:一个关于复数变量 $s$ 的函数 $X (s)$
由于它的输出是一个函数,所以这类变换又叫生成函数。
当 $ t= 0$ 时,求导,输出是数学期望函数 $E (X)$:
$$
\psi^{\prime}(0)=\left[\dfrac{d}{d t} \mathbb{E} e^{t X}\right]_{t=0}=\mathbb{E}\left[\dfrac{d}{d t} e^{t X}\right]_{t=0}=\mathbb{E}\left[X e^{t X}\right]_{t=0}=\mathbb{E}(X)
$$
实际上对于 $k$ 阶导,$\psi^{(k)}(0) = \mathbb {E}(X^k)$(推导见本文),利用这一性质,我们可以很方便地计算一个分布的任意阶矩。
在统计学中,我们暂不不考虑 $t$ 为复数的情况。
例子:令 $X \sim \text {Exp}(1)$ 则
$$
\psi_{X}(t)=\mathbb{E} e^{t X}=\int_{0}^{\infty} e^{t x} e^{-x} \mathrm{d} x =\int_{0}^{\infty} e^{(t-1) x} \mathrm{d} x =\dfrac{1}{1-t}
$$
限定 $t < 1$,以免积分发散。
因此有,$E (X) = \psi ^\prime (0) = 1$ ,$\mathbb {V}(X) = \mathbb {E}(X^2) - \mathbb {E}(X)^2 = 2 - 1 = 1$
引理 MGF 的性质
(1)若 $Y = aX + b$ 则 $ \psi_{Y}(t)=e^{b t} \psi_{X}(a t) $
(2)若 $X_1, \cdots , X_n$ 独立且 $Y = \sum_{i}^{X_i}$ 则 $ \psi_{Y}(t)=\prod_{i} \psi\_{i}(t) $
离散分布的 MGF
$$
M_X(t) = \mathbb{E}[e^{tX}] = \sum_i e^{tx_i}\cdot p(x_i)\notag
$$
常见分布的 MGF
$$
\begin{array}{ll}
\text { Distribution } & \text { MGF } \psi(t) \\
\operatorname{Bernoulli}(p) & p e^{t}+(1-p) \\
\operatorname{Binomial}(n, p) & \left(p e^{t}+(1-p)\right)^ {n} \\
\operatorname{Poisson}(\lambda) & e^{\lambda\left(e^{t} -1\right)} \\
\operatorname{Normal}(\mu, \sigma) & \exp \left\{\mu t+\dfrac {\sigma^{2} t^{2}}{2}\right\} \\
\operatorname{Gamma}(\alpha, \beta) & \left(\dfrac{1} {1-\beta t}\right)^{\alpha} \text { for } t<1 / \beta\end {array}
$$
MGF 为什么能用?
已知:
$$
\begin{equation}
e^{t x}=\dfrac{(t x)^{0}}{0 !}+\dfrac{(t x)^{\prime}}{1 !}+\dfrac{(t x)^{2}}{2 !}+\cdots
\end{equation}
$$
对其求期望,根据期望的性质,可知:
$$
\begin{equation}
\mathbb{E}\left(e^{t x}\right)=\dfrac{t^{0}}{0 !} \mathbb{E}\left(x^{0}\right)+\dfrac{t^{1}}{1 !} \mathbb{E}\left(x^{1}\right)+\dfrac{t^{2}}{2 !} \mathbb{E}\left(x^{2}\right)+\cdots
\end{equation}
$$
这就是 MGF 的展开式。尝试求一阶导数:
$$
\begin{equation}
\dfrac{\mathrm{d}}{\mathrm{d}t} \mathbb{E}\left(e^{t x}\right)=0+E(x)+\dfrac{2 t}{2 !} \mathbb{E}\left(x^{2}\right)+\cdots
\end{equation}
$$
求二阶导数:
$$
\begin{equation}
\dfrac{\mathrm{d}^{2}}{\mathrm{d}t^{2}} \mathbb{E}\left(e^{t x}\right)=0+0+E\left(x^{2}\right)+\cdots
\end{equation}
$$
这样的求导可以继续下去。可以归纳出:
求 $k$ 阶导数,并代入 $t = 0$ ,即可得到 $\mathbb {E}(X^k)$
例子:求 $X \sim \operatorname {Uniform}(a, b)$ 的期望与方差。
参考解答
当 $t \neq 0$ 时:
$$
\frac{d}{dt}\left(\frac{e^{tb}-e^{ta}}{t\left(b-a\right)}\right)=\frac{be^{bt}t-ae^{at}t-e^{bt}+e^{at}}{t^2\left(b-a\right)}
$$
而当 $t = 0$ 时,$\mathbb {E}(e^{tx}) = 0$
所以你会发现没法求。老实用普通方法吧哈哈哈。
各种 MGF 的推导
均匀分布
$$
\begin{align}
& \mathbb{E} \left(e^{t x}\right) \\
&=\int_{a}^{b} e^{t x} \cdot \dfrac{1}{b-a} \mathrm{d} x \\
&=\dfrac{1}{b-a} \cdot \dfrac{1}{t} \int_{a}^{b} e^{t x} \mathrm{d}(t x) \\
&=\left.\dfrac{1}{b-a} \cdot \dfrac{1}{t} e^{t x}\right|_{a} ^{b} \\
&=\dfrac{e^{b t}-e^{a t}}{t(b-a)}
\end{align}
$$
泊松分布
$$
\begin{equation}
\begin{aligned} \mathbb{E}\left(e^{-t x}\right) &=\sum_{k=0}^{n} e^{t k} \cdot \dfrac{\lambda^{k} e^{-\lambda}}{k !} \\
&=\sum e^{t k-\lambda} \cdot \dfrac{\lambda^{k}}{k !} \\
&=e^{-\lambda} \sum e^{t k} \cdot \dfrac{\lambda^{k}}{k !} \\
&=e^{-\lambda} \sum \dfrac{\left(e^{t} \lambda\right)^{k}}{k !} \\
&=e^{-\lambda} \cdot e^{e^{t \lambda} \lambda} \\
&=e^{\left(e^{t}-1\right) \lambda} \end{aligned}
\end{equation}
$$
一阶导数:
$$
\begin{equation}
\begin{aligned} M_{X}^{\prime}(t)
&=\left[e^{\left(e^{t-1}\right) \lambda}\right]^{\prime} \\
&=\left[\left(e^{t-1}\right) \lambda\right]^{\prime} \cdot e^{\left(e^{t}-1\right) \lambda} \\
&=\lambda e^{t} \cdot e^{\left(e^{t-1}\right) \lambda} \\ \mathbb{E}(x)
&=\lambda . \end{aligned}
\end{equation}
$$
二阶导数:
$$
\begin{equation}
\begin{aligned} M {x}^{\prime\prime}(t)
&=\left[\lambda e^{t} \cdot e^{\left(e^{t}-1\right) \lambda}\right]^{\prime} \\
&=\lambda e^{t} \cdot\left[e^{\left(e^{t}-1\right) \lambda}+\lambda e^{t} \cdot e^{\left(e^{t}-1\right) \lambda}\right] \\
&=\lambda e^{t}\left(\lambda e^{t}+1\right) e^{\left(e^{t}-1\right) \lambda} \\ \mathbb{E}\left(x^{2}\right)
&=\lambda^{2}+\lambda \end{aligned}
\end{equation}
$$
伽马分布
$$
\begin{equation}
\begin{aligned}
\mathbb{E}\left(e^{x t}\right)
&=\int_{-\infty}^{\infty} e^{x t} \cdot f(x) \mathrm{d} x \\
&=\int_{-\infty}^{\infty} e^{x t} \cdot \dfrac{\lambda^{\alpha} x^{\alpha-1} e^{-\lambda x}}{\Gamma(\alpha)} \mathrm{d} x \\
&=\dfrac{\lambda^{\alpha}}{\Gamma(\alpha)} \int_{0}^{\infty} e^{-(\lambda-t) x} \cdot x^{\alpha-1} \mathrm{d} x \\
&{\color{#22a097}{\operatorname{let} u=( \lambda-t) x \text{ then } \mathrm{d}u=(\lambda-t) \mathrm{d} x}} \\
\mathbb{E}\left(e^{t x}\right)
&=\dfrac{\lambda^{\alpha}}{r(\alpha)} \int_{0}^{\infty} e^{-u} \cdot\left(\dfrac{1}{\lambda-t}\right)^{\alpha} \cdot\left(\dfrac{1}{\lambda-t}\right)^{-1} \dfrac{\mathrm{d}u}{\lambda-t} \\
&=\dfrac{\lambda^{\alpha}}{\Gamma(\alpha)} \cdot\left(\dfrac{1}{\lambda-t}\right)^{\alpha} \int_{0}^{\infty} e^{-u} \cdot u^{\alpha-1} \mathrm{d}u \\
&=\dfrac{\lambda^{\alpha}}{\Gamma(\alpha)} \cdot\left(\dfrac{1}{\lambda-t}\right)^{\alpha} \quad \Gamma(\alpha) \\
&=\dfrac{\lambda^{\alpha}}{\Gamma(\alpha)} \cdot \dfrac{\Gamma(\alpha)}{(\lambda-t)^{\alpha}} \\
&=\left(\dfrac{\lambda}{\lambda-t}\right)^{\alpha} \\
&=\left(\dfrac{1}{1-\beta t}\right)^{\alpha}
\end{aligned}
\end{equation}
$$
一阶导数
$$
\begin{aligned} M_{x}^{\prime}(t) &=\left(\dfrac{1}{1-\beta t}\right)^{\prime} \cdot \alpha\left(\dfrac{1}{1-\beta t}\right)^{\alpha-1} \\ &=\beta \cdot \dfrac{\alpha}{(1-\beta t)^{\alpha+1}} \end{aligned}
$$
据此
$$
\mathbb{E}(X) = \alpha \beta
$$
二阶导数
$$
\begin{aligned}
M_{x}^{\prime \prime}(t) &=\alpha \beta\left[\left(\dfrac{1}{1-\beta t}\right)^{\alpha+1}\right]^\prime \\
&=\alpha \beta\left[(\alpha+1)\left(\dfrac{1}{1-\beta t}\right)^{\alpha} \cdot\left(\beta \cdot \dfrac{1}{(1-\beta t)^{2}}\right)\right] \\
&=\alpha \beta\left[(\alpha+1) \beta \cdot \dfrac{1}{(1-\beta t)^{\alpha+2}}\right] \\
&=\alpha(\alpha+1) \beta^{2} \cdot(1-\beta t)^{-(\alpha+2)}
\end{aligned}
$$
据此
$$
\mathbb{E}(X^2) = \alpha (\alpha +1)\beta ^{2}
$$
$$
\mathbb{V}(X) = \alpha \beta ^{2}
$$
指数分布
令 $\alpha = 1$,得到指数分布的 MGF:
$$
\dfrac{\lambda }{\lambda - t}
$$
正态分布
考虑 $\sigma ^{2} = 1 \wedge \mu = 0$ ,此时为标准正态分布。
$$
\begin{equation}
\begin{aligned} N(x)
&=\left(\frac{1}{2 \pi}\right)^{\frac{1}{2}} \exp \left\{-\frac{x^{2}}{2}\right\} \\ \mathbb{E}\left(e^{x t}\right)
&=\int_{-\infty}^{\infty} e^{x t}\left(\frac{1}{2 \pi}\right)^{\frac{1}{2}} \exp \left\{-\frac{x^{2}}{2}\right\} \mathrm{d}x \\
&=\left(\frac{1}{2 \pi}\right)^{\frac{1}{2}} \int_{-\infty}^{\infty} \exp \left\{-\frac{1}{2} x^{2}+x t\right\} \mathrm{d}x \\
&=\left(\frac{1}{2 \pi}\right)^{\frac{1}{2}} \int_{-\infty}^{\infty} \exp \left\{-\frac{1}{2}\left(x^{2}-2 x t+t^{2}\right)+\frac{1}{2} t^{2}\right\} \mathrm{d}x \\
&=\left(\frac{1}{2 \pi}\right)^{\frac{1}{2}} \int_{-\infty}^{\infty} \exp \left\{-\frac{1}{2}(x-t)^{2}\right\} \exp \left\{\frac{1}{2} t^{2}\right\} \mathrm{d}x \\
&=\left(\frac{1}{2 \pi}\right)^{\frac{1}{2}} e^{\frac{t^{2}}{2}} \int_{-\infty}^{\infty} e^{-\frac{1}{2}(x-t)^{2}} \mathrm{d}x \\
&=e^{\frac{t^{2}}{2}} \int_{-\infty}^{\infty} \frac{1}{\sqrt{2 \pi}} e^{-\frac{(x-t)^{2}}{2}} \mathrm{d}x \\
&=e^{\frac{t^{2}}{2}} \cdot 1 \\
&=e^{\frac{t^{2}}{2}} \end{aligned}
\end{equation}
$$
参考
All of statistics
https://www.bilibili.com/video/BV1sJ411i75s/