第 6 章 模型,统计推断与学习
ch-6-model-statistical-inference-and-learning
参数与非参数模型 统计推断(Statistical inference),在计算机科学中也称为学习,是利用数据推测其分布的方法。即给定样本 $X_1 , X_2,\cdots , X_n \sim F$ ,推断出 $F$
我们观测到的相关随机变量值 $\mathbf {X} = (X_1 , X_2,\cdots , X_n)$ 称为 观测值、测量值、观测向量(observation)
参数化模型(parametric model)能够通过一组有限参数描述。 非参数化模型:有限参数无法描述。
参数模型的通用形式:
$$
\mathfrak{F} = \left\{ f(x; \theta) : \; \theta \in \Theta \right\}
$$
$\theta$ 是一个未知参数,其可以在 参数空间(parameter space) $\Theta$ 中取值. 若 $\theta $ 是向量,则其中我们不关心的分量称为 冗余参数。 若有分布 $X_1, \cdots ,X_n \sim F$ ,则任何 $F$ 的函数称为 统计泛函
假设我们有数据对 $ (X_1, Y_1) , \cdots (X_n, Y_n) $ 。假设 $X_i$ 表示病人 $i$ 的血压,$Y_i$ 表示病人的寿命。