随机变量

随机变量的分类

随机变量按其值域（根据定义，随机变量是一个函数）是否可数分为 离散型 和 连续型 两种。

设 \(X\) 为离散型随机变量，其所有可能的取值为 \(x_1, x_2, \cdots\)，则我们可以用一系列形如 \(P\{ X = x_i \} = p_i\) 的等式来描述 \(X\)。这就是我们在高中课本中学过的 分布列。

设 \(X\) 为连续型随机变量，考察 \(P\{ X = x \}\) 往往是无意义的（因为这一概率很可能是 \(0\)）。

为什么说概率「很可能」是 \(0\)

考虑这样的随机变量 \(X\)：它以 \(\frac{1}{2}\) 的概率取 \(0\)，以 \(\frac{1}{2}\) 的概率服从开区间 \((0, 1)\) 上的均匀分布。显然 \(X\) 满足连续型随机变量的定义。

对任何实数 \(r \in (0, 1)\)，不难得到 \(P\{ X = r \} = 0\)，但同时有 \(P\{ X = 0 \} = \frac{1}{2}\)。

另一方面，设 \(X \sim F(x)\)，则

\[ P( l < x \leq l + \Delta x ) = F(l + \Delta x) - F(l) \]

一个自然的想法是用极限 \(\lim\limits_{\Delta x \to 0^+} \frac{F(l + \Delta x) - F(l)}{\Delta x}\) 来描述 \(X\) 取值为 \(l\) 的可能性。

这个式子就是我们熟知的导数，于是问题转化为寻找一个非负函数 \(f(x)\) 使得

\[ F(x) = \int_{-\infty}^{x} f(x) \text{d} x \]

若这样的 \(f(x)\) 存在，则称之为 \(X\) 的 密度函数。

前面讨论了随机事件的独立性。由于随机变量和随机事件紧密联系，我们还可以类似地给出随机变量独立性的定义。

若随机变量 \(X, Y\) 满足对任意的 \(x, y \in \mathbb{R}\) 都有

\[ P( X \leq x, Y \leq y ) = P( X \leq x ) P( Y \leq y ) \]

则称随机变量 \(X, Y\) 独立。

Note

有些同学也许会注意到，中学课本中对随机变量独立性的定义是用形如 \(P(X = \alpha)\) 的概率定义的，但由于连续性随机变量取特定值的概率通常是 \(0\)，故在更一般的情形下借助分布函数定义才是更加明智的选择。

若随机变量 \(X\),\(Y\) 相互独立，则对于任意函数 \(f, g\)，随机变量 \(f(X)\) 与 \(g(Y)\) 相互独立。

Warning

有时候我们会研究相互独立的随机变量 \(X\),\(Y\) 的某一函数 \(f(X, Y)\)（如 \(XY^2\)）的分布。

尽管 \(X\) 与 \(Y\) 是独立的，但不能想当然地认为对 \(Y\) 的某一取值 \(y\)，\(f(X, y)\) 与 \(f(X, Y)\) 服从同样的分布。

本页面的全部内容在 小熊老师 - 莆田青少年编程俱乐部 0594codes.cn 协议之条款下提供，附加条款亦可能应用