线性模型中,除了有大量的矩阵表示,也存在如观测向量、误差向量等的随机向量。下面我们介绍关于随机向量(尤其是正态随机向量)的一些基本性质。
均值向量与协方差阵
设 $\pmb X=(X_1,\dots,X_n)’$ 为 $n\times1$ 随机向量,称
$\textsf{E}(\pmb X)=(\textsf{E}(X_1),\dots,\textsf{E}(X_n))'$
为 $\pmb X$ 的均值。
定理1. 设 $\pmb A$ 是 $m\times n$ 非随机矩阵,$\pmb X$ 和 $\pmb b$ 分别是 $n\times 1$ 和 $m\times 1$ 随机向量,记 $\pmb Y=\pmb A\pmb X+\pmb b$,则
$\textsf{E}(\pmb Y)=\pmb A\textsf{E}(\pmb X)+\textsf{E}(\pmb b).$
证明: 设 $\pmb A=(a_{ij})$,$\pmb b=(b_1,\dots,b_m)’$,$\pmb Y=(Y_1,\dots,Y_m)’$。于是
$\displaystyle Y_i=\sum_{j=1}^na_{ij}X_j+b_i,\quad i=1,\dots,m.$
求均值得
$\displaystyle\textsf{E}(Y_i)=\sum_{j=1}^na_{ij}\textsf{E}(X_j)+\textsf{E}(b_i),\quad i=1,\dots,m.$
这就是 $\textsf{E}(\pmb Y)=\pmb A\textsf{E}(\pmb X)+\textsf{E}(\pmb b)$。
定义 $n$ 维随机向量 $\pmb X$ 的协方差阵为
$\textsf{Cov}(\pmb X)=\textsf{E}[(\pmb X-\textsf{E}(\pmb X))(\pmb X-\textsf{E}(\pmb X))'].$
从定义中不难看出,$\textsf{tr}[\textsf{Cov}(\pmb X)]=\sum\limits_{i=1}^n\textsf{Var}(X_i)$。
定理2. 设 $\pmb X$ 为 $n\times1$ 随机向量,则它的协方差阵是非负定对称阵。
证明: 对称是显然的,下证非负定性。对任意的非随机 $n\times1$ 向量 $\pmb c$,注意到 $\pmb c’\pmb X$ 是一个随机变量,所以
$\begin{array}{rl}
0\leq\textsf{Var}(\pmb c'\pmb X)=&\!\!\!\!\textsf{E}[\pmb c'\pmb X-\textsf{E}(\pmb c'\pmb X)]^2\\
=&\!\!\!\!\textsf{E}[(\pmb c'\pmb X-\textsf{E}(\pmb c'\pmb X))(\pmb c'\pmb X-\textsf{E}(\pmb c'\pmb X))']\\
=&\!\!\!\!\pmb c'\textsf{E}[(\pmb X-\textsf{E}(\pmb X))(\pmb X-\textsf{E}(\pmb X))']\pmb c=\pmb c'\textsf{Cov}(\pmb X)\pmb c.
\end{array}$
结论得证。
下面定理给出了随机向量变换的协方差阵。
定理3. 设 $\pmb A$ 为 $m\times n$ 矩阵,$\pmb X$ 为 $n\times1$ 随机向量,$\pmb Y=\pmb A\pmb X$,则
$\textsf{Cov}(\pmb Y)=\pmb A\textsf{Cov}(\pmb X)\pmb A'.$
证明: 事实上,根据协方差阵的定义即有
$\begin{array}{rl}
\textsf{Cov}(\pmb Y)=&\!\!\!\!\textsf{E}[(\pmb Y-\textsf{E}(\pmb Y))(\pmb Y-\textsf{E}(\pmb Y))']\\
=&\!\!\!\!\textsf{E}[(\pmb A\pmb X-\textsf{E}(\pmb A\pmb X))(\pmb A\pmb X-\textsf{E}(\pmb A\pmb X))']\\
=&\!\!\!\!\pmb A\textsf{E}[(\pmb X-\textsf{E}(\pmb X))(\pmb X-\textsf{E}(\pmb X))']\pmb A'=\pmb A\textsf{Cov}(\pmb X)\pmb A'.
\end{array}$
设 $\pmb X$ 和 $\pmb Y$ 分别是 $n\times1$ 和 $m\times1$ 随机向量,定义它们的协方差阵为
$\textsf{Cov}(\pmb X,\pmb Y)=\textsf{E}[(\pmb X-\textsf{E}(\pmb X))(\pmb Y-\textsf{E}(\pmb Y))'].$
定理4. 设 $\pmb X$ 和 $\pmb Y$ 分别是 $n\times1$ 和 $m\times1$ 随机向量,$\pmb A$ 和 $\pmb B$ 分别是 $p\times n$ 和 $q\times m$ 非随机矩阵,则
$\textsf{Cov}(\pmb A\pmb X,\pmb B\pmb Y)=\pmb A\textsf{Cov}(\pmb X,\pmb Y)\pmb B'.$
证明: 由两向量协方差阵的定义即得
$\begin{array}{rl}
\textsf{Cov}(\pmb A\pmb X,\pmb B\pmb Y)=&\!\!\!\!\textsf{E}[(\pmb A\pmb X-\textsf{E}(\pmb A\pmb X))(\pmb B\pmb Y-\textsf{E}(\pmb B\pmb Y))']\\
=&\!\!\!\!\pmb A\textsf{E}[(\pmb X-\textsf{E}(\pmb X))(\pmb Y-\textsf{E}(\pmb Y))']\pmb B'=\pmb A\textsf{Cov}(\pmb X,\pmb Y)\pmb B'.
\end{array}$
随机向量的二次型
设 $\pmb X=(X_1,\dots,X_n)’$ 为 $n\times 1$ 随机向量,$\pmb A$ 为 $n\times n$ 对称阵,则称随机变量
$\displaystyle\pmb X'\pmb A\pmb X=\sum_{i=1}^n\sum_{j=1}^na_{ij}X_iX_j$
为 $\pmb X$ 的二次型。
定理5. 设 $\textsf{E}(\pmb X)=\pmb\mu$,$\textsf{Cov}(\pmb X)=\pmb\Sigma$,则
$\textsf{E}(\pmb X'\pmb A\pmb X)=\pmb\mu'\pmb A\pmb\mu+\textsf{tr}(\pmb A\pmb\Sigma).$
证明: 考虑二次型的分解
$\begin{array}{rl}
\pmb X'\pmb A\pmb X=&\!\!\!\!(\pmb X-\pmb\mu+\pmb\mu)'\pmb A(\pmb X-\pmb\mu+\pmb\mu)\\
=&\!\!\!\!(\pmb X-\pmb\mu)'\pmb A(\pmb X-\pmb\mu)+\pmb\mu'\pmb A(\pmb X-\pmb\mu)+(\pmb X-\pmb\mu)'\pmb A\pmb\mu+\pmb\mu'\pmb A\pmb\mu,
\end{array}$
注意到中间两项的数学期望为零,而且
$\begin{array}{rl}
\textsf{E}[(\pmb X-\pmb\mu)'\pmb A(\pmb X-\pmb\mu)]=&\!\!\!\!\textsf{E}[\textsf{tr}((\pmb X-\pmb\mu)'\pmb A(\pmb X-\pmb\mu))]\\
=&\!\!\!\!\textsf{E}[\textsf{tr}(\pmb A(\pmb X-\pmb\mu)(\pmb X-\pmb\mu)')]\\
=&\!\!\!\!\textsf{tr}\{\pmb A\textsf{E}[(\pmb X-\pmb\mu)(\pmb X-\pmb\mu)']\}=\textsf{tr}(\pmb A\pmb\Sigma).
\end{array}$
因此
$\textsf{E}(\pmb X'\pmb A\pmb X)=\pmb\mu'\pmb A\pmb\mu+\textsf{tr}(\pmb A\pmb\Sigma).$
推论. 在上面定理的假设条件下,
- 若 $\pmb\mu=\pmb0$,则 $\textsf{E}(\pmb X’\pmb A\pmb X)=\textsf{tr}(\pmb A\pmb\Sigma)$;
- 若 $\pmb\Sigma=\sigma^2\pmb I$,则 $\textsf{E}(\pmb X’\pmb A\pmb X)=\pmb\mu’\pmb A\pmb\mu+\sigma^2\textsf{tr}(\pmb A)$;
- 若 $\pmb\mu=\pmb0$,$\pmb\Sigma=\pmb I$,则 $\textsf{E}(\pmb X’\pmb A\pmb X)=\textsf{tr}(\pmb A)$。
下面定理揭示了二次型 $\pmb X’\pmb A\pmb X$ 的方差公式,比较复杂,值得体会。
定理6. 设随机变量 $X_i,i=1,\dots,n$ 相互独立,$\textsf{E}(X_i)=\mu_i$,$\textsf{Var}(X_i)=\sigma^2$,$m_r=\textsf{E}(X_i-\mu_i)^r,r=3,4$,$\pmb A=(a_{ij})_{n\times n}$ 为对称阵。记 $\pmb X=(X_1,\dots,X_n)’$,$\pmb\mu=(\mu_1,\dots,\mu_n)’$,则
$\textsf{Var}(\pmb X'\pmb A\pmb X)=(m_4-3\sigma^4)\pmb a'\pmb a+2\sigma^4\textsf{tr}(\pmb A^2)+4\sigma^2\pmb\mu'\pmb A^2\pmb\mu+4m_3\pmb\mu'\pmb A\pmb a,$
其中 $\pmb a=(a_{11},\dots,a_{nn})’$,即 $\pmb A$ 的对角元组成的列向量。
证明: 由题意知 $\textsf{E}(\pmb X)=\pmb\mu$,$\textsf{Cov}(\pmb X)=\sigma^2\pmb I_n$,故
$\textsf{E}(\pmb X'\pmb A\pmb X)=\pmb\mu'\pmb A\pmb\mu+\sigma^2\textsf{tr}(\pmb A).$
为计算方差
$\textsf{Var}(\pmb X'\pmb A\pmb X)=\textsf{E}(\pmb X'\pmb A\pmb X)^2-[\textsf{E}(\pmb X'\pmb A\pmb X)]^2,$
进一步只需要求第一项。利用分解的思想
$\begin{array}{rl}
\pmb X'\pmb A\pmb X=&\!\!\!\!(\pmb X-\pmb\mu+\pmb\mu)'\pmb A(\pmb X-\pmb\mu+\pmb\mu)\\
=&\!\!\!\!(\pmb X-\pmb\mu)'\pmb A(\pmb X-\pmb\mu)+\pmb\mu'\pmb A(\pmb X-\pmb\mu)+(\pmb X-\pmb\mu)'\pmb A\pmb\mu+\pmb\mu'\pmb A\pmb\mu\\
=&\!\!\!\!(\pmb X-\pmb\mu)'\pmb A(\pmb X-\pmb\mu)+2\pmb\mu'\pmb A(\pmb X-\pmb\mu)+\pmb\mu'\pmb A\pmb\mu,
\end{array}$
因此
$\begin{array}{rl}
(\pmb X'\pmb A\pmb X)^2=&\!\!\!\![(\pmb X-\pmb\mu)'\pmb A(\pmb X-\pmb\mu)]^2+4[\pmb\mu'\pmb A(\pmb X-\pmb\mu)]^2+(\pmb\mu'\pmb A\pmb\mu)^2\\
&+2\pmb\mu'\pmb A\pmb\mu[(\pmb X-\pmb\mu)'\pmb A(\pmb X-\pmb\mu)+2\pmb\mu'\pmb A(\pmb X-\pmb\mu)]\\
&+4\pmb\mu'\pmb A(\pmb X-\pmb\mu)(\pmb X-\pmb\mu)'\pmb A(\pmb X-\pmb\mu).
\end{array}$
为简化写法,令 $\pmb Z=\pmb X-\pmb\mu$,则 $\textsf{E}(\pmb Z)=\pmb0$,于是
$\textsf{E}(\pmb X'\pmb A\pmb X)^2=\textsf{E}(\pmb Z'\pmb A\pmb Z)^2+4\textsf{E}(\pmb\mu'\pmb A\pmb Z)^2+(\pmb\mu'\pmb A\pmb\mu)^2+2\pmb\mu'\pmb A(\sigma^2\textsf{tr}(\pmb A))+4\textsf{E}(\pmb\mu'\pmb A\pmb Z\pmb Z'\pmb A\pmb Z).$
下面逐个计算其中所含的每个均值。由
$\displaystyle (\pmb Z'\pmb A\pmb Z)^2=\sum_i\sum_j\sum_k\sum_la_{ij}a_{kl}Z_iZ_jZ_kZ_l$
及 $Z_i$ 的独立性导出的事实
$\textsf{E}(Z_iZ_jZ_kZ_l)=\left\{\begin{array}{ll}
m_4, & \text{若}~i=j=k=l,\\
\sigma^4, & \text{若}~i=j\neq k=l;i=k\neq j=l; i=l\neq j=k,\\
0, & \text{其它},
\end{array}\right.$
可得
$\begin{array}{rl}
\textsf{E}(\pmb Z'\pmb A\pmb Z)^2=&\!\!\!\!\displaystyle m_4\left(\sum_{i=1}^na_{ii}^2\right)+\sigma^4\left(\sum_{i\neq k}a_{ii}a_{kk}+\sum_{i\neq j}a_{ij}^2+\sum_{i\neq j}a_{ij}a_{ji}\right)\\
=&\!\!\!\!m_4\pmb a'\pmb a+\sigma^4\left\{(\textsf{tr}(\pmb A))^2-\pmb a'\pmb a+2[\textsf{tr}(\pmb A^2)-\pmb a'\pmb a]\right\}\\
=&\!\!\!\!(m_4-3\sigma^2)\pmb a'\pmb a+\sigma^4[(\textsf{tr}(\pmb A))^2+2\textsf{tr}(\pmb A^2)].
\end{array}$
而
$\textsf{E}(\pmb\mu'\pmb A\pmb Z)^2=\textsf{E}(\pmb Z'\pmb A\pmb\mu\pmb\mu'\pmb A\pmb Z)=\sigma^2\textsf{tr}(\pmb A\pmb\mu\pmb\mu'\pmb A)=\sigma^2\pmb\mu'\pmb A^2\pmb\mu.$
最后,若记 $\pmb b=\pmb A\pmb\mu$,则
$\begin{array}{rl}
\textsf{E}(\pmb\mu'\pmb A\pmb Z\pmb Z'\pmb A\pmb Z)=&\!\!\!\!\displaystyle\sum_i\sum_j\sum_kb_ia_{jk}\textsf{E}(Z_iZ_jZ_k)\\
=&\!\!\!\!\displaystyle m_3\sum_ib_ia_{ii}=m_3\pmb b'\pmb a=m_3\pmb\mu'\pmb A\pmb a.
\end{array}$
这是因为当且仅当 $i=j=k$ 时 $\textsf{E}(Z_iZ_jZ_k)=m_3$。综合上述结果,结论成立。
正态随机变量
设 $n$ 维随机向量 $\pmb X=(X_1,\dots,X_n)’$ 具有密度函数
$f(x)=\dfrac{1}{(2\pi)^{n/2}\vert\pmb\Sigma\vert^{1/2}}\exp\left\{-\dfrac{1}{2}(\pmb x-\pmb\mu)'\pmb\Sigma^{-1}(\pmb x-\pmb\mu)\right\},$
其中 $\pmb x=(x_1,\dots,x_n)’,-\infty<x_i<\infty,i=1,\dots,n$,$\pmb\mu=(\mu_1,\dots,\mu_n)’$,$\pmb\Sigma$ 是对称正定矩阵,则称 $\pmb X$ 为 $n$ 维正态随机向量,记为 $N_n(\pmb\mu,\pmb\Sigma)$ 或不引起混淆情况下记为 $N(\pmb\mu,\pmb\Sigma)$。
这里,两个参数 $\pmb\mu$ 和 $\pmb\Sigma$ 就是 $\pmb X$ 的均值向量和协方差矩阵。事实上,定义
$\pmb Y=\pmb\Sigma^{-1/2}(\pmb X-\pmb\mu),$
于是 $\pmb Y$ 的密度函数为
$g(\pmb y)=f(\pmb\Sigma^{1/2}\pmb y+\pmb\mu)\vert J\vert,$
这里 $J$ 为向量变换的Jacobi行列式 $\vert J\vert=\vert\pmb\Sigma^{1/2}\vert=\vert\pmb\Sigma\vert^{1/2}$。所以
$\displaystyle g(\pmb y)=\dfrac{1}{(2\pi)^{n/2}}\exp\left\{-\dfrac{1}{2}\pmb y'\pmb y\right\}=\prod_{i=1}^n\dfrac{1}{\sqrt{2\pi}}\text{e}^{-\frac{y_i^2}{2}}.$
这表明 $\pmb Y$ 的 $n$ 个分量相互独立,且服从 $N(0,1)$。因此
$\textsf{E}(\pmb Y)=\pmb0,~\textsf{Cov}(\pmb Y)=\pmb I_n,\quad\Longrightarrow\quad\textsf{E}(\pmb X)=\pmb\mu,~\textsf{Cov}(\pmb X)=\pmb\Sigma.$
注:称 $N(\pmb 0,\pmb I)$ 为多元标准正态分布。
定理7. 设 $\pmb X\sim N_n(\pmb\mu,\pmb\Sigma)$,且 $\pmb X,\pmb\mu,\pmb\Sigma$ 有如下分块形式:
$\pmb X=\left(\begin{array}{c}
\pmb X_1\\ \pmb X_2
\end{array}\right),\quad\pmb\mu=\left(\begin{array}{c}
\pmb\mu_1\\ \pmb\mu_2
\end{array}\right),\quad\pmb\Sigma=\left(\begin{array}{cc}
\pmb\Sigma_{11} & \pmb 0\\
\pmb 0 & \pmb\Sigma_{22}
\end{array}\right),$
其中 $\pmb X_1,\pmb\mu_1$ 均为 $m\times 1$向量,$\pmb\Sigma_{11}$ 为 $m\times m$ 矩阵,则
$\pmb X_i\sim N(\pmb\mu_i,\pmb\Sigma_{ii}),\quad i=1,2$,且相互独立。
特别地,若 $\pmb\Sigma=\sigma^2\pmb I_n$,且 $\pmb X=(X_1,\dots,X_n)’$,$\pmb\mu=(\mu_1,\dots,\mu_n)’$,则 $X_i\sim N(\mu_i,\sigma^2)$, $i=1,\dots,n$,且相互独立。
证明: 由定义可知 $f(\pmb x)$ 可写为
$f(\pmb x)=f_1(\pmb x_1)f_2(\pmb x_2),$
其中
$\begin{array}{rl}
f_1(\pmb x_1)=&\!\!\!\!\dfrac{1}{(2\pi)^{m/2}\vert\pmb\Sigma_{11}\vert^{1/2}}\exp\left\{-\dfrac{1}{2}(\pmb x_1-\pmb\mu_1)'\pmb\Sigma_{11}^{-1}(\pmb x_1-\pmb\mu_1)\right\},\\
f_2(\pmb x_2)=&\!\!\!\!\dfrac{1}{(2\pi)^{(n-m)/2}\vert\pmb\Sigma_{22}\vert^{1/2}}\exp\left\{-\dfrac{1}{2}(\pmb x_2-\pmb\mu_2)'\pmb\Sigma_{22}^{-1}(\pmb x_2-\pmb\mu_2)\right\}.
\end{array}$
这表明 $\pmb X_i\sim N(\pmb\mu_i,\pmb\Sigma_{ii})$, $i=1,2$,且相互独立。
对于多元正态分布来说,$\pmb X_1$ 与 $\pmb X_2$ 不相关(即 $\textsf{Cov}(\pmb X_1,\pmb X_2)=\pmb 0$),可以推出 $\pmb X_1$ 与 $\pmb X_2$ 独立。
定理8. 设 $n$ 维随机向量 $\pmb X\sim N(\pmb\mu,\pmb\Sigma)$,$\pmb A$ 为 $n\times n$ 非随机可逆矩阵,$\pmb b$ 为 $n\times 1$ 向量。记 $\pmb Y=\pmb A\pmb X+\pmb b$,则
$\pmb Y\sim N(\pmb A\pmb\mu+\pmb b,\pmb A\pmb\Sigma\pmb A').$
证明: 由于 $\pmb A$ 可逆,所以 $\pmb X=\pmb A^{-1}(\pmb Y-\pmb b)$,变换的Jacobi行列式 $\vert J\vert=\vert\pmb A\vert^{-1}$,因此
$\begin{array}{rl}
g(\pmb y)=&\!\!\!\!\dfrac{1}{(2\pi)^{n/2}\vert\pmb\Sigma\vert^{1/2}}\exp\left\{-\dfrac{1}{2}(\pmb A^{-1}(\pmb Y-\pmb b)-\pmb\mu)'\pmb\Sigma^{-1}(\pmb A^{-1}(\pmb Y-\pmb b)-\pmb\mu)\right\}\vert J\vert\\
=&\!\!\!\!\dfrac{1}{(2\pi)^{n/2}\vert\pmb A\pmb\Sigma\pmb A'\vert^{1/2}}\exp\left\{-\dfrac{1}{2}(\pmb Y-(\pmb A\pmb\mu+\pmb b))'(\pmb A\pmb\Sigma\pmb A')^{-1}(\pmb Y-(\pmb A\pmb\mu+\pmb b))\right\}
\end{array}$
这正是 $N(\pmb A\pmb\mu+\pmb b,\pmb A\pmb\Sigma\pmb A’)$ 的密度函数。
推论. 设 $\pmb X\sim N(\pmb\mu,\pmb\Sigma)$,则
$\pmb Y=\pmb\Sigma^{-1/2}\pmb X\sim N(\pmb\Sigma^{-1/2}\pmb\mu,\pmb I),\quad\pmb Z=\pmb\Sigma^{-1/2}(\pmb X-\pmb\mu)\sim N(\pmb 0,\pmb I).$
这意味着,我们可以用一个线性变换把诸分量相关且方差不等的多元正态随机向量变换成多元标准正态随机向量。
推论. 设 $\pmb X\sim N(\pmb\mu,\sigma^2\pmb I_n)$,$\pmb Q$ 为 $n\times n$ 正交阵,则
$\pmb Q\pmb X\sim N(\pmb Q\pmb\mu,\sigma^2\pmb I_n).$
这意味着,诸分量相互独立且具有等方差的正态随机向量,经过正交变换后,诸分量仍然相互独立且具有等方差。
下面定理是定理7中分块的一般情形,其密度函数不可分,考虑利用定理8中对其进行线性变换。
定理9. 设 $\pmb X\sim N_n(\pmb\mu,\pmb\Sigma)$,且 $\pmb X,\pmb\mu,\pmb\Sigma$ 有如下分块形式:
$\pmb X=\left(\begin{array}{c}
\pmb X_1\\ \pmb X_2
\end{array}\right),\quad\pmb\mu=\left(\begin{array}{c}
\pmb\mu_1\\ \pmb\mu_2
\end{array}\right),\quad\pmb\Sigma=\left(\begin{array}{cc}
\pmb\Sigma_{11} & \pmb\Sigma_{12}\\
\pmb\Sigma_{21} & \pmb\Sigma_{22}
\end{array}\right),$
其中 $\pmb X_1,\pmb\mu_1$ 均为 $m\times 1$向量,$\pmb\Sigma_{11}$ 为 $m\times m$ 矩阵,则
$\pmb X_i\sim N(\pmb\mu_i,\pmb\Sigma_{ii}),\quad i=1,2.$
证明: 在定理8中取
$\pmb A=\left(\begin{array}{cc}
\pmb I_m & \pmb 0\\
-\pmb\Sigma_{21}\pmb\Sigma_{11}^{-1} & \pmb I_{n-m}
\end{array}\right),\quad\pmb b=\pmb 0,$
则 $\pmb Y=\pmb A\pmb X\sim N(\pmb A\pmb\mu,\pmb A\pmb\Sigma\pmb A’)$。由于
$\pmb A\pmb\Sigma\pmb A'=\pmb\Sigma=\left(\begin{array}{cc}
\pmb\Sigma_{11} & \pmb 0\\
\pmb 0 & \pmb\Sigma_{22.1}
\end{array}\right),\quad\pmb\Sigma_{22.1}=\pmb\Sigma_{22}-\pmb\Sigma_{21}\pmb\Sigma_{11}^{-1}\pmb\Sigma_{12}.$
于是
$\pmb Y=\left(\begin{array}{c}
\pmb Y_1\\ \pmb Y_2
\end{array}\right)=\left(\begin{array}{c}
\pmb X_1\\ \pmb X_2-\pmb\Sigma_{21}\pmb\Sigma_{11}^{-1}\pmb X_1
\end{array}\right)\sim N\left(\left(\begin{array}{c}
\pmb\mu_1\\ \pmb\mu_2-\pmb\Sigma_{21}\pmb\Sigma_{11}^{-1}\pmb\mu_1
\end{array}\right),\left(\begin{array}{cc}
\pmb\Sigma_{11} & \pmb 0\\
\pmb 0 & \pmb\Sigma_{22.1}
\end{array}\right)\right).$
由定理7可知 $\pmb X_1\sim N(\pmb\mu_1,\pmb\Sigma_{11})$,同理 $\pmb X_2\sim N(\pmb\mu_2,\pmb\Sigma_{22})$。
下面定理是定理8的改进版本,它不要求变换矩阵 $\pmb A$ 是可逆方阵。
定理10. 设 $n$ 维随机向量 $\pmb X\sim N(\pmb\mu,\pmb\Sigma)$,$\pmb A$ 为 $m\times n$ 矩阵,且秩为 $m(<n)$,则
$\pmb Y=\pmb A\pmb X\sim N_m(\pmb A\pmb\mu,\pmb A\pmb\Sigma\pmb A').$
证明: 将 $\pmb A$ 扩充为 $n\times n$ 可逆矩阵
$\pmb C=\left(\begin{array}{c}
\pmb A\\ \pmb B
\end{array}\right).$
应用定理8得
$\pmb Z=\pmb C\pmb X=\left(\begin{array}{c}
\pmb A\\ \pmb B
\end{array}\right)\pmb X\sim N\left(\left(\begin{array}{c}
\pmb A\pmb\mu\\ \pmb B\pmb\mu
\end{array}\right),\left(\begin{array}{cc}
\pmb A\pmb\Sigma\pmb A' & \pmb A\pmb\Sigma\pmb B'\\
\pmb B\pmb\Sigma\pmb A' & \pmb B\pmb\Sigma\pmb B'
\end{array}\right)\right).$
再利用定理9可得 $\pmb Y=\pmb A\pmb X\sim N_m(\pmb A\pmb\mu,\pmb A\pmb\Sigma\pmb A’)$。
推论. 设 $n$ 维随机向量 $\pmb X\sim N(\pmb\mu,\pmb\Sigma)$,$\pmb c$ 是 $n\times 1$ 非零向量,则
$\pmb c'\pmb X\sim N(\pmb c'\pmb\mu,\pmb c'\pmb\Sigma\pmb c).$
即多元正态随机向量的任意非退化线性组合是一元正态随机变量。
推论. 设 $n$ 维随机向量 $\pmb X\sim N(\pmb\mu,\pmb\Sigma)$,$\pmb\mu=(\mu_1,\dots,\mu_n)’$,$\pmb\Sigma=(\sigma_{ij})$,则
$X_i\sim N(\mu_i,\sigma_{ii}),\quad i=1,\dots,n.$
即多元正态随机向量的任一分量为正态随机变量。反之结论并不成立。
后记
本文内容参考自《线性模型引论》(王松桂等,科学出版社)。
如对本文内容有任何疑问,请联系 watthu@mail.ustc.edu.cn。