本节我们重点介绍正态随机向量的二次型的一些基本性质。
正态随机向量的二次型
设 $\pmb X\sim N_n(\pmb\mu,\pmb\Sigma)$,$\pmb A_{n\times n}$ 为实对称矩阵,以下总假设 $\pmb\Sigma>\pmb 0$。
定理1. 设 $\pmb X\sim N_n(\pmb\mu,\pmb\Sigma)$,$\pmb A$ 为 $n\times n$ 实对称矩阵,则
特别地,当 $\pmb\Sigma=\sigma^2\pmb I_n$ 时,
证明: 记 $\pmb Y=\pmb\Sigma^{-1/2}\pmb X$,则 $\pmb Y\sim N(\pmb\Sigma^{-1/2}\pmb\mu,\pmb I_n)$,所以 $\pmb Y$ 的各分量相互独立,且
注意到对正态分布 $m_3=0$,$m_4=3$,应用上节的定理6可知,
设 $\pmb X\sim N(\pmb\mu,\pmb I_n)$。随机变量 $Y=\pmb X’\pmb X$ 的分布称为自由度为 $n$,非中心参数为 $\lambda=\pmb\mu’\pmb\mu$ 的 $\chi^2$ 分布,记为 $Y\sim\chi^2(n,\lambda)$。当 $\lambda=0$ 时,称 $Y$ 的分布为中心 $\chi^2$ 分布,记为 $Y\sim\chi^2(n)$。
我们知道 $\chi^2$ 分布具有如下性质:
- 可加性:设 $Y_i\sim\chi^2(n_i,\lambda_i)$,$i=1,\dots,k$,且相互独立,则
$Y_1+\cdots+Y_k\sim\chi^2(n,\lambda),$ 这里 $n=\sum\limits_{i=1}^kn_i$,$\lambda=\sum\limits_{i=1}^k\lambda_i$。
- 数字特征:$\textsf{E}(\chi^2(n,\lambda))=n+\lambda$,$\textsf{Var}(\chi^2(n,\lambda))=2n+4\lambda$。
另外,设 $X\sim N_n(\pmb0,\pmb\Sigma)$,$\pmb\Sigma$ 为正定矩阵,则 $\pmb Y=\pmb\Sigma^{-1/2}\pmb X\sim N_n(\pmb0,\pmb I_n)$,于是
对于正态随机向量的一般二次型,我们有下面的定理。
定理2. 设 $X\sim N_n(\pmb\mu,\pmb I_n)$,$\pmb A$ 为 $n\times n$ 实对称矩阵,则
证明: 先证充分性。设 $\pmb A$ 幂等、对称且 $\textsf{rk}(\pmb A)=r$,于是存在正交矩阵 $\pmb Q$ 使得
令 $\pmb Y=\pmb Q’\pmb X$,则 $\pmb Y\sim N_n(\pmb Q’\pmb\mu,\pmb I_n)$。对 $\pmb Y$ 和 $\pmb Q’$ 做分块
其中 $\pmb Y_1$ 和 $\pmb Q_1$ 分别是 $r\times 1$ 和 $r\times n$ 矩阵。于是 $\pmb A=\pmb Q_1’\pmb Q_1$,$\pmb Y_1=\pmb Q_1\pmb X\sim N_r(\pmb Q_1\pmb\mu,\pmb I_r)$,且
其中 $\lambda=(\pmb Q_1\pmb\mu)’(\pmb Q_1\pmb\mu)=\pmb\mu’\pmb Q_1’\pmb Q_1\pmb\mu=\pmb\mu’\pmb A\pmb\mu$。
再证必要性。设 $\textsf{rk}(\pmb A)=t$,因 $\pmb A$ 对称,故存在正交矩阵 $\pmb Q$ 使得
其中 $\pmb\Lambda=\textsf{diag}(\lambda_1,\dots,\lambda_t)$,$\lambda_1,\dots,\lambda_t$ 非零。令 $\pmb Y=\pmb Q’\pmb X$,则 $\pmb Y\sim N_n(\pmb Q’\pmb\mu,\pmb I_n)$。记 $\pmb c=\pmb Q’\pmb\mu=(c_1,\dots,c_n)’$,则
其中 $\pmb Y=(Y_1,\dots,Y_n)’$,$Y_j\sim N(c_j,1)$,$j=1,\dots,t$,且相互独立。注意到 $\lambda_jY_j^2$ 的特征函数为
于是 $\pmb X’\pmb A\pmb X$ 的特征函数为
另一方面,由假设 $\pmb X’\pmb A\pmb X\sim\chi^2(r,\lambda)$,$\lambda=\pmb\mu’\pmb A\pmb\mu$,故其特征函数为
二者应该相等。比较两者的奇点和个数可知,$\lambda_j=1,j=1,\dots,t$,且 $t=r$,因此必要性得证。
推论. 设 $\pmb A_{n\times n}$ 为实对称矩阵,$\pmb X\sim N(\pmb\mu,\pmb I_n)$,那么
推论. 设 $\pmb A_{n\times n}$ 为实对称矩阵,$\pmb X\sim N(\pmb0,\pmb I_n)$,那么
推论. 设 $\pmb A_{n\times n}$ 为实对称矩阵,$\pmb X\sim N(\pmb\mu,\pmb\Sigma)$,$\pmb\Sigma>\pmb0$,那么
定理2及其推论把判定正态随机向量的二次型服从 $\chi^2$ 分布的问题转化为研究相应的二次型矩阵的问题,而后者往往很容易处理。因此,这些结果时判定 $\chi^2$ 分布的很有效的工具。
定理3. 设 $\pmb X\sim N_n(\pmb\mu,\pmb I_n)$,$\pmb A$ 为 $n\times n$ 实对称矩阵,$\pmb X’\pmb A\pmb X=\pmb X’\pmb A_1\pmb X+\pmb X’\pmb A_2\pmb X\sim\chi^2(r,\lambda)$,$\pmb X’\pmb A_1\pmb X\sim\chi^2(s,\lambda_1)$,$\pmb A_2=\pmb A-\pmb A_1\geq\pmb0$,其中 $\lambda=\pmb\mu’\pmb A\pmb\mu$,$\lambda_1=\pmb\mu’\pmb A_1\pmb\mu$,则
- $\pmb X’\pmb A_2\pmb X\sim\chi^2(r-s,\lambda_2)$,$\lambda_2=\pmb\mu’\pmb A_2\pmb\mu$;
- $\pmb X’\pmb A_1\pmb X$ 与 $\pmb X’\pmb A_2\pmb X$ 相互独立;
- $\pmb A_1\pmb A_2=\pmb 0$。
证明: 因为 $\pmb X’\pmb A\pmb X\sim\chi^2(r,\lambda)$,由定理2可知,$\pmb A$ 幂等且 $\textsf{rk}(\pmb A)=r$,于是存在正交矩阵 $\pmb P$ 使得
记
则
由 $\pmb A_1\geq\pmb0$ 和 $\pmb A-\pmb A_1\geq\pmb0$ 知 $\pmb D$ 和 $-\pmb D$ 均为非负定矩阵,因此 $\pmb D=\pmb 0$,从而
又因为 $\pmb A_1$ 幂等且 $\textsf{rk}(\pmb A_1)=s$,因此 $\pmb B$ 具有同样性质,于是存在 $r\times r$ 正交矩阵 $\pmb Q$ 使得
记
则 $\pmb S’$ 为 $n\times n$ 正交矩阵,且
即 $\pmb S’$ 使得 $\pmb A$ 和 $\pmb A_1$ 同时对角化。作变换 $\pmb Y=\pmb S’\pmb X$,则 $\pmb Y\sim N_n(\pmb S’\pmb\mu,\pmb I_n)$,于是
所以
其中 $\lambda_2=\pmb\mu’\pmb A_2\pmb\mu$。又因为 $Y_1,\dots,Y_n$ 相互独立,所以 $\pmb X’\pmb A_1\pmb X$ 与 $\pmb X’\pmb A_2\pmb X$ 相互独立,此外
由此定理得证。
推论. 设 $X\sim N_n(\pmb\mu,\pmb I_n)$,$\pmb A_1$ 和 $\pmb A_2$ 为 $n\times n$ 实对称矩阵,$\pmb X’\pmb A_1\pmb X$ 和 $\pmb X’\pmb A_2\pmb X$ 都服从 $\chi^2$ 分布,则
证明: 充分性。令 $\pmb A=\pmb A_1+\pmb A_2$,由 $\pmb A_1\pmb A_2=\pmb 0$ 可知 $\pmb A_2\pmb A_1=(\pmb A_1\pmb A_2)’=\pmb 0$,因此由 $\pmb A_1,\pmb A_2$ 的幂等性可知
即 $\pmb A$ 幂等,由定理3可知 $\pmb X’\pmb A_1\pmb X$ 和 $\pmb X’\pmb A_2\pmb X$ 相互独立。
必要性。若 $\pmb X’\pmb A_1\pmb X$ 和 $\pmb X’\pmb A_2\pmb X$ 相互独立,则由 $\chi^2$ 分布的可加性知 $\pmb X’\pmb A\pmb X=\pmb X’\pmb A_1\pmb X+\pmb X’\pmb A_2\pmb X$ 服从 $\chi^2$ 分布,再由定理3可知 $\pmb A_1\pmb A_2=\pmb 0$。
推论. 设 $\pmb X\sim N_n(\pmb\mu,\pmb\Sigma)$,$\pmb\Sigma>\pmb 0$,$\pmb X’\pmb A\pmb X=\pmb X’\pmb A_1\pmb X+\pmb X’\pmb A_2\pmb X\sim\chi^2(r,\lambda)$,$\pmb X’\pmb A_1\pmb X\sim\chi^2(s,\lambda_1)$,$\pmb A_2=\pmb A-\pmb A_1\geq\pmb 0$,则
- $\pmb X’\pmb A_2\pmb X\sim\chi^2(r-s,\lambda_2)$;
- $\pmb X’\pmb A_1\pmb X$ 与 $\pmb X’\pmb A_2\pmb X$ 相互独立;
- $\pmb A_1\pmb\Sigma\pmb A_2=\pmb 0$,
其中 $\lambda,\lambda_1,\lambda_2$ 为非中心参数,不再精确写出。
推论. 设 $\pmb X\sim N_n(\pmb\mu,\pmb\Sigma)$,$\pmb\Sigma>\pmb 0$,$\pmb A_1$ 和 $\pmb A_2$ 为 $n\times n$ 实对称矩阵,$\pmb X’\pmb A_1\pmb X$ 和 $\pmb X’\pmb A_2\pmb X$ 都服从 $\chi^2$ 分布,则
正态随机向量的二次型与线性型的独立性
设 $\pmb X\sim N_n(\pmb\mu,\pmb\Sigma)$,$\pmb A,\pmb B$ 皆为 $n$ 阶实对称矩阵,$\pmb C$ 为 $m\times n$ 矩阵。下面我们将主要建立二次型 $\pmb X’\pmb A\pmb X,\pmb X’\pmb B\pmb X$ 和线性型 $\pmb C\pmb X$ 相互独立的条件,这些结果在线性模型的参数估计和假设检验中将有重要应用。
定理4. 设 $\pmb X\sim N_n(\pmb\mu,\pmb I_n)$,$\pmb A$ 为 $n\times n$ 实对称矩阵,$\pmb C$ 为 $m\times n$ 实矩阵。若 $\pmb C\pmb A=\pmb 0$,则 $\pmb C\pmb X$ 与 $\pmb X’\pmb A\pmb X$ 相互独立。
证明: 由于 $\pmb A$ 是实对称矩阵,因此存在正交矩阵 $\pmb P$ 使得
其中 $\pmb\Lambda=\textsf{diag}(\lambda_1,\dots,\lambda_r)$,$\lambda_i,i=1,\dots,r$ 为 $\pmb A$ 的非零特征根,$r$ 为 $\pmb A$ 的秩。将矩阵 $\pmb P$ 分块成 $\pmb P=(\pmb P_1\vdots\pmb P_2)$,其中 $\pmb P_1$ 是 $n\times r$ 矩阵,考虑正交变换
于是 $\pmb Y_i=\pmb P_i’\pmb X,i=1,2$。由于 $\pmb Y\sim N_n(\pmb P’\pmb\mu,\pmb I_n)$,所以
且 $\pmb Y_1$ 与 $\pmb Y_2$ 相互独立。而由 $\pmb C\pmb A=\pmb 0$ 可得
记 $\pmb D=\pmb C\pmb P$,将其分块为 $\pmb D=(\pmb D_1\vdots\pmb D_2)$,其中 $\pmb D_1$ 为 $m\times r$ 矩阵。由上式可知 $\pmb D_1=\pmb 0$,因此
又注意到
结合 $\pmb Y_1$ 与 $\pmb Y_2$ 的独立性可知 $\pmb C\pmb X$ 与 $\pmb X’\pmb A\pmb X$ 相互独立。
推论. 设 $\pmb X\sim N_n(\pmb\mu,\pmb\Sigma)$,$\pmb\Sigma>0$,$\pmb A$ 为 $n\times n$ 实对称矩阵,$\pmb C$ 为 $m\times n$ 实矩阵。若 $\pmb C\pmb\Sigma\pmb A=\pmb 0$,则 $\pmb C\pmb X$ 与 $\pmb X’\pmb A\pmb X$ 相互独立。
引理. 设 $\pmb A$ 和 $\pmb B$ 均为 $n\times n$ 实对称矩阵,则存在正交矩阵 $\pmb Q$ 使得 $\pmb Q’\pmb A\pmb Q$ 与 $\pmb Q’\pmb B\pmb Q$ 为对角阵,当且仅当 $\pmb A\pmb B=\pmb B\pmb A$。
证明: 充分性。首先存在正交矩阵 $\pmb P_1$ 使得
其中 $r_1+\cdots+r_s=n$。又因为 $\pmb A\pmb B=\pmb B\pmb A$,所以
即 $\pmb D\pmb C=\pmb C\pmb D$,其中 $\pmb C=\pmb P_1’\pmb B\pmb P_1$。因此 $\pmb C$ 也必为分块对角矩阵:
注意到 $\pmb C$ 是对称矩阵,所以存在正交矩阵
使得 $\pmb P_2’\pmb C\pmb P_2$ 为对角阵。令 $\pmb Q=\pmb P_1\pmb P_2$,则可同时使 $\pmb Q’\pmb A\pmb Q$ 与 $\pmb Q’\pmb B\pmb Q$ 均为对角阵。
必要性。注意到
左乘 $\pmb Q$ 并右乘 $\pmb Q’$ 可得 $\pmb A\pmb B=\pmb B\pmb A$。
定理5. 设 $\pmb X\sim N_n(\pmb\mu,\pmb I_n)$,$\pmb A$ 和 $\pmb B$ 均为 $n\times n$ 实对称矩阵,且 $\pmb A\pmb B=\pmb 0$,则二次型 $\pmb X’\pmb A\pmb X$ 与 $\pmb X’\pmb B\pmb X$ 相互独立。
证明: 由 $\pmb A\pmb B=\pmb 0$ 以及 $\pmb A$ 和 $\pmb B$ 的对称性,立得 $\pmb B\pmb A=\pmb A\pmb B=0$,即 $\pmb A,\pmb B$ 可交换。由引理知,存在正交矩阵 $\pmb Q$ 使得
由 $\pmb A\pmb B=\pmb 0$ 可推得 $\pmb\Lambda_1\pmb\Lambda_2=\pmb 0$,即 $\lambda_i^{(1)}$ 和 $\lambda_i^{(2)}$ 至少有一个为0,$i=1,\dots,n$。
令 $\pmb Y=\pmb Q’\pmb X$,则 $\pmb Y\sim N(\pmb Q’\pmb\mu,\pmb I_n)$,于是 $\pmb Y$ 的所有分量都相互独立。另一方面,由于
所以由它们特征值不同时为0的性质知 $\pmb X’\pmb A\pmb X$ 和 $\pmb X’\pmb B\pmb X$ 依赖于 $\pmb Y$ 的不同分量,所以它们相互独立。
注: 这个定理的逆也是成立的,即设 $\pmb X\sim N_n(\pmb\mu,\pmb I_n)$,$\pmb A$ 和 $\pmb B$ 均为 $n\times n$ 实对称矩阵,若 $\pmb X’\pmb A\pmb X$ 与 $\pmb X’\pmb B\pmb X$ 相互独立,则 $\pmb A\pmb B=\pmb 0$。
推论. 设 $\pmb X\sim N_n(\pmb\mu,\pmb\Sigma)$,$\pmb\Sigma>\pmb 0$,$\pmb A$ 和 $\pmb B$ 均为 $n\times n$ 实对称矩阵,且 $\pmb A\pmb\Sigma\pmb B=\pmb 0$,则二次型 $\pmb X’\pmb A\pmb X$ 与 $\pmb X’\pmb B\pmb X$ 相互独立。
后记
本文内容参考自《线性模型引论》(王松桂等,科学出版社)。
如对本文内容有任何疑问,请联系 watthu@mail.ustc.edu.cn。