常见分布参数的后验分布计算(续)
一类离散分布总体
设离散随机变量 $X$ 的概率分布有下列形式:
其中 $b(x)$ 和 $d(x)$ 取值为非负整数。此类分布包含下列几个常见的分布:
- 两点分布 $\text{Bernoulli}(\theta)$:$h(x)=1$,$b(x)=x$,$d(x)=1-x$;
- 二项分布 $B(n,\theta)$:$\displaystyle h(x)=\binom{n}{x}$,$b(x)=x$,$d(x)=n-x$;
- 几何分布 $Ge(\theta)$:$h(x)=1$,$b(x)=1$,$d(x)=x-1$;
- 负二项分布 $NB(r,\theta)$:$\displaystyle h(x)=\binom{x-1}{r-1}$,$b(x)=r$,$d(x)=x-r$。
1. 无信息先验
- 当参数的先验分布为Laplace无信息先验,即 $\pi(\theta)=\pmb 1_{(0,1)}(\theta)$ 时,$\theta$ 的后验密度为
$\pi(\theta\mid x)=\dfrac{f(x\mid\theta)\pi(\theta)}{\int_{\Theta}f(x\mid\theta)\pi(\theta){\rm d}\theta}\propto\theta^{b(x)}(1-\theta)^{d(x)},\quad 0<\theta<1.$ 添加正则化常数可得 $\theta$ 的后验分布为
$\theta\mid x\sim Be(b(x)+1,d(x)+1).$ -
当参数的先验分布为Jeffreys无信息先验时,首先写出对数似然函数
$l(\theta\mid x)=\ln h(x)+b(x)\ln\theta+d(x)\ln(1-\theta).$ 因此
$\dfrac{\partial^2l(\theta\mid x)}{\partial\theta^2}=-\dfrac{b(x)}{\theta^2}-\dfrac{d(x)}{(1-\theta)^2},$ 所以Fisher信息阵
$I(\theta)=\mathbb E\left[-\dfrac{\partial^2l(\theta\mid X)}{\partial\theta^2}\right]=\dfrac{\mathbb E[b(X)]}{\theta^2}+\dfrac{\mathbb E[d(X)]}{(1-\theta)^2}.$ 因此对应的Jeffreys先验为
$\pi(\theta)=[{\rm det}~I(\theta)]^{1/2}=\sqrt{\dfrac{\mathbb E[b(X)]}{\theta^2}+\dfrac{\mathbb E[d(X)]}{(1-\theta)^2}},\quad 0<\theta<1.$
2. 共轭先验
- 当参数的先验分布为共轭先验分布时,设 $\theta$ 的共轭先验分布为 $Be(\alpha,\beta)$,其密度函数为
$\pi(\theta)=\dfrac{\Gamma(\alpha+\beta)}{\Gamma(\alpha)\Gamma(\beta)}\theta^{\alpha-1}(1-\theta)^{\beta-1},\quad 0<\theta<1.$ 所以 $\theta$ 的后验密度为
$\pi(\theta\mid x)=\dfrac{f(x\mid\theta)\pi(\theta)}{\int_{\Theta}f(x\mid\theta)\pi(\theta){\rm d}\theta}\propto\theta^{\alpha+b(x)-1}(1-\theta)^{\beta+d(x)-1},\quad 0<\theta<1.$ 添加正则化常数可得 $\theta$ 的后验分布为
$\theta\mid x\sim Be(\alpha+b(x),\beta+d(x)).$
下表总结这类离散分布总体在三种先验下的后验分布结论。
总体分布 | Laplace无信息先验 | Jeffreys无信息先验 | 共轭先验 $Be(\alpha,\beta)$ |
---|---|---|---|
两点分布 | $Be(x+1,2-x)$ | $Be(x+1/2,3/2-x)$ | $Be(\alpha+x,\beta+1-x)$ |
二项分布 | $Be(x+1,n+1-x)$ | $Be(x+1/2,n+1/2-x)$ | $Be(\alpha+x,\beta+n-x)$ |
几何分布 | $Be(2,x)$ | $Be(1,x-1/2)$ | $Be(\alpha+1,\beta+x-1)$ |
负二项分布 | $Be(r+1,x-r+1)$ | $Be(r,x-r+1/2)$ | $Be(\alpha+r,\beta+x-r)$ |
多项分布总体
定义(多项分布) 若 $k$ 维随机向量 $\pmb X=(X_1,\dots,X_k)$ 的概率密度函数为
其中 $\pmb x=(x_1,\dots,x_k),x_i>0,i=1,2,\dots,k$,$\pmb\theta=(\theta_1,\dots,\theta_k),0<\theta_i<1$,则称 $\pmb X$ 服从参数为 $\pmb\theta=(\theta_1,\dots,\theta_k)$ 的多项分布,记为 $\pmb X\sim MN(n;\theta_1,\dots,\theta_k)$。
定义(Dirichlet分布) 若 $k$ 维随机向量 $\pmb\theta=(\theta_1,\dots,\theta_k)$ 的概率密度函数为
其中 $\pmb\theta=(\theta_1,\dots,\theta_k),0<\theta_i<1,i=1,2,\dots,k$,$\pmb\alpha=(\alpha_1,\dots,\alpha_k),\alpha_i>0$,则称 $\pmb\theta$ 服从参数为 $\pmb\alpha=(\alpha_1,\dots,\alpha_k)$ 的Dirichlet分布,记为 $\pmb\theta\sim\mathcal{D}(\alpha_1,\dots,\alpha_k)$。
1. 无信息先验
考虑Jeffreys无信息先验,首先写出对数似然函数
所以
因此
所以Fisher信息阵为
所以 $\pmb\theta$ 的无信息先验密度为
所以当 $\pmb X=\pmb x$ 给定时,$\pmb\theta$ 的后验密度为
添加正则化常数可得 $\pmb\theta$ 的后验分布为
2. 共轭先验
设 $\pmb\theta$ 的共轭先验分布为 $\mathcal{D}(\alpha_1,\dots,\alpha_k)$,其密度函数为
其中 $\pmb\theta=(\theta_1,\dots,\theta_k),0<\theta_i<1,i=1,2,\dots,k$。所以 $\pmb\theta$ 的后验密度为
添加正则化常数可得 $\pmb\theta$ 的后验分布为
寿命分布总体
设总体 $X$ 服从伽马分布 $\Gamma(r,\lambda)$,其密度函数为
其中 $r$ 已知。设 $\pmb X=(X_1,\dots,X_n)$ 为从总体中抽取的i.i.d.样本。
1. 无信息先验
考虑 $\lambda$ 的无信息先验为Jeffreys先验。首先写出其对数似然函数
所以
因此Fisher信息阵为
所以 $\lambda$ 的无信息先验密度为
所以当 $\pmb X=\pmb x$ 给定时,$\lambda$ 的后验密度为
添加正则化常数可得 $\lambda$ 的后验分布为
2. 共轭先验
设 $\lambda$ 的共轭先验分布为 $\Gamma(\alpha,\beta)$,其密度函数为
所以 $\lambda$ 的后验密度为
添加正则化常数可得 $\lambda$ 的后验分布为
指数分布总体截尾
定数截尾
假定指数分布 $Exp(\lambda)$ 的样本 $X_1,\dots,X_n$ 中仅观测到前 $r$ 个,即 $X_{(1)}<X_{(2)}<\cdots<X_{(r)}$ 为 $n$ 个观测值中可观测到的前 $r$ 个,其中 $X_{(1)},\dots,X_{(r)},\dots,X_{(n)}$ 为样本 $X_1,\dots,X_n$ 的次序统计量。可以证明
是 $\lambda$ 的充分统计量,且 $2T/\lambda\sim\chi^2(2r)$。所以 $T$ 的密度函数为
-
无信息先验
考虑 $\lambda$ 的无信息先验为Jeffreys先验 $\pi(\lambda)=1/\lambda$,则 $\lambda$ 的后验密度为
$\pi(\lambda\mid t)\propto g(t\mid\lambda)\pi(\lambda)\propto\lambda^{-(r+1)}\exp\left\{-\dfrac{t}{\lambda}\right\},\quad\lambda>0.$ 添加正则化常数可得 $\lambda$ 的后验分布为
$\lambda\mid\pmb x\sim\Gamma^{-1}(r,t),$ 其中 $\displaystyle t=\sum\limits_{j=1}^rx_{(j)}+(n-r)x_{(r)}$.
-
共轭先验
设 $\lambda$ 的共轭先验分布为 $\Gamma^{-1}(\alpha,\beta)$,则 $\lambda$ 的后验密度为
$\pi(\lambda\mid t)\propto g(t\mid\lambda)\pi(\lambda)\propto\lambda^{-(r+\alpha+1)}\exp\left\{-\dfrac{t+\beta}{\lambda}\right\},\quad\lambda>0.$ 添加正则化常数可得$\Lambda$的后验分布为 $\lambda$ 的后验分布为
$\lambda\mid\pmb x\sim\Gamma^{-1}(r+\alpha,t+\beta),$ 其中 $\displaystyle t=\sum\limits_{j=1}^rx_{(j)}+(n-r)x_{(r)}$.
定时截尾
设总体 $X\sim Exp(\theta)$,且假定指数分布的 $n$ 个样本 $X_1,\dots,X_n$ 中仅观测到不大于 $C$ 的样本,即观测到 $(Y_1,\Lambda_1),\dots,(Y_n,\Lambda_n)$,其中
其中 $C$ 为已知的定时数。
考察样本 $(Y_i,\Lambda_i)$ 关于参数 $\theta$ 的似然函数
所以
其中 $\displaystyle R=\sum_{i=1}^n\Lambda_i$,$X_{(1)},\dots,X_{(R)},X_{(R+1)},\dots,X_{(n)}$ 表示 $X_1,\dots,X_n$ 的次序统计量。
-
共轭先验
当参数的先验分布为共轭先验分布时,设 $\theta$ 的共轭先验分布为伽马分布 $\Gamma(\alpha,\beta)$,其密度函数为
$\pi(\theta)=\dfrac{\beta^\alpha}{\Gamma(\alpha)}\theta^{\alpha-1}\exp\{-\beta\theta\},\quad\theta>0.$ 所以 $\theta$ 的后验密度为
$\displaystyle\pi(\theta\mid\pmb Y,\pmb\Lambda)=\dfrac{L(\theta\mid\pmb Y,\pmb\Lambda)\pi(\theta)}{\int_{\Theta}L(\theta\mid\pmb Y,\pmb\Lambda)\pi(\theta){\rm d}\theta}\propto\theta^{R+\alpha-1}\exp\left\{-\theta\bigg(\beta+\sum_{i=1}^RX_{(i)}+(n-R)C\bigg)\right\}$ 添加正则化常数后可得 $\theta$ 的后验分布为
$\displaystyle\theta\mid\pmb X\sim\Gamma\left(R+\alpha,\beta+\sum_{i=1}^RX_{(i)}+(n-R)C\right).$
泊松分布总体
设总体 $X$ 服从泊松分布 $\mathcal{P}(\lambda)$,其概率质量函数为
设 $\pmb X=(X_1,\dots,X_n)$ 为从总体中抽取的i.i.d.样本。
1. 无信息先验
考虑 $\lambda$ 的无信息先验为Jeffreys先验。首先写出其对数似然函数为
所以
因此Fisher信息阵为
所以 $\lambda$ 的无信息先验密度为
所以当 $\pmb X=\pmb x$ 给定时,$\lambda$ 的后验密度为
添加正则化常数可得 $\lambda$ 的后验分布为
2. 共轭先验
设 $\lambda$ 的共轭先验分布为 $\Gamma(\alpha,\beta)$,其密度函数为
所以 $\lambda$ 的后验密度为
添加正则化常数可得 $\lambda$ 的后验分布为
均匀分布总体
设总体 $X$ 服从均匀分布 $U(0,\theta)$,其密度函数为
设 $\pmb X=(X_1,\dots,X_n)$ 为从总体中抽取的i.i.d.样本。
1. 无信息先验
由于 $\theta$ 是位置参数,因此取无信息先验 $\pi(\theta)\equiv1$,所以当 $\pmb X=\pmb x$ 给定时,$\theta$的后验分布为
添加正则化常数可得 $\theta$ 的后验分布为
这里 $Pa(x_{(n)},n-1)$ 是帕累托分布。
2. 共轭先验
设 $\theta$ 的共轭先验分布为 $Pa(\theta_0,\alpha)$,其密度函数为
其中 $\alpha>0$ 和 $\theta_0$ 已知。所以 $\theta$ 的后验密度为
添加正则化常数可得 $\theta$的后验分布为
后记
如对本文内容有任何疑问,请联系 watthu@mail.ustc.edu.cn。