统计小站 | Kausiujik

「欢迎来到我的统计世界」

Bayes-Lec3.2 贝叶斯统计推断(假设检验与预测推断)

Hypothesis Testing and Prediction

假设检验 设假设检验问题的一般形式为 $H:\theta\in\Theta_H\longleftrightarrow K:\theta\in\Theta_K,$ 其中 $\Theta_H\cup\Theta_K=\Theta$,其中 $\Theta$ 是参数空间,$\Theta_H$ 是 $\Theta$ 的非空子集。 在贝叶斯统计推断中,处理假设检验问题是直截了当的,在获得后验分...

Bayes-Lec3.1 贝叶斯统计推断(点估计与区间估计)

Point and Interval Estimation

贝叶斯统计推断概述 未知参数 $\theta$ 的后验分布 $\pi(\theta\mid\pmb x)$ 集中了抽样信息和先验信息中关于 $\theta$ 的所有信息,有关 $\theta$ 的点估计、区间估计和假设检验等统计推断方法都是按照一定方式从后验分布中提取信息的,其提取方法与经典统计推断相比要简单明确得多。 基于后验分布的统计推断意味着只考虑已出现的样本观测值,认为未出...

RL-Lec3 动态规划

Dynamic Programming

动态规划的基本概念 动态规划(Dynamic Programming)是指通过把原问题分解为子问题的方式求解的一类方法,它通过记住求解过的子问题来节省时间。 一般地,适用动态规划解决的问题需要满足如下两个性质: 最优子结构(Optimal Substructure):整个问题的最优解可以通过求解子问题得到。 重叠子问题(Overlapping Subproblems):子问题...

Bayes-Lec2.3 多元正态分布与线性回归模型中参数的后验分布

Posterior Distribution of MVN and LR

多元正态分布总体 独立同方差情形 设 $\pmb X$ 为 $p$ 维随机向量并且 $\pmb X\sim N_p(\pmb\theta,\sigma^2\pmb I)$,其中 $\sigma^2>0$ 已知。令 $\pmb X_1,\dots,\pmb X_n$ 为从总体中抽取的i.i.d.样本,其联合概率密度函数为 $\begin{array}{rl} f(\pmb x_1,...

RL-Lec2.2 最优策略下贝尔曼方程及MDP的扩展

Bellman Equation for Optimal Policy and Extension of MDPs

最优策略 对策略定义一个偏序关系,称策略 $\pi$ 优于 $\pi’$(记作 $\pi\succeq\pi’$)当且仅当 $v_\pi(s)\geq v_{\pi'}(s),\quad\forall s.$ 定理. 对任何一个马尔可夫决策过程 存在最优策略 $\pi_{\star}$ 比其它任何一个策略都不差,即 $\pi_{\star}\succeq\pi,\foral...

小站总访问量