统计小站 | Kausiujik

「欢迎来到我的统计世界」

Bayes-Lec2.2 常见分布参数的后验分布计算(续)

Posterior Distribution of Parameters of Common Distribution

常见分布参数的后验分布计算(续) 一类离散分布总体 设离散随机变量 $X$ 的概率分布有下列形式: $f(x\mid\theta)=\mathbb P(X=x\mid\theta)=h(x)\theta^{b(x)}(1-\theta)^{d(x)},$ 其中 $b(x)$ 和 $d(x)$ 取值为非负整数。此类分布包含下列几个常见的分布: 两点分布 $\text{Bern...

Bayes-Lec2.1 贝叶斯统计推断基础

Basic Bayes Statistical Reference

基本概念 贝叶斯统计推断中所有变量都是随机变量,一切参数推断应该基于其后验分布进行。 定义(先验分布) 参数空间 $\Theta$ 上的任一概率分布都称作先验分布(prior distribution),常用 $\pi(\theta)$ 表示其 p.m.f.(离散性)或 p.d.f(连续型)。 先验分布有许多选取方式,在本节中介绍几种重要的先验选取方式。 无信息先验:对参...

RL-Lec2.1 马尔可夫决策过程

Markov Decision Process

马尔可夫过程(Markov Process) 称一个状态 $S_t$ 是马尔可夫的当且仅当 $\mathbb P(S_{t+1}\mid S_t)=\mathbb P(S_{t+1}\mid S_1,\dots,S_t),$ 换言之,当前状态已知时,未来的状态与过去的状态无关,我们完全可以抛弃过去的状态,即当前状态是未来状态的充分统计量。 由此一个马尔可夫过程可以完全由状态转移概率...

Bayes-Lec1 经典统计推断回顾

Review of Classical Statistics

概率及其解释 概率的公理化定义 概率起源于Fermat和Pascal研究赌博中的机会而发展起来的概率理论,是研究随机性的学科。Kolmogorov(1933)奠定了严格的数学公理化基础。 记 $\Omega$ 为一个随机试验的样本空间,则一个概率测度 $\mathbb P$ 为满足以下条件的函数: 对任意事件 $A\in\Omega$,$\mathbb P(A)\geq0$;...

RL-Lec1 强化学习介绍

Introduction to Reinforcement Learning

强化学习背景 机器学习主要分为监督学习、无监督学习和强化学习。 监督学习(Supervised Learning):对于有标签的数据进行学习,目的是能够正确判断无标签的数据。主要任务:分类(Classification)和回归(Regression)。 无监督学习(Unsupervised Learning):对于无标签的数据进行学习,目的是不仅能够解决有明确答案的问题,也可以...

小站总访问量