统计小站 | Kausiujik

「欢迎来到我的统计世界」

Bayes-Lec2.2 常见分布参数的后验分布计算(续)

Posterior Distribution of Parameters of Common Distribution

常见分布参数的后验分布计算(续) 一类离散分布总体 设离散随机变量 X 的概率分布有下列形式: f(xθ)=P(X=xθ)=h(x)θb(x)(1θ)d(x), 其中 b(x)d(x) 取值为非负整数。此类分布包含下列几个常见的分布: 两点分布 $\text{Bern...

Bayes-Lec2.1 贝叶斯统计推断基础

Basic Bayes Statistical Reference

基本概念 贝叶斯统计推断中所有变量都是随机变量,一切参数推断应该基于其后验分布进行。 定义(先验分布) 参数空间 Θ 上的任一概率分布都称作先验分布(prior distribution),常用 π(θ) 表示其 p.m.f.(离散性)或 p.d.f(连续型)。 先验分布有许多选取方式,在本节中介绍几种重要的先验选取方式。 无信息先验:对参...

RL-Lec2.1 马尔可夫决策过程

Markov Decision Process

马尔可夫过程(Markov Process) 称一个状态 St 是马尔可夫的当且仅当 P(St+1St)=P(St+1S1,,St), 换言之,当前状态已知时,未来的状态与过去的状态无关,我们完全可以抛弃过去的状态,即当前状态是未来状态的充分统计量。 由此一个马尔可夫过程可以完全由状态转移概率...

Bayes-Lec1 经典统计推断回顾

Review of Classical Statistics

概率及其解释 概率的公理化定义 概率起源于Fermat和Pascal研究赌博中的机会而发展起来的概率理论,是研究随机性的学科。Kolmogorov(1933)奠定了严格的数学公理化基础。 记 Ω 为一个随机试验的样本空间,则一个概率测度 P 为满足以下条件的函数: 对任意事件 AΩP(A)0;...

RL-Lec1 强化学习介绍

Introduction to Reinforcement Learning

强化学习背景 机器学习主要分为监督学习、无监督学习和强化学习。 监督学习(Supervised Learning):对于有标签的数据进行学习,目的是能够正确判断无标签的数据。主要任务:分类(Classification)和回归(Regression)。 无监督学习(Unsupervised Learning):对于无标签的数据进行学习,目的是不仅能够解决有明确答案的问题,也可以...

小站总访问量4625