贝叶斯统计:初学指南(法力风暴初学指南任务怎么接)
cac55 2024-10-03 17:48 12 浏览 0 评论
什么是 Bayesian Statistics?
Bayesian statistics is a particular approach to applying probability to statistical problems。
在 statistical inference 上,主要有两派:频率学派和贝叶斯学派。
Frequentist statistics tries to eliminate uncertainty by providing estimates. Bayesian statistics tries to preserve and refine uncertainty by adjusting individual beliefs in light of new evidence.
贝叶斯推理的目标?
produce quantitative trading strategies based on Bayesian models.
在使用贝叶斯理论过程中,我们最基本的公式如下:
为了方便的计算后验概率,我们会采用共轭先验的方法来简化后验的计算。
举个简单例子,假设我们投掷一枚硬币,我们刚开始认为正面朝上的概率是服从一个 Beta 分布的,Beta 分布能产生一个 0-1 之间的随机数。
我们刚开始假设α = β = 1,则 Beta 分布退化为一个均匀分布,接着我们不断的投掷硬币,记录好每次投掷的结果,然后根据结果再来计算此时正面朝上的概率。
此时我们可以计算出 n 次中 k 次朝上的概率值为:
我们再来计算后验概率:
可以看到后验概率也是 Beta 分布,我们通过假设先验概率为 Beta 分布,能非常方便的计算出后验概率。
下面是一段实验代码:
产生的图如下:
随着实验结果的增加,我们越来越确信正面朝上概率为 0.5。
以上是一个简单的后验问题,如果遇到一些复杂的后验概率,我们就要使用 mcmc 来做了.
MCMC is a means of computing the posterior distribution when conjugate priors are not applicable.
我们再来看后验的计算公式:
此处要想计算出解析解,就必须知道 evidence P(D),其计算公式如下:
这里的问题就是我们一般很难求联合概率的积分,所以我们要通过数值逼近的方法来求 P(D)。其中有一大类算法是:Markov Chain Monte Carlo Algorithms,有 Metropolis Algorithm, Metropolis-Hastings, the Gibbs Sampler, Hamiltonian MCMC and the No-U-Turn Sampler (NUTS).
注:此处为什么积分困难,可以看为什么要使用 MCMC 方法?
MCMC 的应用是和 "维数灾难" 有关的。考虑一个 R 上的分布,如果我们要计算它的数学期望,采用题主所描述的 "等距计算",那么取 100 个点大致可以保证精度。然而考虑一个 R^50 的分布,这时候要采用 "等距计算" 就要在每个维度上取 100 个点,这样一来就要取 10^100 个点。作为对比,已知宇宙的基本粒子大约有 10^87 个。如果仔细观察 "等距计算" 的结果,就会发现绝大多数点算出的概率都很小,而少部分点的概率非常大。而如果我们忽略大多数概率小的点,只计算概率大的那小部分点,对最后数学期望的结果影响非常小。这是 MCMC 思路的直观部分。MCMC 应用的概率模型,其参数维数往往巨大,但每个参数的支撑集非常小。比如一些 NLP 问题的参数只取 {0,1},但维数往往达到几千甚至上万左右,这正说明了 MCMC 更适用这些问题。
下面介绍第一个算法:Metropolis 算法。
先介绍 mcmc 算法的一般套路:
先在参数空间中选择一个
在参数空间中提议一个新的位置
根据先验信息和观测数据决定接收或者拒绝
如果接收跳跃,则跳转到新的位置,并且返回到 step1
如果拒绝,则保持当前位置并返回到 step1
连续采用一系列点,最后返回接受的点集合
不同的 mcmc 算法的区别就在于:
how you jump as well as how you decide whether to jump.
Metropolis 使用正态分布来进行跳跃,正态分布的μ为当前位置的,然后σ是需要决定的。σ 是 Metropolis 算法的参数,不同的 σ 值决定了算法的收敛速度。如果 σ 值大,意味着 proposal width 宽,能够跳的更远,并且搜索更多的后验参数空间,但是容易跳过高概率的地方,但是过小的σ 值,又会使得 proposal width 过小,导致收敛过慢。
一旦新的位置被提议出来,下一步就是要决定是否要跳转了,我们计算两个位置的概率比值:
然后我们从 [0,1] 的均匀分布中采出一个值,如果在 [0,p] 之间就接受,否则拒绝。
下面我们来对上面过程举个例子来说明。
假设我们有一组观测数据,来自一个正态分布,我们假设参数μ的先验分布也是一个正态分布,公式描述如下:
μ~Normal(0,1) # 参数先验概率
x|μ~Normal(x;μ,1) # 似然
我们通过代码采样如下:
对于这个问题,我们为了对比 mcmc 的结果,该后验概率我们是可以直接计算出来的,具体的数学推导见:note
我们对照上面说的 mcmc 算法的一般套路,先采样:
挑选出新的值后,我们下一步就是要去衡量新的参数好不好,怎么定义好不好呢?就是看新的参数是否能更好的解释数据。
怎么去定义更好的解释数据呢?
可以用下面的公式
解释起来就是基于当前观测数据,哪个参数概率更大。
下面就是决定是否要接收新参数了:
然后不断重复上面的过程,我们就有了一系列的了。
完整的代码可以见 mcmc。
总结
本文主要介绍 mcmc,其解决了当后验概率太复杂时候,用采用的方法去近似后验分布,本文介绍了最简单的 Metropolis 算法,后面会继续学习其他算法,欢迎关注。
参考
Markov Chain Monte Carlo for Bayesian Inference - The Metropolis Algorithm
MCMC sampling for dummies
Bayesian Inference with PyMC3 - Part 1
你的鼓励是我继续写下去的动力,期待我们共同进步。
相关推荐
- 爷青回 | QQ经典老头像(爷青回这个梗出自哪里)
-
点个关注不迷路记得点击上方关注我呦点击表情包长按可保存至手机表情包素材来源于网络,仅供分享哦拿完图记得吱一声点击下方分享、在看让更多人看到...
- 史上最全QQ官方经典头像全面翻新,不光高清还会动
-
每当看到上面这些头像,总能想起那些年的"轻舞飞扬","缘分天空","追风少年",这些已经模糊的头像给我们留下了太深的印象。这次为了纪念QQ20周年,腾讯官方整合了早期的105个经典头像,进行了全面翻...
- QQ最全表情含义图解意思(qq表情含义图解最新 新版 文字)
-
QQ都不陌生吧!对QQ的表情符号含义你了解多少呢?在本文中最全图解233个表情所表达的含义,供有需人享用。用过QQ的人都晓得它的创始人是马化腾。QQ于1999年2月10日正式推出。QQ是腾讯公司开发的...
- 海联真人版QQ经典表情(海联真人版qq经典表情在哪)
-
海联版傲娇的说声“耶”狂拽炫酷就是我淑女应该轻言细语萌萌哒的娇羞哎哟喂小丫头片子机智如我吓死宝宝了欧巴卡几嘛~今天天气好晴朗怎么样?是不是很有趣呢拿起手机给自己拍几张萌萌哒的美照吧...
- QQ音乐·音乐灵感独家对话金曲奖「最佳单曲制作人奖」得主JADE
-
JADE-AllRightJADE-差-点JADE-Goodbye,GoodbyeJADE-IAmLovefeat.乔瑟夫Chillseph下面请听本期灵感电台节目:本期博客...
- 亿万富豪爱泼斯坦狱中“自杀”,他背后的神秘女人出现在洛杉矶快餐店
-
爱泼斯坦在狱中离奇“自杀”,但他身负同谋指控的前女友、英国社交名媛希莱恩·麦克斯维尔(GhislaineMaxwell),却意外地出现在了洛杉矶街头平民快餐店,边啃着汉堡,咽着薯条,嘬着奶昔,边埋头...
- 扛起星战大旗的你们 觉得星战女需要换一身衣裳吗?
-
马上进入2016年,除了各种总结盘点以外,2016年的新看点也是需要科普一下了。目前最令人期待的应该就是《星球大战》回归了!《StarWars:原力觉醒》1月10日上映,博主不是电影评论员,所以不会...
- 和人对话的时候,我,最怕的就是,看到了自己内心的惶恐和脆弱
-
IWannaBeYourSlave(LiveFromGlobalCitizenLive2021),Maneskin很多时候,哪怕最甘于寂寞的人,也需要和人发生关联,需要和这个世界沟...
- 2024年度串烧完整版(搞笑失败尴尬丢人版)来了
-
一首APT的时间带你回顾你的2024年年度歌单。·1.《免我蹉跎苦》黄龄。·2.《红昭愿》音阙诗听。·3.《苹果香》狼戈。·4.《免我蹉跎苦》黄龄。·5.《红昭愿》音阙诗听。·6.《苹果香》狼戈。·7...
- 一课译词:打工人(打工人的翻译)
-
下午好,各位打工人!近日,“打工人”爆红网络,受到各行各业年轻人的追捧,但这词到底说的是个啥?“打工人”是那些依靠体力或技术的劳动者的统称。除了赚钱这个最大的目标,别的啥也不想;他们意志坚定,也不会迟...
- 初级词汇题(一)柏拉图指出不是每个孩子都适合上学,你赞成吗?
-
初级词汇题(一)柏拉图在《理想国》中指出不是每个孩子都适合上学,你赞成吗?今天分享的题目是我基于英文原著改编的初级词汇题A开头的第81道题。背景知识拓展:什么是nativist(先天论者)?什么是哲学...
- 治愈系英文:每个说不想恋爱的人,心里都装着一个无法拥有的人
-
Therearesomanypeopleouttherewhowilltellyouthatyoucan't.Whatyou'vegottodoisturna...
- 首首经典!意大利流行乐队Maneskin作品I WANNA BE YOUR SLAVE
-
手机点击试听(上边)Maneskin是一支来自罗马的意大利流行摇滚乐队,由主唱DamianoDavid、贝斯手VictoriaDeAngelis、吉他手ThomasRaggi和鼓手...
- 国家电网新一代电子商务平台投标文件双层PDF制作最全教程
-
投标知识在招投标过程中,我们经常碰见有些文件要求制成双层PDF格式,那么双层PDF是什么呢?怎么制作呢?今天就给大家普及下。定义双层PDF双层PDF格式文件是一种具有多层结构的PDF格式文件,是PD...
你 发表评论:
欢迎- 一周热门
- 最近发表
- 标签列表
-
- 如何绘制折线图 (52)
- javaabstract (48)
- 新浪微博头像 (53)
- grub4dos (66)
- s扫描器 (51)
- httpfile dll (48)
- ps实例教程 (55)
- taskmgr (51)
- s spline (61)
- vnc远程控制 (47)
- 数据丢失 (47)
- wbem (57)
- flac文件 (72)
- 网页制作基础教程 (53)
- 镜像文件刻录 (61)
- ug5 0软件免费下载 (78)
- debian下载 (53)
- ubuntu10 04 (60)
- web qq登录 (59)
- 笔记本变成无线路由 (52)
- flash player 11 4 (50)
- 右键菜单清理 (78)
- cuteftp 注册码 (57)
- ospf协议 (53)
- ms17 010 下载 (60)