前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >DeepMind Dreamer 系列为什么效果这么好

DeepMind Dreamer 系列为什么效果这么好

作者头像
CreateAMind
发布2023-09-01 08:19:23
2590
发布2023-09-01 08:19:23
举报
文章被收录于专栏:CreateAMind

因为使用了自由能理论,dreamer系列是自由能理论的一个实现及大量的工程迭代优化,请看分析:

论文:Learning Latent Dynamics for Planning from Pixels是dreamer系列的前传论文(参考1) ,其公式:

论文:A step-by-step tutorial on active inference and its application to empirical data 部分自由能相关的定义公式:

仔细比较两者的公式,可以看出两者优化的目标是相同的,公式的意义在自由能中也做了详细的解读,而且有很多的变形和不同的含义(推荐文末参考):

论文:Learning Latent Dynamics for Planning from Pixels 其他公式及推导:

另外planet的确定与随机的区分实现:

类似STDP里面的STP和LTP长短可塑记忆。(参考2)

相关参考:

1 论文精选:Dreamer系列文章详细解读(PlaNet, Dreamer, DreamerV2, DreamerV3)

2 脑启发的ANN学习机制综述

主动推理 与 信念-愿望-意图 (BDI) 介绍自由能与心理学概念的联系

直觉理解变分自由能的目标函数

如何从科学模型角度看待自由能原理框架?

自由能AI认知框架优点123456

回答薛定谔问题: 生命是什么?自由能公式

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2023-06-06,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 CreateAMind 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档