首页
学习
活动
专区
工具
TVP
发布

CreateAMind

专栏作者
943
文章
587811
阅读量
55
订阅数
2000行AlphaZero算法通用简单快速实现
由于 AlphaZero 非常耗费资源,因此成功的开源实现(例如Leela Zero)是用低级语言(例如 C++)编写的,并针对高度分布式计算环境进行了优化。这使得学生、研究人员和黑客很难访问它们。
用户1908973
2023-02-14
3110
通过观察随时反馈调整规划
paper:Deriving time-averaged active inference from control principles
用户1908973
2022-11-22
2870
易处理模型推理的统一框架
A Compositional Atlas of Tractable Circuit Operations: From Simple Transformations to Complex Information-Theoretic Queries
用户1908973
2022-11-22
1840
概率编程的高度
paper: Symbolic Exact Inference for Discrete Probabilistic Programs
用户1908973
2022-11-22
7740
用概率推理解决强化学习- pyro colab代码
2018:Reinforcement Learning and Control as Probabilistic Inference: Tutorial and Review
用户1908973
2022-11-22
3050
概率编程应该有什么高度?
paper: Symbolic Exact Inference for Discrete Probabilistic Programs
用户1908973
2022-11-22
3620
CausalNeural Connection: Expressiveness Learnability Inference
尽管NCM具有足够的表达能力,但是一个真正的SCM是没办法仅仅通过观察数据学习出来的,也就是不具备足够的学习能力
用户1908973
2022-11-22
2340
复杂推理模型,信念的信念
主动推理提供了感知行为的第一原理描述,从中可以导出特殊和重要的案例,例如强化学习、主动学习、贝叶斯最优推理、贝叶斯最优设计等。主动推理通过将信息获得置于与奖励或价值相同的基础上,解决了与先前偏好相关的开发-探索困境。简而言之,主动推理以预期(变分)自由能的形式,用(贝叶斯)信念的泛函代替了价值函数。在本文中,我们考虑一种复杂的主动推理,使用预期自由能的递归形式。复杂性描述了一个代理对信念的信任程度。我们考虑对事态的行动的反事实后果有信念的代理人和对那些潜在状态有信念的代理人。换句话说,我们从简单地考虑“如果我做了那件事会发生什么”转变为“如果我做了那件事,我会相信发生什么”。自由能泛函的递归形式有效地实现了对未来行动和结果的深树搜索。至关重要的是,这种搜索是基于信念状态的序列,而不是状态本身。我们用深层决策问题的数值模拟来说明这种方案的能力。
用户1908973
2022-11-22
2970
建模结构学习的主动推理方法——以概念学习为例
An Active Inference Approach to Modeling Structure Learning: Concept Learning as an Example Case
用户1908973
2022-11-22
4970
一个意识研究的结构测试黄金标准
Applying Yoneda's lemma to consciousness research: categories of level and contents of consciousness
用户1908973
2022-11-22
2300
A Theory of Learning to Infer :有限资源下不合理的合理性
https://gershmanlab.com/pubs/Dasgupta20.pdf 主要结论自动翻译节选
用户1908973
2022-06-10
3020
[开源包]DisCoPy:Python 中的幺半群范畴
我们介绍了 DisCoPy,这是一个用于计算幺半群类别的开源工具箱。这个库提供了一个直观的语法来定义字符串图表和幺正函子。它的模块化允许在范畴理论的各种应用中有效地实现计算实验,在这些应用中,图已经成为通用语言。作为一个例子,我们首次使用 DisCoPy 在量子硬件上进行自然语言处理。
用户1908973
2022-06-10
6270
不确定性推理:让模型知道自己不知道
深度学习取得了很大的成功,但是在可解释,可信任等方面还很不足。模型包含对自我推理结果的置信度很重要,模型需要对自我不确定性推理结果进行告知。如果模型可以知道自己不知道,那模型就是有了最基本的意识,模型可以给出推理结果及对结果的置信度。通过不确定性推理可以达到这一点
用户1908973
2022-06-10
3980
自由能生成模型数学整理1
The free energy principle for action and perception: A mathematical review(2017)
用户1908973
2022-06-08
3760
通用智能框架part2
LatentSLAM 框架的整体可以根据分层生成模型进行数学理解(atal 等人,2021b)。有两个不同层次的推理,每个层次都使用自己的生成模型来解释相应抽象层次上的环境动态。当生成模型被堆叠时,较高层次的模型将来自较低层次的状态作为观察值,而较低层次通过智能体的传感器观察实际环境。每个单独的创成式模型在数学上都可以看作是联合概率
用户1908973
2022-06-08
3670
通用智能框架 part1
paper:Generalized Simultaneous Localization and Mapping (G-SLAM) as unification framework for natural and artificial intelligences: towards reverse engineering the hippocampal/entorhinal system and principles of high-level cognition
用户1908973
2022-06-08
3420
700篇参考文献的模拟智能论文
模拟已经成为各学科研究人员探索复杂动态系统在各种条件下的行为的不可或缺的工具[1],包括假设或极端条件,以及在气候[2,3,4],生物[5,6],社会政治[7,8]和其他具有重大后果的环境中越来越多的临界点。然而,在许多环境中,模拟器(以及广义的建模工具)的实用性受到了限制。首先,尽管硬件的进步使模拟能够模拟日益复杂的系统,但计算成本严重限制了几何细节的水平、物理的复杂性和模拟器运行的次数。这可能导致简化假设,这往往使结果无法用于假设检验和实际决策。此外,模拟器存在固有的偏 见,因为它们只模拟它们被编程来模拟的东西;对于昂贵的模拟器,灵敏度和不确定性分析通常是不切实 际的;模拟代码由低级机械组件组成,这些组件通常是不可微的,并导致难以处理的可能性;模拟器很少能与真实世界的数据流集成,更不用说在线运行实时数据更新了。人工智能(AI)和机器学习(ML)在科学领域的最新进展推动了人工智能/机器学习在科学领域(除了发现高维数据中的模式)的几个关键目标方面的进展。这些进展允许我们将先验知识或领域知识导入 ML 模型,并将 知识从已学模型输出回科学领域;利用 ML 解决数值上难以处理的模拟和优化问题,以及最大化真实世界数据的效用;生成无数的合成数据;量化和推理模型和数据中的不确定性;并推断数据中的因果关系。正是在人工智能和模拟科学的交汇处,我们可以期待在基本上所有领域的科学实验和发现方面取得重大进展。例 如,使用神经网络加速气候科学的模拟软件[9],或多代理强化学习和经济政策模拟的博弈论[10]。然而,这个领域相对来说是新生的和不同的,需要一个统一的整体视角来推进人工智能和模拟科学的交叉。本文探讨了这一观点。我们列出了在科学模拟和人工智能方面取得重大进展所需的方法,以及它们必须如何有效地结合。当 Phillip Colella 在 2004 年向 DARPA 提出科学计算的“七个小矮人”时,科学计算领域也处于类似的转折点,其中七个小矮人中的每一个都代表一种捕捉计算和数据移动模式的算法方法[11,12,13]。ii 在本文的剩余部分,我们选择用“基序”代替一个潜在的不敏感术语,这是我们对该领域未来发展的建议。事实证明,motifs 命名法对于在广泛的应用中对这些方法的行为和要求进行高层次的抽象推理是有用的,同时将这些方法从具体的实现中分离出来。更重要的是,这是一个可以理解的跨学科交流的词汇。Motifs 也提供了“反基准”:不局限于狭隘的性能或代码工件,因此鼓励算法、编程语言、数据结构和硬件的创新[12]。因此,科学计算的主题为 R&D 在科学中的数值方法(以及最终的并行计算)的努力提供了一个清晰的路线图。在本文中,我们同样定义了模拟智能的九个主题,互补算法方法的类别,它们代表了协同模拟和人工智能技术促进科学发展的基础;模拟智能(SI)描述了一个融合了科学计算、科学模拟和人工智能的领域,旨在通过计算机研究过程和系统,以更好地理解和发现现场现象。每个 SI 主题都有来自科学计算和人工智能社 区的动力,但必须协调一致地追求和集成,以克服科学模拟器的缺点,并实现新的科学工作流。不像科学计算的老七个主题,我们的 SI 主题不一定是独立的。其中许多都是相互联系和相互依赖的,就像操作系统各层中的组件一样。各个模块可以组合在一起,并以多种方式进行交互,从而从这种组合中获益。使用这一比喻,我们探索了“SI 堆叠”每一层的性质、每一层中的图案,以及当它们组合在一起时可用的组合可能性——这些层如图 1 所示。我们首先描述 SI 堆栈的核心层,详细介绍其中的每个主题:概念、挑战、最先进的方法、未来方向、伦理考 虑和许多激励人心的例子。当我们遍历 SI 堆栈,遇到众多模块和科学工作流程时,我们将最终能够展示这些进步将如何使模拟和科学工作的许多用户受益。我们的讨论继续涵盖重要的 SI 主题,如逆问题解决和人机合作,以及基本的基础设施领域,如数据工程和加速计算。
用户1908973
2022-03-14
3180
how we learn 学习笔记 2 学习的七个定义
这些心智模型的丰富性,在很大程度上是无意识的,超出了我们的想象。例如,你拥有一个巨大的语言思维模型,身体模型,各种外部交互模型(游戏、手机),
用户1908973
2021-04-16
4220
how we learn 学习笔记 1 AI方向预测
第一部分:简介 我们大脑的认知能力如何抵御环境的创伤,剧烈的大脑创伤后的变化(作者举例失明小孩的写作经历)?鉴于我们截然不同的感官体验,为什么菲利普和我会有相同的想法?不同的人类大脑是如何在相同的概
用户1908973
2021-04-16
3040
解读深度强化学习基石论文:函数近似的策略梯度方法
导读:这篇是1999 年Richard Sutton 在强化学习领域中的经典论文,论文证明了策略梯度定理和在用函数近似 Q 值时策略梯度定理依然成立,本论文奠定了后续以深度强化学习策略梯度方法的基石。理解熟悉本论文对 Policy Gradient,Actor Critic 方法有很好的指导意义。
用户1908973
2020-12-29
9810
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档