首页
学习
活动
专区
工具
TVP
发布

CreateAMind

专栏作者
943
文章
588065
阅读量
55
订阅数
NEURO-SYMBOLIC FORWARD REASONING 图表
用户1908973
2023-09-13
1170
mnist图片缺失 97%的像素,mnist add准确率84%;及15位的加法训练
paper: Neural-Probabilistic Answer Set Programming
用户1908973
2023-02-14
2090
4个视觉符号推理数据集超简介
1 Are Deep Neural Networks SMARTer than Second Graders 2212.09993
用户1908973
2023-02-14
4400
代码:lossless 压缩 10x faster VAE
paper1: [1] Anji Liu, Stephan Mandt and Guy Van den Broeck. Lossless Compression with Probabilistic Circuits, In International Conference on Learning Representations (ICLR), 2022.
用户1908973
2022-11-22
3030
用概率推理解决强化学习- pyro colab代码
2018:Reinforcement Learning and Control as Probabilistic Inference: Tutorial and Review
用户1908973
2022-11-22
3060
CausalNeural Connection: Expressiveness Learnability Inference
尽管NCM具有足够的表达能力,但是一个真正的SCM是没办法仅仅通过观察数据学习出来的,也就是不具备足够的学习能力
用户1908973
2022-11-22
2340
deepmind 不确定性估计软件包
Posterior predictive distributions quantify uncertainties ignored by point estimates. The neural_testbed provides tools for the systematic evaluation of agents that generate such predictions. Crucially, these tools assess not only the quality of marginal predictions per input, but also joint predictions given many inputs. Joint distributions are often critical for useful uncertainty quantification, but they have been largely overlooked by the Bayesian deep learning community.
用户1908973
2022-11-22
1600
10多表图对比:自监督表示学习算法大梳理
Beyond Just Vision: A Review on Self-Supervised Representation Learning on Multimodal and Temporal Data
用户1908973
2022-11-22
2040
[开源包]DisCoPy:Python 中的幺半群范畴
我们介绍了 DisCoPy,这是一个用于计算幺半群类别的开源工具箱。这个库提供了一个直观的语法来定义字符串图表和幺正函子。它的模块化允许在范畴理论的各种应用中有效地实现计算实验,在这些应用中,图已经成为通用语言。作为一个例子,我们首次使用 DisCoPy 在量子硬件上进行自然语言处理。
用户1908973
2022-06-10
6270
[代码]神经符号生成机器
调和符号和分布式表示是一个至关重要的挑战,可以潜在地解决当前深度学习的局限性。最近,通过以生成对象为中心的表示模型,在这个方向上取得了显著的进展。虽然学习识别模型以无监督的方式从原始图像推断以对象为中心的符号表示,如边界框,但没有这样的模型可以提供生成模型的另一个重要能力,即根据学习的世界密度的结构生成(采样)。在本文中,我们提出了生成神经符号机器,这是一个结合了分布式和符号表示的优点的生成模型,支持符号组件的结构化表示和基于密度的生成。这两个关键属性是通过两层潜在层次实现的,具有用于灵活密度建模的全局分布式潜在和结构化符号潜在图。为了增加这种层次结构中模型的灵活性,我们还提出了 StructDRAW prior。实验表明,该模型在结构精度和图像生成质量方面明显优于以往的结构化表示模型和最新的非结构化生成模型。我们的代码、数据集和训练模型可从以下网址获得https://github.com/JindongJiang/GNM
用户1908973
2022-06-10
2320
强化学习缺陷:如何用贝叶斯从错误中学习-安全及效率
Learning from What’s Right and Learning from What’s Wrong
用户1908973
2022-04-15
4340
动画模拟统计随机变量生成器:离散基础篇
本公众号MyEncyclopedia定期发布AI,算法,工程类深度和前沿文章。学习本文的最佳姿势为点击文末在看,发送本文链接到桌面版浏览器,打开文末阅读原文,敲入代码运行。
用户1908973
2021-02-19
1.2K0
Jane Street Market Prediction 排名前10的notebook分享
https://www.kaggle.com/c/jane-street-market-prediction/leaderboard
用户1908973
2020-12-29
1.5K0
SDDPG = SAC1
在上文指出:“基于policy optimization的强化学习算法的数学基础都是policy gradient 定理(PGT),比如PG, A2C, A3C, TRPO, PPO, IMPALA等等。现在我们有了soft policy gradient 定理,对应地可以演化出一系列新算法,比如SPG, SA2C, SA3C, STRPO, SPPO, SIMPALA等等。”
用户1908973
2020-08-13
5600
SPG定理与算法介绍
在传统的policy optimization强化学习中,通常会手加一个动作熵作为探索项,然后对该项的权重因子调参以达到增加探索的目的。然而“In practice, moreover, policy gradient methods typically employ carefully tuned entropy regularization in order to prevent policy collapse.”,更严重的是动作熵的引入破坏了PG(policy gradient )理论的自洽性,而对于一个理论来说自洽性重于泰山。
用户1908973
2020-08-04
1.3K0
GTrXL架构介绍 (Transformer在RL中的应用)
论文链接:https://arxiv.org/pdf/1910.06764.pdf
用户1908973
2020-07-08
1.6K0
Meet CreateAMind Cuju ( 谷歌足球 SOTA )
谷歌足球(Google Research Football)是Google Brain 开发的一个足球仿真策略游戏。
用户1908973
2020-05-09
8100
Convolutional Tsetlin Machine tutorial
https://github.com/cair/convolutional-tsetlin-machine
用户1908973
2019-12-20
7680
可解释的AI
https://github.com/cair/pyTsetlinMachineParallel#interpretability-demo
用户1908973
2019-12-20
5830
使用Ray并行化你的强化学习算法(三)
我们先看算法的核心部分:model,包含了TensorFlow建图,计算loss,训练和测试。
用户1908973
2019-12-19
1.4K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档