首页
学习
活动
专区
工具
TVP
发布

CreateAMind

专栏成员
1002
文章
637676
阅读量
56
订阅数
mnist图片缺失 97%的像素,mnist add准确率84%;及15位的加法训练
paper: Neural-Probabilistic Answer Set Programming
CreateAMind
2023-02-14
2250
4个视觉符号推理数据集超简介
1 Are Deep Neural Networks SMARTer than Second Graders 2212.09993
CreateAMind
2023-02-14
4830
代码:lossless 压缩 10x faster VAE
paper1: [1] Anji Liu, Stephan Mandt and Guy Van den Broeck. Lossless Compression with Probabilistic Circuits, In International Conference on Learning Representations (ICLR), 2022.
CreateAMind
2022-11-22
3310
用概率推理解决强化学习- pyro colab代码
2018:Reinforcement Learning and Control as Probabilistic Inference: Tutorial and Review
CreateAMind
2022-11-22
3400
CausalNeural Connection: Expressiveness Learnability Inference
尽管NCM具有足够的表达能力,但是一个真正的SCM是没办法仅仅通过观察数据学习出来的,也就是不具备足够的学习能力
CreateAMind
2022-11-22
2570
deepmind 不确定性估计软件包
Posterior predictive distributions quantify uncertainties ignored by point estimates. The neural_testbed provides tools for the systematic evaluation of agents that generate such predictions. Crucially, these tools assess not only the quality of marginal predictions per input, but also joint predictions given many inputs. Joint distributions are often critical for useful uncertainty quantification, but they have been largely overlooked by the Bayesian deep learning community.
CreateAMind
2022-11-22
1800
10多表图对比:自监督表示学习算法大梳理
Beyond Just Vision: A Review on Self-Supervised Representation Learning on Multimodal and Temporal Data
CreateAMind
2022-11-22
2270
[代码]神经符号生成机器
调和符号和分布式表示是一个至关重要的挑战,可以潜在地解决当前深度学习的局限性。最近,通过以生成对象为中心的表示模型,在这个方向上取得了显著的进展。虽然学习识别模型以无监督的方式从原始图像推断以对象为中心的符号表示,如边界框,但没有这样的模型可以提供生成模型的另一个重要能力,即根据学习的世界密度的结构生成(采样)。在本文中,我们提出了生成神经符号机器,这是一个结合了分布式和符号表示的优点的生成模型,支持符号组件的结构化表示和基于密度的生成。这两个关键属性是通过两层潜在层次实现的,具有用于灵活密度建模的全局分布式潜在和结构化符号潜在图。为了增加这种层次结构中模型的灵活性,我们还提出了 StructDRAW prior。实验表明,该模型在结构精度和图像生成质量方面明显优于以往的结构化表示模型和最新的非结构化生成模型。我们的代码、数据集和训练模型可从以下网址获得https://github.com/JindongJiang/GNM
CreateAMind
2022-06-10
2630
动画模拟统计随机变量生成器:离散基础篇
本公众号MyEncyclopedia定期发布AI,算法,工程类深度和前沿文章。学习本文的最佳姿势为点击文末在看,发送本文链接到桌面版浏览器,打开文末阅读原文,敲入代码运行。
CreateAMind
2021-02-19
1.3K0
Jane Street Market Prediction 排名前10的notebook分享
https://www.kaggle.com/c/jane-street-market-prediction/leaderboard
CreateAMind
2020-12-29
1.6K0
SDDPG = SAC1
在上文指出:“基于policy optimization的强化学习算法的数学基础都是policy gradient 定理(PGT),比如PG, A2C, A3C, TRPO, PPO, IMPALA等等。现在我们有了soft policy gradient 定理,对应地可以演化出一系列新算法,比如SPG, SA2C, SA3C, STRPO, SPPO, SIMPALA等等。”
CreateAMind
2020-08-13
6320
SPG定理与算法介绍
在传统的policy optimization强化学习中,通常会手加一个动作熵作为探索项,然后对该项的权重因子调参以达到增加探索的目的。然而“In practice, moreover, policy gradient methods typically employ carefully tuned entropy regularization in order to prevent policy collapse.”,更严重的是动作熵的引入破坏了PG(policy gradient )理论的自洽性,而对于一个理论来说自洽性重于泰山。
CreateAMind
2020-08-04
1.4K0
GTrXL架构介绍 (Transformer在RL中的应用)
论文链接:https://arxiv.org/pdf/1910.06764.pdf
CreateAMind
2020-07-08
1.7K0
Meet CreateAMind Cuju ( 谷歌足球 SOTA )
谷歌足球(Google Research Football)是Google Brain 开发的一个足球仿真策略游戏。
CreateAMind
2020-05-09
8710
Convolutional Tsetlin Machine tutorial
https://github.com/cair/convolutional-tsetlin-machine
CreateAMind
2019-12-20
7790
可解释的AI
https://github.com/cair/pyTsetlinMachineParallel#interpretability-demo
CreateAMind
2019-12-20
6000
使用Ray并行化你的强化学习算法(三)
我们先看算法的核心部分:model,包含了TensorFlow建图,计算loss,训练和测试。
CreateAMind
2019-12-19
1.5K0
一起测智商——解耦真的对下游任务有帮助吗
先来一道经典的智商测试题,根据左边八个小方块的规律从右边的六个小方块中选出一个填补空缺。
CreateAMind
2019-11-07
1K0
RL学习距离和障碍物的关系 v2
如果去学校要翻一座山,那肯定不能走直线,没有哪条路是直线的就说明了到达目标是曲折的。
CreateAMind
2019-09-11
4210
Google Research Football (scenario 7) 实验
在之前的公众号我们介绍了谷歌足球环境(Google Research Football )
CreateAMind
2019-09-09
9550
点击加载更多
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档