首页
学习
活动
专区
工具
TVP
发布

CreateAMind

专栏作者
943
文章
587480
阅读量
55
订阅数
NEURO-SYMBOLIC FORWARD REASONING 图表
用户1908973
2023-09-13
1170
代码:SpikeGPT: 使用Spiking Neural Networks
SpikeGPT: Generative Pre-trained Language Model with Spiking Neural Networks
用户1908973
2023-09-01
2860
mnist图片缺失 97%的像素,mnist add准确率84%;及15位的加法训练
paper: Neural-Probabilistic Answer Set Programming
用户1908973
2023-02-14
2090
代码:lossless 压缩 10x faster VAE
paper1: [1] Anji Liu, Stephan Mandt and Guy Van den Broeck. Lossless Compression with Probabilistic Circuits, In International Conference on Learning Representations (ICLR), 2022.
用户1908973
2022-11-22
3020
[代码]神经符号生成机器
调和符号和分布式表示是一个至关重要的挑战,可以潜在地解决当前深度学习的局限性。最近,通过以生成对象为中心的表示模型,在这个方向上取得了显著的进展。虽然学习识别模型以无监督的方式从原始图像推断以对象为中心的符号表示,如边界框,但没有这样的模型可以提供生成模型的另一个重要能力,即根据学习的世界密度的结构生成(采样)。在本文中,我们提出了生成神经符号机器,这是一个结合了分布式和符号表示的优点的生成模型,支持符号组件的结构化表示和基于密度的生成。这两个关键属性是通过两层潜在层次实现的,具有用于灵活密度建模的全局分布式潜在和结构化符号潜在图。为了增加这种层次结构中模型的灵活性,我们还提出了 StructDRAW prior。实验表明,该模型在结构精度和图像生成质量方面明显优于以往的结构化表示模型和最新的非结构化生成模型。我们的代码、数据集和训练模型可从以下网址获得https://github.com/JindongJiang/GNM
用户1908973
2022-06-10
2320
动画模拟统计随机变量生成器:离散基础篇
本公众号MyEncyclopedia定期发布AI,算法,工程类深度和前沿文章。学习本文的最佳姿势为点击文末在看,发送本文链接到桌面版浏览器,打开文末阅读原文,敲入代码运行。
用户1908973
2021-02-19
1.2K0
强化学习开源环境集(魂斗罗,星际争霸,斗地主,自动驾驶都有哦)
OpenAI 发布的增强的游戏强化学习研究平台,Gym Retro。其中包括对任天堂 Game boy,NES, 世嘉游戏等各种模拟器的支持。通过附带的 Integration UI 程序可以加载nes,md,snes等格式并抽取游戏的 reward 和 state。
用户1908973
2021-02-19
2.5K0
SPG定理与算法介绍
在传统的policy optimization强化学习中,通常会手加一个动作熵作为探索项,然后对该项的权重因子调参以达到增加探索的目的。然而“In practice, moreover, policy gradient methods typically employ carefully tuned entropy regularization in order to prevent policy collapse.”,更严重的是动作熵的引入破坏了PG(policy gradient )理论的自洽性,而对于一个理论来说自洽性重于泰山。
用户1908973
2020-08-04
1.3K0
Convolutional Tsetlin Machine tutorial
https://github.com/cair/convolutional-tsetlin-machine
用户1908973
2019-12-20
7680
可解释的AI
https://github.com/cair/pyTsetlinMachineParallel#interpretability-demo
用户1908973
2019-12-20
5830
Google Research Football (scenario 11) 实验
在之前的公众号文章中我们介绍了Football Academy中的两个scenario的实验:
用户1908973
2019-09-24
1.1K0
Google Research Football (scenario 7) 实验
在之前的公众号我们介绍了谷歌足球环境(Google Research Football )
用户1908973
2019-09-09
8860
RL解决'BipedalWalkerHardcore-v2' (SOTA) 更新
我们介绍了openai gym 环境'BipedalWalkerHardcore-v2'以及我们解决这个环境,达到效果和效率上的 state-of-the-art。
用户1908973
2019-09-03
1.6K0
Data Analysis
Now a days, we run a lot experiment based on spinuping(https://spinningup.openai.com/en/latest/), but as the number of experiments goes up, compare different result and analyse whcih element is key become more and more difficult.
用户1908973
2019-07-23
9340
从Q-Learning到A3C 强化学习基础快速复习
https://spinningup.openai.com/en/latest/spinningup/rl_intro2.html
用户1908973
2019-07-17
6230
解读Been There, Done That: Meta-Learning with Episodic Recall
最近在研究的线路就是: metal learning + episodic memory.
用户1908973
2019-07-10
9220
SPN 图片可视化 代码 应用 model 等介绍
http://proceedings.mlr.press/v97/tan19b/tan19b.pdf
用户1908973
2019-07-01
4730
基于视频的无监督segmentation论文推荐
https://github.com/aimerykong/predictive-filter-flow
用户1908973
2019-05-13
6060
基于视频的无监督segmentation论文推荐
https://github.com/aimerykong/predictive-filter-flow
用户1908973
2019-05-07
4310
SQN(看最后的视频里 砖块被打光了)及代码及saved_models
再看LunarLander-v2的效果(也是比较简单了。。。),AverageEpRet就是不上300... : (
用户1908973
2019-03-06
5020
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档