CreateAMind

546 篇文章
32 人订阅

网络安全

用户1908973

互信息:无监督提取特征 kexue.fm笔记

苏剑林. (2018, Oct 10). 《变分自编码器 = 最小化先验分布 + 最大化互信息 》[Blog post]. Retrieved from htt...

912
用户1908973

vae学习笔记

苏剑林. (2018, Apr 03). 《变分自编码器(三):这样做为什么能成? 》[Blog post]. Retrieved from https://k...

841
用户1908973

强化学习中的光流 运动感知

Artemij Amiranashvili1 Alexey Dosovitskiy2 Vladlen Koltun2 Thomas Brox1

764
用户1908973

强化学习中的光流 运动感知

Artemij Amiranashvili1 Alexey Dosovitskiy2 Vladlen Koltun2 Thomas Brox1

1022
用户1908973

Teach agent how to walk with sac algorithm

https://github.com/rail-berkeley/softlearning training about ten hours with 24 ...

704
用户1908973

favae Sequence Disentanglement using Information Bottleneck

FAVAE: Sequence Disentanglement using Information Bottleneck Principle

381
用户1908973

Motion Selective Prediction for Video Frame Synthesis

https://www.arxiv-vanity.com/papers/1812.10157/

772
用户1908973

STCN

https://www.arxiv-vanity.com/papers/1902.06568/

1444
用户1908973

Motion Selective Prediction for Video Frame Synthesis

https://www.arxiv-vanity.com/papers/1812.10157/

792
用户1908973

SQN(看最后的视频里 砖块被打光了)及代码及saved_models

再看LunarLander-v2的效果(也是比较简单了。。。),AverageEpRet就是不上300... : (

923
用户1908973

RND 实验 跑了17个房间

https://github.com/openai/random-network-distillation

632
用户1908973

Playing MontezumaRevenge with RND 含视频

https://github.com/openai/random-network-distillation

943
用户1908973

多目标的强化学习教程-两篇均有代码

1122

扫码关注云+社区

领取腾讯云代金券