专栏首页深度强化学习实验室第10期:DeepRL每日论文快报

第10期:DeepRL每日论文快报

DeepRL每日论文快报

来源自:arxiv.com

编辑:DeepRL

时间:2019-12-13

On-policy Reinforcement Learning with Entropy Regularization

arxiv链接: https://arxiv.org/pdf/1912.01557.pdf

Human-Robot Collaboration via Deep Reinforcement Learning of Real-World Interactions

arxiv链接: https://arxiv.org/pdf/1912.01715.pdf

Iterative Policy-Space Expansion in Reinforcement Learning

arxiv链接: https://arxiv.org/pdf/1912.02532.pdf

Deep Model Compression via Deep Reinforcement Learning

arxiv链接: https://arxiv.org/pdf/1912.02532.pdf

Observational Overfitting in Reinforcement Learning

arxiv链接: https://arxiv.org/pdf/1912.02975.pdf

Reinforcement Learning Upside Down: Don't Predict Rewards -- Just Map Them to Actions

arxiv链接: https://arxiv.org/pdf/1912.02875.pdf

Learning Sparse Representations Incrementally in Deep Reinforcement Learning

arxiv链接: https://arxiv.org/pdf/1912.04002.pdf

Entropy Regularization with Discounted Future State Distribution in Policy Gradient Methods

arxiv链接: https://arxiv.org/pdf/1912.05104.pdf

GitHub每日同步更新(欢迎star)

https://github.com/NeuronDance/DeepRL/tree/master/DRL-PaperDaily

本文分享自微信公众号 - 深度强化学习实验室(Deep-RL),作者:DeepRL

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-12-13

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 第13期:深度强化学习《论文快报》

    Direct and indirect reinforcement learning

    J.Q.Wang@2048
  • 第14期:深度强化学习《论文快报》

    Model-based Multi-Agent Reinforcement Learning with Cooperative Prioritized Swee...

    J.Q.Wang@2048
  • 第9期:DeepRL每日论文快报

    Learning Representations in Reinforcement Learning:An Information Bottleneck App...

    J.Q.Wang@2048
  • 第13期:深度强化学习《论文快报》

    Direct and indirect reinforcement learning

    J.Q.Wang@2048
  • 第14期:深度强化学习《论文快报》

    Model-based Multi-Agent Reinforcement Learning with Cooperative Prioritized Swee...

    J.Q.Wang@2048
  • 自然语言处理领域重要论文&资源全索引

    选自GitHub 作者:Kyubyong Park 机器之心编译 参与:刘晓坤、李泽南 自然语言处理(NLP)是人工智能研究中极具挑战的一个分支。随着深度学习等...

    机器之心
  • GitHub项目:自然语言处理领域的相关干货整理

    自然语言处理(NLP)是计算机科学,人工智能,语言学关注计算机和人类(自然)语言之间的相互作用的领域。本文作者为NLP初学者整理了一份庞大的自然语言处理领域的概...

    AiTechYun
  • 自然语言处理领域重要研究及资源全索引!

    来源:机器之心 作者:Kyubyong Park 本文长度为3071字,建议阅读6分钟 本文为你整理自然语言处理最新深度研究成果。 自然语言处理(NLP)是人工...

    数据派THU
  • 【2017年末AI最新论文精选】词向量fasttext,CNN is All,强化学习,自回归生成模型, 可视化神经网络损失函数

    【导读】专知内容组整理出最近arXiv放出的五篇论文,包括《Tomas Mikolov新作词向量表示,CNN Is All You Need,强化学习库, 自回...

    WZEARW
  • 词向量fasttext,CNN is All,强化学习,自回归生成模型,可视化神经网络损失函数

    【导读】专知内容组整理出最近arXiv放出的五篇论文,包括《Tomas Mikolov新作词向量表示,CNN Is All You Need,强化学习库, 自回...

    企鹅号小编

扫码关注云+社区

领取腾讯云代金券