首页
学习
活动
专区
工具
TVP
发布

PaddlePaddle

专栏作者
573
文章
574489
阅读量
73
订阅数
yyds!用飞桨玩明日方舟
每个游戏玩家都有一个梦,希望自己在虚拟世界中成为万众瞩目、无所不能的英雄。然后…然后…闹钟响了梦醒了,又到了挤地铁上班的时间。
用户1386409
2021-04-20
5820
用多智能体强化学习算法MADDPG解决"老鹰捉小鸡"问题
MADDPG算法是强化学习的进阶算法,在读对应论文Multi-Agent Actor-Critic for Mixed Cooperative-Competitive Environments的过程中,往往会遇到很多不是很好理解的数学公式,这篇文章旨在帮助读者翻过数学这座大山,并从PARL(PARL是百度提供的一个高性能、灵活的强化学习框架)的代码理解MADDPG算法。本文目录如下:
用户1386409
2020-08-12
1.2K0
飞桨强化学习框架PARL发布首个工业级深度进化学习库EvoKit
PARL 1.3 重点发布了首个工业级进化学习框架EvoKit,支持大规模神经网络在真实业务场景中调研和部署进化学习算法,针对性解决进化学习算法部署到业务场景所遇到的难题。
用户1386409
2020-04-29
4360
NeurIPS颁奖现场揭秘:如何用飞桨PARL控制仿生人运动
训练代码的开源路径:https://github.com/PaddlePaddle/PARL
用户1386409
2019-12-19
3530
AI 界的黄埔军校 | 业界首批“首席AI架构师”毕业
在传统产业“遭遇”智能时代,科技革新亟待深化的当下,“革新者”的队伍该如何壮大?
用户1386409
2019-07-02
5890
强烈推荐 | 飞桨最全面的工具组件详解
深度学习技术已经具备了很强的通用性,正在推动人工智能进入工业大生产阶段。飞桨(PaddlePaddle)是百度自研的开源深度学习平台,有全面的官方支持的工业级应用模型,涵盖自然语言处理、计算机视觉、推荐引擎等多个领域,并开放多个领先的预训练中文模型。并为开发者开放 PaddleHub、PARL、AutoDL Design、VisualDL 等一系列深度学习工具组件,帮助开发者快速落地AI应用。接下来,小编带你一一了解。
用户1386409
2019-06-14
8690
PARL源码走读——使用策略梯度算法求解迷宫寻宝问题
作为一个强化学习小白,本人怀着学习的心态,安装并运行了PARL里的quick-start。不体验不知道,一体验吓一跳,不愧是 NeurIPS 2018 冠军团队的杰作,代码可读性良好,函数功能非常清晰,模块之间耦合度低、内聚性强。不仅仅适合零基础的小白快速搭建DRL环境,也十分适合科研人员复现论文结果。
用户1386409
2019-06-10
8030
PaddlePaddle升级解读 | PARL1.1一个修饰符实现并行强化学习算法
WAVE SUMMIT 2019深度学习开发者峰会,基于PaddlePaddle打造的深度强化学习框架PARL发布了聚焦于并行的1.1版本。本篇文章为大家带来PARL在并行算法优化方面的最新进展。
用户1386409
2019-06-06
7010
PaddlePaddle版Flappy-Bird—使用DQN算法实现游戏智能
刚刚举行的 WAVE SUMMIT 2019 深度学习开发者峰会上,PaddlePaddle 发布了 PARL 1.1 版本,这一版新增了 IMPALA、A3C、A2C 等一系列并行算法。作者重新测试了一遍内置 example,发现卷积速度也明显加快,从 1.0 版本的训练一帧需大约 1 秒优化到了 0.15 秒(配置:win8,i5-6200U,GeForce-940M,batch-size=32)。
用户1386409
2019-06-06
6190
强化学习之原理与应用
强化学习特别是深度强化学习近年来取得了令人瞩目的成就,除了应用于模拟器和游戏领域,在工业领域也正取得长足的进步。百度是较早布局强化学习的公司之一。这篇文章系统地介绍强化学习算法基础知识,强化学习在百度的应用,以及百度近期发布的基于PaddlePaddle深度学习框架的强化学习工具PARL。
用户1386409
2019-03-07
1.2K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档