首页
学习
活动
专区
工具
TVP
发布

UAI人工智能

专栏作者
40
文章
35194
阅读量
29
订阅数
Google AI dopamine 多巴胺强化学习框架
值得试试。下图是在 Seaquest 游戏上的算法比对,可以看到 Rainbow 最厉害了。
用户1107453
2018-09-29
1K0
解析 AlphaGo Zero 突破性成功的密码
DeepMind 的 AlphaGo Zero 的研究成果终于应约而至,大家均为之惊叹。从一大早到晚上,有不少人来自工业界、学术界,比如上海交大的 Liu Kent、帝国理工的 L 兄、UCL 的朋友等问起一些关于 DeepMind 最新 AlphaGo Zero 的为何能够取得突破的问题,决定写文简单分享一下自己的看法。 一句话概括就是 DeepMind 整体对强化学习的深入探究指导了 Zero 的设计。 首先很感谢 DeepMind 团队对人类关于围棋认知的贡献。但更令人兴奋的是,人工智能技术能够取得的
用户1107453
2018-06-21
5240
AlphaGo 的下一步计划
今日 DeepMind 的 AlphaGo 3:0 柯洁。整个未来围棋峰会结束。DeepMind 宣告的下一步的计划。 仅仅看到的棋盘上的三个子,我们就明白这不是一场寻常的比赛。 中国围棋大师,世界
用户1107453
2018-06-21
4180
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档