腾讯云开发者社区-腾讯云

开发者社区

文档建议反馈控制台

最新优惠活动

文章/答案/技术大牛

发布

UAI人工智能

专栏作者

40

文章

35196

阅读量

29

订阅数

Google AI dopamine 多巴胺强化学习框架

go 强化学习 git 游戏编程算法

值得试试。下图是在 Seaquest 游戏上的算法比对，可以看到 Rainbow 最厉害了。

2018-09-29

1K0

【召唤Legend Writer】这个世界正在召唤人工智能的”传奇写手“，你会书写下一个legend吗？

人工智能强化学习

视频：UAI出品2017 By Alpha 1 AI 存在众生相 2016至今，人工智能达到沸点，在此之前，人工智能一直以概念的形态存在，时间不过几十年而已。然而，这个引领时代潮流的先进理念早就在历史中被孕育、被培养，最后被孵化。在AI 的舞台上面，一直存在着众生相，比如出现了众多AI 研究先驱，学习 AI 论文的学习者，以 AI+ 进行产业变革的创业者，投资 AI 生态上每一环的投资人，实现 AI 的工程师等等。 2 好内容值得被看见而一直在真正沉淀和输出好的内容的 AI 内容产生者却相

2018-06-21

3570

【AI信息解读】吴恩达摇身变成AI投资人

人工智能深度学习强化学习

UAI专业解读师出品 AI信息解读 8 月 8 日，吴恩达宣布深度学习课程项目正式发布。据称是完成了 1/3。传说中的三大项目中的第一个。约一周之后的今天 10 小时前，他的第二个项目问世。这是专注于人工智能领域投资的 1.5 亿美元基金。他也要成为一名投资人了。吴恩达老师身份的转变宣告着他脱离大公司的束缚，打造他理想的 AI 未来世界的开始。1.5 亿的基金虽说不大，但足够投入到一些产生优质的项目的创始人身上，从而催生一些重要的AI产品。如果在他的领导下构建一个 AI 孵化器，那么整个世界范围生态就

2018-06-21

2780

解析 AlphaGo Zero 突破性成功的密码

强化学习人工智能游戏

DeepMind 的 AlphaGo Zero 的研究成果终于应约而至，大家均为之惊叹。从一大早到晚上，有不少人来自工业界、学术界，比如上海交大的 Liu Kent、帝国理工的 L 兄、UCL 的朋友等问起一些关于 DeepMind 最新 AlphaGo Zero 的为何能够取得突破的问题，决定写文简单分享一下自己的看法。一句话概括就是 DeepMind 整体对强化学习的深入探究指导了 Zero 的设计。首先很感谢 DeepMind 团队对人类关于围棋认知的贡献。但更令人兴奋的是，人工智能技术能够取得的

2018-06-21

5240

强化学习Reinforcement Learning被MIT Technology Review列入 2017 年十大技术

强化学习机器学习

今天 MIT Technology Review 将强化学习（Reinforcement Learning）列入 2017 年十大突破技术，并阐明其已经能够在 1 到 2 年内发挥出可触及的作用。话说强化学习领域也是一个历史相当久远的领域，这里我们引用之前 Neil 写过的一篇文章《深度强化学习导引》：强化学习，现在常常将其看作机器学习领域的一个分支，但如果细细去看，你会发现，强化学习本身也有完整的一条发展的脉络。从动物行为研究和优化控制两个领域独立发展最终经 Bellman 之手汇集抽象为 MDP 问

2018-06-21

5640

Neural Fictitious Self Play——从博弈论到深度强化学习

强化学习深度学习编程算法机器学习

这是此前完成的一篇个人觉得非常重要的论文的分析。这篇论文来自 UCL 的Johannes Heinrich 和 David Silver。David Silver 可以说是 AlphaGo 团队的领袖，Johannes 则是 UCL 的博士生，在博弈求解方面的研究取得了一定的进展。本文也是其 15 年论文工作的基础之上的引入深度学习的工作。博弈论作为一个经典的领域从 1944 年诞生至今也过去了 72 年，该领域得到了巨大的发展，成果累累，对经济学、生物学等等学科产生了重大影响。而计算机科学领域对博弈问

2018-06-21

5.8K0

没有更多了

社区活动

腾讯技术创作狂欢月

“码”上创作 21 天，分 10000 元奖品池！

Python精品学习库

代码在线跑，知识轻松学

博客搬家 | 分享价值百万资源包

自行/邀约他人一键搬运博客，速成社区影响力并领取好礼

技术创作特训营·精选知识专栏

往期视频·千货材料·成员作品最新动态