首页
学习
活动
专区
工具
TVP
发布

UAI人工智能

专栏作者
40
文章
35196
阅读量
29
订阅数
Google AI dopamine 多巴胺强化学习框架
值得试试。下图是在 Seaquest 游戏上的算法比对,可以看到 Rainbow 最厉害了。
用户1107453
2018-09-29
1K0
【召唤Legend Writer】这个世界正在召唤人工智能的”传奇写手“,你会书写下一个legend吗?
视频:UAI出品2017 By Alpha 1 AI 存在众生相 2016至今,人工智能达到沸点,在此之前,人工智能一直以概念的形态存在,时间不过几十年而已。然而,这个引领时代潮流的先进理念早就在历史中被孕育、被培养,最后被孵化。 在AI 的舞台上面,一直存在着众生相,比如出现了众多AI 研究先驱,学习 AI 论文的学习者,以 AI+ 进行产业变革的创业者,投资 AI 生态上每一环的投资人,实现 AI 的工程师等等。 2 好内容值得被看见 而一直在真正沉淀和输出好的内容的 AI 内容产生者却相
用户1107453
2018-06-21
3570
【AI信息解读】吴恩达摇身变成AI投资人
UAI专业解读师出品 AI信息解读 8 月 8 日,吴恩达宣布深度学习课程项目正式发布。据称是完成了 1/3。传说中的三大项目中的第一个。约一周之后的今天 10 小时前,他的第二个项目问世。这是专注于人工智能领域投资的 1.5 亿美元基金。他也要成为一名投资人了。 吴恩达老师身份的转变宣告着他脱离大公司的束缚,打造他理想的 AI 未来世界的开始。1.5 亿的基金虽说不大,但足够投入到一些产生优质的项目的创始人身上,从而催生一些重要的AI产品。 如果在他的领导下构建一个 AI 孵化器,那么整个世界范围生态就
用户1107453
2018-06-21
2780
解析 AlphaGo Zero 突破性成功的密码
DeepMind 的 AlphaGo Zero 的研究成果终于应约而至,大家均为之惊叹。从一大早到晚上,有不少人来自工业界、学术界,比如上海交大的 Liu Kent、帝国理工的 L 兄、UCL 的朋友等问起一些关于 DeepMind 最新 AlphaGo Zero 的为何能够取得突破的问题,决定写文简单分享一下自己的看法。 一句话概括就是 DeepMind 整体对强化学习的深入探究指导了 Zero 的设计。 首先很感谢 DeepMind 团队对人类关于围棋认知的贡献。但更令人兴奋的是,人工智能技术能够取得的
用户1107453
2018-06-21
5240
强化学习Reinforcement Learning被MIT Technology Review列入 2017 年十大技术
今天 MIT Technology Review 将强化学习(Reinforcement Learning)列入 2017 年十大突破技术,并阐明其已经能够在 1 到 2 年内发挥出可触及的作用。 话说强化学习领域也是一个历史相当久远的领域,这里我们引用之前 Neil 写过的一篇文章《深度强化学习导引》: 强化学习,现在常常将其看作机器学习领域的一个分支,但如果细细去看,你会发现,强化学习本身也有完整的一条发展的脉络。从动物行为研究和优化控制两个领域独立发展最终经 Bellman 之手汇集抽象为 MDP 问
用户1107453
2018-06-21
5640
Neural Fictitious Self Play——从博弈论到深度强化学习
这是此前完成的一篇个人觉得非常重要的论文的分析。这篇论文来自 UCL 的Johannes Heinrich 和 David Silver。David Silver 可以说是 AlphaGo 团队的领袖,Johannes 则是 UCL 的博士生,在博弈求解方面的研究取得了一定的进展。本文也是其 15 年论文工作的基础之上的引入深度学习的工作。 博弈论作为一个经典的领域从 1944 年诞生至今也过去了 72 年,该领域得到了巨大的发展,成果累累,对经济学、生物学等等学科产生了重大影响。而计算机科学领域对博弈问
用户1107453
2018-06-21
5.8K0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档