【微软亚研130PPT教程】强化学习简介

【导读】近年来,强化学习特别是深度强化学习在棋类、视屏游戏、机器人控制等问题上取得了极大的成功,成为人工智能研究的热点。 微软亚洲研究院的秦涛研究员在报告《强化学习简介》中对强化学习做一个简要介绍。

报告内容


该报告分为3个部分:

  1. 强化学习基础,包括:
    • 马氏决策过程
    • Bellman方程
    • 规划
    • 最优控制
    • 蒙特卡洛采样
    • TD算法
  2. 强化学习新算法,包括:
    • 基于值函数的算法
    • 基于策略函数的算法
    • 基于两者的混合算法
  3. 强化学习所面临的挑战,如鲁棒性、样本效率等

讲者简介


秦涛 博士,微软亚洲研究院资深研究员/经理,中国科学技术大学博士生导师。主要研究领域包括机器学习和人工智能(深度学习和强化学习的算法设计、理论分析及在实际问题中的应用),互联网搜索与计算广告,博弈论和多智能体系统,在国际会议和期刊上发表学术论文100余篇。曾任SIGIR、ACML、AAMAS领域主席,担任多个国际学术大会程序委员会成员,包括ICML、NIPS、KDD、IJCAI、AAAI、WSDM、EC、SIGIR、AAMAS、WINE,曾任多个国际学术研讨会联合主席。获得《北京青年》2017年度年度“工匠精神·青年榜样”奖。

PDF下载链接

附部分PPT:

参考链接:

  • http://www.cips-cl.org/static/CCL2018/downloads/tutorialsPPT/T4.pdf

-END-

原文发布于微信公众号 - 专知(Quan_Zhuanzhi)

原文发表时间:2018-10-26

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏AI科技评论

赛后跟踪:如何在 ImageNet 比赛中获得冠军?

近两个月,国内团队先后在全球权威的人脸检测评测平台 FDDB 和全球自动驾驶算法公开排行榜 KITTI 以及 Cityscapes 上取得非常好的成绩,这在一定...

3705
来自专栏大数据文摘

机器视觉与深度神经网络—洗去浮华,一窥珠玑

3104
来自专栏大数据文摘

周博磊知乎热答:如何评价何恺明大神斩获ICCV 2017最佳论文

1663
来自专栏AI研习社

博客 | 玩转「马里奥」的算法能搞定「口袋妖怪」吗?

现在,你很可能已经听说过机器人玩游戏的水平超过人类了吧。这些机器人的一种设计方法是给它们明确地编程,设定一组输入和一组输出之间的对应关系;或者也可以让它们自主学...

984
来自专栏京东技术

京东AI研究院在CVPR 2018 LIP 全球竞赛中荣获两项冠军

2553
来自专栏AI科技评论

学界 | 如何提高NIPS论文命中率?这里有一份详细的分析

在学术界,NIPS大会在论文方面的争议似乎比其他学术会议更为突出一些。例如去年在ML圈子里影响颇大的SARM论文撤稿事件就是在NIPS,以及像这位叫Thang ...

4527
来自专栏机器之心

观点 | Yoav Goldberg撰文再回应Yann LeCun:「深度学习这群人」不了解NLP(附各方评论)

选自Medium 机器之心编译 作者:Yoav Goldberg 参与:黄小天 昨日,机器之心发布了一篇题为《从 Yoav Goldberg 与 Yann L...

37113
来自专栏大数据文摘

金融风控领域的工业级大数据应用: 如何跨越AI与业务经验结合前的鸿沟?

1582
来自专栏AI科技评论

观点 | 玩转「马里奥」的算法能搞定「口袋妖怪」吗?

AI 科技评论:现在机器人玩游戏的水平甚至已经超过了人类,然而对于不同的游戏,一个算法是否全部搞定呢?软件开发者 Shayaan Jagtap 就以「马里奥」这...

922
来自专栏腾讯高校合作

犀牛鸟人物丨专访刘偲老师:图像之美像素级语义理解研究

2433

扫码关注云+社区

领取腾讯云代金券