前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >首位AAAI华人主席杨强:《强化学习(第2版)》架起了一座通往强化学习经典知识宝库的桥梁

首位AAAI华人主席杨强:《强化学习(第2版)》架起了一座通往强化学习经典知识宝库的桥梁

作者头像
博文视点Broadview
发布2020-06-10 16:52:06
7330
发布2020-06-10 16:52:06
举报
文章被收录于专栏:博文视点Broadview

即将在 2 月 7 日举行的人工智能顶级会议 AAAI 2020 上即将首次出现大会主席职位。在17日,南京大学教授周志华在微博发布消息称,微众银行首席人工智能官杨强教授将担任国际人工智能大会 AAAI 2021 大会主席。杨强教授是 AAAI 大会历史上第二位大会主席,同时将成为担任此职位的首位华人。

杨强教授作为人工智能业界的国际专家,在学术界和工业界做出了许多贡献,尤其近些年为中国人工智能和数据挖掘的发展做出了重要的贡献。杨强教授是国际人工智能界“迁移学习”(transfer learning)领域的发起人和带头人,同时也是国际“联邦学习”(Federated Learning)的发起人之一及带头人。

杨强教授曾经公开赞誉过一本书“为机器学习领域的中国学者和学生架起了一座通往强化学习经典知识宝库的桥梁。” 这本书便是——《强化学习(第2版)》

《强化学习(第2版)》来自强化学习领域先驱者Richard S. Sutton和Andrew G. Barto之手,Csaba Szepesvari、Demis Hassabis、邓力、黃士傑、Pedro Domingos、漆远、Tom Mitchell、杨强、Yoshua Bengio、张钹、周志华等国内外行业大咖一致给出好评。

跟随杨强教授,用2分半的时间一同了解《强化学习(第2版)》这部殿堂之作。

以下为杨强教授的推荐文字


记得在2018年的IJCAI大会上, 我作为国际人工智能联合会的理事会主席给 Andrew Barto 教授颁发2018年杰出研究贡献奖(Research Excellence Award)。这个奖每年颁发给一位长期在人工智能界探索并做出杰出贡献的科学家。我当时问Barto教授,看到现在AlphaGo和AlphaZero凭强化学习横扫围棋界,有什么感受?他说,一直到现在退休,强化学习都是小众研究领域。现在虽然已退休,但赶上AlphaGo/AlphaZero的成功,还是很感慨的!

在人工智能界,Richard Sutton(Barto的学生)和 Andrew Barto 是公认的强化学习的鼻祖,是他们师徒把强化学习作为一个机器学习的重要分支,搬上大雅之堂。这部《强化学习(第2版)》也凝聚了他们的心血。如文中所述,强化学习模拟人类学习的策略,利用积累的经验来改进决策系统的性能,就像国际象棋大师的走子一样,其是通过反复考虑对手可能的反应而进行多步的判断来给出的。这些观察通过用数学,特别是概率论对智能体、对手和环境进行简练的表达,可以解释如何通过不断的训练,逐步提高智能体的能力。

全书对读者的机器学习背景没有做太多的假设,从头娓娓道来,不仅把强化学习重要的理念讲得极为清晰,而且细致回顾了一些强化学习背后的科学家的小故事,生动活泼。同时,书中也不时地指出脑科学的新发现对强化学习研究的启迪,让读者从多学科的角度得到全面的知识。书中还有无数的小例子,用以帮助读者理解复杂的概念,比如井字棋游戏。此外,书中引用新的人工智能进展,对强化学习的经典算法(如蒙特卡洛搜索树算法)加以系统的解释,让读者理解这些算法如何应用在著名的IBM的WATSON系统和AlphaGo/AlphaZero系统中。

中文版特别值得一提的是上海交通大学俞凯教授及其团队所做的高质量的中文翻译。本书的翻译涉及众多强化学习概念的首次中文翻译,这需要译者同时具有深厚的机器学习和翻译功底。毫不夸张地说,中文版的面世为机器学习领域的中国学者和学生架起了一座通往强化学习经典知识宝库的桥梁。

———— ————

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2020-01-19,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 博文视点Broadview 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
相关产品与服务
联邦学习
联邦学习(Federated Learning,FELE)是一种打破数据孤岛、释放 AI 应用潜能的分布式机器学习技术,能够让联邦学习各参与方在不披露底层数据和底层数据加密(混淆)形态的前提下,通过交换加密的机器学习中间结果实现联合建模。该产品兼顾AI应用与隐私保护,开放合作,协同性高,充分释放大数据生产力,广泛适用于金融、消费互联网等行业的业务创新场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档