AAAI 2018 杰出论文出炉,两位中国留学生共同获奖

编辑 | 周翔

作为人工智能的顶级会议,AAAI 2018 将于 2.2~2.7 在美国路易斯安那州的新奥尔良举行。然而,大会还没开始,获奖信息就已经在网上传播开来。

获得“杰出论文奖”的是加拿大阿尔伯塔大学 Martin Müller 教授与他的两位学生 Chenjun Xiao, Jincheng Mei 的论文:“Memory-Augmented Monte Carlo Tree Search”,目前该论文还没有公开。

其中,Chenjun Xiao 于 2014 年加入 Martin Müller 教授的研究小组,攻读硕士,2016 年开始攻读博士学位。Jincheng Mei 本科毕业于华南理工大学,硕士毕业于上海交通大学,2015 年进入加拿大阿尔伯塔大学,攻读博士学位。

获得“杰出学生论文奖”的则是来自牛津大学的“Counterfactual Multi−Agent Policy Gradients”,该论文的作者为 Jakob Foerster、Gregory Farquhar、Triantafyllos Afouras、Nantas Nardelli 以及 Shimon Whiteson。

目前,该论文已经公开,以下是 AI 科技大本营对论文概述的简要翻译:

许多现实世界的问题,比如网络分组路由和自动驾驶汽车的协调,通常都被自然地建模为协作多代理系统。我们非常需要一种新的强化学习方法,来有效地学习这种系统的分散策略。为此,我们提出了一种被称为反事实多智能体(COMA,counterfactual multi-agent)策略梯度的方法。COMA 使用中心化的 critic 来估算 Q 函数,以及去中心化的 actors 来优化智能体的策略。另外,为了解决多智能体信用分配的挑战,我们使用了一个反事实的基线,边际化了一个智能体的行为,同时保持其他智能体的行为是固定的。COMA 还使用了 critic 表示法,可以单次正向传递中有效地计算反事实基线。我们使用具有显著部分可观察性的 decentralised variant,在《星际争霸》单位微操作(unit micromanagement)的测试平台上评估了 COMA。结果显示,COMA 显着提高了其他多智能体actor-critic方法的平均表现,而最佳表现的智能体甚至可以与最先进的中心控制器竞争,访问完整的状态信息。

根据 jeffhuang 统计的获奖论文清单,营长发现,自 1996 年以来,虽然已经有一些华人的名字出现其中,但是到目前为止,中国只有浙江大学一所高校上榜。随着越来越多的华人在人工智能领域崭露头角,希望中国的高校能够也能够培养并留住更多的顶尖人才。

原文发布于微信公众号 - AI科技大本营(rgznai100)

原文发表时间:2018-01-18

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏机器学习人工学weekly

机器学习人工学weekly-2018/4/8

注意下面很多链接需要科学上网,无奈国情如此 1. clustering 5种算法解释 The 5 Clustering Algorithms Data Scie...

32040
来自专栏程序员的知识天地

用Python自动生成表情包?小学生都能学会的操作!

作为一个数据分析师,应该信奉一句话----"一图胜千言"。不过这里要说的并不是数据可视化,而是一款全民向的产品形态——表情包!!!!

9320
来自专栏JasonhavenDai

论文相关知识1.核心期刊2. A、B、C类3.相关概念4.阅读方法5.参考阅读

1.核心期刊 CCL,全国计算语言学学术会议 ACL,国际计算语言年会 NIPS,神经信息处理系统进展大会 SCI SCI即《科学引文索引》(Science ...

37050
来自专栏BestSDK

如何用深度学习来识别恶意软件

这是一个悲伤的故事,你可能经历过。 你又热又渴,看到桌子上有一瓶看起来像水的东西,来不及思考,揭开瓶盖喝了一大口。哦!漏!是油! 时间回到10秒前,我们重来一次...

34590
来自专栏机器人网

详解:无人机中超声波原理

近年来,消费类无人机越来越受欢迎,多用于拍摄震撼的片段、运送救援物资,多数无人机使用各种传感技术实现自主导航、碰撞检测。而你又是否知道,超声波传感尤其有助于无人...

11520
来自专栏大数据文摘

猎杀埃博拉病毒的算法

35670
来自专栏腾讯位置服务

距离矩阵服务上线,实现最优派单及路径解决方案

继一对多的距离计算服务后,腾讯位置服务近日再次升级,推出更为强大的距离矩阵(多对多)距离服务。从计算性能上来看,多对多矩阵最高支持25×25矩阵(一次请求计算路...

23620
来自专栏思影科技

AJP:青少年饮酒后大脑发育轨迹发生改变

薛老师和他的猫推荐你关注思影科技 来自美国加州SRI国际健康科学中心、斯坦福大学等机构的研究人员联合在The American journal of psych...

32090
来自专栏思影科技

AJP事件相关电位研究:精神分裂症患者听觉感觉处理缺陷的临床和认知意义

来自塞拉利昂精神疾病研究、教育和临床中心,旧金山VA医疗保健系统,加州大学旧金山分校精神病学系和加州大学洛杉矶分校的心理学系以及精神病学系、生物行为科学系的研究...

35960
来自专栏大数据文摘

生命之圈:生物数据可视化的美丽新方法

307100

扫码关注云+社区

领取腾讯云代金券