专栏首页arxiv.org翻译专栏密集交通中基于迭代推理的融合强化学习(CS AI)
原创

密集交通中基于迭代推理的融合强化学习(CS AI)

在密集交通中移动是一项具有挑战性的任务,因为智能体需要对许多其他参与者的随机行为进行推理,此外,它必须在有限的时间和距离内完成移动。在本项工作中,我们提出了一种强化学习和博弈论相结合的方法来学习合并行为。我们利用k级行为的概念设计了一个强化学习智能体的训练课程,这种方法使智能体在训练过程中暴露于各种各样的行为中,从而促进了它对模型差异的学习生成具有鲁棒性的学习策略,结果证明我们的方法与传统训练方法相比能够生成更有效的学习策略。

原文题目:Reinforcement Learning with Iterative Reasoning for Merging in Dense Traffic

原文:Maneuvering in dense traffic is a challenging task for autonomous vehicles because it requires reasoning about the stochastic behaviors of many other participants. In addition, the agent must achieve the maneuver within a limited time and distance. In this work, we propose a combination of reinforcement learning and game theory to learn merging behaviors. We design a training curriculum for a reinforcement learning agent using the concept of level-k behavior. This approach exposes the agent to a broad variety of behaviors during training, which promotes learning policies that are robust to model discrepancies. We show that our approach learns more efficient policies than traditional training methods.

原文作者:Maxime Bouton, Alireza Nakhaei, David Isele, Kikuo Fujimura, Mykel J. Kochenderfer

原文链接:https://arxiv.org/abs/2005.11895

原创声明,本文系作者授权云+社区发表,未经许可,不得转载。

如有侵权,请联系 yunjia_community@tencent.com 删除。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • 10亿美元:MIT宣布建立计算学院,近70年来最大结构变革只为AI

    这个项目,是美国所有学术机构在AI领域进行的投资中最大的一笔,要重新调整MIT的方向:

    量子位
  • 学界丨Facebook 田渊栋:学AI的门槛在哪,以及,为什么AI人才有高收入?

    AI科技评论按:本文作者田渊栋,卡耐基梅隆大学机器人系博士学位、上海交通大学硕士学位和学士学位,前谷歌无人车项目组成员,现任Facebook人工智能组研究员,主...

    AI科技评论
  • 田渊栋:什么样的人适合搞AI?AI人才高收入是否合理?

    田渊栋 知乎专栏:https://zhuanlan.zhihu.com/yuandong

    用户1908973
  • 刘知远:写给正在填报志愿并对CS/AI感兴趣的2019届考生们

    为的是在计算机专业日益火爆的当下,解答考生和家长们普遍好奇的问题,帮助考生更加理性地选择专业,希望更多真正喜欢CS/AI的考生选好学校选对专业。现在看,这篇短文...

    AI科技大本营
  • 指南 | 写给正在填报志愿并对CS/AI感兴趣的2019考生们

    本文是在计算机专业日益火爆的当下,解答考生和家长们普遍好奇的问题,帮助考生更加理性地选择专业,希望更多真正喜欢CS/AI的考生选好学校选对专业。

    数据派THU
  • 清华刘知远:写给正在填报志愿并对CS/AI感兴趣的考生们

    2018年6月高考结束后,我写过一篇短文:《写给正在填报志愿并对CS/AI感兴趣的考生们-2018》。

    大数据文摘
  • 想本科入读人工智能专业,这篇文章送给准备填志愿的你

    在计算机专业和人工智能日益火爆的当下,很多人对这两个专业又是好奇又是憧憬。对此,清华大学刘知远教授近日在知乎上分享了一些内容,以帮助考生更加理性地选择专业,希望...

    机器之心
  • 想本科入读人工智能专业,这篇文章送给准备填志愿的你

    在计算机专业和人工智能日益火爆的当下,很多人对这两个专业又是好奇又是憧憬。对此,清华大学刘知远教授近日在知乎上分享了一些内容,以帮助考生更加理性地选择专业,希望...

    小小詹同学
  • 资源 |“从蒙圈到入坑”,推荐新一波ML、DL、RL以及数学基础等干货资源

    编译| AI科技大本营(rgznai100) 参与 | suiling 此前营长曾发过一篇高阅读量、高转发率,高收藏量的文章《爆款 | Medium上6900...

    AI科技大本营
  • 写给想要填报CS/AI志愿的考生们

    国内CS/AI方向又有很多新的变化,最明显的是各大高校纷纷设立人工智能学院,开始招收人工智能专业本科生。最近又要开始新的一轮填报志愿,我又来蹭个热点,花了些时间...

    昱良
  • AI 的深度强化学习调配交通信号灯

    聊起 AI,画面都充斥着机械语言:精密高级的芯片,光怪陆离的智能产业……你眼中的 AI 有什么样的能力?能给传统行业带来哪些变革与发展?基于此,云加社区联手知乎...

    云加社区
  • 一文透析腾讯安全联邦学习应用服务

    近年来,随着人工智能技术的高速发展,社会各界对隐私保护的需求不断加强。欧盟出台了最严隐私保护的法案《通用数据保护条例》(GDPR),中国也在相关法律法规中明确指...

    腾讯安全
  • 一周AI回顾 | 南沙设立人工智能视觉图像研发中心,旷视科技C轮筹资4.6亿美元

    本期一周AI看点包括行业热点、投融资、业界观点、技术前沿以及应用等方面。 行业 中科曙光研制出首款搭载寒武纪AI芯片的人工智能服务器 中科曙光近日成功研制出首款...

    AI科技大本营
  • 「腾讯大数据-天工」问世,鹅厂想用AI给大数据平台做自动驾驶系统

    十年演进,腾讯大数据第四代数智融合计算平台「天工」终于问世,它有什么过人之处? 本文转载自:机器之心 作者:蛋酱 上世纪 80 年代,姚期智教授曾在一篇文章中...

    腾讯大数据
  • 编织联邦学习的产业路径,腾讯向金融智能化的更远处进发

    这届人工智能能够化身“新基建”的中流砥柱,避免了重蹈“AI寒冬”的覆辙,一个很大的原因就是,机器学习从产业层面提质增效,真正让技术变成了社会经济的价值推动力。

    脑极体
  • 金融学如何应对人工智能和大数据?

    ? 李开复说未来十年金融行业的从业人员很有可能会被人工智能所取代,而人文、文化、艺术方面的领域人工智能尚难以涉及。那么还有学金融学专业的必要吗? 大数据这是一...

    小莹莹
  • 哈工大成立人工智能研究院,NLP全国第三

    今日(5 月 5 日),哈尔滨工业大学正式宣布成立人工智能研究院,王亚东教授担任首任院长。据悉,哈工大人工智能研究院将按照“理论、技术、平台、应用”4个层次、8...

    AI科技大本营
  • 中国经济全产业数字智能化升级 百度成为核心推手

    通过加载数据,理解数据,最终唤醒数据,AI,正成为新一轮产业变革与“数字中国”建设的核心驱动力。近日,人民日报整版讨论“数字中国”建设,指出全球经济范式已开始从...

    罗超频道
  • 《MIT科技评论》“35位35岁以下科技创新青年”名单出炉!AI领域有5人入选 | 2020中国区

    今日,《麻省理工科技评论》2020年中国区“35 岁以下科技创新 35 人”榜单出炉。其中,AI领域相关人物共有5人入选,分别是:

    计算机视觉

扫码关注云+社区

领取腾讯云代金券