专栏首页CreateAMindGoogle Research Football (scenario 11) 实验

Google Research Football (scenario 11) 实验

谷歌足球游戏环境使用介绍

在之前的公众号文章中我们介绍了Football Academy中的两个scenario的实验:

Google Research Football (scenario 2) 实验

Google Research Football (scenario 7) 实验

这里分享的是Football Academy中最后一个 scenario 的一些实验结果。

scenario 2 和 scenario 7 都不是完整比赛,游戏复杂度相对较低,scenario 11 是 11v11 比赛,更像完整比赛,但是被抢断,出界,进球都会终止比赛。

Google Research Football 最近升级到1.5版本,但是跑的时候遇到了显示的bug,变成了黑白风格。。

已经在官方github项目提交 issue,还在解决中。

https://github.com/google-research/football/issues/64

1. 通过简单的传球和带球,到禁区附近伺机射门,得分可达0.95。

2. 我们正在进行11v11的正式比赛训练,用训练过的agent也可以跑scenario 11,但是不会刻意避免终止的情况,所以得分不高。

3. 随机 scenario 11 进球集锦

官方的Baseline里的PPO算法训练得分为0.7,IMPALA训练100M的得分为0.4, 我们训练得分为0.95。

训练算法和代码可以在我们的强化学习项目中找到,普通版本和并行版本链接: https://github.com/createamind/DRL

https://github.com/createamind/Distributed-DRL 欢迎加入或支持我们 :)

本文分享自微信公众号 - CreateAMind(createamind),作者:kangaroo

原文出处及转载信息见文内详细说明,如有侵权,请联系 yunjia_community@tencent.com 删除。

原始发表时间:2019-09-20

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

我来说两句

0 条评论
登录 后参与评论

相关文章

  • Soft Reinforcement Learning 介绍

    Soft Reinforcement Learning (SRL) 是强化学习的一个新的范式,脱胎于最大熵强化学习 (Maximum Entropy Reinf...

    用户1908973
  • adam神经网络优化算法简介

    以下内容摘自 http://www.cnblogs.com/xinchrome/p/4964930.html

    用户1908973
  • 40年认知架构研究概览:实现通用人工智能的道路上我们已走了多远?

    在这篇论文中,我们呈现了关于过去 40 年认知架构(cognitive architecture)研究的宏观概述。尽管目前已有架构的数量已经有数百种了,但绝大多...

    用户1908973
  • MQ(消息队列)常见的应用场景解析

    提高系统性能首先考虑的是数据库的优化,之前一篇文章《数据库的使用你可能忽略了这些》中有提到过开发中,针对数据库需要注意的事项。但是数据库因为历史原因,横向扩展是...

    itmifen
  • MQ消息队列应用研究

    版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.n...

    林老师带你学编程
  • MQ不丢消息,究竟是怎么实现的?

    通过消息队列(MsgQueue,MQ)发送任务和消息,万一MQ重启了怎么办?能否保证MQ不丢消息?

    架构师之路
  • 消息中间件MQ科普

    消息队列(Message Queue),是一种跨进程的通信机制,用于上下游传递消息。

    乐心湖
  • 01.MQ简介

    当你刚刚为公司的一个Web应用实现了一个很棒的注册模块。它看起来简洁、高效。在你沾沾自喜的时候,你的leader对你说,现在咱们需要在注册成功后对用户发送一条短...

    qubianzhong
  • 信用算力实现金融级数据服务的实践

    微服务架构已成为了互联网的热门话题之一,而这也是互联网技术发展的必然阶段。然而,微服务概念的提出者 Martin Fowler 却强调:分布式调用的第一原则就是...

    heidsoft
  • 究竟什么时候该使用MQ?

    任何脱离业务的组件引入都是耍流氓。引入一个组件,最先该解答的问题是,此组件解决什么问题。

    架构师之路

扫码关注云+社区

领取腾讯云代金券