Github 项目推荐 | 多 Agent 学习 AI 炸弹人游戏挑战赛 —— Playground

Playground 的 Pommerman 是专门为 AI 研究用的炸弹人游戏比赛,已经有来自世界各地的开发者提交了经过训练的 Agent。它由一群机器学习研究者举办,主办方会在他们的服务器上定期举办比赛来展示训练的结果。

该领域的大多数开源研究工具都是为单一的 Agent 而设计,而该项目的主办方专注于开发标准化的面向多 Agent 学习工具。同时,主办方还在 train_with_tensorforce.py 里提供了多训练脚本示例,这些示例能帮助开发者包装 Pommerman 环境,使开发者能够使用 TensorForce 这样的流行的库来训练。

开发者提交的 Agent 可以有三种比赛方式:

  • FAA:四人竞争,一人获胜,用于测试计划和策略能力
  • 团队:2 V 2,两队 Agent 竞争,一队获胜,用于测试 Agent 间的合作能力
  • 团队无线电:和团队模式一样,不过每个 Agent 都有一个无线电,可以每步从大小为 8 的字典里发送两个字。

详细信息请参阅网站:

https://www.pommerman.com/

Github 地址:

https://github.com/MultiAgentLearning/playground

原文发布于微信公众号 - AI研习社(okweiwu)

原文发表时间:2018-02-19

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏生信技能树

TCGA的28篇教程-风险因子关联图-一个价值1000但是迟到的答案

其实那个需求很简单:https://www.ncbi.nlm.nih.gov/pubmed/24893932 文章里面也说的很清楚,如下:

23920
来自专栏机器之心

资源 | 2018 AIIDE星际争霸AI挑战赛亚军CherryPi开源TorchCraftAI

TorchCraftAI 地址:https://torchcraft.github.io/TorchCraftAI/

6710
来自专栏大数据挖掘DT机器学习

数据挖掘知识点总结(Microsoft 关联规则分析算法)

前言 本篇继续我们的微软挖掘算法系列总结,前几篇我们分别介绍了:Microsoft决策树分析算法、Microsoft聚类分析算法、Microsoft Naive...

39360
来自专栏互联网技术栈

Google Analytics 维度和指标

“维度”是指数据的属性。举例来说,“城市”维度表示的是发起会话的城市,例如“巴黎”或“纽约”。“网页”维度表示的是用户浏览过的网页的网址。

11620
来自专栏牛客网

蚂蚁金服一面面经

本来以为自己的简历不可能跳过笔试,所以最近在刷笔试题,没有怎么复习安卓,在加之有些紧张,凉凉,呜呜呜~~~~~~~ 阿里不给通知,毫无预兆的打过来电话面试,面试...

50260
来自专栏算法+

音频算法之小黄人变声 附完整C代码

前面提及到《大话音频变声原理 附简单示例代码》与《声音变调算法PitchShift(模拟汤姆猫) 附完整C++算法实现代码》

91670
来自专栏AI派

还没准备好数据呢,为什么要着急用算法呢

开始之前,通知下我的读者,随着订阅读者越来越多,为了对读者们负责,有以下几件事情需要告知下:

24760
来自专栏Crossin的编程教室

用程序帮你炒股(2)

6月26日A股大跌,据估算市值蒸发4.5万亿。当日的领涨板块,你们感受一下: 银行 -4.66% 食品饮料 -6.94% 建筑装饰 -7.14% 有入市的...

46970
来自专栏目标检测和深度学习

资源 | 2018 AIIDE星际争霸AI挑战赛亚军CherryPi开源TorchCraftAI

TorchCraftAI 地址:https://torchcraft.github.io/TorchCraftAI/

14020
来自专栏灯塔大数据

技术 | 人生苦短,请用Python——10大Python库汇总

前言 对于码农来说,主要关注2017年新推出了哪些开源库,还有就是新近有什么流行的既能解决问题又好用的利器。下面就来为2017年做个总结。 1、Pipenv 第...

45590

扫码关注云+社区

领取腾讯云代金券