Github 项目推荐 | 用于训练和测试文本游戏强化学习 Agent 的工具

TextWorld 是一个沙盒环境,用于训练和测试基于文本游戏的强化学习 Agent。

Github 链接:

https://github.com/Microsoft/TextWorld

安装

  • TextWorld 需要 Python 3,目前仅支持 Linux 系统。
  • 安装 TextWorld 最简单的方法是通过 pip。
  • 复制本库后,进入项目的根文件夹(即与setup.py一起)并运行
pip install .

远程安装:

pip install https://github.com/Microsoft/TextWorld/archive/master.zip

**请确保 pip 与您的 Python 3 安装相关联

附加功能

如果需要,可以为TextWorld安装一个或多个额外功能。

pip install .[prompt,vis]
  • [prompt]:启用命令自动完成(仅适用于生成的游戏)。要激活它,请在运行 tw-play 脚本时使用 --hint 选项,然后在提示符处按TAB-TAB。
  • [vis]:启用游戏状态查看器(仅适用于生成的游戏)。要激活它,请在运行 tw-play 脚本时使用 --html-render 选项,并在浏览器中显示游戏的当前状态。

要求

为了使用 TextWorld 生成和播放基于文本的游戏,需要以下系统库:

sudo apt-get -y install uuid-dev libffi-dev build-essential xdot gcc make python3-dev

以及一些可以单独安装的 Python 库

pip install -r requirements.txt

用法

生成一个游戏

TextWorld 提供了一种通过 tw-make 脚本生成简单的基于文本的游戏的简便方法。 例如:

tw-make custom --world-size 5 --nb-objects 10 --quest-length 5 --output gen_games/

custom 表示我们想要使用以下选项自定义游戏: - world-size 控制世界中的房间数量 - --nb-objects 控制可以与之交互的对象数量(不包括门)和 - quest-length 控制为赢得游戏而键入所需的最少命令数。 完成后,游戏将保存在gen_games /文件夹中。

玩游戏

要玩游戏,可以使用 tw-play 脚本。 例如,播放上一节中生成的游戏的命令是:

tw-play gen_games/simple_game.ulx

*仅支持 Z-machine 的游戏(* .z1至.z8)和 Glulx 的游戏(.ulx)。

文档

https://aka.ms/textworld-docs

原文发布于微信公众号 - AI研习社(okweiwu)

原文发表时间:2018-07-17

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏SAP最佳业务实践

SAP最佳业务实践:ETO–项目装配(240)-4基于SD的更改调整项目

image.png CJ20N基于 SD 的更改调整项目 创建客户订单后,需要基于订单中的更改精调项目。 角色项目经理 后勤®项目系统®项目®项目构造器 1...

49780
来自专栏Golang语言社区

系统架构之三(业务运营支撑系统)

本人从事过3年的移动业务运营支撑系统开发,行业术语叫做boss系统,后又转入游戏行业进行游戏开发。 现设计一个业务运营支撑系统的架构如下: ? 详细解释各模块如...

410100
来自专栏向治洪

携程React Native实践

React Native(下文简称 RN)开源已经一年多时间,国内各大互联网公司都在使用,携程也在今年 5 月份投入资源开始引入,并推广给多个业务团队使用,本文...

41270
来自专栏码字搬砖

sqoop --split-by详解

假设有一张表test,sqoop命令中–split-by ‘id’,-m 10,会发生怎样奇特的事情。首先呢,sqoop会去查表的元数据等等,重点说一下s...

31340
来自专栏知晓程序

小程序如何关联公众号?| 小程序问答 #42

今天,知晓程序(微信号 zxcx0101)就接着上期,手把手教你如何将小程序与公众号关联起来。

27610
来自专栏游戏杂谈

蛋疼的flash player插件

后来,在cmd下运行chrome --allow-outdated-plugins,结果正常了,不提示了!!再双击桌面的chrome图标,也正常了!!!

21520
来自专栏小文博客

OCE – Online Code Editor

16810
来自专栏企鹅号快讯

左手用R右手Python系列——多进程/线程数据抓取与网页请求

这一篇涉及到如何在网页请求环节使用多进程任务处理功能,因为网页请求涉及到两个重要问题:一是多进程的并发操作会面临更大的反爬风险,所以面临更严峻的反爬风险,二是抓...

26260
来自专栏用户2442861的专栏

java系统高并发解决方案之图片服务器分离

http://blog.csdn.net/jimmy609/article/details/37909013

1K20
来自专栏杨建荣的学习笔记

swingbench压测Oracle小记(r12笔记第19天)

之前也分享过一篇关于swingbench测试Oracle的文章,图形工具和命令行的博弈-swingbench配置(r8笔记第63天),也算是一个起步了。 ...

40670

扫码关注云+社区

领取腾讯云代金券