基于强化学习算法的恐龙跳跳跳

文章来源：企鹅号 - 明柳梦少

在这个项目中，我们将使用强化学习（Reinforcement Learning）来玩Google的T-rex游戏。RL算法基于Deep Q-Learning算法[1]，并在TensorFlow框架中进行实现。

依赖环境

Python 3.5或更高版本

pillows4.3.0

scipy 0.19.1

tensorflow1.7.0或更高

可选：tensorflow tensorboard

安装

本项目已在MacOs，Debian，Ubuntu和基于Ubuntu的发行版这些系统上测试过。首先，我们先克隆GitHub存储库：

我们建议在安装所需的软件包之前创建一个virtualenv。有关如何操作，请参见virtualenv[2]或virtualenv-wrapper[3]。

至于依赖库，我们可以使用pip方式轻松安装。

入门

运行javascript T-rex游戏的Webserver

运行T-rex JavaScript游戏需要一个简单的网络服务器。最简单的方法是使用python的Simple HTTP Server模块。打开一个新终端并导到TF-Rex/game文件路径，然后运行以下命令

打开你本地主机的浏览器，访问127.0.0.1:8000，然后你就可以看到这个游戏了。此方法已针对Chrome和Mozilla Firefox浏览器分别进行了测试。

TF-Rex

记住几个点：

1、通过在终端执行命令：

，所有命令行的参数都可以恢复还原。

2、通过尝试使用预训练的Q-learner玩这个游戏，快速检查安装是否成功。

3、在终端执行命令：

，我们将还原保存在./trained-model文件下的预训练模型，并开始玩T-rex游戏。

4、重要提示：浏览器需要连接到python端。因此，当你执行完下一条命令时，请刷新浏览器

5、如果你想自己训练一个新模型，你可以如下操作

同样，浏览器需要刷新才能启动该过程。作为logdir参数的目录将保存TensorFlow中间变量的检查点和tensorboard信息。

6、在训练模型时，你可以打开另一个终端来启动tensorboard

你可以在主机浏览器http://127.0.0.1:6006/上看到 tensorboard。

参考

[1] 以深度强化学习演奏Atari

[2] Virtualenv

[3] virtualenv-wrapper

============================================

发表于: 2018-06-122018-06-12 12:00:03
原文链接：https://kuaibao.qq.com/s/20180612G0PTAF00?refer=cp_1026
腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号（企鹅号）传播渠道之一，根据《腾讯内容开放平台服务协议》转载发布内容。
如有侵权，请联系 cloudcommunity@tencent.com 删除。

扫码

添加站长进交流群

领取专属 10元无门槛券

私享最新 技术干货

基于强化学习算法的恐龙跳跳跳

相关快讯

扫码

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐