基于强化学习算法的恐龙跳跳跳

  在这个项目中,我们将使用强化学习(Reinforcement Learning)来玩Google的T-rex游戏。RL算法基于Deep Q-Learning算法[1],并在TensorFlow框架中进行实现。

依赖环境

Python 3.5或更高版本

pillows4.3.0

scipy 0.19.1

tensorflow1.7.0或更高

可选:tensorflow tensorboard

安装

  本项目已在MacOs,Debian,Ubuntu和基于Ubuntu的发行版这些系统上测试过。首先,我们先克隆GitHub存储库:

  我们建议在安装所需的软件包之前创建一个virtualenv。有关如何操作,请参见virtualenv[2]或virtualenv-wrapper[3]。

至于依赖库,我们可以使用pip方式轻松安装。

入门

运行javascript T-rex游戏的Webserver

  运行T-rex JavaScript游戏需要一个简单的网络服务器。最简单的方法是使用python的Simple HTTP Server模块。打开一个新终端并导到TF-Rex/game文件路径,然后运行以下命令

  打开你本地主机的浏览器,访问127.0.0.1:8000,然后你就可以看到这个游戏了。此方法已针对Chrome和Mozilla Firefox浏览器分别进行了测试。

TF-Rex

记住几个点:

1、通过在终端执行命令:

,所有命令行的参数都可以恢复还原。

2、通过尝试使用预训练的Q-learner玩这个游戏,快速检查安装是否成功。

3、在终端执行命令:

,我们将还原保存在./trained-model文件下的预训练模型,并开始玩T-rex游戏。

4、重要提示:浏览器需要连接到python端。因此,当你执行完下一条命令时,请刷新浏览器

5、如果你想自己训练一个新模型,你可以如下操作

  同样,浏览器需要刷新才能启动该过程。作为logdir参数的目录将保存TensorFlow中间变量的检查点和tensorboard信息。

6、在训练模型时,你可以打开另一个终端来启动tensorboard

你可以在主机浏览器http://127.0.0.1:6006/上看到 tensorboard。

参考

[1] 以深度强化学习演奏Atari

[2] Virtualenv

[3] virtualenv-wrapper

============================================

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20180612G0PTAF00?refer=cp_1026
  • 腾讯「腾讯云开发者社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 cloudcommunity@tencent.com 删除。

扫码关注腾讯云开发者

领取腾讯云代金券