首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Gym 的 Frozen Lake 环境介绍

Gym 的 Frozen Lake 环境介绍

作者头像
杨熹
发布2020-03-20 11:25:07
2.1K0
发布2020-03-20 11:25:07
举报
文章被收录于专栏:杨熹的专栏杨熹的专栏

Frozen Lake 是指在一块冰面上有四种state:

S: initial stat 起点

F: frozen lake 冰湖

H: hole 窟窿

G: the goal 目的地

agent 要学会从起点走到目的地,并且不要掉进窟窿。

上一篇文章有介绍gym里面env的基本用法,下面几行可以打印出一个当前环境的可视化:

import gym # loading the Gym library
env = gym.make("FrozenLake-v0")
env.reset()                    
env.render()

如果想看这个游戏里面有多少state和action可以用下面两行,就上面图例而言,state 有0-15共16个,action有4个:

print("Action space: ", env.action_space)
print("Observation space: ", env.observation_space)

在不采用任何算法时,env 可以通过 sample() 方法在每个state上随机选择 action。

将选择的 action 输入给 env.step,同样可以得到 new_state, reward, done, info 这四个返回值。

每次使用 env.render() 都能将当前新的环境布局展示出来。

MAX_ITERATIONS = 10
for i in range(MAX_ITERATIONS):
    random_action = env.action_space.sample()
    new_state, reward, done, info = env.step(
       random_action)
    env.render()
    if done:
        break

学习资料:

https://www.google.com/amp/s/reinforcementlearning4.fun/2019/06/16/gym-tutorial-frozen-lake/amp/

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档