首页
学习
活动
专区
工具
TVP
发布

帮你学MatLab

专栏作者
90
文章
106861
阅读量
46
订阅数
MATLAB训练CartPole强化学习模型
这次用的环境是移动倒立摆CartPole环境,建立环境模型,主要是对reword进行定义
万木逢春
2022-01-19
1.1K2
DQN与PG多角度比较
首先是原理上的对比,强化学习研究的目标是训练出一个对应于具体任务的好模型,这两个训练策略的方法是不同的。DQN基于值的方法,简单说就是先学出个值函数 ,然后通过值函数确定策略。而PG基于策略的方法则是,直接通过一个目标函数去训练出一个策略
万木逢春
2020-08-06
1.3K0
MATLAB借助openai gym环境训练强化学习模型
虽然openai的gym强化学习环境底层绘图库是pyglet,不太方便自定义,但是已有的环境还是很好用的,有了前面的python环境准备之后,只需要安装gym就可以
万木逢春
2020-07-31
1.6K0
MATLAB强化学习工具箱整理
其中网格环境是可以从空网格自定义起点终点障碍物的,也可以添加全局外力,甚至跳跃障碍物的特殊功能
万木逢春
2020-07-24
3.6K0
MATLAB强化学习训练simulink模型优化
simulink物理结构模型用的是前面文章matlab倒立摆环境建模当在solidworks绘制后导入的,去除子模块封装,添加驱动以及传感器接口,就像这个样子
万木逢春
2020-04-14
2.4K7
matlab增强学习之小球不落地
在利用之前FrozenLake环境训练当中那种面向对象方式管理程序时发现训练后期运行速度变慢、而且是肉眼可观察到的变慢,所以采用了matlab另一种程序文件管理方式packages
万木逢春
2019-09-25
7370
matlab强化学习Q-Learning与Sarsa对比
观察下一步选取哪一个动作会带来最大的奖励, 但是在真正要做决定时, 却不一定会选取到那个带来最大奖励的动作, Q-learning 只是估计了一下接下来的动作值
万木逢春
2019-09-05
1.4K0
强化学习第-1步
function self = one_dimensional_env(len,fresh_time)
万木逢春
2019-07-10
4700
强化学习第0步
global N_STATES ACTIONS EPSILON ALPHA GAMMA MAX_EPISODES FRESH_TIME
万木逢春
2019-07-10
4770
没有更多了
社区活动
RAG七天入门训练营
鹅厂大牛手把手带你上手实战
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档