万木逢春

LV0
发表了文章

通过图像训练强化学习模型

在gym中运行atari环境的时候可以选择同一个游戏的内存方式或者图像方式,内存方式直接返回游戏的状态,图像方式返回当前游戏的画面

万木逢春
发表了文章

MATLAB强化学习训练simulink模型优化

simulink物理结构模型用的是前面文章matlab倒立摆环境建模当在solidworks绘制后导入的,去除子模块封装,添加驱动以及传感器接口,就像这个样子

万木逢春
发表了文章

MATLAB操作MongoDB数据库

自然语言处理中的分词结果,数字图像处理中的分割识别结果,它们通常有着不一样个数的单元,当我们需要逐个处理这些单元数据的时候如果全部导入MATLAB会占用大量内存...

万木逢春
发表了文章

MATLAB操作redis

redis是一个key-value存储系统。它支持存储的value类型更多,包括string(字符串)、list(链表)、set(集合)、zset(sorted...

万木逢春
发表了文章

实时获取simulink状态

我们想要在GUI界面内展示simulink模型的运行状态,可以通过给模型中特定模块绑定监听事件,当模块发生特定事件后调用我们绑定的函数,在函数当中获取模型中的其...

万木逢春
GUI编程算法
发表了文章

MATLAB强化学习训练simulink模型

simulink可以方便地建立物理域模型,这是一个简单的倒立摆,同样可以使用MATLAB的强化学习工具箱进行训练

万木逢春
发表了文章

MATLAB强化学习 PG 算法

采用 policy gradient 学习方法训练agent,并行训练的参数也需要调整

万木逢春
发表了文章

MATLAB强化学习 DQN 算法

强化学习 DQN 算法将状态和动作当成神经网络的输入, 然后经过神经网络分析后得到动作的 Q 值, 这样不需要在表格中记录 Q 值, 而是直接使用神经网络生成 ...

万木逢春
神经网络
发表了文章

matlab倒立摆强化学习训练

Actor(玩家):为了得到尽量高的reward,实现一个函数:输入state,输出action。用神经网络来近似这个函数。目标任务就是如何训练神经网络,让它的...

万木逢春
神经网络
发表了文章

matlab倒立摆环境建模

classdef CartPoleEnv < rl.env.MATLABEnvironment

万木逢春
订阅了专栏

腾讯云自媒体分享计划

3 文章3.1K 关注者
关注了用户

腾讯云自媒体分享计划

腾讯 · 产品运营 (已认证)

申请条件:至少有 20 篇或以上符合投稿要求可迁入腾讯云专栏的原创技术文章。

3 文章0 回答3.1K 关注者
发表了文章

matlab强化学习-复杂网格环境搭建与训练

先看这个向量式方法生成随机maze来训练Q—learning的agent、主要特点是地图大

万木逢春
发表了文章

MATLAB强化学习toolbox

新版本MATLAB提供了Reinforcement Learning Toolbox可以方便地建立二维基础网格环境、设置起点、目标、障碍,以及各种agent模型

万木逢春
发表了文章

重启电脑继续运行MATLAB程序

因为实验室断电问题,或者其他原因,程序运行会被打断。这里提供一个matlab可以在中断后,重启,利用之前已有的结果继续优化过程

万木逢春
发表了文章

在MATLAB中使用opencv

我们来说说第二类,需要做的事情是先编译opencv的源码、再编译matlab可用的mex文件夹,这两步的编译器必须是同一个,而最近几年的新版本matlab都推荐...

万木逢春
发表了文章

matlab增强学习之小球不落地

在利用之前FrozenLake环境训练当中那种面向对象方式管理程序时发现训练后期运行速度变慢、而且是肉眼可观察到的变慢,所以采用了matlab另一种程序文件管理...

万木逢春
MATLAB强化学习BashBash 指令
发表了文章

简单游戏环境搭建

function self = single_pong_env(weight,height,fresh_time)

万木逢春
发表了文章

matlab强化学习Sarsa与Sarsa(lambda)对比

适用于回合型环境,要等到回合结束, 才开始对本回合所经历的所有步都添加更新, 但是这所有的步都是和宝藏有关系的, 都是为了得到宝藏需要学习的步, 所以每一步在下...

万木逢春
发表了文章

matlab强化学习Q-Learning与Sarsa对比

观察下一步选取哪一个动作会带来最大的奖励, 但是在真正要做决定时, 却不一定会选取到那个带来最大奖励的动作, Q-learning 只是估计了一下接下来的动作值

万木逢春

个人简介

个人成就

扫码关注云+社区

领取腾讯云代金券