首页
学习
活动
专区
工具
TVP
发布

帮你学MatLab

专栏作者
90
文章
106083
阅读量
46
订阅数
MATLAB强化学习 DQN 算法
强化学习 DQN 算法将状态和动作当成神经网络的输入, 然后经过神经网络分析后得到动作的 Q 值, 这样不需要在表格中记录 Q 值, 而是直接使用神经网络生成 Q 值.也可以只输入状态值, 输出所有的动作值, 然后按照 Q learning 的原则, 直接选择拥有最大值的动作当做下一步要做的动作.
万木逢春
2019-11-18
4.2K1
matlab倒立摆强化学习训练
Actor(玩家):为了得到尽量高的reward,实现一个函数:输入state,输出action。用神经网络来近似这个函数。目标任务就是如何训练神经网络,让它的表现更好(得更高的reward)。这个网络被称为actor Critic(评委):为了训练actor,需要知道actor的表现到底怎么样,根据表现来决定对神经网络参数的调整。这就要用到强化学习中的“Q-value”、但Q-value也是一个未知的函数,所以也可以用神经网络来近似。这个网络被称为critic。
万木逢春
2019-11-10
1.4K0
一个小目标——AI操作游戏
DeepMind在13年发了一篇paper,叫做”Playing Atari with Deep Reinforcement Learning”,讲的是怎么教计算机玩atari游戏
万木逢春
2019-06-20
8180
MATLAB智能算法30个案例分析(3-2)
神经网路部分 function err=Bpfun(x,P,T,hiddennum,P_test,T_test) %% 训练&测试BP网络 %% 输入 % x:一个个体的初始权值和阈值 % P:训练样
万木逢春
2018-04-18
8340
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档