腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
帮你学MatLab
专栏作者
举报
90
文章
106083
阅读量
46
订阅数
订阅专栏
申请加入专栏
全部文章(90)
matlab(29)
强化学习(9)
其他(8)
编程算法(7)
https(6)
java(5)
python(5)
游戏(5)
plot(5)
github(4)
神经网络(4)
开源(4)
网络安全(4)
agent(4)
bash(3)
git(3)
bash 指令(3)
数据加密服务(3)
axis(3)
function(3)
normalization(3)
state(3)
title(3)
数据库(2)
sql(2)
腾讯云开发者社区(2)
汽车(2)
action(2)
actor(2)
block(2)
figure(2)
global(2)
height(2)
rgb(2)
set(2)
size(2)
函数(2)
ios(1)
c++(1)
php(1)
r 语言(1)
jquery(1)
云数据库 SQL Server(1)
云数据库 Redis(1)
ide(1)
linux(1)
云数据库 MongoDB(1)
腾讯云测试服务(1)
mongodb(1)
人工智能(1)
图像处理(1)
网站(1)
serverless(1)
gui(1)
numpy(1)
asp(1)
gcc(1)
anaconda(1)
大数据(1)
机器人(1)
add(1)
cell(1)
io(1)
ioc(1)
line(1)
load(1)
map(1)
matrix(1)
mean(1)
na(1)
numeric(1)
ode(1)
return(1)
self(1)
sort(1)
sum(1)
table(1)
text(1)
tiff(1)
time(1)
unique(1)
viewer(1)
width(1)
读书笔记(1)
排序(1)
数据(1)
思维导图(1)
搜索文章
搜索
搜索
关闭
MATLAB强化学习 DQN 算法
神经网络
强化学习 DQN 算法将状态和动作当成神经网络的输入, 然后经过神经网络分析后得到动作的 Q 值, 这样不需要在表格中记录 Q 值, 而是直接使用神经网络生成 Q 值.也可以只输入状态值, 输出所有的动作值, 然后按照 Q learning 的原则, 直接选择拥有最大值的动作当做下一步要做的动作.
万木逢春
2019-11-18
4.2K
1
matlab倒立摆强化学习训练
神经网络
Actor(玩家):为了得到尽量高的reward,实现一个函数:输入state,输出action。用神经网络来近似这个函数。目标任务就是如何训练神经网络,让它的表现更好(得更高的reward)。这个网络被称为actor Critic(评委):为了训练actor,需要知道actor的表现到底怎么样,根据表现来决定对神经网络参数的调整。这就要用到强化学习中的“Q-value”、但Q-value也是一个未知的函数,所以也可以用神经网络来近似。这个网络被称为critic。
万木逢春
2019-11-10
1.4K
0
一个小目标——AI操作游戏
游戏
matlab
神经网络
DeepMind在13年发了一篇paper,叫做”Playing Atari with Deep Reinforcement Learning”,讲的是怎么教计算机玩atari游戏
万木逢春
2019-06-20
818
0
MATLAB智能算法30个案例分析(3-2)
matlab
神经网络
神经网路部分 function err=Bpfun(x,P,T,hiddennum,P_test,T_test) %% 训练&测试BP网络 %% 输入 % x:一个个体的初始权值和阈值 % P:训练样
万木逢春
2018-04-18
834
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档