腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
算法channel
专栏作者
举报
853
文章
1026174
阅读量
136
订阅数
订阅专栏
申请加入专栏
全部文章(853)
python(292)
编程算法(290)
机器学习(132)
其他(97)
深度学习(71)
神经网络(68)
numpy(43)
人工智能(41)
数据分析(38)
数据结构(35)
https(34)
java(30)
网络安全(26)
大数据(20)
javascript(19)
github(19)
api(19)
html(18)
函数(18)
游戏(17)
强化学习(17)
线性回归(17)
数据(16)
http(15)
NLP 服务(14)
开源(14)
决策树(14)
二叉树(14)
网站(13)
tensorflow(12)
git(12)
存储(12)
缓存(12)
matlab(11)
pandas(11)
模型(11)
算法(11)
文件存储(10)
爬虫(10)
监督学习(10)
数据库(9)
图像处理(9)
spark(9)
sql(8)
容器(8)
微信(8)
pdf(8)
json(7)
云数据库 SQL Server(7)
打包(7)
面向对象编程(7)
ide(6)
分布式(6)
卷积神经网络(6)
正则表达式(6)
pytorch(6)
数据处理(6)
程序(6)
对象(6)
网络(6)
装饰器(6)
c++(5)
php(5)
go(5)
node.js(5)
linux(5)
ubuntu(5)
mapreduce(5)
csv(5)
map(5)
编程(5)
工具(5)
jquery(4)
容器镜像服务(4)
腾讯云测试服务(4)
serverless(4)
shell(4)
hadoop(4)
keras(4)
selenium(4)
机器人(4)
腾讯云开发者社区(4)
kafka(4)
geo(4)
path(4)
pip(4)
工作(4)
数学(4)
图表(4)
自动驾驶(3)
数据挖掘(3)
scala(3)
xml(3)
flask(3)
搜索引擎(3)
unix(3)
短视频(3)
命令行工具(3)
svg(3)
图像识别(3)
zookeeper(3)
anaconda(3)
ascii(3)
chatgpt(3)
dataframe(3)
gpt(3)
jupyter(3)
matplotlib(3)
pivot(3)
self(3)
table(3)
编码(3)
表格(3)
地图(3)
基础(3)
技巧(3)
脚本(3)
配置(3)
数组(3)
思维导图(3)
索引(3)
优化(3)
官方文档(2)
c 语言(2)
css(2)
android(2)
sqlite(2)
批量计算(2)
云直播(2)
yarn(2)
自动化(2)
hive(2)
gui(2)
tcp/ip(2)
windows(2)
数据可视化(2)
nat(2)
敏感数据处理(2)
unicode(2)
学习方法(2)
app(2)
cut(2)
data(2)
dt(2)
google(2)
graph(2)
heatmap(2)
image(2)
iterable(2)
kaggle(2)
key(2)
label(2)
legend(2)
min(2)
nan(2)
plot(2)
rank(2)
seaborn(2)
state(2)
sum(2)
time(2)
width(2)
xlsx(2)
变量(2)
布局(2)
程序员(2)
动画(2)
接口(2)
开发(2)
可视化(2)
框架(2)
入门(2)
视频(2)
原理(2)
源码(2)
原型(2)
终端(2)
人脸识别(1)
区块链(1)
ios(1)
mac os(1)
iphone(1)
xcode(1)
c#(1)
bash(1)
.net(1)
bootstrap(1)
opengl(1)
qt(1)
oracle(1)
django(1)
spring(1)
日志服务(1)
消息队列 CMQ 版(1)
机器翻译(1)
电商(1)
金融(1)
医疗(1)
在线旅游(1)
企业(1)
webpack(1)
html5(1)
jdk(1)
ssh(1)
opencv(1)
npm(1)
单元测试(1)
scrapy(1)
markdown(1)
scikit-learn(1)
无监督学习(1)
迁移学习(1)
小程序(1)
canvas(1)
processing(1)
特征工程(1)
jupyter notebook(1)
utf8(1)
es(1)
flink(1)
验证码(1)
智能推荐平台(1)
add(1)
agent(1)
alpha(1)
apple(1)
apply(1)
argparse(1)
axis(1)
break(1)
bug(1)
cat(1)
center(1)
character(1)
code(1)
compare(1)
contains(1)
copy(1)
crosstab(1)
curve(1)
echarts(1)
error(1)
excel(1)
factory(1)
fibonacci(1)
gan(1)
glob(1)
greedy(1)
handle(1)
iconfont(1)
jieba(1)
line(1)
list(1)
matrix(1)
max(1)
maze(1)
mean(1)
nonetype(1)
object(1)
png(1)
policy(1)
precision(1)
pyautogui(1)
pygame(1)
pyinstaller(1)
random(1)
regression(1)
series(1)
socket(1)
split(1)
streamlit(1)
subplot(1)
timeline(1)
timeout(1)
title(1)
tooltip(1)
ui(1)
web(1)
word2vec(1)
zip(1)
笔记(1)
遍历(1)
部署(1)
测试(1)
插件(1)
代理(1)
单例模式(1)
递归(1)
动态规划(1)
翻译(1)
工程师(1)
工具软件(1)
公众号(1)
管理(1)
后台(1)
互联网(1)
继承(1)
集合(1)
计算机(1)
架构(1)
加密(1)
链表(1)
连接(1)
乱码(1)
命令行(1)
前端(1)
日志(1)
软件工程(1)
设计(1)
实践(1)
数据类型(1)
统计(1)
推送(1)
系统(1)
性能(1)
压缩(1)
异常处理(1)
语法(1)
重构(1)
字符串(1)
自然语言处理(1)
文本分析(1)
搜索文章
搜索
搜索
关闭
强化学习第十三篇:使用深度学习解决迷宫问题,完整步骤和代码
深度学习
强化学习
self
state
网络
前面强化学习推送到第十二篇,迷宫问题已使用Q-learning解决过,今天使用另一种方法:深度Q网络,简称DQN网络解决。
double
2024-04-11
218
0
第10篇:强化学习Q-learning求解迷宫问题 代码实现
强化学习
state
地图
集合
算法
迭代完成,得到最佳路线,就如上图所示环境,最佳路线如下所示。大概在第50-80迭代步便可搜索到:
double
2023-08-08
358
0
第十二篇:强化学习SARSA算法
机器学习
强化学习
动态规划
函数
算法
SARSA(「State-Action-Reward-State-Action」)算法是一种经典的强化学习算法,用于解决马尔可夫决策过程(MDP)问题。该算法于1994年由美国计算机科学家Rummery和Niranjan提出。
double
2023-08-08
488
0
Q-learning算法 探索与利用平衡问题
强化学习
greedy
框架
算法
性能
Q-learning算法中,探索与利用是一个重要的平衡性问题。怎么在算法中平衡,今天第十一篇讨论:Q-learning算法探索与利用平衡问题
double
2023-08-08
168
0
第九篇:强化学习Q-learning算法 通俗介绍
存储
强化学习
表格
地图
算法
前面我们介绍强化学习基本概念,马尔科夫决策过程,策略迭代和值迭代,这些组成强化学习的基础。
double
2023-08-08
263
0
第八篇:强化学习值迭代及代码实现
强化学习
maze
地图
函数
算法
值迭代是强化学习另一种求解方法,用于找到马尔可夫决策过程(MDP)中的最优值函数。
double
2023-08-08
322
0
第七篇:强化学习策略迭代 代码实现
强化学习
policy
函数
数组
算法
定义迷宫的奖励矩阵,它是二维数组,维度含义:[num_states][num_actions]
double
2023-08-08
212
0
第六篇:强化学习策略迭代 通俗解释
游戏
强化学习
函数
数组
算法
策略迭代是马尔可夫决策过程(MDP)中的一种求解方法,当然也是强化学习常用求解方法。
double
2023-08-08
197
0
第五篇:强化学习基础之马尔科夫决策过程
游戏
强化学习
函数
基础
索引
迷宫可以表示为一个二维网格,每个格子可以是墙壁(不可通过)或空地(可通过)。智能体可以采取四个动作:向上、向下、向左和向右移动。目标是找到宝藏,同时避免碰到墙壁。
double
2023-08-08
246
0
强化学习的应用领域和案例
自动驾驶
医疗
游戏
强化学习
机器人
AlphaGo在对阵李世石的第二局中做出的传奇落子动作。这手落子震惊了许多职业棋手。
double
2023-08-08
277
0
第三篇:强化学习发展历史
自动驾驶
神经网络
游戏
强化学习
算法
强化学习作为一门研究领域,经历了多年的发展和演进。以下是强化学习的主要发展历史里程碑:
double
2023-08-08
513
0
第二篇:强化学习中的7个基础概念
游戏
强化学习
函数
基础
网络
在强化学习中,智能体需要在不断尝试和错误的过程中学习,通过观察环境的反馈(奖励或惩罚)来调整自己的行为,从而逐步改进策略。
double
2023-08-08
173
0
第一篇:强化学习基本原理通俗介绍
机器学习
强化学习
agent
强化学习是一种机器学习方法,旨在让智能体(agent)通过与环境的交互学习如何做出最优的行动选择以获得最大的累积奖励。
double
2023-08-08
123
0
我将开始更新 强化学习
强化学习
函数
模型
算法
优化
很久没有更新文章,从现在开始我将逐步恢复更新。在接下来的日子,我将系统更新强化学习文章,在期间,也会插播一些读博做科研的一些日常总结。
double
2023-08-08
174
0
一文入门 深度强化学习
编程算法
强化学习
机器学习
监督学习
自动驾驶
深度强化学习是人工智能最有趣的分支之一。它是人工智能社区许多显着成就的基石,它在棋盘、视频游戏、自动驾驶、机器人硬件设计等领域击败了人类冠军。
double
2022-01-26
959
0
强化学习(Reinforcement Learning)
强化学习
强化学习(Reinforcement Learning)是机器学习领域的三大分支之一,另外两种是我们熟知的监督学习,和非监督学习方法。
double
2020-02-21
711
0
如何抉择是否要做机器学习?如何入门机器学习?
机器学习
go
神经网络
强化学习
编程算法
今天又有公众号读者问我一些关于职业选择、入门AI的问题,想想它们同样曾经困扰着我,相信现在也还困扰着一些人,未来可能还会有人面临这样的问题。我深知你们心里很焦急,可能也有点无助,你们的心情我现在完全可以体会得到。
double
2018-09-30
521
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档