腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
首页
学习
活动
专区
工具
TVP
最新优惠活动
返回腾讯云官网
人工智能
专栏作者
举报
486
文章
776857
阅读量
225
订阅数
订阅专栏
申请加入专栏
全部文章(486)
人工智能(251)
机器学习(219)
深度学习(140)
神经网络(115)
编程算法(43)
tensorflow(42)
python(33)
其他(28)
大数据(27)
图像识别(24)
图像处理(22)
卷积神经网络(17)
决策树(14)
数据处理(14)
线性回归(10)
机器人(10)
keras(9)
无人驾驶(8)
强化学习(8)
人脸识别(7)
c++(6)
安全(6)
数据库(5)
spark(5)
数据挖掘(4)
容器镜像服务(4)
游戏(4)
网络安全(4)
监督学习(4)
scikit-learn(4)
NLP 服务(3)
android(3)
github(3)
api(3)
apache(3)
医疗(3)
自动化(3)
https(3)
自动驾驶(2)
ios(2)
java(2)
javascript(2)
r 语言(2)
django(2)
http(2)
容器(2)
开源(2)
分布式(2)
运维(2)
numpy(2)
opencv(2)
php(1)
c#(1)
.net(1)
asp.net(1)
云数据库 Redis(1)
access(1)
linux(1)
nginx(1)
金融(1)
云+未来(1)
互联网金融(1)
爬虫(1)
hadoop(1)
wordpress(1)
unity(1)
pytorch(1)
kernel(1)
无监督学习(1)
迁移学习(1)
微信(1)
数据可视化(1)
数据结构(1)
架构设计(1)
微服务(1)
智能客服机器人(1)
搜索文章
搜索
搜索
关闭
什么时候强化学习未必好用?
强化学习
深度学习
作者 Jason Xie 编译 Erica Yi 编辑 Emily 强化学习(reinforcement learning)描述的是个体(agent)必须在环境(environment)中采取行动(action),以最大化设定的奖励(reward)函数的学习问题的集合。 不同于监督式深度学习,强化学习并不会出现大量明确标记好的输入 /输出对数据。大部分的强化学习都在网上进行,也就是说当个体积极地与它的环境进行多次迭代互动时,它最终开始学习采取怎样的行为会使自身奖励最大化的方案(policy)。
企鹅号小编
2018-02-26
1.1K
0
机器学习的基本概念
机器学习
监督学习
强化学习
我发现,查阅和掌握机器学习基本概念的最佳方法是,回顾机器学习教科书的介绍章节,并观看典型的在线课程视频。
花落花飞去
2018-02-09
1.9K
0
机器学习算法:选择您问题的答案
机器学习
编程算法
监督学习
强化学习
当我开始涉足数据科学时,我经常面临为如何我的问题选择最合适的算法的问题。如果你像我一样,当你看到一些关于机器学习算法的文章时,你会看到许多详细的描述。但是,即使看了这么多的算法文章,你依然不懂得要如何选择合适的算法。
花落花飞去
2018-02-02
1K
0
长时间序贯任务结构的演示学习方法及其在手术机器人中的应用
深度学习
强化学习
人工智能
本文总结了最近三篇论文的结果,这些论文提出了一些可以将更长的任务分解成更短子任务的学习算法。
花落花飞去
2018-02-01
1.5K
1
机器学习之——强化学习中的Bandit算法
机器学习
强化学习
本文介绍了强化学习中的Bandit算法,包括其基本概念、工作原理以及ε-贪心策略和softmax方法等。强化学习在人工智能领域具有广泛的应用,而Bandit算法是其基础模型之一。通过理解Bandit算法,我们可以更好地掌握强化学习的关键概念,并应用于实际问题的求解。
企鹅号小编
2018-01-08
2K
0
关注专栏作者,随时接收最新技术干货
花落花飞去
腾讯社区运营
关注
全球资讯翻译官
腾讯总部云加社区运营
关注
Techeek
腾讯产品运营
关注
QiqiHe
腾讯产品运营
关注
DeepMind推出控制套件:为强化学习智能体提供性能基准
人工智能
机器学习
强化学习
本文介绍了一种用于深度强化学习的控制套件,该套件包括多个任务,旨在评估算法在各种任务中的性能。该控制套件使用Mujoco物理引擎来模拟环境,并提供了多种学习算法和模型,包括DQN、DDPG、DeepMimic和A3C。作者提供了基准测试的详细结果,并提供了对代码库的访问,以便其他人可以复制并扩展其功能。
企鹅号小编
2018-01-08
635
0
让你的火柴人动起来!DeepMind发布强化学习环境dm
数据处理
机器学习
强化学习
来源:DeepMind 编译:Bot 编者按:今天,DeepMind发表了一篇名为DeepMind Control Suite的论文,并在GitHub上发布了控制套件dm_control——一套由Mu
企鹅号小编
2018-01-04
2K
0
随机计算图:连续案例
深度学习
神经网络
强化学习
本译文自Artem sobolev 在http://artem.sobolev.name 发表的Stochastic Computation Graphs: Continuous Case。文中版权、
花落花飞去
2017-12-19
1.6K
0
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
立即发文
Python精品学习库
代码在线跑,知识轻松学
立即查看
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
立即体验
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
立即查看
领券
问题归档
专栏文章
快讯文章归档
关键词归档
开发者手册归档
开发者手册 Section 归档