首页标签强化学习

#强化学习

强化学习是机器学习中的一个领域,强调如何基于环境而行动,以取得最大化的预期利益。

AI调参新纪元,腾讯数据库论文被SIGMOD收录

腾讯云数据库 TencentDB

腾讯云 · 产品团队 (已认证)

—   点击▲关注 腾讯云数据库 — ? 腾讯数据库与华中科技大学合作发布了最新研究论文 《An End-to-End Automatic Cloud ...

5940

关于增强学习你应该了解的五件事儿

用户3578099

强化学习(Reinforcement Learning)是当前最热门的研究课题之一,它在AlphaGo中大放光彩,同时也变得越来越受科研人员的喜爱。本文主要介绍...

6420

机器学习入门系列(1)--机器学习概览

材ccc

目前强化学习的应用还不算非常广,特别是结合了深度学习的强化学习,主要是应用在机器人方面,当然最著名的一个应用就是 DeepMind 的 AlphaGo 了,它是...

4930

The introduction of distributed reinforcement learning framework

用户1908973

7420

GitHub万星资源:强化学习算法实现,教程代码样样全,还有详细学习规划

Datawhale

自从有了强化学习(RL),AI上能星际争霸,下能雅达利称王,让内行人沉醉,让外行人惊奇。

2820

GitHub万星资源:强化学习算法实现,教程代码样样全,还有详细学习规划

代码医生工作室

自从有了强化学习(RL),AI上能星际争霸,下能雅达利称王,让内行人沉醉,让外行人惊奇。

6720

大咖浅谈 | 从头开始做一个机器手臂2:写静态环境

腾讯云AI中心

腾讯云 · 产品经理 (已认证)

上次我们已经搭建好了三个主要部分, 包括 main.py, rl.py, env.py. 强化学习最重要的部分之一就是怎样定义你的环境. 做出来一个可视化的模拟...

12630

这个一瘸一拐的机器人是用树枝搭的,它自己学会了走路

算法工程师之路

这些树枝机器人首先借助深度强化学习在模拟环境中学会行走。研究者采取的步骤是:首先从野外捡拾一些树枝,对这些树枝称重并进行 3D 扫描,然后模拟整个机器人,最后对...

7630

一份帮助你更好地理解深度学习的资源清单

用户3578099

人工智能和深度学习太火了,火得一塌糊涂,有很多人想从事这个行业。网络上也有很多教程可供大家开始深度学习。如果你完全是一个小白,那么你可以在入行...

5910

1万+字原创读书笔记,机器学习的知识点全在这篇文章里了

AI科技大本营

【导读】作者用超过1.2万字的篇幅,总结了自己学习机器学习过程中遇到知识点。“入门后,才知道机器学习的魅力与可怕。”希望正在阅读本文的你,也能在机器学习上学有所...

6020

滴滴KDD 2019 论文详解:基于深度价值网络的多司机智能派单模型

AI科技评论

通过系统的离线模拟实验以及在滴滴平台的在线AB实验证明,这种基于深度强化学习的派单算法相比现有最好的方法能进一步显著提升平台各项效率及用户体验。

10020

滴滴KDD 2019 论文详解:基于深度学习自动生成客服对话

AI科技评论

今年,滴滴共有三篇Oral论文入选KDD2019,研究内容涵盖基于深度学习方法自动化地生成工单摘要、基于深度强化学习与半马尔科夫决策过程进行智能派单及模仿学习和...

5310

强化学习读书笔记(3)| 有限马尔科夫决策过程(Finite Markov Decision Processes)

用户1621951

本章我们介绍有限马尔科夫决策过程(Finite MDPs),这个问题和赌博机一样涉及到评估的反馈,但这里还多了一个方面——在不同的情况做出不同的选择。MDPs是...

4010

李宏毅机器学习完整笔记发布,AI界「最热视频博主」中文课程笔记全开源

小小詹同学

内容在整体框架上与李宏毅老师的机器学习课程保持一致,主要由监督学习、半监督学习、迁移学习、无监督学习、监督学习中的结构化学习以及强化学习构成。建议学习过程中将李...

6320

AI和大数据如何落地智能城市?京东城市这6篇论文必读 | KDD 2019

AI科技大本营

因此我们提出了一个基于强化学习的优化模型,来实现快递员的动态调度管理,从而达到只利用一部分现有快递员来高效完成每天的大量送取件任务的目的。

6220

《李宏毅机器学习完整笔记》发布,Datawhale开源项目LeeML-Notes

AI算法与图像处理

内容在整体框架上与李宏毅老师的机器学习课程保持一致,主要由监督学习、半监督学习、迁移学习、无监督学习、监督学习中的结构化学习以及强化学习构成。建议学习过程中将李...

9440

强化学习算法教程+实战+详细学习规划,GitHub 万星项目!

Amusi

自从有了强化学习(RL),AI上能星际争霸,下能雅达利称王,让内行人沉醉,让外行人惊奇。

7530

入门机器学习,照这个课程清单按顺序学就对了

Amusi

Chip Huyen 是一位来自越南的作家和计算机科学家,现居于美国硅谷,就职于英伟达人工智能应用团队。

9230

KDD CUP 2019 实录:野心尽露的数据挖掘「奥林匹克」

AI研习社

此外,她也以分享了组委会最终决定设立三个赛道的原因。如下图所示,排在第一位的原因,是提案数的暴增,由此可见 KDD CUP 对于业内企业的吸引力。其中强化学习赛...

5820

《李宏毅机器学习完整笔记》发布,Datawhale开源项目LeeML-Notes

昱良

百度 · 研发工程师 (已认证)

内容在整体框架上与李宏毅老师的机器学习课程保持一致,主要由监督学习、半监督学习、迁移学习、无监督学习、监督学习中的结构化学习以及强化学习构成。建议学习过程中将李...

8320

扫码关注云+社区

领取腾讯云代金券