首页
学习
活动
专区
工具
TVP
发布

磐创AI技术团队的专栏

定期分享机器学习深度学习相关优质原创文章
专栏作者
715
文章
981586
阅读量
123
订阅数
强化学习的基本迭代方法
本文着重于对基本的MDP进行理解(在此进行简要回顾),将其应用于基本的强化学习方法。我将重点介绍的方法是"价值迭代"和"策略迭代"。这两种方法是Q值迭代的基础,它直接导致Q-Learning。
磐创AI
2020-07-09
1.6K0
强化学习的线性代数
线性代数的基本原理如何支持深度强化学习?答案是解决了马尔可夫决策过程时的迭代更新。
磐创AI
2020-07-09
9280
学习强化学习之前要掌握的3种技能
现代强化学习几乎完全集中在深度强化学习上。深度强化学习中的“深”一词意味着在算法的核心方面使用神经网络。神经网络在学习过程中进行一些高维近似。话虽如此,该模型并不需要具有许多层和特征,这是一个普遍的误解,深层暗示了许多层。
磐创AI
2020-07-03
5910
Ray和RLlib用于快速并行强化学习
Ray不仅仅是一个用于多处理的库,Ray的真正力量来自于RLlib和Tune库,它们利用了强化学习的这种能力。它使你能够将训练扩展到大型分布式服务器,或者利用并行化特性来更有效地使用你自己的笔记本电脑进行训练。
磐创AI
2020-07-02
2.7K0
边做边思考,谷歌大脑提出并发RL算法,机械臂抓取速度提高一倍!
该研究在如下情况中研究强化学习:在受控系统随着时间演变的过程中同时对动作进行采样。换句话说,所研究的机器人必须在执行着上一个动作的同时考虑下一个动作。就如同人或动物一样,机器人必须同时思考及行动,在上一个动作完成之前决定下一个动作。
磐创AI
2020-05-26
3720
TensorFlow2.0实战强化专栏开篇
本公众号先后推出了由作者小猴锅倾力打造的Tensorflow2.0原创入门专栏以及上手实战专栏,均在发出后取得了不错的反响。
磐创AI
2020-03-04
6700
文末开奖 | 深度强化学习专栏(七):深度强化学习算法
【磐创AI导读】:本篇文章是深度强化学习专栏的第三篇,讲了第四节无模型的强化学习方法,希望对大家有所帮助。查看上篇关于本专栏的介绍:深度强化学习(DRL)专栏开篇。想要获取更多的机器学习、深度学习资源,欢迎大家点击上方蓝字关注我们的公众号:磐创AI。
磐创AI
2019-11-15
8400
人工智能免费公开课一网打尽!14个类别、230门课程,GitHub标星6000+
这原本是吴恩达在斯坦福大学开授的课程,课程视频在网络上受到了学习者的广泛好评,后来还推出了专门的网课。
磐创AI
2019-10-25
5070
一文带你实战强化学习(下) | DQN
【磐创AI导读】:本篇文章是深度强化学习专栏的第四篇,讲了第五节实战强化学习中Monte Carlo Policy Gradient 算法及Actor Critic 算法,希望对大家有所帮助。查看关于本专栏的介绍:深度强化学习(DRL)专栏开篇。想要获取更多的机器学习、深度学习资源,欢迎大家点击上方蓝字关注我们的公众号:磐创AI。
磐创AI
2019-10-23
1.1K0
深度强化学习专栏(三)
【磐创AI导读】:本篇文章是深度强化学习专栏的第三篇,讲了第四节无模型的强化学习方法,希望对大家有所帮助。查看上篇关于本专栏的介绍:深度强化学习(DRL)专栏开篇。
磐创AI
2019-09-17
6840
深度强化学习(DRL)专栏(二):有模型的强化学习
【磐创AI导读】:本篇文章是深度强化学习专栏的第二篇,讲了第三节有模型的强化学习,希望对大家有所帮助。查看上篇关于本专栏的介绍:深度强化学习(DRL)专栏开篇。想要获取更多的机器学习、深度学习资源,欢迎大家点击上方蓝字关注我们的公众号:磐创AI。
磐创AI
2019-09-09
2.2K0
深度强化学习(DRL)专栏(一)
【磐创AI导读】:本篇文章是深度强化学习专栏的第一篇,讲了引言和强化学习基础知识,希望对大家有所帮助。查看上篇关于本专栏的介绍:深度强化学习(DRL)专栏开篇。想要获取更多的机器学习、深度学习资源,欢迎大家点击上方蓝字关注我们的公众号:磐创AI。
磐创AI
2019-09-03
1.2K0
图像配准:从SIFT到深度学习
图像配准(Image Registration)是计算机视觉中的基本步骤。在本文中,我们首先介绍基于OpenCV的方法,然后介绍深度学习的方法。
磐创AI
2019-07-30
6.5K1
一文看懂NLP神经网络发展历史中最重要的8个里程碑!
导读:这篇文章中作者尝试将 15 年的自然语言处理技术发展史浓缩为 8 个高度相关的里程碑事件,不过它有些偏向于选择与当前比较流行的神经网络技术相关的方向。我们需要关注的是,本文中介绍的许多神经网络模型都建立在同时代的非神经网络技术之上。在文章的最后,作者强调了这些有影响力的技术成果,它们为以后的 NLP 方法发展奠定了基础。
磐创AI
2019-07-23
4050
近期 github 机器学习热门项目top5
【磐创AI导读】:Github是全球最大的开源代码社区,本文为大家总结了2108年11月最热门的机器学习项目top5。欢迎大家点击上方蓝字关注我们的公众号:磐创AI,获取更多的机器学习、深度学习资源。
磐创AI
2018-12-27
4910
近期 github 机器学习热门项目top5
【磐创AI导读】:GitHub是数据科学家希望从人群中脱颖而出的宝贵平台,拥有来自顶尖技术巨头(如Google、Facebook、IBM、NVIDIA等)的开放源码项目。本文为大家总结了近期最热门的机器学习项目top5。欢迎大家点击上方蓝字关注我们的公众号:磐创AI,获取更多的机器学习、深度学习资源。
磐创AI
2018-12-25
4640
没有更多了
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档