首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

【干货书】Python强化学习算法:学习、理解和开发智能算法以应对人工智能挑战

来源:专知本文为书籍介绍,建议阅读5分钟读完本书后,你将使用关键的强化学习算法来克服现实应用中的挑战,并成为强化学习研究社区的一员。 强化学习(RL)是人工智能的一个流行和有前途的分支,它涉及建立更智能的模型和智能体,这些模型和智能体可以根据不断变化的需求自动确定理想的行为。本书将帮助你掌握RL算法,并在构建自学习智能体时理解它们的实现。 从介绍强化学习环境中工作所需的工具、库和设置开始,本书涵盖了强化学习的构建模块,并深入研究了基于值的方法,如Q-learning和SARSA算法的应用。您将学习如何使用

03

【Copy攻城狮日志】强化学习7天打卡营学习笔记

↑开局一张图,故事全靠编。我常常会扪心自问,一个连本行工作都干不好的人,还有时间去捣鼓别的领域,去“学习”别的领域的新知识?然鹅,自诩为“Copy攻城狮”的我,膨胀到像 学一波AI,不求结果,为了兴趣愿意去尝试,哪怕到头来竹篮打水一场空。于是,机缘巧合通过齐老师了解到Baidu的AIStuio以及此次飞浆的实战入门课。国际惯例,免费的午餐实际上并非真正的面试,如同HuaweiCloud的AI训练营推广ModelArts,这次的课也是为了推广飞浆。当然,对于AI小白来说,这些 都是非常不错的工具,里面的学习资源也非常丰富,废话不多说,马上开启Copy之路!

03

Uber开源Atari,让个人计算机也可以快速进行深度神经进化研究

Uber近期发布了一篇文章,公开了五篇关于深度神经进化的论文,其中包括发现了遗传算法可以解决深层强化学习问题,而一些流行的方法也可替代遗传算法,如深度Q-learning和策略梯度。这项研究是Salimans等人在2017年进行的,另一种神经进化算法,即进化策略(ES)同样可以解决问题。Uber进一步阐述了以下问题:如何通过更多地探索更新智能体所带来的压力形式来改进ES;ES是如何与梯度下降联系起来的。这些研究花费巨大,通常需要720到3000个CPU,并分布在巨大,高性能的计算集群中,因此对于大多数研究人员、学生、公司和业余爱好者来说,深度神经进化研究似乎遥不可及。

04
领券