首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

【学术】强化学习系列(上):关于强化学习,你需要知道的重要知识点

强化学习是一个非常有用的工具,可以在任何机器学习工具包中使用。为了能使你能够尽可能快地实现最新的模型,本系列的两篇文章是作为基础知识来设计的。这两篇文章中将分享强化学习中最重要的知识点。在文章的最后,你将了解所有的基本理论,以理解强化学习算法是如何工作的。首先我们看看本系列的上半部分内容。 监督学习 VS 评估学习 对于许多感兴趣的问题,监督学习的范例并没有给我们带来我们所需要的灵活性。监督学习与强化学习之间的主要区别在于,所获得的反馈是否具有评估性(evaluative)或启发性(instructive)

08
领券