首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

开发 | OpenAI提出层级强化学习,给长序列动作学习带来新的曙光

AI科技评论按:强化学习是学到一个策略解决智能体与环境间互动问题的重要学习范式。不过以往的强化学习过程都常常很低效,在复杂环境中往往难以收敛。这一方面由于简单的策略难以完善、细致地描述各种不同环境状态下的不同行为,另一方面也有由于可能的行为的组合太多所以要探索的空间太大了。 OpenAI的研究人员们这次就开发了一个层次化的强化学习算法,它可以学习到高阶的行动,用来解决一系列不同的任务,同时也可以快速学会解决总共需要上千个步骤的任务。当这个算法用来解决导航问题时,它能够为不同方向的走或者爬行学到一系列高级别的

05

OpenAI 提出层级强化学习,给长序列动作学习带来新的曙光

强化学习是学到一个策略解决智能体与环境间互动问题的重要学习范式。不过以往的强化学习过程都常常很低效,在复杂环境中往往难以收敛。这一方面由于简单的策略难以完善、细致地描述各种不同环境状态下的不同行为,另一方面也有由于可能的行为的组合太多所以要探索的空间太大了。 OpenAI 的研究人员们这次就开发了一个层次化的强化学习算法,它可以学习到高阶的行动,用来解决一系列不同的任务,同时也可以快速学会解决总共需要上千个步骤的任务。当这个算法用来解决导航问题时,它能够为不同方向的走或者爬行学到一系列高级别的动作,这也让智

011

Kylin快速入门系列(3) | Cube构建原理

我们知道,一个N维的Cube,是由1个N维子立方体、N个(N-1)维子立方体、N*(N-1)/2个(N-2)维子立方体、…、N个1维子立方体和1个0维子立方体构成,总共有2^N个子立方体组成,在逐层算法中,按维度数逐层减少来计算,每个层级的计算(除了第一层,它是从原始数据聚合而来),是基于它上一层级的结果来计算的。比如,[Group by A, B]的结果,可以基于[Group by A, B, C]的结果,通过去掉C后聚合得来的;这样可以减少重复计算;当 0维度Cuboid计算出来的时候,整个Cube的计算也就完成了。 每一轮的计算都是一个MapReduce任务,且串行执行;一个N维的Cube,至少需要N次MapReduce Job。   过程如下:

04

【Cancer Cell】生物分子凝聚体与肿瘤(完整版)

癌变的特征是多种细胞过程的失调,这些过程一直是详细的遗传学、生物化学和结构学研究的主题,但直到最近,才有证据显示许多这些过程发生在生物分子凝结体的背景下。凝结体是无膜的团体,通常由液液相分离形成,将具有相关功能的蛋白质和RNA分子隔离开来。来自凝结体研究的新见解预示着我们对癌症细胞失调机制的理解将发生深刻的变化。在这里,我们总结生物分子凝结体的关键特征,指出它们已经被暗示(或很可能被暗示)在致癌发生中的作用,描述癌症治疗药物的药动学可能会受到凝结体的极大影响,并讨论一些必须解决的问题,以进一步提高我们对癌症的理解和治疗。

02
领券