深度学习库非常适合促进复杂可微函数的实现。这些函数通常具有 f(x) → y 之类的形状,其中 x 是一组输入张量,y 是通过对这些输入执行多次计算而产生的输出张量。为了实现一个新的 f 函数并创建一个新的原型,需要通过组合运算符组装各种块(或模块)。尽管过程简单,但这种方法无法处理顺序决策方法的实现。经典平台非常适合以有效的方式管理信息的获取、处理和转换。
当谈到强化学习 (RL) 时,所有这些实现都变得至关重要。经典的深度学习框架不足以捕捉代理与其环境的交互。尽管如此,仍然可以编写不能很好地集成到这些平台中的额外代码。已经考虑对这些任务使用多个强化学习 (RL) 框架,但它们仍然有两个缺点:
作为上述两个问题的解决方案,Facebook 研究人员引入了“SaLinA”。SaLina 致力于实现顺序决策过程,包括与强化学习相关、自然和简单的从业者,对如何实现神经网络有基本的了解。SaLina 建议通过使用顺序处理信息的简单“代理”来解决任何顺序决策问题。目标受众不仅是 RL 研究人员或计算机视觉研究人员,而且是 NLP 专家,正在寻找一种自然的方式在模型中对对话进行建模,使它们比以前的方法更直观、更容易理解。
SaLinA 是 PyTorch 的扩展。它有一个易于理解和维护的核心代码,总共只有一百行。
SaLina 的主要优势:
论文:
https://arxiv.org/pdf/2110.07910.pdf
Github:
https://github.com/facebookresearch/salina