概念学习是一个主要的例子,它需要一种内部模型扩展过程(添加新的隐藏状态来解释新的观察结果)和模型缩减过程(将不同的状态合并为一个潜在原因,从而通过元学习降低模型复杂性)。...我们定义了代理的偏好,使得它更喜欢正确地报告特定类别的知识,而反对不正确的报告。这确保了它只报告鸟和鱼的一般类别,除非对更具体的类别有足够的把握。...在另外的 32 次模拟中,我们还证实,如果代理只具备翅膀和鳃之间的区别的知识(即,通过用平坦分布替换 A 矩阵中对应于从动物到大小和颜色的映射的行),它将在 100%的时间内正确地报告属类,但不会报告属类...通过状态空间扩展的概念获取
我们首先检查了我们的模型以两种不同的方式获取概念知识的能力。...至关重要的是,在学习过程中,代理人没有被告知哪个状态正在生成它的观察结果。这意味着它必须解决推理和学习问题。