您好! 我正在设计一个演员模型可生成的动作空间。动作为一个(6,9)的二维0-1矩阵。每行的1的个数应在1--4个,每列的1的个数最多为1个。现在我想让神经网络的输出是满足这个条件的,一直没有想到合适的方法。感谢您的帮助!
相似问题