nbest_size = {0,1}: 不执行采样。
nbest_size > 1: 从 nbest_size 结果中进行采样。...这是在使用掩码语言建模训练此模型时使用的标记。这是模型将尝试预测的标记。...0, 1]中选择:
如果perm_mask[k, i, j] = 0,则 i 在批次 k 中关注 j;
如果perm_mask[k, i, j] = 1,则 i 在批次 k 中不参与 j。...": input_ids, "token_type_ids": token_type_ids})
请注意,当使用子类化创建模型和层时,您无需担心任何这些,因为您可以像将输入传递给任何其他 Python...0, 1]中选择:
如果perm_mask[k, i, j] = 0,则 i 在批次 k 中关注 j;
如果perm_mask[k, i, j] = 1,则 i 在批次 k 中不参与 j。