我目前正在研究一个NLP模型,它比较两个评论,并确定哪一个会更受欢迎。我已经提出了一个架构-它将基于GPT-2。但是现在我很难理解它的输出的一般格式。我检查了GPT-2的这 PyTorch实现,下面是我所理解的:
到目前为止我不明白的是:
presents变量的作用是什么?我看了里面,这只是张量的列表,但我不知道它们是什么。拜托,你能帮我理解一下吗?我很感谢你的帮助。提前谢谢你!
发布于 2023-03-17 15:41:23
presents是模型的隐藏状态。此返回值在推理期间使用,以避免在每个推断步骤中重新计算前面步骤的隐藏状态(请参阅sample.py)。set_embedding_weights是GPT2LMHead将完全连通矩阵设为与嵌入矩阵相等的一种方法。这样,您可以为嵌入矩阵和logit投影矩阵重用相同的参数。这是对模型进行正则化的一种常见方法(即避免过度拟合,减少参数总数)。我相信这是引入这种方法的一项研究。https://datascience.stackexchange.com/questions/120289
复制相似问题