我想使用预先训练过的T5模型doc/t5来执行在https://huggingface.co/datasets/boolq上回答问题的任务,知道我的输入是段落和问题,输出是布尔值,真假,这是问题的答案。
我见过一些人把模型调到这个特定的任务。但是,我想知道是否有办法用预先训练过的模型来获得一些输出,然后在调优后将它们与模型进行比较。
谢谢!
发布于 2022-04-13 21:48:45
T5模型是否也对BoolQ进行了培训,这会使测试/评估变得困难和可疑,因为后面的测试数据并不是模型中真正不可见的数据。你可以在曲面模型卡和谷歌的原纸中看到它。
我发现奇怪的是,给预先训练的T5基来自数据集不会产生预期的答案或答案格式。的问题。t5 for BoolQ有一个精心调整的版本,它提供了一个更可接受的答案。即使使用本文中的精确示例和格式,以SQuAD格式回答问题的预训练模型也存在同样的问题。
这让我认为,问题回答的微调与其他一些任务不同,这些任务实际上没有包含在模型的发布版本中,或者至少没有足够的效果让模型记住任务是如何工作的。在这种情况下,对其进行微调(再一次/更多)将是有意义的。
https://stackoverflow.com/questions/71861922
复制相似问题