首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >问答首页 >用预训练模型T5回答问题

用预训练模型T5回答问题
EN

Stack Overflow用户
提问于 2022-04-13 17:55:49
回答 1查看 531关注 0票数 0

我想使用预先训练过的T5模型doc/t5来执行在https://huggingface.co/datasets/boolq上回答问题的任务,知道我的输入是段落和问题,输出是布尔值,真假,这是问题的答案。

我见过一些人把模型调到这个特定的任务。但是,我想知道是否有办法用预先训练过的模型来获得一些输出,然后在调优后将它们与模型进行比较。

谢谢!

EN

回答 1

Stack Overflow用户

发布于 2022-04-13 21:48:45

T5模型是否也对BoolQ进行了培训,这会使测试/评估变得困难和可疑,因为后面的测试数据并不是模型中真正不可见的数据。你可以在曲面模型卡和谷歌的原纸中看到它。

我发现奇怪的是,给预先训练的T5基来自数据集不会产生预期的答案或答案格式。的问题。t5 for BoolQ有一个精心调整的版本,它提供了一个更可接受的答案。即使使用本文中的精确示例和格式,以SQuAD格式回答问题的预训练模型也存在同样的问题。

这让我认为,问题回答的微调与其他一些任务不同,这些任务实际上没有包含在模型的发布版本中,或者至少没有足够的效果让模型记住任务是如何工作的。在这种情况下,对其进行微调(再一次/更多)将是有意义的。

票数 0
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/71861922

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档