国家知识产权局信息显示,盐城工学院、盐城旷盈信息科技有限公司申请一项名为“一种基于多视图的文本分类模型的多阶段训练方法及系统”的专利,公开号CN120596670A,申请日期为2025年04月。
专利摘要显示,本发明提供一种基于多视图的文本分类模型的多阶段训练方法及系统,包括:对原始文本数据进行掩码处理并基于处理后的数据对预训练模型进行初步训练;基于全部文本数据及其对应的文本词频伪标签进行第二阶段中间训练;基于预设的比例的文本数据及其对应的文本主题视图伪标签进行第三阶段训练。本发明的基于多视图的文本分类模型的多阶段训练方法及系统,通过对文本数据进行多角度分析,提取包括文本词频视图和文本主题视图在内的多种视图特征,并基于这些特征生成伪标签。随后,对预训练模型进行多阶段的中间训练。在完成多阶段的中间训练后,进一步利用少量标注数据对模型进行微调,从而增强模型在目标领域的适应性。
声明:市场有风险,投资需谨慎。本文为AI基于第三方数据生成,仅供参考,不构成个人投资建议。
来源:市场资讯