首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

CVPR 2021 | 用于文本识别的序列到序列对比学习

今天给大家介绍的是以色列科技大学Aviad Aberdam等人发表在CVPR2021上的一篇文章 ”Sequence-to-Sequence Contrastive Learning for Text Recognition”。作者在这篇文章中提出了一种用于视觉表示的序列到序列的对比学习框架 (SeqCLR)用于文本识别。考虑到序列到序列的结构,每个图像特征映射被分成不同的实例来计算对比损失。这个操作能够在单词级别从每张图像中提取几对正对和多个负的例子进行对比。为了让文本识别产生有效的视觉表示,作者进一步提出了新的增强启发式方法、不同的编码器架构和自定义投影头。在手写文本和场景文本数据集上的实验表明,当文本解码器训练学习表示时,作者的方法优于非序列对比方法。此外,半监督的SeqCLR相比监督训练显著提高了性能,作者的方法在标准手写文本重新编码上取得了最先进的结果。

03
领券