首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

全方位支持任务数据集模型,Salesforce开源一站式视觉语言学习框架LAVIS

机器之心专栏 作者:HJZ Salesforce 亚洲研究院推出了一站式视觉语言开源框架 LAVIS。 视觉语言模型在内容推荐、电子商务里有广泛应用,例如图像描述生成、文本图像检索以及多模态内容分类。依托于海量互联网数据,多模型模型近期得到长足发展,其性能在下游任务上得到了广泛的验证。 尽管如此,现阶段的视觉语言方向的发展也存在其局限性。例如,由于语言视觉任务的多样性和复杂性,特别是对于初学者或者其他领域的工程研究人员,训练和评估现有视觉语言模型并不容易, 其较陡的学习曲线让很多新接触视觉语言方向的人望而却

01

AAAI|MetaDelta:一种少样本图像分类的元学习系统AAAI|MetaDelta:一种少样本图像分类的元学习系统

今天给大家介绍清华大学YudongChen等人发表在AAAI上的一篇文章 “MetaDelta:AMeta-LearningSystemforFew-shotImageClassifification” 。现有的元学习算法很少考虑未知数据集的时间和资源效率或泛化能力,这限制了它们在实际场景中的适用性。在这篇文章中,作者提出了一种新的实用的元学习系统MetaDelta,用于小镜头图像分类。MetaDelta由两个核心组件组成:(1)由中央控制器监督的多个meta-learners以确保效率,(2)一个元集成模块负责集成推理和更好的泛化。MetaDelta的每个meta-learner都由一个经过批量训练的预训练编码器和用于预测的无参数解码器组成。

05

Frustratingly Simple Few-Shot Object Detection

从几个例子中检测稀有物体是一个新兴的问题。 先前的研究表明元学习是一种很有前途的方法。 但是,精细的调音技术没有引起足够的重视。 我们发现,仅微调现有检测器的最后一层稀有类是至关重要的少数射击目标检测任务。 这种简单的方法比元学习方法的性能要高出约2 ~ 20点,有时甚至是之前方法的准确度的两倍。 然而,少数样本中的高方差往往会导致现有基准测试的不可靠性。 基于PASCAL VOC、COCO和LVIS三个数据集,我们通过对多组训练实例进行采样来修改评估协议,以获得稳定的比较,并建立新的基准。 同样,我们的微调方法在修订后的基准上建立了一个新的最先进状态。

02
领券