superglue - 腾讯云开发者社区

文章/答案/技术大牛

发布

LightGlue: Sarlin 新作，轻量级 SuperGlue

这篇文章提出了一种轻量级 SuperGlue，通过增加一种提前退出机制 + 修剪掉无匹配能力的点，做到推理时即快又好，各位同学速速围观！

1.5K4 0

AI模型的基准测试

现在常见的模型的基准测试有 GLUE、SuperGLUE、HELM、MMLU等等。...自然语言处理能力的基准测试：GLUE和SuperGLUE GLUE（General Language Understanding Evaluation，通用语言理解评估）是2018年有纽约大学、华盛顿大学等机构一起创建的自然语言任务的集合...因此为了避免类似的误导的结果，SuperGLUE 出现了。...SuperGLUE 继承了 GLUE 的基础设计，仅保留了 GLUE 九项任务中的两项分别是RTE和WSC（也就是GLUE中的WNLI模式），还引入了五个难度更大的新任务，这些任务的选择标准包括为了实现难度和多样性的最大化...图 2 2023年 8 月份SuperGLUE的结果但是 GLUE、SuperGLUE 都是针对英文的语言能力测试，我国的一些研究机构、大学也提出了对应的中文能力的基准测试 CLUE、SuperCLUE

9723 0

您找到你想要的搜索结果了吗？

是的

没有找到

超难NLP新基准SuperGLUE正式发布：横扫SOTA模型BERT勉强过关

SuperGLUE正式上线：NLP模型们，来迎接挑战吧！...什么是SuperGLUE？如果你搜索SuperGLUE，出现在首页的一定的各种胶水。...初始的SuperGLUE基准版本包含了人类水平估计结果，扩展了GLUE中的句子和句子的分类，还包含了共指消解、句子完成和问答。...SuperGLUE任务集合比较多样化，为了帮助研究者能够开发出统一的新方法，SuperGLUE团队还贴心的为研究人员提供了一套基于PyTorch和AllenNLP、用来操作NLP的预训练、多任务学习和迁移学习的模块化建模工具包...论文： https://w4ngatang.github.io/static/papers/superglue.pdf

2.5K2 0

BERT之后，GLUE基准升级为SuperGLUE：难度更大

进入 SuperGLUE 时代 ?...SuperGLUE 与 GLUE 也有很多差异： SuperGLUE 仅保留了 GLUE 九项任务中的两项（其中一项还经过修改），还引入了五个难度更大的新任务。...初始的 SuperGLUE 基准版本即包含了人类水平估计结果。在 SuperGLUE 中这些被选中的任务上，基于 BERT 的强基线与人类水平之间还存在显著的差距。...此外，SuperGLUE 还添加了测试模型问答、执行共指消解和执行常识推理能力的任务。下表给出了 SuperGLUE 包含的任务： ? SuperGLUE 包含的任务。...综合以上各项任务，SuperGLUE 基准也设置了一个总体评估指标：SuperGLUE 分数。该分数即是在以上所有任务上所得分数的平均。

1.3K2 0

AI研究人员携手发表更严格的自然语言效能评测平台SuperGLUE

导读许多对话式AI系统的自然语言处理表现，已经超越既有GLUE平台能够评测的境界，需要另一个具备更高难度挑战的评测平台，也就是SuperGLUE ?...Facebook AI、DeepMind、纽约大学与华盛顿大学的AI研究人员，在本周共同发表了SuperGLUE平台，这是一个专门用来测量人工智慧（AI）自然语言处理（NLP）能力的效能评测平台，原因是有愈来愈多的对话式...不过，即使它们能够超越GLUE上特定任务的人类效能，却依然无法解决某些人类得以完美完成的任务，为了替NLP研究设定一个全新且更高的门槛，SuperGLUE于焉诞生。...SuperGLUE包含8种不同的任务，其中一之为「选择合理的替代方案」（ Choice of Plausible Alternatives，COPA），这是一个因果推理任务，系统先得到一个前提，之后即必须从两个可能的选择中判断其因果...再以最近表现最佳的RoBERTa模型为例，它击败了目前所有的NLU系统，也在「多重句子阅读理解」（Multisentence Reading Comprehension，MultiRC）任务上超越人类效能，但在SuperGLUE

4974 0

NLP领域“学霸”太多，一年前标准已过时，新跑分标准SuperGLUE出炉

于是，原本参与制定GLUE的三家公司和学校联合Facebook提出了新的测试标准SuperGLUE。SuperGLUE使用谷歌的BERT作为性能测试基准。 ?...我们从最初的GLUE基准测试中吸取的经验教训，并推出了SuperGLUE，这是一个采用了GLUE的新基准测试，具有一系列更加困难的语言理解任务、改进的资源和一个新的公共排行榜。...这四家机构希望，通过SuperGLUE这项新标准，引入半监督和自我监督学习的新方法，对更大规模的数据进行训练，促进NLP领域的创新。...Facebook在最新的SuperGLUE测试了RoBERTa，它与其中多项任务的人类基线之间仍然存在巨大差距，这说明了当前最先进的自然语言理解系统的一些局限性。 ?...SuperGLUE总共包含10项任务，用于测试系统因果推理、识别因果关系、阅读短文后回答是非问题等等方面的能力。SuperGLUE还包含Winogender，一种性别偏见检测工具。 ?

6531 0

RoBERTa在SuperGLUE得分逼近人类，甩baseline十多个点

现在，Facebook AI又将RoBERTa提交到了SuperGLUE，榜单显示RoBERTa已经领先Bert 15个百分点，表现直逼人类。...从GLUE到SuperGLUE：难度更大 SuperGLUE在GLUE设计的基础上，采用了一系列更加困难的语言理解任务，除了共同任务识别文本蕴涵（RTE）和 Winograd 模式挑战赛（WSC）外...，还添加了常识推理和词义消除等任务，上表中给出的其他测试数据集包括： CB短文本语料库 MultiRC真假问答任务数据集 COPA因果推理 WiC词义消岐 RoBERTa离人类还有多远从SuperGLUE...SuperGLUE代表的是我们需要处理的35个任务中最难的几个。而对于35个中的大多任务，BERT 本身的性能就已经快接近极限了。

4821 0

CVPR 2021 Image Matching 挑战赛双冠算法：揭秘AR导航背后的技术

Retrain SuperGlue 另外我们还重新训练了SuperGlue，这里体现在两个方面。一个是将复现官方的 SuperPoint+SuperGlue 方法。...第二个是使用效果更好的特征提取方法 DISK，训练 DISK+SuperGlue。其中DISK+SuperGlue 在 YFCC 验证集上面比 SuperPoint+SuperGlue 高4%左右。...针对比赛数据集，DISK+SuperGlue 在 Phototourism 上表现较好，但在其他另外两个数据集效果较差，可能是因为 DISK在 Megadepth 上面训练，在建筑物数据集上面过拟合。...最后在 8k 赛道（unlimited keypoints），我们对 SuperPoint+SuperGlue ，DISK+SuperGlue 进行 ensemble，效果比二者单独使用要更好。...Rabinovich, “SuperGlue: Learning feature matching with graph neural networks,” in CVPR, 2020. 6.D.

2.1K2 2

41岁SuperGLUE之父英年早逝，AI圈悲痛不已

Felix是一位学术成果颇丰的AI学者，谷歌总引用量为19680，参与创建了自然语言理解基准GLUE和SuperGLUE。

600 0

刷新50多个NLP任务基准，并登顶SuperGLUE全球榜首，百度ERNIE 3.0知识增强大模型显威力

ERNIE 3.0 一举刷新 54 个中文 NLP 任务基准，其英文模型在国际权威的复杂语言理解任务评测 SuperGLUE 上，以超越人类水平 0.8 个百分点的成绩登顶全球榜首。...ERNIE 3.0 英文模型登顶 SuperGLUE：超越人类水平 0.8 个百分点除了中文模型的惊艳效果，ERNIE 3.0 英文模型在国际权威的复杂语言理解任务评测 SuperGLUE 上超越谷歌的...SuperGLUE 是由谷歌 DeepMind、Facebook 研究院、纽约大学、华盛顿大学等多个权威机构联合发布的复杂语言理解任务评测，旨在提升常识推理、因果判断、上下文消歧、指代消解等复杂任务的效果...ERNIE 3.0 登顶 SuperGLUE 全球榜首。事实上，早在 2019 年 12 月，ERNIE 就曾以 9 个任务平均得分首次突破 90 大关的成绩登顶 GLUE 全球榜首。...这次 ERNIE 3.0 在 SuperGLUE 评测上夺冠，再次证明了 ERNIE 的强大实力。 ? ERNIE 登顶 GLUE 全球榜首。

9372 0

AI在这张“问卷”上首次超越人类，SuperGLUE被微软谷歌两家“攻破”

在最新的NLU测试基准SuperGLUE中，人类首次被AI超越了。 SuperGLUE相比“前辈”GLUE大大提升了问题的难度，提出一年多以来，人类一直处于第一位。...关于SuperGLUE SuperGLUE是由Facebook、纽约大学、华盛顿大学和DeepMind四家机构于2019年8月提出的新NLU测试基准，以取代过去的GLUE。 ?...因此GLUE已不能顺应NLU技术的发展，SuperGLUE应运而生。...四家机构在SuperGLUE的官方文档中如是说。 SuperGLUE总共包含10项任务，用于测试系统因果推理、识别因果关系、阅读短文后回答是非问题等等方面的能力。...现在SuperGLUE上超越了人类表现，微软的研究人员认为：“这是通向通用AI的重要里程碑”。

5953 0

用编程创建和管理训练数据集难？三种强大的抽象方法呈上！

我们进行了一项实验来测试针对基础训练数据操作的有效性，分别对训练集的一部分数据使用了本文的框架、Snorkel（一种快速创建、建模和管理训练数据的系统，通过标记函数以编程的方式标记数据）和在 SuperGLUE...运行例子对于本文的其余部分，我们用 SuperGLUE 的语境用词（WiC）任务作为示例：目标词在句中的用法是否一致？...SuperGLUE 结果使用这些编程抽象方法，我们在 SuperGLUE Benchmark 及其 4 个组合任务上获得了新的最好成绩。...SuperGLUE 类似于 GLUE，但包含「更困难的任务...... 选择最大化难度和多样性，以及...... 选择显示基于 BERT 的强基线与人类表现之间的巨大余量差距。」...本次发布的代码包括了重要的基础结构改进以及如何将 LF，TF 和 SF 应用于 SuperGLUE 和其他任务的教程。我们很高兴如果您已经在自己的应用程序中应用了 Snorkel。

1K3 0

NLU新里程碑，微软DeBERTa登顶SuperGLUE排行榜，显著超越人类

机器之心报道参与：小舟、陈萍在最新的 NLU 测试基准 SuperGLUE 中，微软提出的 DeBERTa 登顶榜单，并超越人类。...本次扩大规模带来了极大的性能提升，使得单个 DeBERTa 模型 SuperGLUE 上宏平均（macro-average）得分首次超过人类（89.9 vs 89.8），整体 DeBERTa 模型在 SuperGLUE...SuperGLUE 排行榜，2021 年 1 月 6 日。 DeBERTa 是一种基于 Transformer，使用自监督学习在大量原始文本语料库上预训练的神经语言模型。...表 6：DeBERTa_1.5B 和其他几种模型在 SuperGLUE 测试集上的结果。...https://www.microsoft.com/en-us/research/blog/microsoft-deberta-surpasses-human-performance-on-the-superglue-benchmark

8601 0

用基础模型指导特征传播，首个泛化型图像匹配器OmniGlue搞定未见过域

使用改进的关键点表示来生成成对相似度矩阵：对比 SuperGlue 和 LightGlue SuperGlue 和 LightGlue 都使用注意力层进行信息传播。...在局部描述符改进方面，与 SuperGlue 不同，OmniGlue 解耦了位置和外观特征。...作为参考，SuperGlue 将关键点表示为 d + p，将两个特征纠缠在一起，其中位置特征也用于产生匹配结果。...总之，SuperGlue 是最接近 OmniGlue 的模型，可作为直接对比的参考。也因此，研究者使用 SuperGlue 作为实验验证的主要参考比较。...从 Synthetic Homography（SH）到 MegaDepth（MD）数据集，如下表 2 所示，与基础方法 SuperGlue 相比，OmniGlue 不仅在领域内数据上表现出优异的性能，而且还表现出强大的泛化能力

1771 0

【图像匹配】开源 | SuperGlue应用于真实的室内和室外环境的姿态估计任务中，性能表现SOTA

来源：苏黎世联邦理工学院论文名称：SuperGlue: Learning Feature Matching with Graph Neural Networks 原文作者：Paul-EdouardSarlin...本文介绍了一种通过联合查找对应点和剔除不匹配点来匹配两组局部特征的神经网络——SuperGlue。...我们引入了一种基于注意力的灵活的context聚合机制，使SuperGlue能够推出底层3D场景和连带的特征分配。...在真实的室内和室外环境的姿态估计任务中，SuperGlue的性能表现SOTA。该方法在GPU上进行实时匹配，可以很容易地集成到SfM或SLAM系统中。

2.1K2 0

Facebook等联合推出语言理解基准SuperGLUE，为模型提供更困难的挑战

SuperGLUE的前提是会话AI的深度学习模型已经达到了上限，需要更大的挑战。它使用BERT作为模型性能基准。...在SuperGLUE之前，纽约大学、华盛顿大学和DeepMind的研究人员于2018年4月为语言理解制定了通用语言理解评估（GLUE）基准。...SuperGLUE旨在使任务比GLUE更复杂，并鼓励构建能够掌握更复杂或细微差别的语言的模型。...SuperGLUE包含在一系列困难的NLP任务中测试创造性方法的新方法，这些任务侧重于机器学习的许多核心领域的创新，包括样本高效，转移，多任务和自我监督学习。...SuperGLUE还包含Winogender，一种性别偏见检测工具。SuperGLUE排行榜将在super.gluebenchmark.com在线发布。

5003 0

ACL2023 | Multi-CLS BERT：传统集成的有效替代方案

在 GLUE 和 SuperGLUE 数据集上进行了实验，证明了 Multi-CLS BERT 在提高整体准确性和置信度估计方面的可靠性。它甚至能够在训练样本有限的情况下超越更大的 BERT 模型。...GLUE 和 SuperGLUE 数据集上的实验结果 GLUE和SuperGLUE是两个广泛使用的自然语言理解基准测试数据集。...在所提出的方法中，作者使用GLUE和SuperGLUE数据集来评估Multi-CLS BERT的性能。...在GLUE数据集上，作者使用100个、1,000个和完整数据集进行了实验，并在SuperGLUE数据集上使用了相同的设置。...实验结果表明，Multi-CLS BERT在GLUE和SuperGLUE数据集上都能够可靠地提高整体准确性和置信度估计。

4512 0

微软和谷歌的人工智能，在SuperGLUE基准测试中超越了人类

基于一年前推出的GLUE基准，SuperGLUE包含了一系列更难理解的语言挑战、改进的资源和公开的排行榜。当SuperGLUE刚被推出时，排行榜上表现最佳的模式和人类表现之间有近20个百分点的差距。...“我们没有理由相信SuperGLUE能够检测到自然语言处理的进一步进展，至少不能完全相信。” 但SuperGLUE测试并不是完美的，也不是一种完整的人类语言能力测试。...SuperGLUE 正如研究人员在介绍SuperGLUE的论文中写的那样，他们的基准是一种简单的、难以博弈的衡量标准，用来衡量通用英语理解技术的进步。...微软研究人员写道：“DeBERTa在SuperGLUE上超越人类的表现，标志着通用人工智能的一个重要里程碑。...在SuperGLUE问世两年来的研究结果的推动下，也许未来的研究会更进一步。

4461 0

CVPR 2021 | PixLoc: 端到端场景无关视觉定位算法(SuperGlue一作出品)

今天要介绍的文章是“Back to the Feature: Learning Robust Camera Localization from Pixels to Pose”，发表于CVPR 2021，本文的一作正是SuperGlue

1.5K2 0

一种基于注意力机制特征匹配网络SuperGlue：端到端深度学习SLAM的重要里程碑

基于注意力机制提出了一种灵活的内容聚合机制，这使得SuperGlue能够同时感知潜在的3D场景以及进行特征匹配。...SuperGlue借鉴了这种注意力机制。框架以及原理特征匹配必须满足的硬性要求是：i)至多有1个匹配点；ii)有些点由于遮挡等原因并没有匹配点。...只能说SuperGlue的效果太好了，直接放结果吧（本来论文7页就写完了，作者放了10页附录大招）。...实验表明，SuperGlue与现有方法相比有了显着改进，可以在极宽的基线室内和室外图像对上进行高精度的相对姿势估计。此外，SuperGlue可以实时运行，并且可以同时使用经典和深度学习特征。...作者最后提到：若与深度学习前端结合使用，SuperGlue是迈向端到端深层SLAM的重要里程碑。

3.3K3 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

LightGlue: Sarlin 新作，轻量级 SuperGlue

AI模型的基准测试

超难NLP新基准SuperGLUE正式发布：横扫SOTA模型BERT勉强过关

BERT之后，GLUE基准升级为SuperGLUE：难度更大

AI研究人员携手发表更严格的自然语言效能评测平台SuperGLUE

NLP领域“学霸”太多，一年前标准已过时，新跑分标准SuperGLUE出炉

RoBERTa在SuperGLUE得分逼近人类，甩baseline十多个点

CVPR 2021 Image Matching 挑战赛双冠算法：揭秘AR导航背后的技术

41岁SuperGLUE之父英年早逝，AI圈悲痛不已

刷新50多个NLP任务基准，并登顶SuperGLUE全球榜首，百度ERNIE 3.0知识增强大模型显威力

AI在这张“问卷”上首次超越人类，SuperGLUE被微软谷歌两家“攻破”

用编程创建和管理训练数据集难？三种强大的抽象方法呈上！

NLU新里程碑，微软DeBERTa登顶SuperGLUE排行榜，显著超越人类

用基础模型指导特征传播，首个泛化型图像匹配器OmniGlue搞定未见过域

【图像匹配】开源 | SuperGlue应用于真实的室内和室外环境的姿态估计任务中，性能表现SOTA

Facebook等联合推出语言理解基准SuperGLUE，为模型提供更困难的挑战

ACL2023 | Multi-CLS BERT：传统集成的有效替代方案

微软和谷歌的人工智能，在SuperGLUE基准测试中超越了人类

CVPR 2021 | PixLoc: 端到端场景无关视觉定位算法(SuperGlue一作出品)

一种基于注意力机制特征匹配网络SuperGlue：端到端深度学习SLAM的重要里程碑

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐