首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

ICLR 2022最佳论文解读

2 PLL问题难点 PLL效果目前和有监督学习还有一定差距。PLL问题难点在于标签,也就是从候选label集合预测出样本真实label。...利用对比学习提升表示学习效果,再利用良好表示对label进行label又有助于进一步生成良好样本表征,形成良性循环,提升整体效果。...,以及基于聚类label两个核心模块。...在有监督学习,每个样本都有其对应的确定性label,天然可以构造出正样本。而PLL问题中,每个样本label是不确定无法直接获取正样本对。...对MoCo等对比学习框架不了解同学,可以参考我之前文章:对比学习4种经典训练模式。利用对比学习,可以让样本在特征空间形成类簇,这也为后续标签奠定了基础。

42710

对比学习引领弱标签学习新SOTA,浙大新研究入选ICLR Oral

然而,现存 PLL 算法与完全监督下方法依然存在较大差距。 为此,本文提出一个协同框架解决 PLL 两个关键研究挑战 —— 表征学习和标签。...在 PLL 问题中,最重要问题为标签(Disambiguation),即从候选标签集合识别得到真实标签。...可以发现,对比学习模块,最重要问题即为正样本集合构建。然而,在 PLL 问题中,真实标签是未知,因此无法直接选择同类样本。...消融实验 最后,研究者展示不同模块对实验结果影响,可以看到,标签模块和对比学习模块都会带来非常明显性能提升,消融其中一个会带来 性能下降。更多实验结果请详见原论文。...理论分析 终于到了最激动人心部分!相信大家都有一个疑问:为什么 PiCO 能够获得如此优异结果?本文中,研究者从理论上分析对比学习得到原型有助于标签

64710
您找到你想要的搜索结果了吗?
是的
没有找到

学习笔记CB008:词义、有监督、无监督、语义角色标注、信息检索、TF-IDF、

词义,句子、篇章语义理解基础,必须解决。语言都有大量多种含义词汇。词义,可通过机器学习方法解决。词义有监督机器学习分类算法,判断词义所属分类。...词义无监督机器学习聚类算法,把词义聚成多类,每一类一种含义。 有监督词义方法。基于互信息词义方法,两种语言对照,基于大量中英文对照语料库训练模型可词义。...来源信息论,一个随机变量包含另一个随机变量信息量(英文信息包含中文信息信息量),假设两个随机变量X、Y概率分别是p(x), p(y),联合分布概率是p(x,y),互信息计算公式,I(X; Y) =...基于互信息词义方法对机器翻译系统效果最好。缺点,双语语料有限,多种语言能识别出歧义情况也有限(如中英文同一个词都有歧义)。 基于贝叶斯分类器方法。...训练出p(s)和p(v|s),一个多义词w计算(p(c|s)p(s))最大概率。 无监督词义方法。完全无监督词义不可能,没有标注无法定义词义,可通过无监督方法做词义辨识。

1.4K240

多因子融合实体识别与链指

,最后用DeepCosine来结合知识库实体向量预测及其他数值特征,比如流行度等弱模型进行融合进而可以产生一个非常强实体预测结果。...在整个实体识别与链指过程,常见是把这个任务分成两部分,即先进行实体识别,然后再进行实体[1-3]。最近也有部分工作强调要用端到端方式统一两个任务[4]。...因此基于预训练模型实体识别结果也提高了很多。得益于预训练模型强大实体识别能力,本文因此采用两步走方式来进行实体识别和链指。...因为实体识别的准确率足够高,因此对后面的结果产生False Positve样本影响会小很多,同时可以降低联合模型计算空间。 命名实体识别任务多在识别文本事物名称,例如人名、地名和机构名。...动力] 4.2 实体链指 在实体链指任务,本文令每个候选实体和输入语句中实体一一配对,形成一个二分类问题。

2.7K50

论文报告 Semi-supervised Word Sense Disambiguation

接下里,第一种方法可以通过无监督最近邻方法获得测试数据每个单词sense;第二种方法使用了较为复杂标签传播模型(Label propagation)。...本文另一个贡献是开源了一个较大带标注语义数据集。 模型 如上,本文模型结构非常简单--LSTM。...首先,作者提出使用大规模无标签语料训练一个语言模型,本文使用语料包涵100B个词(未开放此语料)。在经过预训练后,使用LSTM来获得待上下文信息。...具体做法是使用特殊字符 $ 取代待词,然后用LSTM对整个句子进行编码,LSTM最后一个输出即为当前待上下文信息。接下来,作者提出了两种方法来进行。 方法一 最近邻(NN)方法。...同时,作者还在Google自己标注大型数据集上进行了实验,也取得了很好实验结果

1K60

千言实体链指赛事登顶,冠军团队经验独家分享

训练数据包含mention共26万个,也就是每条训练样本,待mention约3个左右。...验证数据包含mention共3万个,每条样本待mention也是约3个左右。...因此,要在该比赛取得更好成绩,除了做好KB实体任务,针对NIL实体判断及其类型预测任务也至关重要。...特征因子融合方法是使用多折方法训练一个 MLP 模型。具体特征如图8: ? 图8 实体特征因子列表 实验结果 中文短文本实体链指比赛,限定在给定标注数据和知识库。...图10 验证数据实体链指结果 对验证集数据简单进行分析,模型错误主要有四类: fp_nil_ni:标注数据为NIL_TYPE,预测也为NIL_TYPE,但是类别预测错误。

1K20

中文短文本实体识别实体链接,第一名解决方案

百度 2019文短文本实体链指 第一名解决方案 摘要   传统实体链接任务主要是针对长文档。长文档拥有充分上下文 信息,能够辅助实体识别与。...相比之下,中文短文本实体链接存 在很大挑战。实体链接整个过程包括实体识别和实体两个子任务。...针对实体子任务,将其 视为二分类问题,通过基于 BERT 二分类模型对候选实体进行预测,然 后对预测概率进行排序,进而完成任务。...对于错误3,我们实体识别的模型能够解决这一问题 针对错误2与错误3,统计知识库实体E无法匹配总次数E_num,训练集中实体E 无法匹配所有字符串M_1,M_2,M_3...M_i以及该字符串对应出现次数...3实体   实体是基于二分类思想实现,训练时选取连接到实体作为正例,在候选实体里选取两个负例。

4K20

小布助手在百度飞桨实体链指比赛实践应用

Pipeline式实体链指步骤一般有:命名实体识别、候选实体选取、实体,其中最关键一步是实体。Ganea[1]将文本和候选实体encode为两个向量,使用语义匹配来进行实体。...Shuang Chen[2]则将问题转化为实体类型分类,得到实体类别后,通过Link Count确定最终链接到实体。...在排序学习,有三种常见模式pointwise,pairwise和listwise,对于实体这种只需要TOP1排序任务,并不需要考虑候选实体之间顺关系,只考虑全局相关性,因此我们选取了pointwise...NIL实体排序方式实验 实体过程NIL实体如何和其他实体一起排序,是单独作为一个分类任务,还是将NIL转换为特定类型实体参与排序,针对这个问题,我们设计了三种方案: 方案1:只对知识库存在实体进行排序...为了更好地理解用户问题,小布不仅借助OGraph在实体方向进行探索,还在命名实体识别和候选实体挖掘上做了很多工作。

82120

干货 | 携程实体链接技术探索及实践

二、问题分析 实体链接,指将文本表述链接到知识库相应实体来进行实体、帮助计算机理解文本具体含义任务,一般包含实体提及识别、候选实体生成和候选实体三个步骤。...2)候选实体生成为文本给定实体名称生成可能链接候选实体集合,即根据前一步识别到实体提及片段从知识库召回所有用户可能感兴趣实体,该步骤生成候选项集确定了实体范畴。...3)实体是确定一个实体指称项所指向真实世界实体过程,通过候选实体静态特征、或与query交互计算动态特征输出一个用于排序分值。...三、旅游知识图谱 GIS本身是一种知识库,POI则是知识库实体,但仅有POI集合,无法发挥其辅助实体潜能,为此我们需要构建以POI为基础,同时深度结合目的地、产品、标签、别名等其它数据旅游行业知识图谱...调用实体链接服务后,返回结果中广州市白云山(id:7xxx4)被排在top1位置,说明实体阶段系统捕获到了“广州白云山”与定位站“东莞市”之间关联。

1.3K30

EMNLP 2018 | 为什么使用自注意力机制?

本文在主谓一致任务和词义任务上评估了当前 NMT 领域中最流行三种模型:基于 CNN、RNN 和自注意力机制模型,发现实验结果与上述论断并不一致。该论文已被 EMNLP 2018 接收。...受到上述关于路径长度和语义特征提取关系理论陈述启发,研究者在主谓一致任务(需要建模长距离依赖)和词义(WSD)任务(需要提取语义特征)上对三种模型性能进行了评估。...我们假设 CNN 和自注意力网络强大性能也可能来自于其从源文本提取语义特征能力。我们在两个任务(主谓一致任务和词义任务)上评估了 RNN、CNN 和自注意力网络性能。...实验结果证明:1)自注意力网络和 CNN 在建模长距离主谓一致时性能并不优于 RNN;2)自注意力网络在词义方面显著优于 RNN 和 CNN。 ? 图 1:NMT 不同神经网络架构。...WSD 主谓一致任务上实验结果展示了 CNN 和 Transformer 在捕捉长距离依赖方面并没有优于 RNN,即使 CNN 和 Transformer 路径更短。

78610

如何在父进程读取子(外部)进程标准输出和标准错误输出结果

最近接手一个小项目,要求使用谷歌aapt.exe获取apk软件包信息。依稀记得去年年中时,有个同事也问过我如何获取被调用进程输出结果,当时还研究了一番,只是没有做整理。...但是,实际情况并不是我们想那么简单。比如我文前提到问题:别人提供了一个Console控制台程序,我们将如何获取其执行输出结果呢?...这个API参数非常多,我想我们工程对CreateProcess调用可能就关注于程序路径(lpApplicationName),或者命令行(lpCommandLine)。...我想应该有人借用过网上相似的代码,但是却发现一个问题,就是读取出来信息是不全。这个问题关键就在读取方法上,其实没什么玄妙,只要控制好读取起始位置就行了。...,所以我段代码动态申请了一段内存,并根据实际读取出来结果动态调整这块内存大小。

3.8K10

【开脑洞】未来,机器是否会取代人工翻译?

句子翻译两大难题:和调序 机器翻译尚处于“句子翻译“初级阶段,即准确地理解每一个句子基本意思。...据百度NLP(自然语言处理技术)技术人员介绍,尽管机器翻译在句法理解上有所突破,但最大难点还在于和调序。 一个是顺序问题。...一个词有多个语义,比如“看”这个词,看病、看书、看球,是不一样;打球、打赏、打牌、打脸“打”意思也非常不同。如果直接将句子“看”简单翻译为Look自然不行,而这样情况又无法穷举。...和调序是机器翻译要解决最重要两个问题。如果能够突破,机器翻译未来就可以帮助人们做更多事情。 机器翻译突破杀手锏——NLP技术 业界如何解决机器翻译所面临问题呢?...,进而迅速呈现最优翻译结果

56360

动态 | 谷歌让机器更懂语言博大精深,发布最大语料库

但是同样在牛津字典,stock 这个词还有超过 10 个不同含义,比如「(商店里)库存」或是「(鞭子、钓竿等) 柄」。对于计算机算法而言,如何从博大精深含义找寻某个句子对应词义?...这的确是一个词义难题,也就是 AI-Complete 问题。 AI科技评论消息,今天谷歌研究院又发出了重磅新闻,他们发布了基于 MASC&SemCor 数据集大规模有监督词义语料。...这些语料会与牛津字典上例句做映照,广泛适用于各个社区。与此同时,本次发布也是最大全句释义语料库之一。 有监督词义 人们通过对句子中词语内容进行理解,因为我们能通过常识判断上下文含义。...我们希望为机器提供足够背景信息,并应用于理解文本中词语含义。 有监督词义(WSD)尝试解决这一问题,也就是让机器学习使用人工标记数据,并与字典词语所代表典型含义匹配。...这些人工词义标注采用了 Krippendorff's alpha (α >= 0.67 则具有一定可信度,α >= 0.80 则表示具有很高可信度) 进行判断,结果显示得分为 0.869。

81590

Author name disambiguation using a graph model with node splitting and merging based on bibliographi

using a graph model with node splitting and merging based on bibliographic information 基于文献信息进行节点拆分和合并图模型方法...(GFAD) 论文: https://link.springer.com/article/10.1007/s11192-014-1289-4 这是一篇比较早文章,将人名过程作为一个系统,主要想学习它对消过程各个阶段划分...同名问题:分割多个不重叠环中共同顶点 异名问题:合并具有不同名顶点 同时:能够处理异常问题 1. 概述 1. 基于图作者姓名方法 2. 使用合作关系构建图模型 3....以图表为导向的人名方法,从文献信息分析作者间关系构建图模型 2. 通过链接合作者推断作者社交环(过去和现在学术关系) 3. 利用顶点分割或顶点合并 与以往研究相比: 1....Outlier Remover 孤立点: 缺少所需要元信息 如:在使用合著关系系统,只有一个作者文章就是孤立点 对于使用作者所属组织系统,缺少作者所属信息文章就是孤立点 GFAD 将异常值根据代表性关键字相似性度量

69540

收藏 | 最新知识图谱论文清单(附解读、下载)

联合步骤(右侧黄框),主要包括本文提出两个核心方法: 1) 基于广义旅行商问题(GTSP)方法。如下图所示,该方法将每个关键词候选 URI 放入同一个簇。...边权重被设置为两个 URI 在知识库上距离(hop 数),而联合过程被建模为在该图上寻找一条遍历每个簇边权总和最小路(头尾结点可以不同)。...2) 基于连接密度相关特征进行机器学习方法。...下表总结了上述两个方法差异: ? 3) 额外,本文提出了一种自适应实体/属性预测方法。...如果后某个实体/关系和它最终链接到 URI 置信度低于阈值,则可能预处理步骤第二个子过程(实体/关系预测)有错误。

1.1K30

LingPipe : 自然语言处理工具包

(点击上方公众号,可快速关注) 来源:伯乐在线 - 刘立华 LingPipe是运用计算机语言学处理文本信息工具包,可用于如下任务: 在新闻查找人名、组织或位置。 自动分类Twitter搜索结果。...提供查询正确拼写建议。 架构 LingPipe架构是有效、可扩展、可重用、健壮。...//alias-i.com/lingpipe/demos/tutorial/cluster/read-me.html 词性标注 介绍如何从语料库用标签解析器和处理器训练词性标注器,如何编译模型到磁盘并读取...http://alias-i.com/lingpipe/demos/tutorial/chineseTokens/read-me.html 连接符和音节 展示了如何从训练数据字典训练连字符和音节。...http://alias-i.com/lingpipe/demos/tutorial/em/read-me.html 词义 词义是根据一个词上下文确定一个词含义过程,用于分类、搜索、聚类等

1.2K30
领券