首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往

conceptnet-numberbatch: 结合常识知识的词向量 - 概述及使用

常识知识的表示形式有很多:有的是以图的形式,如ConceptNet;有的是以模型的形式,如COMET;而本文要介绍的应该是其中比较易于使用的一种,词向量形式。...其代表是conceptnet-numberbatch。 简介 ConceptNet Numberbatch 是一组词向量,可以直接以向量形式表达词的语义。...它是ConceptNet开源项目的一部分,ConceptNet是最常用的常识知识图谱之一。...相比于其他词向量(word2vec, glove) ConceptNet Numberbatch的优势是它同时利用了文本和ConceptNet中的半结构化信息进行学习,因此它能够学习到一些从一般语料中可能无法直接学习到的一些语义...ConceptNet Numberbatch同时支持单个词语和一些词组,不过为了操作的方便,一般不使用词组,而都是直接使用单个词语的向量。

1.2K20
您找到你想要的搜索结果了吗?
是的
没有找到

ACL 2019 | AI2等提出自动知识图谱构建模型COMET,接近人类表现

例如,和「taking a nap」(睡一小会儿)有关的 ConceptNet 三元组是这样的:s=「take a nap」,r=Causes,o=「have energy」。...对于 ConceptNet 数据集,则需要在关系实体 X^r 和 object token X^o 之间再加入一个 [MASK] token,因为 X^r 在 ConceptNet 中可能有很多个 token...该研究使用了 ATOMIC 和 ConceptNet 作为知识种子集。 ATOMIC 数据集有 87 万个三元组,包括围绕一些特定事件提示(如「X 去商店」)的大量社会常识知识。...ConceptNet 是由 Open Mind Common Sense(OMCS)构成的数据集。三元组是典型的「s-r-o」结构(例如,「睡一会儿-导致-获得能量」)。...ConceptNet 实验结果 ? 表 6:ConceptNET 生成结果。 ? 表 7:从 ConceptNet 的验证集随机抽取的新生成。 本文为机器之心编译,转载请联系本公众号获得授权。

1.4K31

常识知识确能被捕获,西湖大学博士探究BERT如何做常识问答

该研究发现,注意力头(attention head)成功捕获了以 ConceptNet 编码的结构化常识知识,从而对 BERT 直接解决常识任务提供帮助。...图 2:从 ConceptNet 到 CommonsenseQA。...此外,为了分析基于从答案概念到问题概念的链接的隐式结构常识知识,研究者选择过滤掉了一些问题,并且过滤掉的这些问题不包含 ConceptNet 形式的问题概念(如释义)。...直观地讲,如果答案概念到问题概念的链接权重高于答案概念到其他疑问词的链接权重,则 ConceptNet 中的常识知识是通过经验表示捕获的。...在每个候选句子中,研究者根据 ConceptNet 计算了答案概念到问题概念的链接权重。

58220

AAAI 2020学术会议提前看:常识知识与常识推理

制作音乐,根据从 ConceptNet 上的证据可以帮助我们挑出 A 和 C 这两个选项,根据来自维基百科的证据,我们可以挑出 C 和 E 两个选项,结合二者,我们能够得到正确答案 C。...来自结构化的知识源(如 ConceptNet)包含概念之间的宝贵结构关系,对于推理很有帮助,但是它们的覆盖率低。而纯文本知识源(如维基百科)是对结构化知识的补充,可以提供丰富且覆盖面广的证据。...图 2.2 本文方法概览 (1)知识提取部分:根据给定的问题和选项,从结构化知识库 ConceptNet 中自动提取图路径,从维基百科纯文本中自动提取句子。...ConceptNet 是大型常识知识库,常识知识由三元组表示(实体节点,关系,实体节点),对于给定的问题和选项,首先识别出其中的实体,然后在 ConceptNet 中搜索从问题实体到选项的路径,将涉及到的三元组合并到一个图中...作者提出拓扑排序算法(Algorithm 1)根据构造图对证据进行排序,需要说明的是,对于结构化知识源 ConceptNet,使用了 ConceptNet 提供的关系模板将三元组转换为自然语言文本句子。

69200
领券