使用Python中的知识库从文本中提取实体_使用Python从文本( CSV文件中)提取数据_使用python从非结构化文本中提取数值实体 - 腾讯云开发者社区

nlp、dbpedia、freebase、wikidata、named-entity-extraction

我有一个实体提取任务，需要像维基数据，freebase，DBpedia的知识库。考虑到它们的巨大规模，很难从它们中下载和提取实体。有没有一个python客户端可以进行API调用，以非结构化文本作为输入来获取提取结果？

浏览 23提问于2019-10-17得票数 0

1回答

如何执行实体链接到本地知识图？

nlp、named-entity-recognition、named-entity-extraction、entity-linking

我正在从零开始建立我自己的知识库，使用在线文章。我正试图将我刮过的SPO三元组(主题和潜在对象)中的实体映射到我自己的实体记录中，这些实体由我从其他网站上刮来的上市公司组成。我已经研究了大部分图书馆，方法主要是将实体映射到大型知识库，如Wikipedia、YAGO等，但我不太清楚如何将这些技术应用到我自己的<

浏览 2提问于2018-08-27得票数 2

2回答

长而非结构化文档的信息提取/语义搜索

nlp、text-mining、information-retrieval、named-entity-recognition

我被一项特殊的信息提取任务困住了。我有几百，长(5-35页) pdf，文档和docx项目文档，我试图从中提取特定的信息，并将它们存储在一个结构化的数据库中。最终目标是提取和存储信息，以便我们能够查询这些文件和任何新传入的文档以获得快速可靠的信息。例如，我想从知识库中查询一个实体的组合，然后从文档中返回n个最相关的</em

浏览 0提问于2019-10-15得票数 1

1回答

如何确定两个实体之间的关系时，有多个关系，同时创建远程监督培训数据？

nlp、information-extraction

我有远程监督的概念。据我所知，培训数据的创建过程类似于；我对这一步感到困惑。如果这两个实体(e1和e2)之间有多个关系呢？如果是的话，我应该选择哪种关系？

浏览 5提问于2019-12-02得票数 1

回答已采纳

1回答

实体链接与混叠

nlp、entity-linking

在知识库(KB)中查找文本中给定的关键字所指的实体的过程称为实体链接。我有相反的问题。我有一个实体在我的知识库(KB)，我想找到所有的方式，人们可能会参考这个实体。还是在文学中有一个更好的名字？我想找到正确的关键词将帮助我找到相关的研究。

浏览 0提问于2020-12-21得票数 1

回答已采纳

1回答

用于分类具有特定主题的单词列表的NLP算法

python、nlp、algorithms、topic-model

目前，我正在使用LDA将主题建模应用于一个语料库。由于LDA是无监督的，因此它返回给定的“主题”的一组单词，但不一定指定主题本身。我想知道是否有任何关于算法的建议，这些算法可以列出一个单词列表，并看到它可以分类到哪些主题？['game', 'week', 'fantasy', 'sportsline', '

浏览 0提问于2018-11-09得票数 5

回答已采纳

1回答

远程监管:一种基于规则的标签方法？

machine-learning、nlp、data-science、named-entity-recognition

我目前正在从事实体关系方面的工作，我发现很多文件都实施了远程监督来标注数据。我对远程监督的理解是，我们有一个已建立的知识库( KB )，我们通过检查提取的实体对是否存在于知识库中来进行某种“基于规则的标记”。如果实体对存在于KB中，则它将被标记为正，否则将被标记为负值。我的问题是：如果是的话，我不明

浏览 3提问于2019-10-18得票数 1

回答已采纳

1回答

尝试将Drools与hibernate连接起来

hibernate、drools

我正在使用我的项目中的Drools，我正在尝试将知识库连接到Hibernate，以便从数据库中提取事实。然而，我不太明白如何创建知识库:在创建知识库时，我应该创建hibernate会话吗？还是在DRL文件中？你能帮我把hibernate和drools连接起来吗？谢谢

浏览 1提问于2015-04-13得票数 0

1回答

身份文档中的命名实体识别

python、entity、extraction、named-entity-recognition

我正在尝试对驾照等文档中的文本执行命名实体识别(NER)。我们已经从文档中提取了文本。我们的目标是找出哪些文本是名称、地址、国家、文件编号等。用于NER的python库NLTK和Spacy不起作用，因为没有句子来理解上下文。训练NLTK/Spacy是否有效？正则表达式模式匹配在实体提取方面有多好？下面是提取实体<em

浏览 16提问于2019-04-10得票数 0

29回答

使用Python从HTML文件中提取文本

python、html、text、html-content-extraction

我想用Python从HTML文件中提取文本。我想要的输出基本上与从浏览器复制文本并将其粘贴到记事本中得到的输出相同。我想要一些比使用正则表达式更健壮的东西，因为正则表达式在格式不佳的HTML上可能会失败。我看到很多人推荐Beautiful Soup，但我在使用它时遇到了一些问题。首先，它会拾取不需要的文本，比如JavaScrip

浏览 447提问于2008-11-30得票数 282

回答已采纳

1回答

我如何使用沃森AlchemyAPI来训练API？

ibm-watson、alchemyapi

我试图从文本输入中找出实体。如果有任何选择来训练炼金术。这样我就可以根据我的需要修改实体。

浏览 4提问于2016-04-03得票数 0

回答已采纳

1回答

半结构化文本中信息检索的度量学习？

parsing、machine-learning、information-retrieval、information-extraction

我对解析半结构化文本很感兴趣。假设我有一个带有标签的文本：year_field、year_value、identity_field、identity_value、...这些字段及其关联值可以在文本中的任何地方出现，但通常它们彼此接近，更一般地，文本以(非常)粗略的矩阵组织，但更常见的情况是，这些值恰好位于关联字段之后，并最终在其间包含一些不感兴趣的信息。不同格式的数量可以达到几十种，并且不是那么严格

浏览 5提问于2015-06-12得票数 0

0回答

QnA maker版本控制

botframework、chatbot、azure-language-understanding、qnamaker

我希望使用QnA maker来简化我的聊天机器人的简单问答功能，并将LUIS用于更复杂的意图，如从需要更多上下文的问题的句子中提取实体。我知道可以从QnA maker下载tsv格式的知识库，据我所知，您只能发布到1个端点

浏览 8提问于2017-12-13得票数 3

1回答

spaCy只能链接指定的实体吗？

python、spacy、wikipedia、wikidata、entity-linking

去他的Nyquil<code>E 210</code>，得到辛辣的<code>e 111/code>和服 soondubu。 [('Tofu', 'PERSON', 'Q177378

浏览 8提问于2020-03-23得票数 0

回答已采纳

3回答

查找网页的主题

web、web-scraping、rdf、ontology

我感兴趣的是找到随机网页的主题或主题，并将其链接到RDF数据库(如dbpedia )中的实体。我想知道是否有工具/库可以做到这一点，或者以前是否有人尝试过这样做？

浏览 0提问于2012-02-16得票数 2

回答已采纳

2回答

Grakn:我如何从文本集合中构建知识图谱？

vaticle-typedb

我的笔记本里有几个文档(pdf和txt)，我想用Grakn构建一个知识图谱。我通过谷歌找到了blog，但没有文档或自述文件教我如何做到这一点。也写在博客“可以在我们的GitHub repo here上找到挖掘文本的脚本”，但我不能理解我必须做的事情。这里有人能建议我如何使用Grakn从文本构建知识图谱吗？

浏览 25提问于2020-03-26得票数 6

1回答

从西班牙语文本文件中提取NER

nlp、information-retrieval

我正在尝试从西班牙语文本文件中提取各种命名实体。我试过使用nltk，但没有成功。我在nltk 3.x中使用Python 2。

浏览 0提问于2017-11-17得票数 1

回答已采纳

1回答

Azure QnA显示facebook聊天的URL

azure、facebook、chatbot、qnamaker

在确保完成了对QnA聊天机器人的培训之后，我在QnA网站上测试了它，下面是它的样子：然而，当我在facebook上创建聊天机器人应用程序并对其进行测试时，情况如下：是否有一种方法可以将链接嵌入到word中，与嵌入在QnA中的方式相同，而不使url出现。插入图像也是一样的。

浏览 5提问于2020-07-09得票数 1

回答已采纳

1回答

如何将JSON列中的数据直接从数据库中提取到pandas数据帧中

python、python-3.x、pandas、data-science

大家好，我是Python中的Pandas新手，我正在尝试从数据库中的特定表中提取JSON数据。有人能帮我建立数据框架来提取所需的数据吗？我需要从上面的数据在单独的

浏览 9提问于2018-02-13得票数 0

1回答

在freebase中未通过其mid找到实体名称

freebase

我们正在做一个用知识库回答问题的研究项目。我们采用了数据集SimpleQuestions ()。我们将最新的freebase数据转储加载到Virtuoso中，并通过mids (使用关系type.object.name和common.topic.alias)查询实体的名称。但是，许多实体的名称都无法找到。我们还使用Sempre ()提供的知识库，在那里我们可以找到更多实体<

浏览 13提问于2016-12-20得票数 4

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云