腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(9999+)
视频
沙龙
1
回答
使用
Python
中
的
知识库
从
文本
中
提取
实体
nlp
、
dbpedia
、
freebase
、
wikidata
、
named-entity-extraction
我有一个
实体
提取
任务,需要像维基数据,freebase,DBpedia
的
知识库
。考虑到它们
的
巨大规模,很难
从
它们中下载和
提取
实体
。有没有一个
python
客户端可以进行API调用,以非结构化
文本
作为输入来获取
提取
结果?
浏览 23
提问于2019-10-17
得票数 0
1
回答
如何执行
实体
链接到本地知识图?
nlp
、
named-entity-recognition
、
named-entity-extraction
、
entity-linking
我正在从零开始建立我自己
的
知识库
,
使用
在线文章。 我正试图将我刮过
的
SPO三元组(主题和潜在对象)
中
的
实体
映射到我自己
的
实体
记录
中
,这些
实体
由我
从
其他网站上刮来
的
上市公司组成。我已经研究了大部分图书馆,方法主要是将
实体
映射到大型
知识库
,如Wikipedia、YAGO等,但我不太清楚如何将这些技术应用到我自己
的
<
浏览 2
提问于2018-08-27
得票数 2
2
回答
长而非结构化文档
的
信息
提取
/语义搜索
nlp
、
text-mining
、
information-retrieval
、
named-entity-recognition
我被一项特殊
的
信息
提取
任务困住了。我有几百,长(5-35页) pdf,文档和docx项目文档,我试图从中
提取
特定
的
信息,并将它们存储在一个结构化
的
数据库
中
。最终目标是
提取
和存储信息,以便我们能够查询这些文件和任何新传入
的
文档以获得快速可靠
的
信息。例如,我想从
知识库
中
查询一个
实体
的
组合,然后
从
文档
中
返回n个最相关
的</em
浏览 0
提问于2019-10-15
得票数 1
1
回答
如何确定两个
实体
之间
的
关系时,有多个关系,同时创建远程监督培训数据?
nlp
、
information-extraction
我有远程监督
的
概念。据我所知,培训数据
的
创建过程类似于; 我对这一步感到困惑。如果这两个
实体
(e1和e2)之间有多个关系呢?如果是的话,我应该选择哪种关系?
浏览 5
提问于2019-12-02
得票数 1
回答已采纳
1
回答
实体
链接与混叠
nlp
、
entity-linking
在
知识库
(KB)
中
查找
文本
中
给定
的
关键字所指
的
实体
的
过程称为
实体
链接。我有相反
的
问题。我有一个
实体
在我
的
知识库
(KB),我想找到所有的方式,人们可能会参考这个
实体
。还是在文学中有一个更好
的
名字? 我想找到正确
的
关键词将帮助我找到相关
的
研究。
浏览 0
提问于2020-12-21
得票数 1
回答已采纳
1
回答
用于分类具有特定主题
的
单词列表
的
NLP算法
python
、
nlp
、
algorithms
、
topic-model
目前,我正在
使用
LDA将主题建模应用于一个语料库。由于LDA是无监督
的
,因此它返回给定
的
“主题”
的
一组单词,但不一定指定主题本身。我想知道是否有任何关于算法
的
建议,这些算法可以列出一个单词列表,并看到它可以分类到哪些主题?['game', 'week', 'fantasy', 'sportsline', '
浏览 0
提问于2018-11-09
得票数 5
回答已采纳
1
回答
远程监管:一种基于规则
的
标签方法?
machine-learning
、
nlp
、
data-science
、
named-entity-recognition
我目前正在从事
实体
关系方面的工作,我发现很多文件都实施了远程监督来标注数据。我对远程监督
的
理解是,我们有一个已建立
的
知识库
( KB ),我们通过检查
提取
的
实体
对是否存在于
知识库
中
来进行某种“基于规则
的
标记”。如果
实体
对存在于KB
中
,则它将被标记为正,否则将被标记为负值。我
的
问题是: 如果是的话,我不明
浏览 3
提问于2019-10-18
得票数 1
回答已采纳
1
回答
尝试将Drools与hibernate连接起来
hibernate
、
drools
我正在
使用
我
的
项目中
的
Drools,我正在尝试将
知识库
连接到Hibernate,以便
从
数据库中
提取
事实。然而,我不太明白如何创建
知识库
:在创建
知识库
时,我应该创建hibernate会话吗?还是在DRL文件
中
?你能帮我把hibernate和drools连接起来吗?谢谢
浏览 1
提问于2015-04-13
得票数 0
1
回答
身份文档
中
的
命名
实体
识别
python
、
entity
、
extraction
、
named-entity-recognition
我正在尝试对驾照等文档
中
的
文本
执行命名
实体
识别(NER)。我们已经
从
文档中
提取
了
文本
。我们
的
目标是找出哪些
文本
是名称、地址、国家、文件编号等。用于NER
的
python
库NLTK和Spacy不起作用,因为没有句子来理解上下文。训练NLTK/Spacy是否有效?正则表达式模式匹配在
实体
提取
方面有多好? 下面是
提取
实体
<em
浏览 16
提问于2019-04-10
得票数 0
29
回答
使用
Python
从
HTML文件中
提取
文本
python
、
html
、
text
、
html-content-extraction
我想用
Python
从
HTML文件中
提取
文本
。我想要
的
输出基本上与
从
浏览器复制
文本
并将其粘贴到记事本
中
得到
的
输出相同。我想要一些比
使用
正则表达式更健壮
的
东西,因为正则表达式在格式不佳
的
HTML上可能会失败。我看到很多人推荐Beautiful Soup,但我在
使用
它时遇到了一些问题。首先,它会拾取不需要
的
文本
,比如JavaScrip
浏览 447
提问于2008-11-30
得票数 282
回答已采纳
1
回答
我如何
使用
沃森AlchemyAPI来训练API?
ibm-watson
、
alchemyapi
我试图
从
文本
输入
中
找出
实体
。如果有任何选择来训练炼金术。这样我就可以根据我
的
需要修改
实体
。
浏览 4
提问于2016-04-03
得票数 0
回答已采纳
1
回答
半结构化
文本
中信息检索
的
度量学习?
parsing
、
machine-learning
、
information-retrieval
、
information-extraction
我对解析半结构化
文本
很感兴趣。假设我有一个带有标签
的
文本
:year_field、year_value、identity_field、identity_value、...这些字段及其关联值可以在
文本
中
的
任何地方出现,但通常它们彼此接近,更一般地,
文本
以(非常)粗略
的
矩阵组织,但更常见
的
情况是,这些值恰好位于关联字段之后,并最终在其间包含一些不感兴趣
的
信息。不同格式
的
数量可以达到几十种,并且不是那么严格
浏览 5
提问于2015-06-12
得票数 0
0
回答
QnA maker版本控制
botframework
、
chatbot
、
azure-language-understanding
、
qnamaker
我希望
使用
QnA maker来简化我
的
聊天机器人
的
简单问答功能,并将LUIS用于更复杂
的
意图,如从需要更多上下文
的
问题
的
句子中
提取
实体
。我知道可以
从
QnA maker下载tsv格式
的
知识库
,据我所知,您只能发布到1个端点
浏览 8
提问于2017-12-13
得票数 3
1
回答
spaCy只能链接指定
的
实体
吗?
python
、
spacy
、
wikipedia
、
wikidata
、
entity-linking
去他
的
Nyquil<code>E 210</code>,得到辛辣
的
<code>e 111/code>和服 soondubu。 [('Tofu', 'PERSON', 'Q177378
浏览 8
提问于2020-03-23
得票数 0
回答已采纳
3
回答
查找网页
的
主题
web
、
web-scraping
、
rdf
、
ontology
我感兴趣
的
是找到随机网页
的
主题或主题,并将其链接到RDF数据库(如dbpedia )
中
的
实体
。我想知道是否有工具/库可以做到这一点,或者以前是否有人尝试过这样做?
浏览 0
提问于2012-02-16
得票数 2
回答已采纳
2
回答
Grakn:我如何
从
文本
集合
中
构建知识图谱?
vaticle-typedb
我
的
笔记本里有几个文档(pdf和txt),我想用Grakn构建一个知识图谱。 我通过谷歌找到了blog,但没有文档或自述文件教我如何做到这一点。也写在博客“可以在我们
的
GitHub repo here上找到挖掘
文本
的
脚本”,但我不能理解我必须做
的
事情。 这里有人能建议我如何
使用
Grakn
从
文本
构建知识图谱吗?
浏览 25
提问于2020-03-26
得票数 6
1
回答
从
西班牙语
文本
文件中
提取
NER
nlp
、
information-retrieval
我正在尝试
从
西班牙语
文本
文件中
提取
各种命名
实体
。我试过
使用
nltk,但没有成功。我在nltk 3.x中
使用
Python
2。
浏览 0
提问于2017-11-17
得票数 1
回答已采纳
1
回答
Azure QnA显示facebook聊天
的
URL
azure
、
facebook
、
chatbot
、
qnamaker
在确保完成了对QnA聊天机器人
的
培训之后,我在QnA网站上测试了它,下面是它
的
样子: 然而,当我在facebook上创建聊天机器人应用程序并对其进行测试时,情况如下: 是否有一种方法可以将链接嵌入到word
中
,与嵌入在QnA
中
的
方式相同,而不使url出现。插入图像也是一样
的
。
浏览 5
提问于2020-07-09
得票数 1
回答已采纳
1
回答
如何将JSON列
中
的
数据直接
从
数据库中
提取
到pandas数据帧
中
python
、
python-3.x
、
pandas
、
data-science
大家好,我是
Python
中
的
Pandas新手,我正在尝试
从
数据库
中
的
特定表中
提取
JSON数据。有人能帮我建立数据框架来
提取
所需
的
数据吗?我需要从上面的数据在单独
的
浏览 9
提问于2018-02-13
得票数 0
1
回答
在freebase
中
未通过其mid找到
实体
名称
freebase
我们正在做一个用
知识库
回答问题
的
研究项目。我们采用了数据集SimpleQuestions ()。我们将最新
的
freebase数据转储加载到Virtuoso
中
,并通过mids (
使用
关系type.object.name和common.topic.alias)查询
实体
的
名称。但是,许多
实体
的
名称都无法找到。 我们还
使用
Sempre ()提供
的
知识库
,在那里我们可以找到更多
实体<
浏览 13
提问于2016-12-20
得票数 4
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
如何使用Python从列表中删除指定的元素
让机器认知中文实体—复旦大学知识工场发布中文实体识别与链接服务
Python文本预处理:步骤、使用工具及示例
实用Python文本预处理代码
如何使用 Python 库来进行自然语言处理
热门
标签
更多标签
云服务器
ICP备案
实时音视频
即时通信 IM
对象存储
活动推荐
运营活动
广告
关闭
领券