使用SpaCy解析句子的更好方法？

、、

我正在使用SpaCy查找包含'is‘或'was’的句子，这些句子的主语是代词，并返回句子的宾语。我的代码可以工作，但我觉得一定有更好的方法来做到这一点。import spacy ex_phrase = nlp("He was

浏览 37提问于2019-07-11得票数 0

2回答

从SpaCy中删除一个span中的单词？

、、

我正在用Spacy解析一个句子，如下所示：nlp = spacy.load("en")del span[3] 这是一些。如果没有SpaCy的其他一些方法</

浏览 1提问于2018-09-05得票数 11

1回答

Spacy中的顺序/上下文感知文档/句子向量

、、、、

我想用句子做一些有监督的二进制分类任务，并且一直在使用spaCy，因为它易于使用。我使用spaCy将文本转换为向量，然后将向量提供给机器学习模型(例如XGBoost)来执行分类。在spaCy中，很容易加载 (例如BERT / Roberta / XLNet)来将单词/句子转换为nlp对象。然而，直接调用对象的向量将到令牌向量的平均值。这里有两个问题： 1)我们能做得比简

浏览 17提问于2020-05-06得票数 0

1回答

将空间生成的依赖项转换为CoNLL格式不能处理多个根？

、、、

我使用SpaCy库生成依赖项，并使用以下代码将其保存为CoNLL格式。import pandas as pddf1['tweet'] =但我的数据集中有一些句子被Spacy一分为二，因为它们有两个词根。这导致CoNLL格式中的一句话有两个字段。示例:我的

浏览 16提问于2019-09-04得票数 2

回答已采纳

1回答

python中的子句提取/长句切分

、、、、

我目前正在做一个涉及句子向量的项目(来自RoBERTa预训练模型)。当句子很长时，这些向量的质量较低，并且我的语料库包含许多带子句的长句。我一直在寻找从句提取/长句分割的方法，但我惊讶地发现，没有一个主要的NLP包(例如spacy或stanza)提供这种开箱即用的功能。我认为这可以通过使用spacy或stanza的依赖关系解析<

浏览 48提问于2020-12-10得票数 3

2回答

在使用SpaCy方法时，是否有一种简单的方法可以让.similarity忽略停止词？

、、

所以现在，我有一个非常简单的程序，它将取一个句子，然后在一本书中找到这个句子，这个句子在语义上是最相似的，然后把这个句子和接下来的几个句子一起打印出来。在执行这个过程时忽略停止词来获得更好的结果，但是我不知道最好的方法。== 'False':但是，我必须使它比上面的代码更复杂，因为我必须保持原来句子</e

浏览 0提问于2018-10-14得票数 3

回答已采纳

1回答

如何限制Spacy使用的CPU数量？

如何限制Spacy使用的CPU数量？我想从大量句子中提取词性部分和命名实体。由于RAM方面的限制，我首先使用Python将文档解析为句子。然后，我遍历我的句子，并使用nlp.pipe()进行提取。然而，当我这样做时，Spacy消耗了我的整个计算机；Spacy使用所有可用的CPU。这样不好，因为我的电脑是共享<

浏览 2提问于2018-05-25得票数 9

回答已采纳

3回答

如何找到两个文档之间的相似度

、

我曾尝试使用spacy的相似度函数来获取文档中的最佳匹配句子。然而，它失败了，因为它认为每个项目符号是一个句子，项目符号是不完整的句子(例如句子1“密码应该是最小的8个字符的长度，句子2的形式是一个项目符号”8个字符“)。它不知道它是指密码，所以我的相似度很低。

浏览 24提问于2019-04-12得票数 0

2回答

分文造句NLTK vs spaCy

、、、、

我想把课文分成句子。查看堆栈溢出时，我发现：使用NLTK from nltk.tokenize import sent_tokenizetokenized_text=sent_tokenize(text) print(tokenized_text) 使用SPACY fromspacy.lang.en import English # u

浏览 30提问于2019-06-02得票数 2

回答已采纳

1回答

用SpaCy从德语句子中提取主句和分句

、、

在德语中，如何从带有SpaCy的句子中提取主子句和子子句(又称“从属子句”、“从属子句”)？我知道如何使用SpaCy的标记器、词性标记和依赖解析器，但我不知道如何使用SpaCy可以提取的信息来表示德语的语法规则。

浏览 5提问于2020-09-24得票数 3

回答已采纳

1回答

预期str实例，spacy.tokens.token.Token找到

、、

为了对我的数据进行预处理和标记，我同时使用了spacy英语和德语标记器，因为句子都是用这两种语言的。这是我的密码：from spacy.lang.de import Germanfrom spacy.lang.de= '-PRON-' else word for word in tokens]

浏览 4提问于2020-04-17得票数 0

1回答

斯坦福核心NLP树分析器句子限制错误-建议？

、、

我正在处理德国法律文件，我想为句子生成解析树。我可以找到并使用斯坦福。然而，在分析文档的句子时，它没有其他工具(例如spaCy)更好地识别句子限制。例如，它会打断每一个‘.’-字符，包括。缩略语末尾的圆点，如“包括.”)因为对于创建语法树来说，涵盖整个句子是至关重要的，所以这一点对我来说并不是很有效。我希望有任何建议来解决这个问题，尤其是指向可能更适合我的问题的

浏览 3提问于2021-02-16得票数 0

回答已采纳

1回答

如何在spacy中表示一个未知/空白的单词？

、、、

我正在处理来自音频文本的文本，其中有一些未知的单词。每个未知词都有标记(例如“商店不认识他”)。我正在寻找表示“未知”单词的最佳方法，以便最大限度地减少spacy句子依存分析的混乱。什么是最好的替代品，以增加spacy的句子依存解析器在最广泛的句子范围内工作得最好的几率？是空格/‘’或'___‘或'

浏览 12提问于2019-08-02得票数 2

回答已采纳

1回答

如何在python中将句子拆分成分句？

、、、

我试着把句子分成小句，以便进行情感分析。举个例子，我想改句“我喜欢情节，但演技很恐怖”。写成“我喜欢情节”，“但是演技很恐怖。”另一种方法是使用spacy包并找到根动词作为下面的链接。从上面分割成分句的最好方法是什么，还是有更好的方法？

浏览 0提问于2021-08-02得票数 0

回答已采纳

1回答

基本NLP/逻辑解析示例的术语

、、、、

鉴于以下条款：下面的树是否是此表的正确表示？此外，在解析中通常调用以下四个元素：female -- (variable name?) NOT -- (inversion?

浏览 3提问于2020-03-19得票数 1

回答已采纳

2回答

spaCy 3.4句段排列在没有标点符号的短语上表现不佳

、、

我试图使用spaCy的四种选择中的两种来进行句子切分，它们在没有标点符号的短语上的表现似乎都同样糟糕。我正在尝试使用这样的解决方案，这些解决方案的文本范围是混合的，而不是数字化的(说话人的对话)。我的目标是识别句子的边界，我认为语言解析功能可以很好地将短语分解成单个的

浏览 24提问于2022-11-27得票数 0

1回答

Spacy NLP:对于可以是动词的专有名词-根据输入顺序的歧义和基于标点符号的拆分

、

我正在使用spacy NLP。任何解析器都不能总是正确地确定模糊标记的PROPN/名词/动词状态，因为在大多数语言中，拼写相同的单词可能具有不同的含义。Spacy有时会以不同的方式识别相同的拼写单词，即使在类似的情况下也是如此：是标点符号吗( "="?)导致这一切的原因吗？我期望标记作为动词或名词的识别的连续性，但不会改变。我理解使用</em

浏览 16提问于2019-11-07得票数 2

2回答

如何利用AI/ML/NLP提取句子中单词之间的关系

、、、

让我们举一个例子：在所有的三句话中，我想分别摘取被监视的东西(坏的、死的、死的)。我应该用什么方法来实现这一点呢？

浏览 0提问于2021-01-13得票数 0

1回答

如何将带注释的数据集拆分成句子

、

我有一个spacy 2格式的数据集，如下所示我的数据集的序列长度大于512，正在尝试迁移到拥抱脸，所以想同时将文档拆分成句子，还需要更新标记，是否有任何工具可用于我的预期结果，如下图所示 td =

浏览 1提问于2021-08-05得票数 0

1回答

如何使用spaCy对多个句子的实体进行预测？

、、

我用spaCy训练了一个ner模型。我知道如何使用它来识别单个句子的实体(doc对象)并可视化结果：spacy.displacy.render(doc, style="ent", jupyter=True)for ent in doc.ents:现在我要预测多个这样句子的

浏览 7提问于2022-09-30得票数 1

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

从SpaCy中删除一个span中的单词？

Spacy中的顺序/上下文感知文档/句子向量

将空间生成的依赖项转换为CoNLL格式不能处理多个根？

python中的子句提取/长句切分

在使用SpaCy方法时，是否有一种简单的方法可以让.similarity忽略停止词？

如何限制Spacy使用的CPU数量？

如何找到两个文档之间的相似度

分文造句NLTK vs spaCy

用SpaCy从德语句子中提取主句和分句

预期str实例，spacy.tokens.token.Token找到

斯坦福核心NLP树分析器句子限制错误-建议？

如何在spacy中表示一个未知/空白的单词？

如何在python中将句子拆分成分句？

基本NLP/逻辑解析示例的术语

spaCy 3.4句段排列在没有标点符号的短语上表现不佳

Spacy NLP:对于可以是动词的专有名词-根据输入顺序的歧义和基于标点符号的拆分

如何利用AI/ML/NLP提取句子中单词之间的关系

如何将带注释的数据集拆分成句子

如何使用spaCy对多个句子的实体进行预测？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐