是否有可能检索spaCy IOB转换器生成的JSON中的整个句子？

、、、

在执行了将IOB格式的数据转换为兼容spaCy的JSON的步骤后，应该表示句子的值"raw": string在我的JSON中显示为"null“。--lang fr 最后，在output中，我得到以下JSON，但没有"raw"值： [ "id":0, "para

浏览 25提问于2021-05-04得票数 1

回答已采纳

1回答

将自定义数据转换为spacy ner格式

我正在使用flair训练一个自定义的NER模型，但我也想尝试spacy，但我的数据当前采用这种格式1320160208478 B-NUMR ORyan B-PERDsouza B-PER 关于如何将其格式化为spacy NER格式，有什么建议吗？

浏览 42提问于2019-08-19得票数 0

回答已采纳

1回答

Spacy中的顺序/上下文感知文档/句子向量

、、、、

我想用句子做一些有监督的二进制分类任务，并且一直在使用spaCy，因为它易于使用。我使用spaCy将文本转换为向量，然后将向量提供给机器学习模型(例如XGBoost)来执行分类。在spaCy中，很容易加载 (例如BERT / Roberta / XLNet)来将单词/句子转换为nlp对象。然而，直接调用对象的向量将到令牌向量的平均值。这里有两个问题： 1)我们能做得比简

浏览 17提问于2020-05-06得票数 0

3回答

对于已经标记化的输入，可以使用spacy吗？

、、

我有一个句子已经被标记成文字了。我想得到句子中每个单词的词性标记部分。当我检查SpaCy中的文档时，我意识到它从原始句子开始。我不想这样做，因为在这种情况下，spacy可能会以不同的标记结束。因此，我想知道是否可以在单词列表(而不是字符串)中使用spaCy？下面是我的问题的一个例子： # I know that

浏览 0提问于2018-12-03得票数 9

回答已采纳

1回答

斯坦福核心NLP树分析器句子限制错误-建议？

、、

我正在处理德国法律文件，我想为句子生成解析树。我可以找到并使用斯坦福。然而，在分析文档的句子时，它没有其他工具(例如spaCy)更好地识别句子限制。例如，它会打断每一个‘.’-字符，包括。缩略语末尾的圆点，如“包括.”)因为对于创建语法树来说，涵盖整个句子是至关重要的，所以这一点对我来说并不是很有效。我希望有任何建议来解决这个问题，尤其是指向可能更适合我的问题<

浏览 3提问于2021-02-16得票数 0

回答已采纳

1回答

是否有可能找到spaCy POS机标签的不确定性？

、、、

我正在尝试构建一个非英语拼写检查器，它依赖于spaCy对句子的分类，这使得我的算法可以使用词性标签和单个标记的语法依赖性来确定拼写错误(在我的例子中，更具体地说:荷兰语复合词中的错误拆分)。正因为如此，我想知道是否有可能获得spaCy分类的不确定性，从而可以判断spaCy是否正在努力处理一个句子</em

浏览 0提问于2020-12-09得票数 4

1回答

用于神经机器翻译的转换器:能在一次前传中预测目标句子中的每个单词吗？

、、、

我想复制注意是你所需要的中的PyTorch文件中的转换器。我的问题是关于变压器的解码器分支。如果我正确地理解了原语中的句子和目标语言中的部分/不完整翻译，转换器将负责预测翻译中的下一个标记。因此，在这个例子中，编码器将处理“我爱吃巧克力”这句话，解码器将处理部分翻译"Yo comer“，最后

浏览 0提问于2019-06-30得票数 0

1回答

为什么spacy不能在下面的代码中区分两个同形符号？

、、、、

我试图通过对每个文档的每个单词向量进行求和来比较文档之间的差异，最后找出余弦相似度。例如，如果spacy向量对上面列出的两个‘铅’具有相同的向量，那么结果可能会很糟糕。在下面的代码中，为什么两个'bank'令牌之间的相似性是1.00？import spacy str1 = 'The guy went inside the

浏览 0提问于2018-11-09得票数 0

2回答

查找一个单词是否位于两个spaCy实体的依赖路径上

、、、、

我正在处理一个nlp问题，给出了一个包含两个实体的句子，我需要为每个单词生成布尔值，如果它位于这些实体之间的依赖路径上。例如： -If您试图帮助我(首先谢谢)，不要考虑使用< e1 >和< e2 >的xml

浏览 0提问于2018-07-09得票数 2

回答已采纳

1回答

是否有可能在spaCy中排除某些POS机标签？Python

、、

我想通过在动词前加一个“X”来标记动词在句子中的位置。我的函数执行以下步骤来实现这一点。找到动词。我使用spaCy进行POS机标记。SpaCy输出一个词性标签列表，我称之为pos，其中句子中的每个单词都表示为一个标签。将句子也转换为列表L。确定词性列表中动词标记(例如"VBZ")的索引x。将所需的X标记插入到句子列表

浏览 45提问于2018-06-03得票数 2

回答已采纳

1回答

我有一个JavaScript前端和python后端的web应用程序。用户编写一个短语，单击一个按钮，python解析句子(自然语言处理)，然后将数据发送回客户端。我使用SpaCy进行自然语言处理。加载SpaCy需要很长时间，所以我想知道在启动服务器时是否可以在NodeJS中预加载SpaCy (而不是每次生成python文件时都导入SpaCy -这就是我现在所做的，参见下面的代码)。谢谢!FILE C

浏览 26提问于2021-07-14得票数 0

回答已采纳

2回答

如何利用AI/ML/NLP提取句子中单词之间的关系

、、、

让我们举一个例子：在所有的三句话中，我想分别摘取被监视的东西(坏的、死的、死的)。我应该用什么方法来实现这一点呢？

浏览 0提问于2021-01-13得票数 0

2回答

未持久化到磁盘

、、

使用spacy==2.3.0，我通过API为响应提供服务，因此需要持久化管道和自定义令牌，以便在服务器停机和备份时状态保持不变。我发现，通过、nlp.to_disk()或 ()，这些词都不会被写出，因此，当我重新加载API服务器时，我的预测就会改变。示例：print(len(nlp.vocab)) # 478print(len(nlp.vocab，并得到了相同的结果。

浏览 7提问于2021-03-10得票数 0

1回答

Spacy代码没有正确识别与培训数据相关的注释。

、

脲酶#测试使用Doc2x.导入的数据 MrB预计MrX将负责以最高标准拥有客户数据。CompanyA是CompanyB的附属公司。MrAsells是他保证至少一年的产品，并希

浏览 2提问于2021-06-27得票数 2

1回答

NER:为Spacy* v3定义列车数据*

、、、

我真的需要一些帮助为spacy创建培训数据。我尝试了很多方法来创建spacy的培训数据。我从一个词和实体的csv开始，将它们转换为单词和实体的列表，将单词放在句子的列表中，将标记放在每个句子的标签列表中。然后，我将它们转换为json格式。我现在有了多个版本的json文件，我想将它们转换成新的.spacy格式。但

浏览 2提问于2021-05-03得票数 0

1回答

如果BERT的[CLS]可以针对各种句子分类目标进行再培训，那么[SEP]呢？

、、

在BERT预训练中，CLS标记被嵌入到负责下一个句子预测任务(或者，在某些BERT变体中，与其他任务，如ALBERT的句子顺序预测)的分类器的输入中；这有助于对整个转换器进行预训练，也有助于使CLS位置随时可用于重新训练到其他“句子尺度”任务。我想知道SEP是否也可以用同样的方式进行再培训。虽然CLS可能更容易重新训练，因为transformer

浏览 26提问于2020-02-24得票数 1

回答已采纳

4回答

从完整句子自动生成意图和实体

、

例如，对于一个简单的餐馆聊天机器人，训练文件data.json可能包含 "text": "central indian restaurant",Sample Input: Is there any central Indian restaurant?Sample Output: The above data.json为了更

浏览 1提问于2018-05-14得票数 2

2回答

有什么办法可以用白兰素标签吗？

、

我是spaCy的新手，目前正在尝试使用spaCy英语大模型从句子中识别人如果我说“亚历克斯在吃苹果”。它将成功地返回亚历克斯是一个人例如，太阳锯蜜蜂正在吃苹果或亚历山德罗很快就开始吃苹果了。我想知道是否有类似白名单添加“太阳锯蜜蜂”或“亚历山德罗”作为一个人，没有再培训s

浏览 4提问于2020-07-21得票数 0

回答已采纳

3回答

NLP反向标记(从标记到格式良好的句子)

、、

Python的Spacy包有一个统计标记器，可以智能地将一个句子拆分成标记。我的问题是，是否有一个包允许我返回，即从标记列表到格式良好的句子？它可能需要某种统计/基于规则的程序，以了解间隔、大写或缩略语应该如何在一个恰当的句子中工作。

浏览 2提问于2017-05-24得票数 11

回答已采纳

1回答

python spacy语句分词器

、、

我想用spacy把文章中的句子去掉。This is another sentence.") print(sent.text)你会怎么做？

浏览 1提问于2020-09-23得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

将自定义数据转换为spacy ner格式

Spacy中的顺序/上下文感知文档/句子向量

对于已经标记化的输入，可以使用spacy吗？

斯坦福核心NLP树分析器句子限制错误-建议？

是否有可能找到spaCy POS机标签的不确定性？

用于神经机器翻译的转换器:能在一次前传中预测目标句子中的每个单词吗？

为什么spacy不能在下面的代码中区分两个同形符号？

查找一个单词是否位于两个spaCy实体的依赖路径上

是否有可能在spaCy中排除某些POS机标签？Python

Nodejs预加载python库

如何利用AI/ML/NLP提取句子中单词之间的关系

未持久化到磁盘

Spacy代码没有正确识别与培训数据相关的注释。

NER:为Spacy* v3定义列车数据*

如果BERT的[CLS]可以针对各种句子分类目标进行再培训，那么[SEP]呢？

从完整句子自动生成意图和实体

有什么办法可以用白兰素标签吗？

NLP反向标记(从标记到格式良好的句子)

python spacy语句分词器

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐