Spacy引理与'English‘class和en_core_web_sm的不同结果 - 腾讯云开发者社区

python、spacy

我想知道为什么我从这两种语言模型: spacy.lang.en.English和en_core_web_sm中得到了不同的词法分析结果。根据文档，当加载en_core_web_sm模型时，这应该告诉spacy使用语言"en“并初始化spacy.lang.en.English，所以我不明白为什么词汇化规则会改变。我如何才能从英文模型中获取词条，而从en_core_web_sm中获取标签和词法呢？ from spacy.lang.en import English nlp = English() doc = nlp('nonlinearities') print(

浏览 21提问于2019-06-07得票数 0

回答已采纳

1回答

在“en_core_web_sm”模型中，柠檬化可能不能正常工作。

r、spacy

我不知道为什么我会收到这样的警告：柠檬化在“en_core_web_sm”模型中可能不能正常工作根据网页上的说明，我已经定制了Spacy的安装： conda install -c conda-forge spacy conda install -c conda-forge spacy-lookups-data python -m spacy download en_core_web_sm 并在R中初始化如下： spacy_initialize(condaenv = "C:/Users/.../AppData/Local/Continuum/anaconda3/envs/r-

浏览 2提问于2020-03-04得票数 0

14回答

ImportError:没有名为“spacy.en”的模块

python、spacy

我正在开发一个使用Spacy的代码库。我使用以下方法安装了spacy： sudo pip3 install spacy 然后 sudo python3 -m spacy download en 在最后一条命令的末尾，我收到了一条消息： Linking successful /home/rayabhik/.local/lib/python3.5/site-packages/en_core_web_sm --> /home/rayabhik/.local/lib/python3.5/site-packages/spacy/data/en You can now load the m

浏览 2提问于2017-11-14得票数 53

回答已采纳

1回答

如何使用NLP库使复合词单数化？

python、python-3.x、nlp、spacy

问题我试着用把复数词单数化。但是，我无法修正将复数转换为单数作为复合词的错误。我怎样才能得到像下面这样的首选输出？ cute dog two or three word the christmas day 发展环境 Python 3.9.1 错误 print(str(nlp(word).lemma_)) AttributeError: 'spacy.tokens.doc.Doc' object has no attribute 'lemma_' 代码 import spacy nlp = spacy.load("en_core_web_sm

浏览 1提问于2021-04-27得票数 1

回答已采纳

2回答

在uint8上以字符串的形式获取令牌的空间

python、spacy

我想知道是否有一种方法可以以字符串的形式使用tokenizer(s).to_array("LOWERCASE")，而不是使用uint8格式。 from spacy.lang.en import English from spacy.tokenizer import Tokenizer s = "Lets pray for the people that can be the victim of the possible eruption of Taal Volcano keep safe everyone." # Create nlp obj nlp =

浏览 2提问于2021-06-02得票数 3

回答已采纳

1回答

空白模型与预训练模型在空间上的区别

python、spacy、text-classification

目前，我正试图使用spacy来训练文本分类器，我遇到了以下问题:使用spacy.blank('en')创建空白模型与使用经过预先训练的模型spacy.load('en_core_web_sm')有什么区别。为了了解我编写的代码的不同之处： text = "hello everyone, it's a wonderful day today" nlp1 = spacy.load('en_core_web_sm') for token in nlp1(text): print(token.text, token.le

浏览 2提问于2020-03-27得票数 3

回答已采纳

1回答

喷雾狐猴问题/一致性

python、spacy、lemmatization

我目前正在使用spaCy来实现NLP (主要是柠檬化和标记化)。所使用的模型是web (2.1.0)。运行以下代码从查询中检索单词“已清除”的列表 import spacy nlp = spacy.load("en_core_web_sm") doc = nlp(query) list_words = [] for token in doc: if token.text != ' ': list_words.append(token.lemma_) 但是，在运行此代码时，我面临一个主要问题。例如，当查询是“处理茶叶”时。存储在list_

浏览 3提问于2019-04-26得票数 0

回答已采纳

1回答

如何解决Spacy POS属性E1005错误

python、error-handling、spacy

我能够安装spaCy并下载标准的英文版本(en_core_web_sm)。但是，通过加载标准数据模型，我收到了以下错误消息： import spacy # Load English tokenizer, tagger, parser and NER nlp = spacy.load("en_core_web_sm") ValueError: [E1005] Unable to set attribute 'POS' in tokenizer exception for ' '. Tokenizer exceptions are o

浏览 21提问于2021-05-08得票数 1

回答已采纳

1回答

如何对每个单词使用spaCy上实现的标签？

python、python-3.x、string、nlp、spacy

我想做的是我想提取的词，这是在spaCy上，自然语言操作系统的具体标签。 specific labels on spaCy 在下面的例子中，我希望打印单词English，因为选择了标签LANGUAGE。 English 问题没有用于提取每个单词上的标签的示例代码。我如何修复下面的错误？ TypeError: Argument 'string' has incorrect type (expected str, got spacy.tokens.token.Token) 当前代码 import spacy from spacy import displacy nlp =

浏览 20提问于2020-11-26得票数 0

回答已采纳

1回答

带有否定的SpaCy匹配器的意外行为

python、spacy、matcher

不知何故，我很难理解SpaCy匹配中的否定。我试过这个代码： import spacy from spacy.matcher import Matcher import json nlp = spacy.load('en_core_web_sm') #from spacy.tokenizer import Tokenizer matcher = Matcher(nlp.vocab) Sentence = "The cat is black" negative_sentence = "The cat is not black"

浏览 14提问于2022-02-12得票数 2

1回答

空间-引理数

python、keras、neural-network、spacy、lemmatization

在我用向量作为递归神经网络的输入后，我用spacy将句子中的每个单词替换成一个数字/代码。 import spacy str="basing based base" sp = spacy.load('en_core_web_sm') sentence=sp(str) for w in sentence: print(w.text,w.lemma) 在第一层神经网络中有角点，嵌入层中，我要知道查表中的最大单词数，有人知道这个数字吗？谢谢

浏览 4提问于2020-04-16得票数 0

回答已采纳

3回答

为什么spacy ner的结果是高度不可预测的？

python、nlp、spacy、named-entity-recognition

我尝试了ner的spacy，但结果是高度unpredictable.Sometimes的spacy无法识别特定的country.Can，有人能解释一下为什么会这样吗？我尝试了一些随意的句子。案例1： nlp = spacy.load("en_core_web_sm") print(nlp) sent = "hello china hello japan" doc = nlp(sent) for i in doc.ents: print(i.text," ",i.label_) output :在这种情况下没有输出。案例2： nlp = s

浏览 2提问于2019-11-03得票数 2

1回答

Python参数‘spaCy’的类型不正确(应为str，获取为DataFrame)

python、nlp、spacy

我正在尝试使用spaCy，但我收到的这个错误有问题。设置spaCy from spacy.lang.en import English parser = English() import en_core_web_sm nlp = en_core_web_sm.load() comment = data['comment'] 下面是导致错误的代码行： comment = nlp(comment)

浏览 10提问于2019-12-31得票数 2

1回答

安装scrubadub_spacy软件包后，spacy.load("en_core_web_sm")不能工作OSError：[E053]无法读取config.cfg

python、python-3.6、spacy、azure-machine-learning-service、oserror

当我试图运行下面的代码在实例中加载en_core_web_sm时，我会得到以下错误。我调试了这个问题，发现一旦我安装了scrubadub_spacy，这似乎就是导致错误的问题。 spacy.load("en_core_web_sm") OSError Traceback (most recent call last) <ipython-input-2-c6e652d70518> in <module> 1 # Load English tokenizer, tagger, p

浏览 14提问于2022-02-03得票数 2

回答已采纳

1回答

如何搜索文本中可以分隔的复合短语；在python中？

python、nlp、spacy

假设我有一个文本，并想要检查它是否包含一些复合短语，其中我还想包括各自的单词可能不会直接被彼此跟随的情况。例如，假设您想检查一条文本是否与消防队员有关，那么这样的文本 text = "currently there are over 4000 people involved in fighting the rapidly growing fires in Australia" 也会产生积极的结果。(我实际上想把它应用到德语中，那里的例子可能不那么人工) 我在NLP方面没有专业知识，所以也许有一些聪明的方法可以做到这一点，而我只是不知道该搜索哪个词是正确的。当然，如果文本不太大

浏览 0提问于2020-05-20得票数 1

回答已采纳

1回答

基于现有模型的spaCy v3训练器或在现有模型中添加自定义训练器

python、machine-learning、spacy、named-entity-recognition

在spaCy < 3.0中，我能够在经过训练的en_core_web_sm模型中训练NER组件 python -m spacy train en model training validation --base-model en_core_web_sm --pipeline "ner" -R -n 10 具体来说，我需要标记器和en_core_web_sm模型的解析器。spaCy的新版本不再使用这些命令，它们需要在配置文件中设置。根据spaCy的网站，这些组件可以与相应的源代码一起添加，然后在配置文件的培训部分插入到frozen_component (我将在这个问题的末尾

浏览 0提问于2021-02-07得票数 5

1回答

柠檬泽尔不在python spacy图书馆工作

python-3.x、chatbot

我正在尝试使用spacy库创建一个小型聊天机器人，而我使用的是柠檬化器--代码提供了不正确的输出。有人能帮帮我吗。下面是我的代码： import spacy from spacy.lang.en import English lemmatizer = English.Defaults.create_lemmatizer() nlp = spacy.load('en_core_web_sm') lemmatizer = nlp.Defaults.create_lemmatizer() lemmatizer(u'chuckles', 'Noun')

浏览 1提问于2020-08-02得票数 0

回答已采纳

1回答

如何提高Spacy结果的质量？

python-2.7、information-extraction、spacy

我已经安装了Spacy和en_core_web_sm数据。如果我尝试在随机新闻文章中提取个人信息的代码，我得到大约50%的正确数据。其余的都有问题和错误。 import spacy import io from spacy.en import English from spacy.parts_of_speech import NOUN from spacy.parts_of_speech import ADP as PREP nlp = English() ents = list(doc.ents) for entity in ents: if entity.label_ == &

浏览 4提问于2017-03-19得票数 2

1回答

求具有空格的noun_chunk的根的位置

nlp、root、spacy、chunks、lemmatization

使用空格时，您可以轻松地循环遍历文本的noun_phrases，如下所示： S='This is an example sentence that should include several parts and also make clear that studying Natural language Processing is not difficult' nlp = spacy.load('en_core_web_sm') doc = nlp(S) [chunk.text for chunk in doc.noun_chunks] # = ['

浏览 16提问于2020-06-09得票数 0

回答已采纳

1回答

如何设置spacy参数真或假？

python、token、spacy

我只想看到is_alpha是真的，is_stop是假的，最后我想存储这个单词的引理版本。谢谢您:) import spacy nlp = spacy.load("en_core_web_sm") doc = nlp("Apple is looking at buying U.K. startup for $1 billion") for token in doc: print(token.text, token.lemma_, token.pos_, token.tag_, token.dep_,token.shape_, token.is_al

浏览 8提问于2022-06-06得票数 1

1回答

spaCy词法(通过.lemma_)仅返回空字符串

python、spacy

我无法使spaCy lemmatization起作用，它总是返回空字符串。 import spacy from spacy.lang.en import English nlp = English() text = "I went to the bank today for checking my bank balance." doc = nlp(text) 这只返回空字符串： for token in doc: print(token.lemma_) 系统信息： Windows 10 Pro 64bits Python 3.8.8 spacy

浏览 37提问于2021-05-20得票数 1

回答已采纳

1回答

预期str实例，spacy.tokens.token.Token找到

python、nlp、spacy

我正在执行一个数据提取用例。为了对我的数据进行预处理和标记，我同时使用了spacy英语和德语标记器，因为句子都是用这两种语言的。这是我的密码： import spacy from spacy.lang.de import German from spacy.lang.en import English from spacy.lang.de import STOP_WORDS as stp_wrds_de from spacy.lang.en.stop_words import STOP_WORDS as stp_wrds_en import string punctuations = str

浏览 4提问于2020-04-17得票数 0

1回答

Excel列到Spacy Docu (令牌、Lemmas)

python-3.x、spacy

几天来我一直在想办法解决这个问题。但是-我正试图从excel文件中上传数据。然后删除缺少的值，并将两个文本列合并为一个。在这一点上，我有一个dataframe，它显示了大约3000行不同的客户评论。接下来，我想运行Spacy，这样我就可以进行一些依赖分析了。问题是，我总是遇到这样一种情况，即它不解析单个单词。我试过使用一种应用方法。 import pandas as pd import numpy as np import spacy from spacy import displacy nlp=spacy.load('en_core_web_sm') df = pd.re

浏览 0提问于2019-08-07得票数 0

回答已采纳

1回答

AttributeError：'English‘对象没有属性'noun_chunks’

python、python-3.x、spacy

我正在尝试使用spacy noun_chunks，但是它引发了一个错误。我用python -m spacy download en_core_web_sm下载了模型 AttributeError: 'English' object has no attribute 'noun_chunks' NLP = spacy.load('en_core_web_sm') NOUN_CHUNKS = NLP.noun_chunks

浏览 0提问于2019-02-21得票数 0

回答已采纳

1回答

ModuleNotFoundError -没有名为'en-core-web-sm‘的模块

python、module、package、spacy、pipenv

我正在尝试部署一个使用en_core_web_sm的应用程序，它是spacy的子模块。在我的代码中，我使用了import en_core_web_sm，它在本地测试时运行良好。在我的In中，我运行了pipenv spacy[en-core-web-sm]，它在Pipfile中产生了这样的结果：spacy = {extras = ["en-core-web-sm"], version = "*"}.，我尝试过多种方法将它导入到我的.py文件中，但是一直得到ModuleNotFoundError。我尝试过从en-core-web-sm、en_core_web_sm

浏览 10提问于2020-09-02得票数 0

回答已采纳

1回答

流媒体云OSError：[E053]无法读取配置文件

spacy、streamlit

我正在部署一个特别需要spaCy==3.3.1的应用程序到Streamlit，我将它添加到requirement.txt中，以及下载和安装en_core_web_sm的链接， https://github.com/explosion/spacy-models/releases/download/en_core_web_sm-2.2.0/en_core_web_sm-2.2.0.tar.gz#egg=en_core_web_sm。导入是可以的，但是当我加载模型(即nlp = spacy.load("en_core_web_sm") )时，我将得到下面的OSError： OSEr

浏览 12提问于2022-11-11得票数 1

1回答

为什么使用全路径解决找不到模型'en_core_web_sm‘的问题

python、spacy

当我尝试用以下内容从en_core_web_sm从spacy加载时： import spacy nlp = spacy.load('en_core_web_sm')get the following error: 发生下列错误： OSError: [E050] Can't find model 'en_core_web_sm'. It doesn't seem to be a Python package or a valid path to a data directory. 我使用了来自spacy.io的安装说明： pip3 install

浏览 12提问于2022-04-06得票数 0

2回答

在spaCy中使用regex :匹配各种(不同大小写)单词

python、nlp、spacy

编辑由于非主题我想使用SpaCy中的regex查找(应计或应计或年度或年度)休假的任何组合： from spacy.matcher import Matcher nlp = spacy.load('en_core_web_sm') matcher = Matcher(nlp.vocab) # Add the pattern to the matcher matcher.add('LEAVE', None, [{'TEXT': {"REGEX": "(Accrued|accrued|Annua

浏览 0提问于2019-08-20得票数 2

回答已采纳

4回答

加载spacy.load的问题(“en_core_web_md”)

python-3.x、nlp、anaconda、spacy

I已在anaconda中安装了以下软件包： spacy-model-en_core_web_md 2.2.5 spacy-model-en_core_web_sm 2.2.5 python 3.6.2 上面的软件包安装在conda中，命令如下所示： spacy=2.2.2conda conda安装-c conda-forge -c conda -c conda-forge -c conda--c conda-forge spacy-model-en_core_web_md 当我加载en_core_web_md和en_core_web_sm时，我得到如下所示的错误消息：进口en_core_w

浏览 2提问于2020-04-19得票数 1

1回答

空间模型en_core_web_sm不检测语言实体

spacy

我编写了一个小程序从文本中提取语言实体。我使用的是'en_core_web_sm‘，但它确实从下面的句子中检测到了除DATE之外的其他任何东西。从spacy 中，我可以看到“en_core_web_sm”支持语言实体。我认为thatI做了一些明显的错误。有人能指出我做错了什么吗？ nlp2 = spacy.load("en_core_web_sm") test_text = "korean chinese english spanish 2019-2-13 india america 2 years 6 months united state

浏览 3提问于2020-04-04得票数 0

2回答

如何在Spacy中找到标记相似度？

python、nlp、spacy

我正在尝试计算spacy中的标记相似度。即单词标记彼此有多近。我使用的是spacy版本2.0.5。这是我的一个简单的例子。 import spacy from spacy.lang.en import English from spacy.tokenizer import Tokenizer nlp = spacy.load('en') x = nlp(u'apple') y = nlp(u'apple') x.similarity(y) 它的回报率是-81216639937292144.0，但我原本预计是1.0。此外 x = nlp(

浏览 2提问于2017-12-12得票数 0

1回答

无法在PyCharm中使用spaCy模型

python、python-3.x、nlp、pycharm、spacy

我正尝试在PyCharm中使用spacy 'en‘模型要运行此代码： import spacy nlp= spacy.load('en') doc=nlp(u'I am trying to learn natural language processing for chatbots') for token in doc: print(token.txt,token.pos) 但是，我尝试在pycharm中执行以下命令来运行模型： "/Users/zahraaal-nemer/Desktop/University/Le

浏览 95提问于2020-11-08得票数 0

3回答

Python不拾取包含单词的标记。

python、regex、spacy

我运行在下面的简单代码中，以获得包含该单词的所有标记(例如，包含acompared、for、此法比较的单词)。但是，spaCy正则表达式不返回任何内容。正则表达式在python上很好。你能告诉我这是一个spaCy问题还是如何解决这个问题？它返回[]空列表。 import plac from spacy.lang.en import English from spacy.matcher import PhraseMatcher, Matcher from spacy.tokens import Doc, Span, Token import spacy nlp = spacy.load(

浏览 2提问于2019-07-13得票数 1

回答已采纳

2回答

如何从LanguageDetector包中使用spacy_langdetect ()？

python、spacy

我正在尝试使用spacy_langdetect包，我能找到的唯一示例代码是()： import spacy from spacy_langdetect import LanguageDetector nlp = spacy.load("en_core_web_sm") nlp.add_pipe(LanguageDetector(), name='language_detector', last=True) text = 'This is an english text.' doc = nlp(text) print(doc._.language)

浏览 9提问于2021-03-19得票数 11

回答已采纳

1回答

如何在Android Studio中包含使用spaCy的Python程序？

python、android、nlp、spacy、pos-tagger

我有一个Python程序，它使用spaCy来识别句子中的名词。这是我的程序： import spacy nlp = spacy.load('en_core_web_sm') sentence = "1 slice of english blue cheese, preferably a stilton (again, or 4 slices for 4 sandwiches)" doc = nlp(sentence) for token in doc: if token.pos_ == "NOUN":

浏览 15提问于2020-08-04得票数 0

1回答

不能进口香料

python、spacy、text-mining

我一直试图导入spacy，但每次都会出现错误。我使用这一行来安装这个包： conda install -c conda-forge spacy 然后我尝试导入spacy，它给了我这个错误： --------------------------------------------------------------------------- AttributeError Traceback (most recent call last) <ipython-input-11-76a01d9c502b> in <module&g

浏览 1提问于2021-06-08得票数 0

回答已采纳

1回答

如何计算不含spaCy停止词的名词文档的TF值？

python-3.x、list、dataframe、nlp、spacy

我有一个数据框架，df以text、cleaned_text和nouns作为列名。text和cleaned_text包含字符串文档，nouns是从cleaned_text列提取的名词列表。df.shape = (1927, 3)。我试图仅为名词计算df 中所有文档的spaCy值，不包括spaCy秒词。我试过什么？ import spacy from spacy.lang.en import English nlp = spacy.load('en_core_web_sm') # subclass to modify stop word lists recommended

浏览 1提问于2022-03-12得票数 1

2回答

Spacy is_stop不识别停止词吗？

python、nlp、spacy

当我使用SpaCy来识别停止词时，如果我使用en_core_web_lg语料库，它就不起作用了，但是当我使用en_core_web_sm时，它就起作用了。这是个窃听器，还是我做错了什么？ import spacy nlp = spacy.load('en_core_web_lg') doc = nlp(u'The cat ran over the hill and to my lap') for word in doc: print(f' {word} | {word.is_stop}') 结果： The | False cat

浏览 0提问于2018-09-10得票数 1

回答已采纳

3回答

AttributeError:模块'spacy‘没有属性'load’

python、attributes、load、attributeerror、spacy-3

import spacy nlp = spacy.load('en_core_web_sm') **Error:** Traceback (most recent call last): File "C:\Users\PavanKumar\.spyder-py3\ExcelML.py", line 27, in <module> nlp = spacy.load('en_core_web_sm') AttributeError: module 'spacy' has no attribute '

浏览 10提问于2021-05-31得票数 3

2回答

空间:找不到模型'en_core_web_sm‘。它似乎不是Python包，也不是数据目录的有效路径。

python、nlp、anaconda、conda、spacy

我正在尝试加载en_core_web_sm spaCy模型，但没有成功。发生的错误如下： OSError: [E050] Can't find model 'en_core_web_sm'. It doesn't seem to be a Python package or a valid path to a data directory. 我在Anaconda虚拟环境中工作。下面的复选框被勾选：在安装environmentThen，之前，做了conda activate gcp-env，英语语言模型运行了conda install -c conda-for

浏览 13提问于2022-06-01得票数 1

回答已采纳

1回答

空间的sre_constants.error误差en_core_web_sm

python-3.x、spacy

我已经分别安装了Spacy和en_core_web_sm，并且我试图用完整的路径加载en_core_web_sm。 import spacy import en_core_web_sm nlp = spacy.load(r'C:\Anaconda3\Lib\site-packages\en_core_web_sm\en_core_web_sm-2.0.0') doc = nlp("The big grey dog ate all of the chocolate, but fortunately he wasn't sick!") 这将导致以下错误： s

浏览 5提问于2019-12-05得票数 0

1回答

空间-找不到模型

python、spacy

跑步： import spacy nlp = spacy.load('en_core_web_sm') 结果出现以下错误： E050]找不到'en_core_web_sm‘模型。它似乎不是快捷链接、Python包或数据目录的有效路径。我该如何解决这个问题？

浏览 0提问于2018-12-01得票数 3

1回答

spacy.lang.en和load('en')有什么区别？

python、nlp、jupyter-notebook、spacy

在我关于NLP的研究中，更具体地说是spacy库，我对此感到困惑，from spacy.lang.en import English()和spacy.load('en')之间有什么区别，它是如何工作的？有人可以帮助我解释这一点，如果可能的话，用一些例子来说明这种差异？提前谢谢。

浏览 1提问于2019-10-03得票数 6

2回答

如何使用spaCy解决模型安装问题？

python、python-3.x、model、nlp、spacy

我成功地为Windows10安装了spaCy (v2.2.0)。然后我尝试安装英文版的en_core_web_sm，结果出现了以下错误消息：SyntaxError: invalid syntax。其他语言模型也不起作用。这个帖子中提出的解决方案- How to fix 'invalid syntax' for downloading spacy model -是不正确的，因为我没有使用引号。有人知道这可能是什么原因吗？使用的安装命令：pip install spacy使用的模型安装命令：python -m spacy download en_core_web_sm

浏览 23提问于2020-01-10得票数 0

回答已采纳

1回答

ModuleNotFoundError:即使spacy和python在同一条路径上，也没有名为“spacy”的模块

python、spacy、amazon-sagemaker

在我的AWS SageMaker笔记本中，我遵循了SageMaker安装指南 pip install -U pip setuptools wheel pip install -U spacy python -m spacy download en_core_web_sm 当我做import spacy时，我会出错 ModuleNotFoundError: No module named 'spacy' 我确保我的python和spacy路径是一样的我遗漏了什么？

浏览 1提问于2021-10-26得票数 2

1回答

识别语法依赖项时的spaCy奇怪行为

python-3.x、nlp、dependencies、spacy

我正在尝试使用sapCy来识别语法依赖项。我尝试了解释的相同示例。以下是我得到的结果。 import spacy nlp = spacy.load("en_core_web_sm") doc = nlp("Autonomous cars shift insurance liability toward manufacturers") for token in doc: print(token.text, token.dep_, token.head.text, token.head.pos_, [child for child

浏览 4提问于2020-08-05得票数 1

2回答

python : unpackb()得到一个意外的关键字参数'raw‘

python、spacy

我在jupyter笔记本中使用spacy进行自然语言处理，下面的代码如下。 # Import spacy import spacy # Instantiate the English model: nlp nlp = spacy.load('en') 发生下列错误 --------------------------------------------------------------------------- TypeError Traceback (most recent call last) <ip

浏览 0提问于2018-09-15得票数 6

回答已采纳

1回答

防止spaCy将段落编号拆分成句子

python、nlp、spacy、sentence

我正在使用spaCy对使用段落编号的文本进行句子分割，例如： text = '3. English law takes a dim view of stealing stuff from the shops. Some may argue that this is a pity.' 我正在尝试强制spaCy的句子分割器不要将3.拆分成它自己的句子。目前，以下代码返回三个单独的句子： nlp = spacy.load("en_core_web_sm") text = """3. English law takes a dim view

浏览 2提问于2018-11-22得票数 0

2回答

如何获得spacy模型的旧版本？

python-3.x、linux、nlp、spacy

我设法在pip3 install spacy==2.2.4上安装了一个旧版本的spacy。但是，当我使用python3 -m spacy download en_core_web_sm进行后续操作时，它会下载en_core_web_sm-2.2.5.tar.gz。

浏览 34提问于2020-07-21得票数 3

2回答

与lemma_lookup表不一致的空间引理

python、nlp、spacy、lemmatization

与在lemma_lookup表中查找单词的引理相比，在对spacy文档进行迭代并对标记进行符号化时，似乎存在不一致之处。 nlp = spacy.load("en_core_web_lg") doc = nlp("I'm running faster") for tok in doc: print(tok.lemma_) 这打印出“更快”作为标记“更快”的引理，而不是“快速”。但是，令牌确实存在于lemma_lookup表中。 nlp.vocab.lookups.get_table("lemma_lookup")["fast

浏览 2提问于2020-04-09得票数 2

回答已采纳