SpaCy在spacy-lookups-data中找不到语言'en‘的表lexeme_norm

SpaCy 是一个开源的自然语言处理库，用于构建高级 NLP 应用程序。spacy-lookups-data 是一个数据包，包含了不同语言的查找表，用于词形还原、同义词查找等任务。

基础概念

Lexeme: 在 SpaCy 中，lexeme 是词典中的一个词条，包含了词的不同形态（如时态、数等）。
Lexeme Norm: 词形规范化，即将词的不同形态转换为基本形式的过程。

问题分析

当你在使用 SpaCy 并尝试加载 spacy-lookups-data 数据包时，如果遇到找不到特定语言（如 'en' 表示英语）的 lexeme_norm 表，可能是以下几个原因：

数据包未正确安装: 确保你已经安装了 spacy-lookups-data 数据包。
数据包版本问题: 可能是数据包的版本不兼容或者损坏。
语言支持问题: 某些语言可能没有包含在默认的数据包中。

解决方法

安装或更新数据包:
安装或更新数据包:
检查数据包内容: 确认数据包中是否包含英语的 lexeme_norm 表。你可以解压数据包并查看其内容。
手动下载并安装特定语言的数据: 如果数据包中确实缺少英语的 lexeme_norm 表，你可以尝试手动下载并安装。通常，SpaCy 的数据包可以从 SpaCy 官方网站下载。
使用 SpaCy 的 download 命令:
使用 SpaCy 的 download 命令:
检查 SpaCy 版本: 确保你使用的 SpaCy 版本是最新的，因为某些功能可能在不同版本之间有所变化。
检查 SpaCy 版本: 确保你使用的 SpaCy 版本是最新的，因为某些功能可能在不同版本之间有所变化。

示例代码

以下是一个简单的示例，展示如何加载 SpaCy 并使用 lexeme_norm 表：

import spacy

# 加载英语模型
nlp = spacy.load("en_core_web_sm")

# 获取一个词条的规范化形式
doc = nlp("running")
for token in doc:
    print(token.text, token.lemma_)

参考链接

通过以上步骤，你应该能够解决 spacy-lookups-data 中找不到英语 lexeme_norm 表的问题。如果问题仍然存在，建议查看 SpaCy 的官方论坛或社区寻求帮助。

SpaCy在spacy-lookups-data中找不到语言'en‘的表lexeme_norm

、、

我正在尝试用SpaCy训练一个文本分类管道： import spacy nlp.add_pipe("textcat", last) # training logic 但是，每次我打电话给nlp.begin_training()，我得到了错误 ValueError: [E955] Can't find table(s) lexeme_normfor language '

浏览 155提问于2021-02-25得票数 4

回答已采纳

1回答

ImportError:无法从'spacy.lang.en‘导入名称'LEMMA_INDEX’

、、

我试图在spaCy中创建一个词汇化程序，但是当我运行我拥有的代码时，这个错误总是弹出。Traceback (most recent call last): from spacy.lang.enimport LEMMA_INDEX, LEMMA_EXC, LEMMA_RULES ImportError: cannot import name 'LEMMA_INDEX&#

浏览 65提问于2019-11-09得票数 4

回答已采纳

2回答

在spacy中优化单个词库的形式提取(词汇化)

、

我希望在不使用上下文信息的情况下将单词减少到其基本形式。我尝试了spacy，这需要运行nlp来获得单个单词的基本形式，但这会增加执行时间。我使用过this post，其中禁用解析器和NER流水线组件在一定程度上加快了执行时间，但我只想要一个进程来直接查找单词数据库及其词法形式(基本上是单词的基本形式，而不考虑上下文信息 my_list =base_form domy_word did, base_form do my_word do, base_fo

浏览 30提问于2020-06-17得票数 0

1回答

在“en_core_web_sm”模型中，柠檬化可能不能正常工作。

、

我不知道为什么我会收到这样的警告： conda install -c conda-forgespacypython -m spacy download en_core_web_sm

浏览 2提问于2020-03-04得票数 0

1回答

在管道末尾向Spacy添加Span分类器不起作用

、

我想在管道的末尾添加使用默认模型的spancat，如下所示。nlp = spacy.load("en_core_web_sm")config =spancat.add_label("SPANCAT") ValueError: [E955] Can't find

浏览 8提问于2022-09-12得票数 0

2回答

在Spacy柠檬化中添加规则

、

我正在使用Spacy柠檬化作为预处理文本。doc = 'ups'print(i.lemma_)我明白为什么spacy移除“s”，但对我来说很重要的是，在这种情况下，它不会做到这一点。是否有方法向spacy添加特定规则，或者是否必须使用流程外的If语句(这是我不想做的事情)

浏览 3提问于2020-08-05得票数 0

回答已采纳

1回答

空白模型与预训练模型在空间上的区别

、、

目前，我正试图使用spacy来训练文本分类器，我遇到了以下问题:使用spacy.blank('en')创建空白模型与使用经过预先训练的模型spacy.load('en_core_web_sm')有什么区别为了了解我编写的代码的不同之处： nlp1 = spacy

浏览 2提问于2020-03-27得票数 3

回答已采纳

1回答

将自定义语言添加到Spacy 3.0中，并在其中训练管道

、、

到目前为止，我一直在使用Spacy 2.3.1。我创建了自己的自定义类，继承自Language类，并在其中使用Python脚本训练了一个NER管道。但在Spacy 3.0中，引入了一堆方便的CLI命令和配置，以便训练自定义管道，强烈建议使用这些命令来代替Python脚本。以下是nlp对象的配置示例： ...before_creation = nullafter_pipeline_creation = null tokeniz

浏览 11提问于2021-04-11得票数 1

回答已采纳

2回答

在使用Spacy时，如何不将"datum“作为"data”的引理？

、

我遇到了一个非常常见的单词"data“，它被分配了一个词条"datum”，来自查找异常表spacy use。我知道引理在技术上是正确的，但在今天的英语中，"data“的基本形式就是"data”。我使用引理从文本中获取一种关键字，如果我有一个关于数据的文本，我不可能用"datum“来标记它。我想知道是否有其他方法可以得到普通的“数据”，然后构造另一个用于覆盖后处理<em

浏览 23提问于2020-06-10得票数 1

14回答

ImportError:没有名为“spacy.en”的模块

、

我正在开发一个使用Spacy的代码库。我使用以下方法安装了spacy：然后在最后一条命令的末尾，我收到了一条消息：/.local/lib/python3.5/site-packages/spacy/data/en You can

浏览 2提问于2017-11-14得票数 53

回答已采纳

1回答

多语言spaCy过程文档

、、、、

给定一定长度的文档字符串s和相同长度的语言掩码l，我想处理每个部分(span?)文档的空间语言模型。37import spacynlp_en = spacy.load('en') d_de = nlp_de(u"".join([c fori,c in enumerate(s) if l[i]

浏览 2提问于2017-08-28得票数 3

1回答

spaCy或语言模型en_core_web_sm没有安装在任何python可执行文件中。

、、

已经在zsh (osx teminal)中安装了miniconda，并且正在运行以下命令：我认为安装是可以的，但是语言模型并不是在下载。抛出以下错误： spacy_download_langmodel("en_core_web_lg") spacy_download_langmodel(

浏览 4提问于2021-09-13得票数 2

2回答

Spacy无法加载模型: Azure数据库中的en_core_web_md

、、、、

因此，spacy似乎成功地安装在Azure databricks集群中的笔记本中。%sh python -m空格下载en_core_web_md%sh这将返回以下结果：======================安装型号(spaCy v2.3.2) =========

浏览 0提问于2020-11-19得票数 0

2回答

在没有新下载的情况下将已下载的SpaCy语言模型导入到docker容器

、、、、

我想在不同的码头容器上运行多个spacy语言模型。我不希望码头映像包含行RUN python -m spacy download en_core_web_lg，因为其他进程可能有不同的语言模型。我的问题是:是否可以将多个spacy语言模型下载到本地(即en_core_web_lg、en_core_web_md、.)，然后在码头容器生成时将这些模型加载到python

浏览 16提问于2022-05-30得票数 1

4回答

由于代理问题而无法安装spacy [model]

、

我正在尝试安装一个特殊的Spacy模型"en_core_web_sm“。我无法做到这一点，因为代理服务器的限制，我在我的env，我没有控制权。我正在按照他们的文档中的建议使用以下命令： pip install https://github.com/explosion/spacy-models/releases/download/e

浏览 6提问于2019-04-24得票数 7

回答已采纳

1回答

spacy.lang.en和load('en')有什么区别？

、、、

在我关于NLP的研究中，更具体地说是spacy库，我对此感到困惑，from spacy.lang.en import English()和spacy.load('en')之间有什么区别，它是如何工作的？

浏览 1提问于2019-10-03得票数 6

1回答

Azure Python部署- Spacy* nomodule找到异常*

、、

我在使用。我正在尝试通过Azure DevOps管道部署python3.6烧瓶应用程序。它对一个基本应用程序很好，但是当我添加一个额外的代码(spacy模块)时，它开始抛出2019我在requirement.txt中添加了依赖模块Flask-Cors==3.0.8fastai==1.0.59 numpy==1.17.4impo

浏览 3提问于2019-12-24得票数 0

回答已采纳

8回答

无法用spacy.load('en')加载spacy的英语语言模块

、、、、

我无法在jupyter笔记本中加载英文型号，代码如下-import spacy错误消息： C:\ProgramData\Anaconda3'en‘。它似乎不是快捷链接、Python包或数据目录的有效路径。我安装了python版本2.7.

浏览 1提问于2018-12-24得票数 6

6回答

OSError：[E050]找不到模型'en‘

、、、

我正在尝试使用python-的pytextrank库，但是我无法解决这个错误，之前我收到了一个ip.json找不到的错误，但是后来被解决了。) 186 if not SPACY_NLP: 188 189 s

浏览 6提问于2019-09-23得票数 4

回答已采纳

0回答

当SpaCy只支持标记化(pl - polish)时，如何在Rasa NLU中更改语言？

、、、、

SpaCy在标记化中支持波兰语{ "tokenizer_spacy","intent_classifier_sklearn"],"path" : "./data&

浏览 2提问于2018-07-17得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

SpaCy在spacy-lookups-data中找不到语言'en‘的表lexeme_norm

基础概念

问题分析

解决方法

示例代码

参考链接

相关·内容

SpaCy在spacy-lookups-data中找不到语言'en‘的表lexeme_norm

ImportError:无法从'spacy.lang.en‘导入名称'LEMMA_INDEX’

在spacy中优化单个词库的形式提取(词汇化)

在“en_core_web_sm”模型中，柠檬化可能不能正常工作。

在管道末尾向Spacy添加Span分类器不起作用

在Spacy柠檬化中添加规则

空白模型与预训练模型在空间上的区别

将自定义语言添加到Spacy 3.0中，并在其中训练管道

在使用Spacy时，如何不将"datum“作为"data”的引理？

ImportError:没有名为“spacy.en”的模块

多语言spaCy过程文档

spaCy或语言模型en_core_web_sm没有安装在任何python可执行文件中。

Spacy无法加载模型: Azure数据库中的en_core_web_md

在没有新下载的情况下将已下载的SpaCy语言模型导入到docker容器

由于代理问题而无法安装spacy [model]

spacy.lang.en和load('en')有什么区别？

Azure Python部署- Spacy* nomodule找到异常*

无法用spacy.load('en')加载spacy的英语语言模块

OSError：[E050]找不到模型'en‘

当SpaCy只支持标记化(pl - polish)时，如何在Rasa NLU中更改语言？

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐