NLTK不对大写单词进行词汇化_如何使用NLTK或pywsd进行词汇化_Google Colab是否使用GPU进行基于NLTK的词汇化？ - 腾讯云开发者社区

、、

例如纸箱，尺寸:19 CARDBOARD高x 10 CARDBOARD宽x 30 CARDBOARD深我使用NLTK包来做到这一点，但它只接受小写字符串，并且我不想让字符串中的所有单词都小写。

浏览 16提问于2021-08-11得票数 1

回答已采纳

3回答

NLTK WordNet词法分析器:它不应该将一个单词的所有词形变化都词汇化吗？

、、

我正在使用NLTK WordNet Lemmatizer进行词性标注项目，首先将训练语料库中的每个单词修改为其词干(就地修改)，然后仅在新语料库上进行训练。例如，单词loves被词汇化为love，这是正确的，但是即使在词汇化之后，单词loving仍然是loving。这里的loving和句子中的"I'm loving it“一样。同样，许多其他的“ing”形式在词汇化后仍然存在。这

浏览 44提问于2014-08-28得票数 38

回答已采纳

1回答

pandas中的Lemmatize标记化列

、、

我正在尝试对标记化的列comments_tokenized进行词汇化 ? 我有： import nltklemmatizer == df1["comments_tokenized"].apply(lemmatize_text) 但却有 TypeError: unhashable type: 'list

浏览 44提问于2020-01-03得票数 1

回答已采纳

2回答

nltk lemmatizer不知道如何处理美国人这个词

、、

已运行以下程序：wnl().lemmatize("American") wnl().lemmatize("Americans

浏览 1提问于2011-11-04得票数 2

回答已采纳

1回答

使用Python和nltk的词例化

、、

我需要用Python对一些单词进行词汇化Resource punkt not found.Please use the NLTK Downloader to obtain the resource: >>> nltk.download('punkt') 我已经安装了nltk，并且之前导入了库。

浏览 1提问于2018-12-11得票数 0

1回答

如何对句子列表进行词汇化

、、、

from nltk.stem.wordnet import WordNetLemmatizerlmtzr = WordNetLemmatizer我需要对之前的单词进行标记化才能正常工作吗？

浏览 63提问于2018-06-05得票数 5

回答已采纳

1回答

使用nltk恢复原始单词，并使用完整语义进行标记化

、

我知道使用nltk模块我可以对单词进行词汇化lemmatizer = WordNetLemmatizer() 或但问题是，我没有完整的句子可以标记化。我想输入一个单词，它返回没有句子标记化的原始<

浏览 10提问于2019-10-22得票数 0

1回答

使用quanteda进行词法分析

、

如何使用quanteda对像makes这样的单词进行词汇化，使其成为make。在Python语言中，可以使用NLTK WordNet Lemmatizer

浏览 53提问于2020-06-12得票数 0

回答已采纳

1回答

NLTK词汇化

、、、、

我正在尝试用NLTK对单词进行词汇化。我现在能找到的是，我可以使用stem包得到一些结果，比如将"cars“转换为"car”，将“女人”转换为“女人”，但是我不能对一些带有词缀的单词进行词汇化，比如“致谢”。谁能告诉我如何消除单词的词缀？也就是说，当输入为“确认”时，输出为“确认”。

浏览 0提问于2013-07-17得票数 4

回答已采纳

2回答

在Python中对Twitter数据框使用列举化和Tf- Idf计算时出错

、、

我有一个tweet的数据帧，我试图在词条化的'tweet‘列上计算Tf-Idf。我对词汇化的结果有一个问题，并且在尝试计算Tf-Idf时得到一个错误。下面是我的代码： w_tokenizer = nltk.tokenize.WhitespaceTokenizer() def lemmatize_text我的第一个问题--我如何改进词汇化？现在，我想要计算此列的Tf- Idf，并在我的数据框中生成包含顶部单

浏览 54提问于2020-07-27得票数 2

回答已采纳

1回答

NLTK WordNetLemmatizer将"US“处理为"u”

、、

如果您将单词"US" (美国)从package nltk.stem输入到WordNetLemmatizer中，在经过预处理(变成"us"，即小写)之后，它将被翻译为"u"。例如： from nltk.stem import WordNetLemmatizerword = "US".lower() # "US"becomes "us" lemma = lmtzr.

浏览 7提问于2019-02-20得票数 2

回答已采纳

1回答

Nltk lemmatizers不识别化学名称的复数形式

、、、

所以，我必须承认，我完全是nlp的新手，我对nltk一无所知，我只是试图使用上一位开发人员留下的遗留代码。我需要对大部分来自化学和生物技术出版物的词语进行词汇化。from nltk.stem import WordNetLemmatizerlemmatizer.lemmatize('cats')

浏览 5提问于2020-03-24得票数 0

1回答

在Python中优化语言检测代码和词汇化

、、、、

lang2)在训练模型之前，我想对我的单词进行词汇化但是，如果我们将词性标记为单词，NLTK中的词汇化将正常工作，我尝试如下所示，但得到一些错误： from nltk.ste

浏览 11提问于2018-02-08得票数 0

回答已采纳

2回答

所有熊猫细胞的Lemmatization

、

有一列，让我们把它命名为：'col‘这一列的每个条目都是一个单词列表。'word1‘、'word2’等。nltk.stem.WordNetLemmatizer().lemmatize('word') 我希望能够为pandas数据集中某一列中所有单元格的所有单词找到一个引理。

浏览 1提问于2017-11-30得票数 11

回答已采纳

2回答

训练前语料库的word2vec词汇化

、、、

然而，词汇化是许多语义相似性任务的标准预处理。我想知道是否有人有在训练word2vec之前对语料库进行词汇化的经验，以及这是否是一个有用的预处理步骤。

浏览 2提问于2014-05-27得票数 30

回答已采纳

1回答

使用NLTK区分word与非word

、

在对文本进行词汇化之后，我得到了一个词汇表。对于这个列表中的每个元素，我想知道它是一个单词(“猫”，“狗”，"go"，"xxx___BATMAN___xxx")还是非单词("."如何在Python和NLTK中区分word和非word？ UPD。(对于单词是什么的问题)我想清除我的列表中的全部垃圾。去掉完全不是单词的东西。不要接触复杂的边缘情况。

浏览 7提问于2017-01-18得票数 0

1回答

如何使用Fasttext构建词法分析器

、、、

我有大量的阿拉伯方言单词(4M)和它们对应的词条，我想通过利用它为不在该数据中的新词建立一个词汇化器。问题是如何使用FastText构建这个词汇化工具？

浏览 10提问于2020-04-02得票数 0

2回答

朴素贝叶斯分类器忽略的单词列表应该是什么？

、、

我正在使用PHP上的朴素贝叶斯分类器() 在训练系统时，有一个可以忽略的单词列表。这些单词不会保存到数据库中，因此不会用于分类。我想尽可能地改进这个系统，所以我想知道对于这种系统，是否有任何规则或典型单词列表可以忽略。

浏览 1提问于2012-03-21得票数 0

回答已采纳

2回答

wordnet词法分析器的问题

、

我试过wordnet lemmatizer，但我发现像“学习”或“等待”这样的常用词没有得到适当的处理。

浏览 0提问于2010-06-09得票数 0

回答已采纳

1回答

Nltk的wordnet词汇器不是对所有单词都进行词汇化

、、、、

我在试着把课文中的单词词汇化。例如，'pickled‘应该变成'pickle'，'ran’变成'run'，‘run’变成'raisin‘，等等。我正在使用nltk的WordNet Lemmatizer，如下所示：>>> >>> lem = WordNetLemmatizer如何获得这些单词的'

浏览 0提问于2017-07-29得票数 2

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云