NLTK停用语言

文章/答案/技术大牛

发布

2回答

在nltk python中创建停用词集

、、、

我知道NLTk停用词有很多种语言，但如果我想创建自己的停用词集并在NLTK停用词中使用它们，这是可行的吗？import nltkstops=set(stopwords.words('My own set')) words=["Don't"

浏览 28提问于2019-12-23得票数 1

回答已采纳

3回答

NLTK可用于停用词的语言

、、、

我想知道在哪里可以找到NLTK停用词支持的语言(以及它们的键)的完整列表。他们的书里什么也没说：你知道我在哪里可以找到钥匙列表吗？

浏览 1提问于2019-02-07得票数 10

回答已采纳

1回答

TFIDF与多语言文本分类

、、

我有一个场景，有一个商店，有包括英语在内的不同语言的视频内容。我想使用TFIDF给出一个商品对商品的推荐，但我被停用词搞糊涂了。它将如何在不同的语言中表现？stop_word应该是什么？

浏览 1提问于2020-04-23得票数 0

2回答

我正在使用几种语言，对于其中一些语言，我在NLTK中有一个停用词列表，但对于其他语言则没有。如何从代码中检查一种语言在nltk.corpus.stopwords.words(" language ")中是否可用？当找不到给定的语言时，我希望在不管理异常的情况下这样做。如下所示： if "language" in nltk.corpus.stopwords.languages: sw =

浏览 15提问于2019-02-22得票数 2

回答已采纳

1回答

Python 3中的Stopwords

、

我无法使用from stop_words import stopwords导入停用词，因为它们说明该模块不存在。有没有另外一个命令可以删除大约900个停用词？

浏览 0提问于2018-06-14得票数 0

2回答

如何消除这段代码中的停用词？

、

我已经编写了做情感分析的代码，因此我使用了两个不同的字典，其中的句子被标记为否定或积极。到目前为止，我的代码片段如下所示： return {word: True for word in word_tokenize(satz) } with open('Positiv.txt') as f: pos_data.append([format_sentence(line), 'pos']) neg_data =

浏览 2提问于2016-04-13得票数 0

1回答

如何使用NLTK删除停用词

、

我在使用NLTK删除停用词时遇到了问题。我正在使用下面的代码，它的工作没有我试图删除停用词的部分。from nltk.probability import FreqDist File "C:\Users\meris\PycharmProjects\pythonProject\venv\l

浏览 28提问于2021-01-29得票数 0

2回答

pyspark :如何在spark 1.6.3上使用法语配置StopWordsRemover

、

我想知道如何在spark 1.6.3中用法语配置stopwordsremover。谢谢你的帮助。

浏览 12提问于2018-02-27得票数 2

1回答

Python TextBlob翻译问题

、、、

我正在用Python，TextBlob和NLTK做一个快速的情绪分析控制台应用程序。目前我使用的是西班牙语维基文章的链接，所以我不需要翻译它，我可以使用nltk西班牙语停用词列表，但是如果我想让这段代码在不同语言的链接上工作呢？有没有办法让代码尝试翻译成不同的语言(以及使用不同的停用词列表)，这取决于im提供给应用程序的链接的语言？import nltkfro

浏览 15提问于2019-03-15得票数 2

回答已采纳

2回答

找不到资源‘语料库/停用词’

、、

我正在尝试从nltk.corpus导入停用词。我不能使用nltk.download(‘停用词’)，因为我有代理问题。我在试着手动导入停用词。这就是我所做的。我从github.com下载了nltk_data，并使用nltk.data.path配置了适当的路径。Files\\Anaconda3\\Lib\nltk_data' 我所有的nltk数据都在上面的路径中，而且语料库文件夹中也有停用词。:\\Users\

浏览 4提问于2017-08-02得票数 1

4回答

使用NLTK删除停止字

、、、

我试图通过使用nltk工具包删除停用词来处理用户输入的文本，但是使用停用词删除时，像'and'，'or'，'not‘这样的单词会被删除。我希望这些单词在停用词删除过程后出现，因为它们是以后将文本作为查询处理所需的运算符。我不知道哪些词可以作为文本查询的运算符，我也想从我的文本中删除不必要的词。

浏览 78提问于2013-10-02得票数 78

回答已采纳

2回答

绘制文本中最常用的单词(删除停用单词)

、、

我已经使用以下代码绘制了数据： import nltkdefin text[columnText].astype('str')]) frequency = nltk.FreqDist

浏览 22提问于2020-09-12得票数 1

回答已采纳

2回答

如何删除英语和西班牙语停用词

、、

我正在尝试删除英语和西班牙语的停用词。我的代码适用于英语，但不适用于西班牙语： stopword = nltk.corpus.stopwords.words('english', 'spanish') def remove_stopwords

浏览 77提问于2021-01-04得票数 0

1回答

功能与内容词

、

如何区分更具体地说，我应该使用哪个，以及它如何标记内容/词汇？PS。我使用lemma注释器来获取我想忽略的单词。

浏览 6提问于2017-01-24得票数 2

回答已采纳

10回答

将单词添加到nltk非索引字列表

、、

我有一些从我的数据集中删除停用词的代码，因为停用列表似乎也没有删除我想要的大部分单词，我希望将这些词添加到这个停用列表中，以便在这种情况下可以删除它们。我用来删除停用词的代码是： word_list2 = [w.strip() for w in word_list if w.strip() not in nltk.corpus.stopwords.words

浏览 0提问于2011-04-01得票数 18

2回答

NLTK -缺少停用词-英语

、、

我刚刚下载了NLTK的最新版本及其所有资源。我看到could和would没有被列为停用词。但should被视为一个停用词。这是某种已知的bug还是...？In [7]: import nltk Out[8]: True In [9]: "couldn't" in nltk.cor

浏览 10提问于2019-05-21得票数 4

1回答

Heroku模型部署成功，但未找到nltk.txt

、

我按照Heroku指南在app文件夹的根目录下创建了一个nltk.txt文件。内容是“停用词”(对于停用词语料库)。但是，在部署期间，观察到以下日志消息： remote: -----> Downloading NLTK corpora… remote: !Learn more: https://devcenter.h

浏览 53提问于2020-06-26得票数 1

1回答

将停用字典导入到python

、、

如何将特定的停用词字典(excel表格)导入Python，并将其附加到nltk停用词列表中？目前我的停用词部分看起来像这样：from nltk.corpus import stopwords stop_words = set(stopwords.words

浏览 71提问于2018-06-11得票数 1

1回答

跳过不带属性的元组Python NLTK

、、、、

我有一个脚本，主要是为自然语言工具包工作。它的工作方式是使用NLTK对单个单词进行标记化和标记(分类)。我的问题是，有一种方法可以跳过元组，这会给我一个错误，因为它们不会返回标签属性？2 2 George (显然不完美，但总比没有强)for i in range(len(text)): SENT_DETECTOR = nltk.data.load('

浏览 21提问于2020-05-06得票数 0

1回答