导入NLTK不适用于Hadoop流

NLTK（Natural Language Toolkit）是一个用于自然语言处理（NLP）的Python库，提供了丰富的工具和资源，用于处理和分析文本数据。然而，由于Hadoop流是一个用于大规模数据处理的框架，而NLTK是一个Python库，因此直接导入NLTK可能不适用于Hadoop流。

Hadoop流是Hadoop生态系统中的一个组件，它允许用户使用标准输入和输出流来编写MapReduce任务。它的设计目标是处理大规模数据集，并且能够在分布式环境中高效运行。由于Hadoop流是基于Java编写的，因此它更适合使用Java编写的工具和库。

如果在Hadoop流中需要进行自然语言处理任务，可以考虑使用适合Hadoop生态系统的其他工具和库，如Apache Lucene、Apache OpenNLP、Apache Tika等。这些工具和库都是用Java编写的，可以与Hadoop流无缝集成。

对于Hadoop流中的自然语言处理任务，可以使用以下步骤：

数据预处理：在Hadoop流中，首先需要对输入数据进行预处理。这可能包括文本清洗、分词、词性标注等操作，以便更好地进行后续的处理和分析。
特征提取：根据具体的任务需求，可以使用不同的特征提取方法，如词袋模型、TF-IDF、Word2Vec等。这些特征提取方法可以帮助将文本数据转换为数值表示，以便进行机器学习或其他分析任务。
分布式处理：利用Hadoop流的分布式计算能力，可以将任务并行化处理，以提高处理速度和效率。可以使用MapReduce模型来实现并行处理，将任务拆分为多个子任务，并在集群中的多个节点上同时执行。
结果分析和后处理：在处理完成后，可以对结果进行分析和后处理。这可能包括聚类、分类、情感分析等操作，以便从文本数据中提取有用的信息。

总结起来，对于Hadoop流中的自然语言处理任务，需要选择适合Hadoop生态系统的工具和库，并结合分布式计算能力进行并行处理。这样可以充分利用Hadoop流的优势，处理大规模的文本数据。

如何在Hadoop流作业中包含python包？

、

我正在尝试在Hadoop流作业中包含一个python包(NLTK)，但是我不确定如何在不通过CLI参数"-file“手动包含每个文件的情况下做到这一点。编辑:一种解决方案是在所有的slaves上安装这个包，但我目前没有这个选项。

浏览 1提问于2011-07-25得票数 18

回答已采纳

4回答

在通过终端导入nltk时，我得到一个错误，如下所示 [greenz@localhost hadoop]$ python Python 2.6.6 (r266:84292, Feb 21 2013, 23:54:59) [GCC 4.4.7 20120313 (Red Hat 4.4.7-3)] on linux2 Type "help", "copyright", "credits" or "license" for more information. >>> import nltk Traceback (mo

浏览 2提问于2013-06-21得票数 3

4回答

如何解析java.lang.RuntimeException: PipeMapRed.waitOutputThreads()：子进程失败，返回代码2？

、、

我正在尝试在Hadoop环境中执行NLTK。下面是我用来执行的命令。 bin/hadoop jar $HADOOP_HOME/contrib/streaming/hadoop-streaming-1.0.4.jar -input /user/nltk/input/ -output /user/nltk/output1/ -file /home/hduser/softwares/NLTK/unsupervised_sentiment-master.zip -mapper /home/hduser/softwares/NLTK/unsupervised_sentiment-master/senti

浏览 0提问于2013-05-06得票数 5

2回答

在Azure Synapse笔记本中运行nltk.download :关闭文件上的I/O操作

、、、

我正在用NLTK在Azure Synapse笔记本上做实验。当我尝试运行nltk.download(“秒表”)时，我会得到以下错误： ValueError: I/O operation on closed file Traceback (most recent call last): File "/home/trusted-service-user/cluster-env/env/lib/python3.6/site-packages/nltk/downloader.py", line 782, in download show(msg.message) F

浏览 14提问于2021-03-27得票数 4

3回答

使用SQOOP和FLUME将数据从RDBMS移动到Hadoop

、、

我正在学习Hadoop，在将数据从关系数据库移动到Hadoop以及从关系数据库移动到Hadoop的过程中，我只掌握了几个概念。我已经使用SQOOP import查询将文件从MySQL传输到HDFS。我传输的文件是结构化数据集，而不是任何服务器日志数据。我最近读到我们通常使用flume将日志文件移动到Hadoop中，我的问题是: 1.我们是否也可以使用SQOOP来移动日志文件? 2.如果可以，对于日志文件，SQOOP和FLUME中的哪一个更可取?为什么？

浏览 1提问于2014-03-18得票数 2

2回答

如何修复OSError：[WinError 123]的pyspark NLTK错误？

、、

当我运行将RDD转换为DataFrame时，我得到了一个意外的错误： import nltk from nltk import pos_tag my_rdd_of_lists = df_removed.select("removed").rdd.map(lambda x: nltk.pos_tag(x)) my_df = spark.createDataFrame(my_rdd_of_lists) 当我调用nltk函数od rdd时，总是出现这个错误。当我使用任何numpy方法创建这行代码时，它都没有失败。错误码： Py4JJavaError: An error occur

浏览 63提问于2020-04-06得票数 0

回答已采纳

2回答

Hadoop和NLTK:使用秒词失败

、、、

我试图在Hadoop上运行Python程序。该程序涉及NLTK库。该程序还使用了Hadoop，正如所描述的。 mapper.py: #!/usr/bin/env python import sys import nltk from nltk.corpus import stopwords #print stopwords.words('english') for line in sys.stdin: print line, reducer.py: #!/usr/bin/env python import sys for line in sys.stdin:

浏览 6提问于2013-09-27得票数 1

回答已采纳

2回答

使用hadoop streaming时如何在HDFS中导入nltk语料库

、、、

I got a little problem I want to use nltk corpus in hdfs,But failed.For example I want to load nltk.stopwords in my python code. I use this http://eigenjoy.com/2009/11/18/how-to-use-cascading-with-hadoop-streaming/ 我说了这么多，但我不知道如何在我的工作中改变它。我的nltk文件名是nltk-2.0.1.rc1，我的pyam文件名是PyYAML.3.0.1，所以我的commad是

浏览 0提问于2012-05-23得票数 1

2回答

Oracle Hadoop连接器诉Sqoop

、、

我使用了Sqoop来摄取从Oracle到Hadoop的数据，它运行得很好。只需4分钟就能将8600万条记录从Oracle带到Hive表，而无需使用Sqoop上的分区。谁能给出一些关于Oracle Hadoop连接器的细节，它的性能会比Sqoop更好吗？

浏览 4提问于2016-10-25得票数 2

回答已采纳

1回答

在空隙环境中安装nltk数据

、、、

我想利用NLTK实现hadoop集群上的NLP任务。我们使用Anaconda发行版。该集群处于空隙环境中，因此我无法运行nltk.download()。我想我需要把数据下载到另一台有互联网接入的机器上。我从哪里下载的？以及如何在hadoop集群上安装它？我只是复制文件吗？还是nltk需要知道数据在哪里？是否需要在所有节点上复制数据？

浏览 11提问于2017-01-06得票数 0

回答已采纳

1回答

循环导入修复来自pylint的R0401

、、、

Pylint抱怨NLTK包的特定文件使用R0401错误代码进行循环导入。 nltk/nltk/ccg/lexicon.py:1: [R0401(cyclic-import), ] Cyclic import (nltk -> nltk.internals) nltk/nltk/ccg/lexicon.py:1: [R0401(cyclic-import), ] Cyclic import (nltk.corpus -> nltk.tokenize -> nltk.tokenize.punkt -> nltk.probability) nltk/nltk/ccg/lexi

浏览 0提问于2018-09-12得票数 12

回答已采纳

1回答

如何定位在python中导入的模块

、、

我试图定位nltk中的下面一行代码是如何加载模块gutenberg的 from nltk.corpus import gutenberg 我尝试在.__file__上使用nltk.corpus，它指向一个__init__.py文件。我本来希望在__init__.py文件中看到一个名为gutenberg的函数或类，但是找不到它。我想我不完全理解进口是如何工作的。我哪里出问题了？

浏览 0提问于2014-08-21得票数 0

回答已采纳

1回答

ImportError:没有模块名为'_sqlite3‘错误-下划线相关性？

、、、

我使用Python3.4，最近从python3.3.2升级。我遵循关于如何安装作为python库/工具的报纸的说明。 https://github.com/codelucas/newspaper 在执行以下命令后，我会收到错误： curl https://raw.githubusercontent.com/codelucas/newspaper/master/download_corpora.py | python3 注意事项：我还在上面的命令中指定了python3.4，并且得到了相同的/以下输出/错误： import sqlite3 File "/usr/local/lib/p

浏览 4提问于2017-02-15得票数 2

回答已采纳

1回答

Python:从nltk.corpus.reader导入api模块

、、

我正在尝试从api包中导入nltk模块(更确切地说，是nltk.corpus.reader，它有一个api模块)。当我试图这样做的时候： from nltk.corpus.reader import api 然后打印我得到的，结果是 <module 'nltk.tokenize.api' from '/usr/lib/python2.6/site-packages/nltk/tokenize/api.pyc'> 因此，由于某种原因，它从另一条路径导入另一个模块！为什么这一切都是可能的，我怎样才能解决这个问题？

浏览 1提问于2014-03-09得票数 2

回答已采纳

3回答

用Hadoop解析用户代理

、、

我正在寻找一个库来帮助mi从与Hadoop (Pig或Hive)一起使用的用户代理中提取特性。我主要对移动用户感兴趣。我希望能够提取以下特征： versionbrowser操作系统OS 屏幕大小供应商名称型号名称<code>H 111</code>等。(用户代理中未显式提供的特性) 我正在考虑使用像WURLF或OpenDDR这样的项目，但是它们提供了可以在我的Hadoop作业中使用的API，这将不会非常有效，因为需要外部服务器来服务该API。如果你知道这样的项目，请让我知道，或者，我正在寻找解决方案，如何有效地使用WURLF或OpenDDR与Hadoop。

浏览 2提问于2012-02-02得票数 1

2回答

python在Mac上导入nltk错误

、

我迷路了..。我按照指令在Mac 上安装NLTK。当我在shell中使用导入nltk时，不会出现错误消息。 $ python Python 2.7.6 |Anaconda 1.9.0 (x86_64)| (default, Jan 10 2014, 11:23:15) [GCC 4.0.1 (Apple Inc. build 5493)] on darwin Type "help", "copyright", "credits" or "license" for more information. >>> i

浏览 7提问于2014-02-16得票数 0

回答已采纳

2回答

NLTK潘克特未找到

、、、、

正如标题所示，没有找到punkt。当然，我已经有import nltk和nltk.download('all')了。这仍然不能解决任何问题，而且我仍然会发现这个错误：异常类型: LookupError异常值： NLTK令牌丢失。通过以下命令下载: python；nltk.download(‘nltk.download’) 我运行了nltk.data.path并输出了它 ['/root/nltk_data', '/usr/nltk_data', '/usr/share/nltk_data', '/usr/lib/

浏览 0提问于2019-03-22得票数 0

回答已采纳

1回答

在数据库中pyspark数据下载的NLTK查找错误

、、、

我正试图通过将余弦相似性应用于Databricks中的pyspark来寻找文本列(“title”、“title”)的相似之处。我的函数名为'cosine_sim_udf‘，为了能够使用它，我必须进行第一个udf转换。在将函数应用到df之后，我得到了查找错误。有人知道原因或有解决方案吗？我的功能是找到余弦的相似点； nltk.download('punkt') stemmer = nltk.stem.porter.PorterStemmer() remove_punctuation_map = dict((ord(char), None) for char in s

浏览 3提问于2022-02-28得票数 2

7回答

NLTK和Stopword失败#调试器

、、、

我正试着开始一个情感分析的项目，我将使用停止词的方法。我做了一些研究，我发现nltk有秒词，但是当我执行命令时，会出现一个错误。为了知道nltk使用了哪些单词(比如您在这里可以找到的，在第4.1节中)，我要做以下几点： from nltk.corpus import stopwords stopwords.words('english') 但是当我按回车时 --------------------------------------------------------------------------- LookupError

浏览 14提问于2014-11-01得票数 66

回答已采纳

3回答

hadoop流的hadoop输入格式。Wikihadoop输入格式

、

我想知道hadoop的InputFormats和hadoop streaming有什么不同。hadoop流的输入格式是否也适用于hadoop，反之亦然？我之所以这样问，是因为我发现了维基百科转储文件的一种特殊输入格式，即维基百科InputFormat。上面写着它是hadoop流的输入格式？为什么只针对hadoop流？而不是hadoop？最好的

浏览 0提问于2013-06-14得票数 0

1回答

NoClassDefFoundError HBase带纱

、、、、

我知道这是一个要求很高的话题。不过，在我钻研了我能找到的所有话题(其中大部分都在谈论CLASSPATH)之后，我还是解决不了我的问题。我找到并尝试过的主题的例子：我在Ubuntu14.04上使用Hadoop2.5.1和HBase 0.98.11 成功地建立了伪分布式模式，并成功地运行了hadoop .在我想要设置全分布式模式后，作业会因NoClassDefFound错误而失败.我试着在hadoop-env (也是纱-env)中添加"export HADOOP_CLASSPATH=/usr/local/hbase-0.98.11-hadoop2/bin/hbase classpa

浏览 1提问于2015-04-25得票数 0

1回答

当减速器完成时调用映射器

、、、、

我执行这项工作的目的是： hadoop/bin/./hadoop jar /home/hadoopuser/hadoop/share/hadoop/tools/lib/hadoop-streaming-2.6.0.jar -D mapred.reduce.tasks=2 -file kmeans_mapper.py -mapper kmeans_mapper.py -file kmeans_reducer.py \ -reducer kmeans_reducer.py -input gutenberg/small_train.csv -output gutenberg/out 当两个减

浏览 1提问于2016-02-07得票数 0

回答已采纳

1回答

天函数python中的nltk路径

、、

我正在尝试在我的文件夹中使用nltk，但是它找不到它我试着用的是：进口nltk nltk.data.path.append(Nltk_data) 在我的一个文件里文件树： main_azure_folder：share_code：text_analysis.pynltk_data 目前的路径是什么？谢谢

浏览 1提问于2020-05-26得票数 1

回答已采纳

1回答

可以构造一个程序来确定另一个python程序正在使用什么库吗？

、

例如，我在flask/django中有一个使用tensorflow和nltk库的python web应用程序。在同一台计算机上运行的另一个程序是否有可能以某种方式检查python程序并确定它使用的是什么库？例如，以某种方式检查内存空间，并确定它一直在使用nltk和tensorflow库？

浏览 3提问于2019-03-01得票数 1

1回答

Oozie Java Action :传递Hbase类路径

、、、

我正在通过oozie java操作运行一个测试hbase java程序。遇到以下错误： Failing Oozie Launcher, Main class [HbaseTest], main() threw exception, org/apache/hadoop/hbase/HBaseConfiguration java.lang.NoClassDefFoundError: org/apache/hadoop/hbase/HBaseConfiguration at HbaseTest.main(HbaseTest.java:28) at sun.reflect.NativeMethodAc

浏览 1提问于2014-10-01得票数 6

回答已采纳

1回答

错误:找不到org.apache.oozie.action.hadoop.PigMain

、、

我试图通过oozie工作流执行一个简单的猪脚本，该工作流导入python和其他jar，并最终得到以下错误： Failing Oozie Launcher, Main class [org.apache.oozie.action.hadoop.PigMain], exception invoking main(), java.lang.ClassNotFoundException: Class org.apache.oozie.action.hadoop.PigMain not found java.lang.RuntimeException: java.lang.ClassNotFoundEx

浏览 2提问于2015-08-11得票数 0

3回答

ImportError:没有名为“sqlite3”的模块

、、、

我试图在python文件中导入nltk，但是我得到了这个错误。文件"mycode.py"，第5行从实用程序导入文件“/home/myhome/基线/utities.py”，第1行，导入nltk文件"/home/myhome/.local/lib64/python3.5/site-packages/nltk/init.py"，第152行，从nltk.stem导入*文件"/home/myhome/.local/lib64/python3.5/site-packages/nltk/stem/init.py"，第29行，从nltk.corpus.r

浏览 2提问于2019-03-14得票数 3

回答已采纳

2回答

NLTK不在码头工作

、、

我想在码头经营一家nltk服务。然而，我总是收到错误消息"'nltk‘不是一个包“。你能查出到底出了什么问题吗？在构建过程中，所有工作正常，nltk版本被打印出来。当使用docker-compose up nltk启动容器时，我得到 $docker-合成nltk Recreating nltk Attaching to nltk nltk | Traceback (most recent call last): nltk | File "/var/www/nltk.py", line 1, in <modul

浏览 3提问于2017-04-02得票数 0

回答已采纳

1回答

当我尝试识别名词和动词时，Python nltk显示错误

、、

我尝试在Python中识别名词和动词。我使用了nltk包，它显示了一个黄色错误和一个长长的红色字母。我的代码： import nltk text = 'This is a table. We should table this offer. The table is in the center.' text = nltk.word_tokenize(text) result = nltk.pos_tag(text) result = [i for i in result if i[0].lower() == 'table'] print(result) #

浏览 0提问于2020-01-05得票数 0

1回答

Apache和Flume可以互换使用吗？

、、、

我对大数据很陌生。从的一些答案中，Flume和Sqoop都可以从源中提取数据并推送到Hadoop。有谁能说明一下在哪里使用水槽和sqoop在哪里？两者都可以用于相同的任务吗？

浏览 6提问于2014-11-27得票数 3

回答已采纳

1回答

HDFS、Hadoop中的低延迟数据访问

、、

我正在阅读关于大数据和Hadoop的教程，在那里我在HDFS上找到了以下两点流数据访问:在读取第一个数据集时，读取整个数据集的时间比延迟时间更重要。HDFS是建立在写一次和读-多次模式. & 低延迟数据访问:访问第一次数据所需时间非常少的应用程序不应该使用HDFS，因为它重视整个数据，而不是获取第一条记录的时间。我很困惑，因为第一位说读取整个数据集的时间更重要，第二位说...should不使用HDFS，因为它重视整个数据。我不明白这是什么期待？我是刚认识Hadoop的。

浏览 2提问于2017-04-25得票数 1

1回答

PyCharm没有名为'nltk‘的模块，即使我使用pip3安装了它？

、、

import nltk Traceback (most recent call last): File "/Library/Frameworks/Python.framework/Versions/3.10/lib/python3.10/code.py", line 90, in runcode exec(code, self.locals) File "<input>", line 1, in <module> File "/Applications/PyCharm CE.app/Contents/plugi

浏览 3提问于2022-10-03得票数 1

回答已采纳

1回答

ModuleNotFoundError NLTK

、、

标记化工作正常，但当我尝试进行命名实体识别时，namedEnt = ne_chunk(tagged，binary=True) 它给出了以下错误我确实使用pip install NumPy从cmd安装了numpy，但仍然给出了错误 import nltk from nltk.corpus import state_union from nltk.tokenize import PunktSentenceTokenizer, word_tokenize from nltk.chunk import ne_chunk train_text = state_union.raw("2005-G

浏览 11提问于2020-05-07得票数 0

2回答

哪个Hadoop版本符合RHive要求

、、、、

我尝试安装RHive。根据需求，RHive需要Hadoop核心>= 0.20.3 (参见) 当我转到Apache Hadoop版本时，没有0.20.3版本... (参见) 那么，哪些Hadoop版本符合RHive要求？

浏览 0提问于2013-05-01得票数 0

回答已采纳

1回答

nltk版本3.2.3的导入在ImportError中失败

、、、

我在windows 10下运行python 2.7.13，并且很难让nltk正常运行。下面是我试图导入nltk时所发生的事情： >>> import nltk Traceback (most recent call last): File "<pyshell#4>", line 2, in <module> import nltk File "C:\Python27\lib\site-packages\nltk-3.2.3-py2.7-win32.egg\nltk\__init__.py", line 128, in

浏览 0提问于2017-05-19得票数 0

回答已采纳

3回答

不安装即可使用NLTK

、、

使用Natural Language Toolkit学习Python非常有趣，它们在我的本地机器上运行得很好，尽管我必须安装几个包才能使用它。NLTK资源现在是如何集成到我的系统上的，这对我来说仍然是一个谜，尽管很明显，NLTK源代码并不是简单地放在Python解释器知道要找到它的地方。我想在我的网站上使用工具包，这是由另一家公司托管的。简单地将NLTK源代码文件上传到我的服务器并告诉根目录中的脚本"import nltk“是行不通的；我对此表示怀疑。那么，无论NLTK安装例程做什么，与直接导入有什么不同，为什么工具包不能直接导入？有没有一种方法可以使用NLTK源文件而不从根本上改

浏览 1提问于2012-08-29得票数 5

1回答

使用Bash的Hadoop流--有多慢？

、、、、

我从几篇文章中听说，使用bash的Hadoop streaming比编译的代码或python慢得多。这只适用于排序命令和类似命令吗？我的脚本需要 -copy文件到节点-on节点以文件作为参数执行商业程序-pass输出返回到文件夹我的直觉告诉我，这应该是一个类似于编译版本的速度。会是这样吗？

浏览 0提问于2015-01-23得票数 0

2回答

如何在任何维基百科文章的div(id="BodyContent")中抓取文本。我正在使用Python的BeautifulSoup和nltk

、、、

page=nltk.clean_html(soup.findAll('div',id="bodyContent")) 当我尝试运行此代码时，它显示： Traceback (most recent call last): File "C:\Python27\wiki3.py", line 36, in <module> page=nltk.clean_html(soup.findAll('div',id="bodyContent")) File "C:\Python27\lib\s

浏览 0提问于2013-01-24得票数 0

回答已采纳

2回答

.NET和Hadoop --我应该知道/学习什么，什么是可用的？

、、、

信息我的问题是关于BigData in .NET，BigData用来存储和查询大量数据(Facebook，Google，Twitter，.)。BigData的例子有MapReduce、Hadoop、Dryad等。微软放弃了他们的Dryad (DryadLinq)替代品，转而支持Hadoop (和)，所以我想为它做好准备，做好一切与之相关的事情。我已经知道的现在有什么可用的？我应该了解更多关于发行版和开发的知识吗？问题问题1：对于不是.NET平台特有的Hadoop，我应该知道什么？(如何查询、特定的模式、体系结构、.)并且是有用的(在.NET环境中) 问题2：关于.NET平

浏览 5提问于2011-11-24得票数 14

回答已采纳

1回答

纺锤指的是什么？

、、

我正在为正在部署的hadoop集群做非常基本的级别设置。我不熟悉Hadoop或它的一般概念。看一下部署清单，我看到了很多关于纺锤数量和纺锤安装点的讨论。当有人提到一个主轴时，他们是在谈论服务器中物理硬盘驱动器的数量吗？

浏览 1提问于2014-11-10得票数 0

回答已采纳

2回答

NLTK对ADLA的依赖问题

、、

我试图用python使用来自蔚蓝数据湖分析的nltk。我跟随使用自定义Python和U。我已经压缩了NLTK的源代码，并使用了DeployResource.。源代码依赖于nltk_data文件夹，该文件夹部署在顶点上，但其位置未知。下面是我正在执行的U代码。 REFERENCE ASSEMBLY [ExtPy]; DEPLOY RESOURCE @"/FeedbackAnalysisService/Assemblies/nltk. DEPLOY RESOURCE @"/FeedbackAnalysisService/Assemblies/nltk_data.zip"

浏览 0提问于2018-03-13得票数 2

3回答

python文件在从不同目录执行时运行正常

我有一个非常奇怪的问题。当我从不同的目录运行该文件时，它运行得很好。但是如果不这样的话我会得到这样的错误 from textprocessor import * File "/home/mohit/Documents/analysis/categorization/textprocessor.py", line 2, in <module> import nltk File "/usr/local/lib/python2.7/dist-packages/nltk/__init__.py", line 101, in <module>

浏览 0提问于2012-03-06得票数 4

回答已采纳

2回答

如何计算NLTK KMeans集群中的准确性

、、、、

我正在尝试使用NLTK的KMeans聚类算法。总体来说，一切都很顺利。我想使用NLTK的Metrics包来确定精确度、召回率和f度量。我在网络和其他参考文献中搜索了一些例子，但可能没有线索。如果任何人可以引用一个例子或参考。提前谢谢。

浏览 5提问于2016-03-30得票数 2

4回答

在Google App Engine上使用Python NLTK (2.0b5)

、、、

我一直在尝试让NLTK (Natural Language Toolkit)在Google App Engine上工作。我遵循的步骤是：下载安装程序并运行它(一个.dmg文件，因为我使用的是Mac)。将nltk文件夹从python站点包目录复制出来，并将其作为子文件夹放置在我的项目文件夹中。在包含nltk子文件夹的文件夹中创建一个python模块，并添加行：from nltk.tokenize import * 不幸的是，在启动它之后，我得到了这个错误(请注意，这个错误在NLTK内部很深，我在我的python系统安装中看到了这个错误，而不是GAE项目的子文件夹中的那个)： <typ

浏览 29提问于2009-08-17得票数 17

回答已采纳

1回答

使用nltk时。在nltk函数之前

、、

我刚接触python并使用nltk，所以实际上我有一个非常基本的问题，但在任何地方都找不到答案。我想知道什么时候在nltk模块的函数之前使用nltk.。我正在做一些任务，在某些情况下，它不使用它就可以工作，而在一些情况下，它没有使用它。(在示例中，我只编写了导入的内容和最后的命令)。示例1： import nltk print (FreqDist(words).most_common(10)) 这一切都运行得很好。示例2： import nltk import math print (FreqDist(words).most_common(10)) 给出一个错误消息 NameErro

浏览 1提问于2018-11-08得票数 2

2回答

即使nltk安装在我的机器上，也不能导入

、、、、

当我打开一个jupyter笔记本并尝试导入NLTK错误。我可以导入其他软件包，但不能导入NLTK。我将在下面添加一个屏幕截图来说明这一切，但是我在我的mac environmentsI 上安装了带有pip3 install nltk的nltk，我可以运行pip show nltk来查看在jupyter笔记本中无法导入nltk或在python终端中运行的成功安装nltk，我不使用任何环境，也可以使用python3.9.6<code>H 212</code><code><code>f 213/code>

浏览 19提问于2022-05-20得票数 1

1回答

使用远程java客户端的Sqoop导入

、、、

我正在为从mysql到HDFS(hadoop-1.2.1)的sqoop(1.4.5)导入编写一个远程java客户端。这是我的代码： Configuration config = new Configuration(); config.set("fs.default.name","hdfs://x.y.z.w:8020"); config.set("mapred.job.tracker", "x.y.z.w:9101"); SqoopOptions options = new SqoopOptions(config); optio

浏览 0提问于2015-04-12得票数 0

2回答

使用python MRJob在电子病历上引导库

、、、、

问题陈述：我正试图使用python MRJob库在Amazon中运行一个map-还原作业，而且我在用必需的库和包引导节点时遇到了困难。详细信息：我的示例python mrjob代码： import re from mrjob.job import MRJob from sentClassifier import sentClassify import nltk .. do something .. 有些库(如NLTK )需要导入，还有一些本地模块是我正在导入的，比如from sentClassifier import sentClassify。

浏览 3提问于2014-05-03得票数 1

回答已采纳

2回答

无法在AWS EMR上下载nltk语料库，I/O操作在关闭的文件上

、、、

在用JupyterLab打开我的电子病历集群之后。我无法下载额外的语料库与nltk.download()。码 nltk.download('wordnet') 误差 I/O operation on closed file Traceback (most recent call last): File "/usr/local/lib/python3.6/site-packages/nltk/downloader.py", line 817, in download show('Downloading collection %r' %

浏览 4提问于2019-12-17得票数 3

2回答

导入nltk时出现导入错误(无法导入bracket_parse)

、、

我已经安装了nltk和nltk-data。程序在import nltk上出现错误。下面是错误堆栈跟踪： import nltk File "/usr/local/lib/python2.7/dist-packages/nltk/__init__.py", line 137, in <module> from nltk.stem import * File "/usr/local/lib/python2.7/dist-packages/nltk/stem/__init__.py", line 29, in <module> from nl

浏览 0提问于2016-08-09得票数 0