在将字符串转换为列表后，如何从我的nltk标记中删除'\n‘，或者首先阻止它出现？

、、、

我已经将列从CSV转换为列表，然后转换为字符串以进行标记化。在它被转换成一个字符串后，我始终得到'\n‘。我希望要么完全阻止它的发生，要么在它发生后将其移除。到目前为止，我已经尝试了replace、strip和r

浏览 6提问于2019-06-22得票数 3

2回答

Python在从列表转换到字符串时处理新行字符

、、、、

我有一个关于换行符和返回字符的问题。这对我来说很难解释，但我会尽力的。为了使用NLP标记这个句子，尽管NLTK，我需要这个句子在</em

浏览 4提问于2017-03-28得票数 0

1回答

如何在对数据进行聚类后，根据其他列生成新列？

、、、、

我怎么能这么做？我应该将A列转换为二进制0 a 1s吗？我应该对

浏览 1提问于2021-03-06得票数 1

回答已采纳

1回答

从文件到语句的word2vec模型流数据的训练

、、、、

现在，我的txt文件有点混乱，我需要删除所有的“\n”换行符，从我加载的字符串(txt-file)中读取所有句子，然后标记每个句子，以便使用word2vec模型。我不知道如何将字符串列表转换为列表列表，其中每个子列表都包含句子，同时通过生成

浏览 1提问于2019-07-20得票数 0

回答已采纳

1回答

使用NLTK的命名实体识别。提取的关键字的相关性

、、

我正在检查NLTK的命名实体识别功能。是否有可能找出提取的关键字中与原始文本最相关的关键字？另外，可以知道提取的关键字的类型(个人/组织)吗？

浏览 4提问于2011-04-16得票数 4

2回答

使用Python NLTK标记大型(>70MB) TXT文件。连接并将数据写入流错误

、、

首先，我是python/nltk的新手，所以如果这个问题太基本了，我很抱歉。我有一个大文件，我试图对其进行标记；我得到了内存错误。我读过的一种解决方案是一次读取一行文件，这是有意义的，但是，在这样做的时候，我得到了错误cannot concatenate 'str' and 'list' obje

浏览 0提问于2012-03-25得票数 5

回答已采纳

2回答

python正则表达式将所有windows换行符替换为空格

、

我这样做了：import nltkhtml = urlopen(url).read()现在，我在python中有一个很长的字符串，其中充满了定期被windows换行符/r/n中断的文本，我只想使用正则表达式<

浏览 0提问于2011-06-30得票数 14

回答已采纳

4回答

如何从一系列文本条目中提取常见/重要短语

、、、

我有一系列的文本项-来自MySQL数据库的原始超文本标记语言。我希望在这些条目中找到最常见的短语(而不是单个最常见的短语，理想情况下，不强制逐字匹配)。我的例子是Yelp.com上的任何评论，它显示了来自数百条对给定餐厅的评论的3个片段，格式如下：例如，本页的“回顾亮点”部分：我已经安装了<e

浏览 1提问于2010-03-16得票数 70

1回答

使用dataframe删除标记化nltk中的标点符号(python)

、、、

我有一些我能够处理的文本，从停用词，链接，表情符号等。在标记我的数据帧后，我得到了一个不太好的图片。有许多额外的标点符号，它们被标识为单独的单词，并出现在处理后的文本中。添加镜像 ? '].apply(nltk.word_tokenize) 如你所见，有很多像破折

浏览 59提问于2021-11-04得票数 0

3回答

使用re模块输出soup.findall()作为进一步文本操作的输入

、、、

尝试使用BeautifulSoup从网页中提取文本。希望将soup.findall()的输出作为输入传递，以便使用re模块进一步清理数据纯文本输入正常工作，但如果传递soup.findall()的输出，它将引发以下错误。回溯(最近一次调用)：文件“scpe2.py”，第18行，在url = re.search( '，univ) File "/usr/lib/python2.7/re.py“中，第142行，在搜

浏览 6提问于2013-11-24得票数 0

回答已采纳

3回答

查找字符串中字符/单词的周围句子

、、

我正在尝试使用python从包含给定子字符串的字符串中获取句子。 end: 10 { start: 123, }} 我循环遍历每个亮点，在摘要中</

浏览 2提问于2013-03-21得票数 7

回答已采纳

1回答

打印出列表中项目的出现情况

、

首先，标识符的列表可以是字符串或数值。第二，包含多个项目的列表。对于每个标识符(标识符列表中的项)，计算标识符在项列表中出现的频率。对于每个标识符，创建以下outout: identifier在列表中出现的次数。将标记<>替换为标识符的<

浏览 0提问于2019-11-04得票数 0

6回答

基于正则表达式标记的NLP词干化和局部化

、、、

定义一个名为performStemAndLemma的函数，它接受一个参数。第一个参数textcontent是一个字符串。在编辑器中给出了函数定义代码存根。执行下列指定任务：将

浏览 13提问于2020-06-30得票数 1

回答已采纳

4回答

python中的nltk* NERTagger UnicodeDecodeError*

、、

我正在用python 2.7.6编写一个程序，它使用nltk和Stanford在Windows7专业版中命名的实体标记器来标记文本并打印结果，如下所示： ra

浏览 0提问于2015-01-03得票数 0

1回答

从CSV中删除非英语单词

、、

我是Python和NLTK的新手，掌握了存储在CSV中的Flickr数据，并且希望从标记列中删除非英语单词。我一直收到错误，说“期望一个字符串或一个类似字节的对象”。我有一种感觉，这是因为标签列目前是在Pandas系列数据类型中，而不是字符串。但是，我在St

浏览 7提问于2022-04-19得票数 0

回答已采纳

2回答

“‘list”对象在wordnet同义词集中没有属性“lower”问题

、、、、

我正在尝试编写一个函数，该函数将返回一个NLTK定义列表，用于从受该单词的词性约束的文本文档中标记的“tokens”。我首先将nltk.pos_tag提供的标记转换为wordnet.synsets使用的标记，然后依次应用.word_tokenize()、.pos_tag()、.synsets，

浏览 6提问于2017-08-30得票数 0

2回答

如何使用NLTK或pywsd进行词汇化

、、、、

我导入了csv文件，将其转换为数据帧，将变量/列转换为正确的数据类型。然后，我执行停用词删除： # Stop word removal stop_words = set(stopwords.words(但没有停止字接下来的两个步骤让我感到困惑(词性标记和词汇化)。我试过两件事： 1)将</em

浏览 28提问于2020-03-27得票数 2

回答已采纳

2回答

NLTK标签能正确识别收缩吗？

、

我想知道在向NLTK的pos标签发送给定的文本之前，是否需要编写一个反收缩函数。我不愿意标记单词，因为它们最终可能会像(不要‘do’，‘nt’)一样，我怀疑这会使pos标记更加困难。简而言之，我的问题是:nltk的pos标签是否能识别大多数收缩(根据我有限的经验，它似乎能很好地实现w/o单词标记)？单

浏览 6提问于2021-08-09得票数 1

回答已采纳

2回答

nltk pos标签的内部实现

、、

我刚接触过NLP，试着使用nltk pos标签，对使用有疑问，nltk pos标签也是一样的吗？如果是，那么为

浏览 4提问于2018-08-08得票数 2

回答已采纳

2回答

在dataset上阻塞数据时，UnicodeDecodeError意外结束数据

、、、、

我对python很陌生，我正试着开发一小块Yelp！dataset是在JSON中使用的，但我使用库和NLTK转换为CSV。 tokens = &#

浏览 1提问于2015-05-17得票数 2

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Python在从列表转换到字符串时处理新行字符

如何在对数据进行聚类后，根据其他列生成新列？

从文件到语句的word2vec模型流数据的训练

使用NLTK的命名实体识别。提取的关键字的相关性

使用Python NLTK标记大型(>70MB) TXT文件。连接并将数据写入流错误

python正则表达式将所有windows换行符替换为空格

如何从一系列文本条目中提取常见/重要短语

使用dataframe删除标记化nltk中的标点符号(python)

使用re模块输出soup.findall()作为进一步文本操作的输入

查找字符串中字符/单词的周围句子

打印出列表中项目的出现情况

基于正则表达式标记的NLP词干化和局部化

python中的nltk* NERTagger UnicodeDecodeError*

从CSV中删除非英语单词

“‘list”对象在wordnet同义词集中没有属性“lower”问题

如何使用NLTK或pywsd进行词汇化

NLTK标签能正确识别收缩吗？

nltk pos标签的内部实现

在dataset上阻塞数据时，UnicodeDecodeError意外结束数据

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐