如何使用python中的word tokenize函数删除列表中的编号？我正在获得输出，但我需要不带数字的输出

python、pandas、csv、nltk

我不需要列表编号(即) 0,1等。我需要打印没有编号的元素 import pandas as pd import csv #mystr=str(

浏览 24提问于2020-05-01得票数 0

回答已采纳

3回答

用NLTK标记阿拉伯语单词

python、tokenize、nltk

我正在使用NLTK word_tokenizer将一个句子拆分成单词。我想标记这句话：我写的代码是كل شي لما تحتاجه يضيع ...ادور على شاحن فجأة يختفي ..لدرجة اني اسوي نفسي ادور شيء" wordsArr

浏览 13提问于2012-10-23得票数 23

回答已采纳

1回答

为什么我在句子中使用NLTK引词器时会得到TypeError:不可理解的类型？

python、nltk、lemmatization

我目前正在处理一个句子的柠檬化，同时也应用pos_tags。到目前为止，这就是我所拥有的from nltk.tokenize import word_tokenizefrom_morphy(word, pos) File "/Library/Frameworks/Python.framework&#x

浏览 3提问于2020-02-19得票数 0

回答已采纳

4回答

如何按字母从列表中删除多个字符串？

python、python-3.x

我正在尝试从不带字母"a“的列表中删除多个字符串。我尝试使用一个函数来删除列表中不带字母"a“的每个单词 myList = ['advertisement', 'start', 'clever', 'billowy', '

浏览 37提问于2019-04-07得票数 1

回答已采纳

3回答

打印带有移除形容词的pos标记(NLTK)

python、nltk、pos-tagger

genexpr> at 0x000000000E000D00> 如果使用[]圆形打印，我会得到“无效语法”

浏览 0提问于2018-02-19得票数 0

回答已采纳

2回答

如何从Python的bi /tri输出中删除特殊字符(“()”、"'“、”")

python、nltk、special-characters

我编写了一个代码，它使用NLTK从文本输入计算bigram / trigram频率。这里我面临的问题是，由于输出是以Python列表的形式获得的，所以输出包含特定于列表的字符，即(“()”、"'“、”")。我计划将其导出到csv文件中，因此我希望在代码级别上删除<

浏览 0提问于2018-08-30得票数 3

回答已采纳

1回答

使用计数器对列表元素进行计数

python、nltk、counter

我是python和编程的新手，需要你的帮助。我正在尝试使用nltk.word_tokenize和Counter计算文本中最常见的单词。当我获得所有文本元素的列表并想要计算所有元素时，Counter只计算字母。代码如下： from nltk.tokenize import word_tokenize</

浏览 15提问于2019-09-30得票数 1

回答已采纳

1回答

将isalpha应用于列表

python-3.x、function、text、nlp

我是python的新手。我有一个NLP项目，需要从我的关键字删除频率。我在列表中的一行上成功地做到了这一点。因此输入: tokens= 'fibre'，'16'，';'，'quoi'，'1'，';'，'dangers'，'1'

浏览 15提问于2020-04-10得票数 0

1回答

如何用Python将句子列表写入文本文件

python、string、list、type-conversion

我想问一下如何将一组句子打印到文本文件中。我尝试使用write()函数导出如下所示的输出，但无法获得类似于python中的输出。import osfrom nltk.tokenize import word_tokenize, sent_tokenize from n

浏览 3提问于2016-12-15得票数 2

回答已采纳

4回答

如何在Python* 3中获取列表中列表的编号？*

python、python-3.x、list

我正在尝试获取包含特定编号的嵌套列表的编号。这是我的代码：for x in listo: print(len(x)) 我在这里尝试获取的是嵌套列表中包含3的编号。我的代码返回3，因为我</em

浏览 50提问于2018-06-18得票数 2

回答已采纳

1回答

如何在没有预先定义的多词列表的句子中识别多词表达

python、nlp

我正在尝试识别一个句子中的每个多词表达式，并对该句子进行标记化。例如，示例输入句子是“简而言之，此商品供不应求”。我希望输出可以如下所示： ['In short', ',', 'this', 'merchandise', 'is', 'in short supply', '.']我已经通过使用预定义的</e

浏览 25提问于2021-03-13得票数 0

1回答

为什么输出不打印列表？

python、python-3.x、nltk

我正在使用Python中的nltk库；我的背景是Java。我不理解我编写的代码的控制台输出。为什么Python会返回一个奇怪的表单，尽管我将变量tokens初始化为list。from nltk.tokenize import word_tokenize from nltk.c

浏览 2提问于2017-05-04得票数 0

回答已采纳

11回答

如何使用NLTK标记器消除标点符号？

python、nlp、tokenize、nltk

我刚刚开始使用NLTK，我不太明白如何从文本中获取单词列表。如果我使用nltk.word_tokenize()，我会得到一个单词和标点符号的列表。相反，我只需要文字。我怎样才能摆脱标点符号？此外，word_tokenize不能处理多个句子:在最后一个单词上添加圆点。

浏览 0提问于2013-03-21得票数 138

1回答

R-通过网格解析Python树

python、r、parsing、nltk、reticulate

我正在尝试使用Python的NLTK包，在R中使用Retic所得包。在很大程度上，我是成功的。现在，我希望执行命名实体识别(即确定哪些令牌表示命名实体以及它们代表的命名实体的类型)。使用NLTK的ne_chunk()函数。我的问题是，函数返回类nltk.tree.Tree的

浏览 1提问于2018-01-31得票数 2

回答已采纳

1回答

在列表中连接由标记分隔的单词

python、list、loops、set、concatenation

我想在单词列表中连接一个用星号分隔的单词。我尝试的代码是：from nltk.tokenize import word_tokenize with open ('

浏览 0提问于2019-03-17得票数 0

2回答

我怎样才能拿几段文字，看看是否有一个代词，并选择所有这些句子，以形成一个新的段落？

python、nltk

我应该使用NLTK或正则表达式来拆分它吗？这是一个更大项目的一部分，我是Python新手。你能告诉我有什么有用的代码吗？

浏览 5提问于2013-03-17得票数 0

回答已采纳

1回答

使用spaCy从列表数据中删除停止词

python、nlp、spacy

我想在令牌化之后使用spaCy删除停止词。但是，给我一个错误，错误是AttributeError: 'str' object has no attribute 'is_stop'，我想要做的数据是在标记过程之后的数据，这个列名为“令牌化”--如何修复它]df['text'] = df['text'].s

浏览 12提问于2021-11-28得票数 2

回答已采纳

3回答

访问元组列表中元组的第一个元素的范围。

python、tuples

这里有点像python/编程新手。from nltk.tokenize import word_tokenize

浏览 3提问于2014-01-29得票数 0

回答已采纳

1回答

如何使用line_tokenize或word_tokenize使用nltk来分隔新行？

python、python-3.x、nltk

尝试使用word_tokenize和sent_tokenize标记带有新行的段落，但它无法识别新行。para="the new line \n new char"print(sen

浏览 12提问于2018-02-05得票数 1

回答已采纳

2回答

Python不从字符串中移除Char

python

Iv多次尝试从字符串中删除额外的标点符号。= sentence.lower() self.tokenList.append(word)

浏览 1提问于2015-01-11得票数 0

回答已采纳

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

用NLTK标记阿拉伯语单词

为什么我在句子中使用NLTK引词器时会得到TypeError:不可理解的类型？

如何按字母从列表中删除多个字符串？

打印带有移除形容词的pos标记(NLTK)

如何从Python的bi /tri输出中删除特殊字符(“()”、"'“、”")

使用计数器对列表元素进行计数

将isalpha应用于列表

如何用Python将句子列表写入文本文件

如何在Python* 3中获取列表中列表的编号？*

如何在没有预先定义的多词列表的句子中识别多词表达

为什么输出不打印列表？

如何使用NLTK标记器消除标点符号？

R-通过网格解析Python树

在列表中连接由标记分隔的单词

我怎样才能拿几段文字，看看是否有一个代词，并选择所有这些句子，以形成一个新的段落？

使用spaCy从列表数据中删除停止词

访问元组列表中元组的第一个元素的范围。

如何使用line_tokenize或word_tokenize使用nltk来分隔新行？

Python不从字符串中移除Char

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐